借助生成器generator和迭代器iterator可以高效生成和访问对象。
# 生成器
- 列表、字典、集合，这些可迭代对象的容量有限。创建一个10万个元素的列表，要占用很大内存。
- 大量元素被加载到内存之中，但真正使用的元素是很少的。
- **不必创建完整的列表、字典、集合**：如果能按某种算法推算出各元素，在循环中，根据前面元素往后推导即可。
- 生成器：一种一边计算，一边循环的机制。本质上是一个函数。

## 使用生成器表达式创建生成器

In [1]:
n = 10
a = [x**2 for x in range(n) if x%2==0]    # 列表推导式
print(a)
print(type(a))

print('-'*40)
n = 10
b = (x**2 for x in range(n) if x%2==0)    # 生成器表达式generator expression,将列表推导式的[]更改为()
print(b)                                  # print对生成器不起作用，解释器给出的是生成器的地址
print(list(b))
print(type(b))

[0, 4, 16, 36, 64]
<class 'list'>
----------------------------------------
<generator object <genexpr> at 0x111b09ff0>
[0, 4, 16, 36, 64]
<class 'generator'>


### 使用next获取生成器中的元素

In [2]:
def display_a_iter(a_iter, stop=10):
    cnt = 0
    
    while cnt<stop:
        try:
            # 用next获取生成器中的元素
            result = next(a_iter)
#             result = a_iter.__next__()      # 也可以使用对象内部的函数访问 b.__next__()下一个元素
            print(f'第{cnt+1}次调用next(), 结果是{result}!')   
            cnt = cnt+1
        except StopIteration as e:
            print('捕获 StopIteration')    # 如何捕获StopIteration并打印？
            print(e)
            break

In [3]:
n = 10
b = (x**2 for x in range(n) if x%2==0)

display_a_iter(b, 10)

第1次调用next(), 结果是0!
第2次调用next(), 结果是4!
第3次调用next(), 结果是16!
第4次调用next(), 结果是36!
第5次调用next(), 结果是64!
捕获 StopIteration



## 使用yield创建生成器函数
函数定义中包含yield--不再是普通的函数，而是一个生成器。   
- 返回值并不是通过return返回的，而是通过yield。
- 也可以增加一个return语句，但return返回的是StopIteration的异常说明。# to check

`执行流程`
- 普通函数遇到return语句 或者执行到最后一行函数语句就会结束整个函数运行。
- 生成器在每次调用next()时执行，遇到yield就【半途而废】，再次执行时，从上次返回yield语句处接着往下执行。

In [4]:
def fibonacci(n_terms):
    n, a, b = 0, 0, 1       # 变量初始化，多变量赋值，简化代码
    
    while n < n_terms:
        yield b             # 使用yeiled，即为一个生成器
        a, b = b, a+b       # 变量更新
        n = n+1
        
fib = fibonacci(10)
fib                         # 不直接输出

<generator object fibonacci at 0x111afcc80>

### 结合循环使用生成器

In [5]:
for item in fib:
    print(item, end=' ') # print默认输出终结符是换行符，这里替换成空格

1 1 2 3 5 8 13 21 34 55 

# 迭代器
> 迭代器是一种数据结构，比起列表(list)来说，迭代器最大的优势就是延迟计算，按需使用，从而提高开发体验和运行效率.
- 迭代器用于迭代操作（for\while)；
- 可以像列表一样获取其中的每一个元素

`惰性估值Lazy evaluation`
- 只有当迭代值某个值时，该元素才会被计算并获取。
- 迭代器特别适合用于遍历大文件或者无限集合。


## 可迭代对象
- 列表、字典、元组、集合、字符串等，都是存储数据的容器container。
- 逐个从容器中获取元素的过程，就叫迭代iteration。
- 具备可迭代访问特性的对象，就叫做可迭代对象。

In [6]:
from collections.abc import Iterable

In [7]:
items = [[], {}, '100', 99]

def display_iterable_info(items):
    for item in items:
        result = isinstance(item, Iterable)
        print(f'类型：{type(item)}， 实例：{item} ，是否为可迭代对象：{result}')

display_iterable_info(items)

类型：<class 'list'>， 实例：[] ，是否为可迭代对象：True
类型：<class 'dict'>， 实例：{} ，是否为可迭代对象：True
类型：<class 'str'>， 实例：100 ，是否为可迭代对象：True
类型：<class 'int'>， 实例：99 ，是否为可迭代对象：False


## 创建迭代器iter()

In [8]:
x = [1, 2, 3, 4, 5]
a_iter = iter(x)          # 全局函数iter定义了迭代器
b_iter = iter(x)

print(type(x))
print(type(a_iter))
print(type(b_iter))
print('-'*40)

display_a_iter(a_iter, 10)

<class 'list'>
<class 'list_iterator'>
<class 'list_iterator'>
----------------------------------------
第1次调用next(), 结果是1!
第2次调用next(), 结果是2!
第3次调用next(), 结果是3!
第4次调用next(), 结果是4!
第5次调用next(), 结果是5!
捕获 StopIteration



In [9]:
display_iterable_info([a_iter, b_iter])

类型：<class 'list_iterator'>， 实例：<list_iterator object at 0x111b25240> ，是否为可迭代对象：True
类型：<class 'list_iterator'>， 实例：<list_iterator object at 0x111b250c0> ，是否为可迭代对象：True


In [10]:
x = [1, 2, 3, 4, 5]
a_iter = iter(x)            # 前面已经使用过了，需要重新定义

for i in a_iter:
    print(i)

1
2
3
4
5


In [11]:
list(a_iter)

[]

## 创建迭代器对象
实现两种方法：

- __next__():返回迭代器对象内部的下一个元素值。
- __iter__():返回一个迭代器对象。

In [12]:
from itertools import islice

In [13]:
class Fibonacci:
    def __init__(self):
        self.previous = 0
        self.current = 1
    
    def __iter__(self):        # Fibonacci生成的实例，都是可迭代对象
        return self
    
    def __next__(self):        # Fibonacci生成的实例，都是迭代器
        value = self.current
        self.previous = self.current                  # 1、在迭代器内部更新变量
        self.current = self.current+self.previous
        return value                                  # 2、为本次调用返回结果

fib = Fibonacci()
a = list(islice(fib, 0, 10))     # islice(可迭代对象， 开始位置， 结束位置)
print(a)

[1, 2, 4, 8, 16, 32, 64, 128, 256, 512]


In [14]:
a = list(islice(fib, 0, 10))     # islice(可迭代对象， 开始位置， 结束位置)
print(a)

[1024, 2048, 4096, 8192, 16384, 32768, 65536, 131072, 262144, 524288]


# Notion
- 不能用完了迭代器、生成器，在重复使用。指针位置已经发生变化。@TODO，待查

# itertools

In [15]:
import itertools

## 累加数列

In [16]:
x = itertools.accumulate(range(10))    # 累加

print(list(x))                         # Notion:用完即弃！

[0, 1, 3, 6, 10, 15, 21, 28, 36, 45]


## 拓展
### 横向-拼接多个迭代器

In [17]:
x = itertools.chain(range(3), range(4), [3, 2, 1])   # 连接多个列表或者迭代器

print(list(x))

[0, 1, 2, 0, 1, 2, 3, 3, 2, 1]


### 横向-重复元素

In [18]:
x = itertools.repeat(range(3), 5)           # 迭代器，重复构建  # 不同于循环
y = itertools.repeat(0, 5)                  # 原素重复构建

print(list(x))
print(list(y))

[range(0, 3), range(0, 3), range(0, 3), range(0, 3), range(0, 3)]
[0, 0, 0, 0, 0]


### 纵向-增加副本-抑制用后即弃

In [19]:
x = itertools.tee(range(10), 2)       # 拓展为两个相同的迭代器

for i in x:
    print(list(i))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


## 组合
### 1个迭代器

In [20]:
x = itertools.combinations(range(4), 3)                 # 组合，指定元素数目
y = itertools.combinations_with_replacement('ABC', 2)   # 组合，指定元素数目，可以重复取样

print(list(x))
print(list(y))

[(0, 1, 2), (0, 1, 3), (0, 2, 3), (1, 2, 3)]
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]


### 2个迭代器-按位置组合

In [21]:
x = itertools.zip_longest(range(3), range(5))      # 长度不一致迭代器
y = zip(range(3), range(5))

print(list(x))
print(list(y))

[(0, 0), (1, 1), (2, 2), (None, 3), (None, 4)]
[(0, 0), (1, 1), (2, 2)]


### 2个迭代器组合-笛卡尔积

In [24]:
x = itertools.product('ABC', range(3))      # 笛卡尔积，多个迭代器或者列表

print(list(x))

[('A', 0), ('A', 1), ('A', 2), ('B', 0), ('B', 1), ('B', 2), ('C', 0), ('C', 1), ('C', 2)]


### 自身的笛卡尔积

In [38]:
x = itertools.product('ABC', repeat=2)     # 等价product(A, A)

print(list(x))

[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'B'), ('B', 'C'), ('C', 'A'), ('C', 'B'), ('C', 'C')]


## 排列-permutations

In [34]:
x = itertools.permutations(range(4), r=3)      # 排列，指定元素数量的排列空间
y = itertools.permutations(range(4))           # 默认全排列

print(list(x))
print(list(y))

[(0, 1, 2), (0, 1, 3), (0, 2, 1), (0, 2, 3), (0, 3, 1), (0, 3, 2), (1, 0, 2), (1, 0, 3), (1, 2, 0), (1, 2, 3), (1, 3, 0), (1, 3, 2), (2, 0, 1), (2, 0, 3), (2, 1, 0), (2, 1, 3), (2, 3, 0), (2, 3, 1), (3, 0, 1), (3, 0, 2), (3, 1, 0), (3, 1, 2), (3, 2, 0), (3, 2, 1)]
[(0, 1, 2, 3), (0, 1, 3, 2), (0, 2, 1, 3), (0, 2, 3, 1), (0, 3, 1, 2), (0, 3, 2, 1), (1, 0, 2, 3), (1, 0, 3, 2), (1, 2, 0, 3), (1, 2, 3, 0), (1, 3, 0, 2), (1, 3, 2, 0), (2, 0, 1, 3), (2, 0, 3, 1), (2, 1, 0, 3), (2, 1, 3, 0), (2, 3, 0, 1), (2, 3, 1, 0), (3, 0, 1, 2), (3, 0, 2, 1), (3, 1, 0, 2), (3, 1, 2, 0), (3, 2, 0, 1), (3, 2, 1, 0)]


## 分组

In [23]:
x = itertools.groupby(range(10), lambda e: e<5 or e>8)   # 按分组函数的值对元素进行分组

for condition, numbers in x:                             # 分组结果，迭代器
    print(condition, list(numbers))

True [0, 1, 2, 3, 4]
False [5, 6, 7, 8]
True [9]


## 根据函数转换

In [25]:
x = itertools.starmap(str.islower, 'aBCDefGhI')

print(list(x))

[True, False, False, False, True, True, False, True, False]


## 过滤
### 增加过滤条件

In [26]:
cond = [True, False, True, True, False]
x = itertools.compress(range(5), cond)                 # 过滤，按真值条件

print(list(x))

[0, 2, 3]


### 过滤函数-保留

In [27]:
x = itertools.takewhile(lambda e: e<5, range(10))   # 与dropwhile相反，保留元素直至真值函数值为假

print(list(x))

[0, 1, 2, 3, 4]


### 过滤函数-丢弃

In [28]:
x = itertools.dropwhile(lambda e: e<5, range(10))    # Q:按照真值丢弃列表或者迭代器前面的元素

print(list(x))

[5, 6, 7, 8, 9]


In [29]:
x = itertools.filterfalse(lambda e: e<5, range(10))

print(list(x))

[5, 6, 7, 8, 9]


### 切片-islice

In [30]:
x = itertools.islice(range(10), 0, 9, 2)     # 短迭代器，直接切片，对迭代器进行切片

print(list(x))

[0, 2, 4, 6, 8]


In [33]:
x = itertools.count(start=20, step=-1)                 # 原始迭代器很长
# 从start开始，返回均匀间隔的值。通常用于：
# map：生成连续点
# zip：添加序号

y = itertools.islice(x, 0, 10, 1)                      # 设置起始条件，步长进行切片过滤

# print(list(x))    # 无限大，无法运行
print(list(y))

[20, 19, 18, 17, 16, 15, 14, 13, 12, 11]


### 在循环迭代器中切片

In [32]:
x = itertools.cycle('ABC')          # 构建循环迭代器，不可单独使用
y = itertools.islice(x, 0, 20, 1)

print(list(y))

['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A', 'B']


# 典型场景

## 添加一组序号，起始序号可以自定义

In [37]:
a = zip(itertools.count(10), 'This is a line!')      # 编号从10开始

print(list(a))

[(10, 'T'), (11, 'h'), (12, 'i'), (13, 's'), (14, ' '), (15, 'i'), (16, 's'), (17, ' '), (18, 'a'), (19, ' '), (20, 'l'), (21, 'i'), (22, 'n'), (23, 'e'), (24, '!')]
