### 2019.3.10 高级特性：生成器

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。**在Python中，这种一边循环一边计算的机制，称为生成器：generator**

创建generator的方法&得到generator的每一个元素：<br/>
1. 第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个generator<br/>
    i)创建简单的generator<br/>
    ii)得到generator元素： next， for<br/>
2. 第二种方法：在一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator：<br/>
    i)创建generator<br/>
    ii)得到generator元素： next，for

**1.第一种方法<br/>**
    **1_i)创建简单的generator**

In [14]:
#example
L=[i*i for i in range(10)] #用列表生成器[]
print(L)
g=(i*i for i in range(10))
print(g)
print("创建L和g的区别仅在于最外层的[]和()，L是一个list，而g是一个generator。")

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
<generator object <genexpr> at 0x1064aa1a8>
创建L和g的区别仅在于最外层的[]和()，L是一个list，而g是一个generator。


**1_ii)得到generator元素**

a.(不常用)如果要一个一个打印出来，可以通过next()函数获得generator的下一个返回值：<br/>
generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误。<br/>
<br/>
b.(常用)通过for循环来迭代generator，这样方便并且不需要关心StopIteration的错误。

In [6]:
#a. 用next
next(g)

0

注： 计算到g最后一个元素，没有更多的元素时，抛出StopIteration的错误。此时再用next或是for都不能让g重头开始
    一种办法是删除g这个变量（用 del g），然后再重新定义创建g这个变量

In [15]:
#b. 用for循环
for n in g:
    print(n)


0
1
4
9
16
25
36
49
64
81


**2.第二种方法:<br/>**
**2_i)创建generator**<br/>
<br/>
这里我们以斐波那契数列为例：先写它的函数形式，然后用yield得到斐波那契数列的生成器generator<br/>
著名的斐波拉契数列（Fibonacci），除第一个和第二个数外，任意一个数都可由前两个数相加得到：<br/>

1, 1, 2, 3, 5, 8, 13, 21, 34, ...

先写它的函数形式

In [4]:
#示例：斐波拉契数列用列表生成式写不出来，但是，用函数把它打印出来却很容易
#生成斐波那契数列的前N个数
def fib(max):
    n,a,b=0,0,1
    while n<max:
        print(b)
        a,b=b,a+b
        n+=1
    return "done"

fib(6)

1
1
2
3
5
8


'done'

然后用yield得到斐波那契数列的生成器generator:<br/>

可以看出，fib函数实际上是定义了斐波拉契数列的推算规则，可以从第一个元素开始，推算出后续任意的元素，这种逻辑其实非常类似generator。
也就是说，上面的函数和generator仅一步之遥。要把fib函数变成generator，只需要把print(b)改为yield b就可以了：

In [5]:
def fib(max):
    n,a,b=0,0,1
    while n<max:
        yield(b)     #区别仅在于把print改为yield
        a,b=b,a+b  #注意此条赋值语句
        n+=1
    return "done"

fib(6)

<generator object fib at 0x10642f0a0>

**2_ii)得到generator元素**<br/>
a.(不常用):首先要生成一个generator对象，然后用next()函数不断获得下一个返回值<br/>
b.(常用)用for

In [17]:
#a 用next
f = fib(6) #首先生成一个generator对象
next(f)

1

In [19]:
#b 用for
for n in fib(6):
    print (n)

1
1
2
3
5
8


## 要点说明
### 要点1
对使用yeild的生成器，最难理解的就是generator和函数的执行流程不一样。函数是顺序执行，遇到return语句或者最后一行函数语句就返回。而变成generator的函数，在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行。<br/>
<br/>
举个简单的例子，定义一个generator，依次返回数字1，3，5：

In [21]:
def odd():
    print('step 1')
    yield 1
    print('step 2')
    yield 3
    print('step 3')
    yield 5

In [22]:
#这里用next演示，方便illustrate
o=odd()
next(o)

step 1


1

In [23]:
next(o)

step 2


3

In [24]:
next(o)

step 3


5

In [25]:
next(o)

StopIteration: 

可以看到，odd不是普通函数，而是generator，在执行过程中，遇到yield就中断，下次又继续执行。执行3次yield后，已经没有yield可以执行了，所以，第4次调用next(o)就报错。 (如果用for循环就不会用中断)

### 要点2
用for循环调用generator时，发现拿不到generator的return语句的返回值。如果想要拿到返回值，必须捕获StopIteration错误，**返回值包含在StopIteration的value中，所以我们要得到StopIteration错误的值：**

In [26]:
g=fib(6)
while True:
    try:
        x=next(g)
        print('g:',x)
    except StopIteration as e:
        print('Generator return value:',e.value)
        break

g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
Generator return value: done


## 小结
generator是非常强大的工具，在Python中，可以简单地把列表生成式改成generator，也可以通过函数实现复杂逻辑的generator。<br/>
<br/>
要理解generator的工作原理，它是在for循环的过程中不断计算出下一个元素，并在适当的条件结束for循环。对于函数改成的generator来说，遇到return语句或者执行到函数体最后一行语句，就是结束generator的指令，for循环随之结束。<br/>
<br/>
请注意区分普通函数和generator函数，普通函数调用直接返回结果：<br/>

In [29]:
r=abs(6)
r

6

generator函数的“调用”实际返回一个generator对象:

In [30]:
g1=fib(8)
g1

<generator object fib at 0x1064aa3b8>

## 练习

把杨辉三角形每一行看做一个list，试写一个generator，不断输出下一行的list：

In [27]:
#解
def triangles():
    L = [1]
    while True:
        yield L
        L = [1] + [L[i] + L[i+1] for i in range(len(L)-1)] + [1]
        
n = 0
results = []
for t in triangles():
    print(t)
    results.append(t)
    n = n + 1
    if n == 10:
        break
if results == [
    [1],
    [1, 1],
    [1, 2, 1],
    [1, 3, 3, 1],
    [1, 4, 6, 4, 1],
    [1, 5, 10, 10, 5, 1],
    [1, 6, 15, 20, 15, 6, 1],
    [1, 7, 21, 35, 35, 21, 7, 1],
    [1, 8, 28, 56, 70, 56, 28, 8, 1],
    [1, 9, 36, 84, 126, 126, 84, 36, 9, 1]
]:
    print('测试通过!')
else:
    print('测试失败!')

[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]
测试通过!
