# 生成器

In [16]:
g = (x * x for x in range(10))
g

<generator object <genexpr> at 0x000002683DC33570>

In [17]:
next(g)

0

In [18]:
next(g)

1

`generator` 保存的是算法，每次调用 `next(g)` ，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出 `StopIteration` 的错误。

 `fib` 函数实际上是定义了斐波拉契数列的推算规则，可以从第一个元素开始，推算出后续任意的元素，这种逻辑其实非常类似 `generator` 。

也就是说，上面的函数和 `generator` 仅一步之遥。

要把 `fib` 函数变成 `generator` ，只需要把 `print(b)` 改为 `yield b` 就可以了：

In [21]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        print(b)
        a, b = b, a + b
        n = n + 1
    return 'done'

fib(6)

1
1
2
3
5
8


'done'

## yield

In [22]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        a, b = b, a + b
        n = n + 1
    return 'done'

In [23]:
f = fib(6)
f

<generator object fib at 0x000002683DB71830>

但是用 `for` 循环调用 `generator` 时，发现拿不到 `generator` 的 `return` 语句的返回值。

如果想要拿到返回值，必须捕获 `StopIteration` 错误，返回值包含在 `StopIteration` 的 `value` 中：

In [24]:
for i in f:
    print(i)

1
1
2
3
5
8


In [31]:
g = fib(6)
while True:
    try:
        x = next(g)
        print('g:', x)
    except StopIteration as e:
        print('Generator return value:', e.value)
        break

g: 1
g: 1
g: 2
g: 3
g: 5
g: 8
Generator return value: done


这里，最难理解的就是 `generator` 和函数的执行流程不一样。

函数是顺序执行，遇到 `return` 语句或者最后一行函数语句就返回。

而变成 `generator` 的函数，在每次调用 `next()` 的时候执行，遇到 `yield` 语句返回，再次执行时从上次返回的 `yield` 语句处继续执行。

举个简单的例子，定义一个 `generator` ，依次返回数字 `1，3，5` ：

In [25]:
def odd():
    print('step 1')
    yield 1
    print('step 2')
    yield(3)
    print('step 3')
    yield(5)

In [27]:
o = odd()

In [28]:
next(o)

step 1


1

In [29]:
next(o)

step 2


3

In [30]:
next(o)

step 3


5

杨辉三角定义如下：

              1
             / \
            1   1
           / \ / \
          1   2   1
         / \ / \ / \
        1   3   3   1
       / \ / \ / \ / \
      1   4   6   4   1
     / \ / \ / \ / \ / \
    1   5   10  10  5   1
    
把每一行看做一个 `list` ，试写一个 `generator` 

In [None]:
def triangles(maxN):
    n=0
    tmp = [1]
    while n < maxN:
        n += 1
        for i in tmp:
            

# 迭代器

## 可迭代对象： `Iterable` 

可以直接作用于 `for` 循环的数据类型有以下几种：

一类是集合数据类型，如 `list` 、 `tuple` 、 `dict` 、 `set` 、 `str` 等；

一类是 `generator` ，包括生成器和带 `yield` 的 `generator function` 。

这些可以直接作用于 `for` 循环的对象统称为可迭代对象： `Iterable` 。

可以使用 `isinstance()` 判断一个对象是否是 `Iterable` 对象：

In [34]:
from collections import Iterable

isinstance([], Iterable)

isinstance({}, Iterable)

isinstance('abc', Iterable)

isinstance((x for x in range(10)), Iterable)

isinstance(100, Iterable) # False


True

True

True

True

False

## 迭代器： `Iterator`

而生成器不但可以作用于 `for` 循环，还可以被 `next()` 函数不断调用并返回下一个值，直到最后抛出 `StopIteration` 错误表示无法继续返回下一个值了。

可以被 `next()` 函数调用并不断返回下一个值的对象称为迭代器： `Iterator` 。

可以使用 `isinstance()` 判断一个对象是否是 `Iterator` 对象：

In [36]:
from collections import Iterator
isinstance((x for x in range(10)), Iterator)
isinstance([], Iterator)

True

False

## `iter()` 函数

生成器都是 `Iterator` 对象，但 `list` 、 `dict` 、 `str` 虽然是 `Iterable` ，却不是Iterator。

把 `list` 、 `dict` 、 `str` 等 `Iterable` 变成 `Iterator` 可以使用 `iter()` 函数：

In [37]:
isinstance(iter([]), Iterator)

True

 `Python` 的 `for` 循环本质上就是通过不断调用 `next()` 函数实现的

In [40]:
for x in [1, 2, 3, 4, 5]:
    pass

实际上完全等价于：

In [41]:
# 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5])
# 循环:
while True:
    try:
        # 获得下一个值:
        x = next(it)
    except StopIteration:
        # 遇到StopIteration就退出循环
        break