#### 笔记： 迭代器与生成器

迭代是访问集合元素的一种方式。

迭代器是一个可以记住遍历的位置的对象

迭代器对象从集合的第一个元素开始访问，知道所有的元素被访问完结束。迭代器只能往前不会往后退。

迭代器有两个基本的方法：`iter()`和`next()`.

字符串，列表或元组都可用于创建迭代器。

In [1]:
# 迭代器对象可以使用常规for语句进行遍历：

list = [1, 2, 3, 4]
it = iter(list) #创建迭代器对象
for x in it:
  print(x, end=' ')

1 2 3 4 

In [2]:
# 也可使用next()函数

import sys # 引入sys模块

list = [1, 2, 3, 4]
it = iter(list)

while True:
  try:
    print(next(it))
  except StopIteration:
    sys.exit()

1
2
3
4


SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


#### 创建一个迭代器

[面向对象](https://www.runoob.com/python3/python3-class.html)

把一个类作为一个迭代器使用需要在类中实现两个方法`__iter__()`和`__next__()`.

`__iter__()` 方法返回一个特殊的迭代器对象， 这个迭代器对象实现了 `__next__()` 方法并通过 `StopIteration` 异常标识迭代的完成。

`__next__()`方法会返回下一个迭代器对象。

eg: 创建一个返回数字的迭代器，初始值为1，逐步递增1：

In [4]:
class MyNumbers:
  def __iter__(self):
    self.a = 1
    return self
  
  def __next__(self):
    x = self.a
    self.a += 1
    return x
  
myclass = MyNumbers()
myiter = iter(myclass)

print(next(myclass))
print(next(myclass))
print(next(myclass))
print(next(myclass))

1
2
3
4


#### `StopIteration`

`StopIteration` 异常用于标识迭代的完成，防止出现无限循环的情况，在 `__next__()` 方法中我们可以设置在完成指定循环次数后触发 `StopIteration` 异常来结束迭代。

eg: 在 20 次迭代后停止执行：

In [5]:
class MyNumbers:
  def __iter__(self):
    self.a = 1
    return self
  
  def __next__(self):
    if self.a <= 20:
      x = self.a
      self.a += 1
      return x
    else:
      raise StopIteration
      
myclass = MyNumbers()
myiter = iter(myclass)

for x in myiter:
  print(x)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20


## 生成器

在 Python 中，使用了 `yield` 的函数被称为生成器（generator）。

跟普通函数不同的是，生成器是一个返回迭代器的函数，只能用于迭代操作，更简单点理解生成器就是一个迭代器。

在调用生成器运行的过程中，每次遇到 **`yield` 时函数会暂停并保存当前所有的运行信息，返回 `yield` 的值, 并在下一次执行 `next()` 方法时从当前位置继续运行**。

调用一个生成器函数，返回的是一个迭代器对象。

以下实例使用 `yield` 实现斐波那契数列：

In [6]:
import sys

def fib(n):
  a, b, counter = 0, 1, 0
  while True:
    if (counter > n):
      return
    yield a
    a, b = b, a+b
    counter += 1
    
f = fib(10)

while True:
  try:
    print(next(f), end = ' ')
  except StopIteration:
    sys.exit()


0 1 1 2 3 5 8 13 21 34 55 

SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


## 补充说明

#### 1. 关于`yield`:

比较有`yield`和没有`yield`的情况进一步理解生成器：

In [8]:
# 使用yield

import sys

def fib(n, w=0):
  a, b, counter = 0, 1, 0
  while True:
    if (counter > n):
      return
    yield a
    a, b = b, a+b
    print('%d, %d' % (a,b))
    counter += 1
    
f = fib(10)

while True:
  try:
    print(next(f), end = ' ')
  except:
      sys.exit()

0 1, 1
1 1, 2
1 2, 3
2 3, 5
3 5, 8
5 8, 13
8 13, 21
13 21, 34
21 34, 55
34 55, 89
55 89, 144


SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [9]:
# 不使用yield

import sys

def fib(n, w=0):
  a, b, counter = 0, 1, 0
  while True:
    if (counter > n):
      return
    #yield a
    a, b = b, a+b
    print('%d, %d' % (a,b))
    counter += 1
    
f = fib(10)

while True:
  try:
    print(next(f), end = ' ')
  except:
      sys.exit()

1, 1
1, 2
2, 3
3, 5
5, 8
8, 13
13, 21
21, 34
34, 55
55, 89
89, 144


SystemExit: 

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


第二种没有`yield`时，函数只是简单执行，没有返回迭代器`f`。这里的迭代器可以用生成`l`列表来理解一下：

In [10]:
l = [i for i in range(0, 15)]
print(l)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]


In [11]:
m = (i for i in range(15))
print(m)

<generator object <genexpr> at 0x1121ab9a8>


In [12]:
for g in m:
  print(g, end = ' ')
  # 这里的m就像上面的f一样，是迭代器。

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 

#### 2. 什么情况下需要使用 `yield`？

一个函数 `f`，`f` 返回一个 `list`，这个 `list` 是动态计算出来的（不管是数学上的计算还是逻辑上的读取格式化），并且这个 `list` 会很大（无论是固定很大还是随着输入参数的增大而增大），这个时候，我们希望每次调用这个函数并使用迭代器进行循环的时候一个一个的得到每个 `list` 元素而不是直接得到一个完整的 `list` 来节省内存，这个时候 `yield` 就很有用。

以斐波那契函数为例，我们一般希望从 `n` 返回一个 `n` 个数的 `list`：

In [None]:
def fab(num):
  n, a, b = 0, 0, 1
  L = []
  while n < num:
    L.append(b)
    a, b = b, a + b
    n += 1
  return L  

上面那个 `fab` 函数从参数 `num` 返回一个有 `num` 个元素的 `list`，当这个 `num` 很大的时候，会非常的占用内存。
一般我们使用的时候都是这个样子的，比如：

In [None]:
f = iter(fab(1000))
while True:
  try:
    print(next(f), end=' ')
  except StopIteration:
    sys.exit()

这样我们实际上是先生成了一个 1000 个元素的 `list:f`，然后我们再去使用这个 `f`。

现在，我们换一个方法：
因为我们实际使用的是 `list` 的遍历，也就是 `list` 的迭代器。那么我们可以让这个函数 `fab` 每次只返回一个迭代器——一个计算结果，而不是一个完整的 `list`：

In [None]:
def fab(num):
  n, a, b = 0, 0, 1
  while n < num:
    yield b
    a, b = b, a + b
    n += 1
    
for x in fab(100):
  print(x)

我们每次调用`fab`函数或者 `next` 函数之类的，实际上的运行方式是每次的调用都在 `yield` 处中断并返回一个结果，然后再次调用的时候再恢复中断继续运行。