# 第八章F：迭代器和生成器

## 1. 容器Container

所谓容器类型，就是能存储元素的数据结构。在Python中有很多容器类型，如List，tuple，str，set，dict等都是容器类型。我们这儿也可以定义自己的容器类型：

In [23]:
class Fib():
    def __init__(self, limit=10):
        self.prev = 0
        self.curr = 1
        self.limit = limit

    def __iter__(self):
        return self

    def __next__(self):
        if self.curr >= self.limit:
            raise StopIteration
        else:
            self.curr, self.prev = self.prev + self.curr, self.curr
            return self.curr

fib = Fib(10)
for i in fib:
    print(i)

1
2
3
5
8
13


这里`for ...in...`实际上调用了两个方法：
  * `__iter__()`在启动`for`的时候作为迭代器被调用，开始构造容器对象
  * `__next__()`在每一次循环中被调用，每次返回一个元素
  
对于这个`Container`类来说，定义了`__iter__()`和`__next__`两种方法，所以其就是可迭代的类或对象。

### <font color="red">练习</font>

1. 对上面的程序来说，输出的最后一个元素大于我们设定的limit，所以程序其实是有错的，那么怎么修改呢？

2. 如果想要将limit的意义修改为输出元素的个数，又该怎么修改呢？

In [43]:
"""
Fib is an iterator for generating Fibonacci series.

Fib(n) will generate the series within the range (0, n).
"""
class Fib():
    def __init__(self, limit=10):
        self.prev = 0
        self.curr = 1
        self.limit = limit

    def __iter__(self):
        return self

    def __next__(self):
        self.curr, self.prev = self.prev + self.curr, self.curr
        if self.curr > self.limit:
            raise StopIteration
        else: 
            return self.curr

fib = Fib(10)
for i in fib:
    print(i)

1
2
3
5
8


In [34]:
"""
Fib is an iterator for generating Fibonacci series.

Fib(n) will generate the series containing n numbers.
"""
class Fib():
    def __init__(self, limit=10):
        self.prev = 0
        self.curr = 1
        self.limit = limit

    def __iter__(self):
        return self

    def __next__(self):
        self.limit -= 1
        if self.limit < 0:
            raise StopIteration
        else:
            self.curr, self.prev = self.prev + self.curr, self.curr
            return self.curr

fib = Fib(10)
for i in fib:
    print(i)

1
2
3
5
8
13
21
34
55
89


## 2. 迭代器Iterator

只要含有`__next__()`方法的类就是迭代器，所以这里`Fib`类就是一个迭代器。通过迭代器，我们可以遍历容器中的元素。

对于迭代器来说，`__iter__()`方法并不是必须的，但是，如果没有它，会导致不方便。

In [24]:
class Fib():
    
    def __init__(self, limit=10):
        self.prev = 0
        self.curr = 1
        self.limit = limit
    
    def __next__(self):
        if self.curr >= self.limit:
            raise StopIteration      
        else:
            self.curr, self.prev = self.curr + self.prev, self.curr
            return self.curr
        
c = Fib(10)
for i in range(10):
    try:
        print(next(c))
    except StopIteration as e:
        break

1
2
3
5
8
13


## 3. 生成器Generator

生成器是一种特殊的迭代器。当调用生成器函数的时候，会实例化一个生成器，但并不执行任何代码，只有当真正被使用的时候才会调用内部的`__next__()`方法。因此，生成器要比列表等容器相比效率要更高，因为列表要占用更多的内存。

比如下面这个例子的Fibonacci序列生成器函数，其关键就是使用了`yield`：

In [50]:
def fib(n=100):
    """fib(n) is a generator function to yield Fibonacci series smaller than n."""
    prev, curr = 0, 1
    
    while curr < n:
        yield curr
        prev, curr = curr, prev + curr

In [36]:
print(fib.__doc__)

fib(n) is a generator function to yield Fibonacci series smaller than n.


In [15]:
for item in fib(1000):
    print(item)

1
1
2
3
5
8
13
21
34
55
89
144
233
377
610
987


## 小结

- 生成器是一类特殊的迭代器，区别是生成器只能遍历一次，而且用`yield`代替了`return`，只在需要的时候才产生结果，不是立即产生结果。

In [73]:
def log(n):
    while n > 0:
        yield n
        n -= 1

In [74]:
for x in log(10): print(x)

10
9
8
7
6
5
4
3
2
1
