## Iterables

**任何可以用 for in 来迭代读取的都是迭代容器，例如lists,strings,files.这些迭代器非常的便利，因为你可以想取多少便取多少，但是你得存储所有的值，其中很多值都完全没有必要每次都保持在内存中。**

In [1]:
# ex1
mylist = [x*x for x in xrange(3)]
for each in mylist: print each
for each in mylist: print each,

0
1
4
0 1 4


## Generators

Generators(生成器)也是可迭代的，但是你每次只能迭代它们一次，因为不是所有的迭代器都被一直存储在内存中的，他们临时产生这些值：

In [None]:
# ex2
mygenerator = (x*x for x in xrange(3))
for each in mygenerator: print each
for each in mygenerator: print each,
print "I was tired out"

生成器几乎和迭代器是相同的，除了符号[]变为()。但是你无法用两次，因为他们只生成一次：他们生成0然后丢弃，继续统计1，接着是4，一个接着一个。

## Yield

Yield的用法有点像return,除了它返回的是一个生成器，例如：

In [3]:
def createGenerator():
    mylist = xrange(3)
    for i in mylist:
        yield i*i

In [4]:
mygenerator = createGenerator() # create a generator
print(mygenerator) # mygenerator is an object!
for i in mygenerator:
    print(i)

<generator object createGenerator at 0x0000000003BDFC18>
0
1
4


createGenerator()生成的是一个生成器。

为了掌握yield的精髓，你一定要理解它的要点：当你调用这个函数的时候，你写在这个函数中的代码并没有真正的运行。这个函数仅仅只是返回一个生成器对象。有点过于奇技淫巧:-)

然后，你的代码会在每次for使用生成器的时候run起来。

现在是解释最难的地方：
当你的for第一次调用函数的时候，它生成一个生成器，并且在你的函数中运行该循环，直到它生成第一个值。然后每次调用都会运行循环并且返回下一个值，till没有值返回为止。该生成器被认为是空的一旦该函数运行但是不再yield。之所以如此是因为该循环已经到达终点，或者是因为你再也不满足“if/else”的条件。

In [5]:
class Bank(): # let's create a bank, building ATMs
    crisis = False
    def create_atm(self):
        while not self.crisis:
            yield "$1000"

In [6]:
hsbc = Bank() # when everything's ok the ATM gives you as much as you want

In [7]:
corner_street_atm = hsbc.create_atm()

In [8]:
print(corner_street_atm.next())

$1000


In [9]:
print(corner_street_atm.next())

$1000


In [10]:
print([corner_street_atm.next() for cash in range(5)])

['$1000', '$1000', '$1000', '$1000', '$1000']


In [11]:
print list(corner_street_atm.next() for cash in range(5))

['$1000', '$1000', '$1000', '$1000', '$1000']


In [12]:
hsbc.crisis = True # crisis is coming, no more money!

In [13]:
print corner_street_atm.next()

StopIteration: 

In [14]:
wall_street_atm = hsbc.create_atm() # it's even true for new ATMs

In [15]:
print(wall_street_atm.next())

StopIteration: 

In [16]:
hsbc.crisis = False # trouble is, even post-crisis the ATM remains empty

In [17]:
print(corner_street_atm.next())

StopIteration: 

In [18]:
brand_new_atm = hsbc.create_atm() # build a new one to get back in business

## Itertools模块

Itertools模块包含一些特别的函数去执行迭代器。有没有想过去复制一个生成器 或者链接两个生成器?等等。
引入itertools就好了，import itertools.
下面举个例子.看看四匹马到达先后顺序的例子：

In [19]:
import itertools
horses = [1, 2, 3, 4]
races = itertools.permutations(horses)
print(races)

<itertools.permutations object at 0x0000000003B714C0>


In [20]:
print(list(itertools.permutations(horses)))

[(1, 2, 3, 4), (1, 2, 4, 3), (1, 3, 2, 4), (1, 3, 4, 2), (1, 4, 2, 3), (1, 4, 3, 2), (2, 1, 3, 4), (2, 1, 4, 3), (2, 3, 1, 4), (2, 3, 4, 1), (2, 4, 1, 3), (2, 4, 3, 1), (3, 1, 2, 4), (3, 1, 4, 2), (3, 2, 1, 4), (3, 2, 4, 1), (3, 4, 1, 2), (3, 4, 2, 1), (4, 1, 2, 3), (4, 1, 3, 2), (4, 2, 1, 3), (4, 2, 3, 1), (4, 3, 1, 2), (4, 3, 2, 1)]


最后是理解迭代器的内部机制：
Iteration is a process implying iterables (implementing the __iter__() method) and iterators (implementing the __next__() method). Iterables are any objects you can get an iterator from. Iterators are objects that let you iterate on iterables.

如何生成斐波那契數列
-----
def fab(max):
n, a, b = 0, 0, 1
while n < max:
print b
a, b = b, a + b
n = n + 1
通过 iterable 对象来迭代

for i in range(1000): pass
会导致生成一个 1000 个元素的 List，而代码：
for i in xrange(1000): pass
则不会生成一个 1000 个元素的 List，而是在每次迭代中返回下一个数值，内存空间占用很小。因
为 xrange 不返回 List，而是返回一个 iterable 对象。
利用 iterable 我们可以把 fab 函数改写为一个支持 iterable 的 class，以下是第三个版本的 Fab：

In [2]:
class Fab(object):
    
    def __init__(self, max):
        self.max = max
        self.n, self.a, self.b = 0,0,1
    
    def __iter__(self):
        return self
    
    def next(self):
        if self.n < self.max:
            r = self.b
            self.a, self.b = self.b, self.a+self.b
            self.n += 1
            return r
        raise StopIteration()

Fab 类通过 next() 不断返回数列的下一个数，内存占用始终为常数：

In [3]:
for n in Fab(5):print n

1
1
2
3
5


然而，使用 class 改写的这个版本，代码远远没有第一版的 fab 函数来得简洁。如果我们想要保持
第一版 fab 函数的简洁性，同时又要获得 iterable 的效果，yield 就派上用场了：

In [4]:
def fab(max):
    n, a, b = 0, 0, 1
    while n < max:
        yield b
        # print b
        a, b = b, a + b
        n += 1

第四个版本的 fab 和第一版相比，仅仅把 print b 改为了 yield b，就在保持简洁性的同时获得了
iterable 的效果。
调用第四版的 fab 和第二版的 fab 完全一致：

In [6]:
for n in fab(5):print n

1
1
2
3
5


简单地讲，yield 的作用就是把一个函数变成一个 generator，带有 yield 的函数不再是一个普通函
数，Python 解释器会将其视为一个 generator，调用 fab(5) 不会执行 fab 函数，而是返回一个
iterable 对象！在 for 循环执行时，每次循环都会执行 fab 函数内部的代码，执行到 yield b 时，
fab 函数就返回一个迭代值，下次迭代时，代码从 yield b 的下一条语句继续执行，而函数的本地
变量看起来和上次中断执行前是完全一样的，于是函数继续执行，直到再次遇到 yield。
也可以手动调用 fab(5) 的 next() 方法（因为 fab(5) 是一个 generator 对象，该对象具有 next() 方
法），这样我们就可以更清楚地看到 fab 的执行流程：

In [7]:
f = fab(5)
f.next()
f.next()
f.next()
f.next()

3

In [8]:
f.next()

5

In [9]:
f.next()

StopIteration: 

当函数执行结束时，generator 自动抛出 StopIteration 异常，表示迭代完成。在 for 循环里，无需
处理 StopIteration 异常，循环会正常结束。

如何判断一个函数是否是一个特殊的 generator 函数？可以利用 isgeneratorfunction 判断：
--

In [11]:
from inspect import isgeneratorfunction

In [12]:
isgeneratorfunction(fab)

True

要注意区分 fab 和 fab(5)，fab 是一个 generator function，而 fab(5) 是调用 fab 返回的一个
generator，好比类的定义和类的实例的区别：

类的定义和类的实例
--

In [14]:
import types

In [15]:
isinstance(fab, types.GeneratorType)

False

In [17]:
isinstance(fab(5), types.GeneratorType)

True

**fab 是无法迭代的，而 fab(5) 是可迭代的：**

In [18]:
from collections import Iterable
isinstance(fab, Iterable)

False

In [19]:
isinstance(fab(5), Iterable)

True

另一个例子
===

另一个 yield 的例子来源于文件读取。如果直接对文件对象调用 read() 方法，会导致不可预测的内
存占用。好的方法是利用固定长度的缓冲区来不断读取文件内容。通过 yield，我们不再需要编写
读文件的迭代类，就可以轻松实现文件读取：

In [23]:
def read_file(fpath):
    BLOCK_SIZE = 1024
    with open(fpath, 'rb') as f:
        while True:
            block = f.read(BLOCK_SIZE)
            if block:
                yield block
            else:
                return

In [25]:
print """
return 的作用
在一个 generator function 中，如果没有 return，则默认执行至函数完毕，如果在执行过程中
return，则直接抛出 StopIteration 终止迭代。
"""


return 的作用
在一个 generator function 中，如果没有 return，则默认执行至函数完毕，如果在执行过程中
return，则直接抛出 StopIteration 终止迭代。

