# 可迭代对象,迭代器的范畴


凡是满足`Iterable`协议的都是可迭代对象.因此所有的容器都是可迭代对象,可迭代对象不管容量的大小,只要每次for循环都可以取出对象即可,因此迭代是数据处理的基石.扫描内存中放不下的数据集时，我们要找到一种惰性获取数据项的方式，即按需一次获取一个数据项.这就是迭代器模式（`Iterator pattern`）.而符合这一特征的数据类型就是`Iterator`迭代器.`Iterator`除了有`__iter__`外还要实现`next`方法.

## 生成器

生成器是python中最中要的数据模型之一,由它衍生而来的[协程](http://blog.hszofficial.site/TutorialForPython/%E6%B5%81%E7%A8%8B%E6%8E%A7%E5%88%B6/%E9%98%BB%E5%A1%9E%E5%BC%82%E6%AD%A5%E4%B8%8E%E5%8D%8F%E7%A8%8B.html)可以看这篇文章了解.

生成器实现需要实现接口`__iter__`,`__next__`,`send`,`throw`这4个方法,但也有更加简单的方式实现就是使用生成器函数

生成器函数就是带有`yield`的函数,它停止需要抛出`StopIteration`异常

## 最简单的可迭代对象--生成器表达式

列表解析通过一定的操作可以产生一个列表,而如果去掉`[]`,那就是惰性的生成器表达式了

### 何时使用生成器表达式

根据我的经验，选择使用哪种句法很容易判断：如果生成器表达式要分成多行写，我倾向
于定义生成器函数，以便提高可读性。此外，生成器函数有名称，因此可以重用。

In [2]:
a = (i for i in range(10))

In [3]:
type(a)

generator

In [4]:
for i in a:
    print(i)

0
1
2
3
4
5
6
7
8
9


## iter函数 用于创建迭代器

`iter`函数可以将一个可迭代对象转换为一个迭代器

In [9]:
a = iter([i for i in range(10)])


序列可以迭代的原因在于解释器需要迭代对象时，会自动调用`iter`.

内置的iter 函数有以下作用:

1. 检查对象是否实现了`__iter__` 方法，如果实现了就调用它，获取一个迭代器。
2. 如果没有实现`__iter__` 方法，但是实现了`__getitem__` 方法，Python 会创建一个迭代器，尝试按顺序（从索引0 开始）获取元素。
3. 如果尝试失败，Python 抛出`TypeError`异常，通常会提示'xxx object is not iterable'

当`iter`有第二个参数的时候,`iter`的作用是使用常规的函数或任何可调用的对象创建迭代器.这样使用时，

+ 第一个参数必须是可调用的对象，用于不断调用（没有参数），产出各个值
+ 第二个值是哨符，这是个标记值，当可调用的对象返回这个值时，触发迭代器抛出`StopIteration` 异常，而不产出哨符。

In [11]:
from random import randint

In [15]:
b = iter(lambda : randint(1,10),5)

In [16]:
for i in b:
    print(i)

8
9
7
9


# 可迭代对象的操作

### enumerate

`enumerate`方法可以获取可迭代对象的下表对应内容.

In [5]:
for i,v in enumerate((1,2,3,4,5)):
    print(i,v)

0 1
1 2
2 3
3 4
4 5


In [10]:
next(a)

0

### 拆包操作

python3支持可迭代对象的拆包操作,并且可以结合通配符达到一些很酷的效果

In [1]:
_,x,*last=range(10)

In [2]:
x

1

In [3]:
last

[2, 3, 4, 5, 6, 7, 8, 9]

## 内置的可迭代对象

可迭代对象作为python最中要的特性之一,已经被很多语言借鉴吸收,比如javascript在ES6标准中实现了生成器.

python3有大量的内置可迭代对象

### range(start,end,step)整数等差数列对象

In [18]:
[i for i in range(1,10,3)]

[1, 4, 7]

## 标准库中的生成器函数

## 生成器规约函数