# 生成器与迭代器

- 序列  
实现有 `__getitem__()` 魔术方法的对象称为序列。字符串、列表、元组和字典是序列。

- 可迭代对象  
实现有`__iter__`魔术方法的对象称为可迭代对象。字符串、列表、元组和字典也是可迭代对象。集合是可迭代对象，但不是序列。

`for`循环来遍历可迭代对象的每一个元素。

## 可迭代对象（Iterable）

使用内置函数`hasattr()`：

In [None]:
for dtype in [str, list, tuple, dict, set]:
    print(str(dtype), hasattr(dtype(), '__iter__'))

显然整数、复数等数据类型不是可迭代对象：

In [None]:
for dtype in [int, bool, float, complex]:
    print(str(dtype), hasattr(dtype(), '__iter__'))

## 迭代器（Iterator）

迭代器(Iterator)是可以用`for`循环进行遍历的对象，使用内置函数`next()`依次返回元素。

访问迭代器对象的元素只能从第一个元素，直到访问完所有元素，最后引起`StopIteration`异常。

通过检查是否定义`__next__`方法来判断迭代器对象。

In [None]:
for dtype in [str, list, tuple, dict, set]:
    print(str(dtype), hasattr(dtype(), '__next__'))

使用内置函数 `iter()` 可以把可迭代对象转化为迭代器:

In [None]:
xs = (1, 2, 3)
ixs1 = iter(xs)
ixs2 = iter([1, 2, 3])
print(type(ixs1), type(ixs2))
print(hasattr(ixs1, '__next__'), hasattr(ixs2, '__next__'))

使用`next()`来访问元素：

In [None]:
print(next(ixs1))
print(next(ixs1))
print(next(ixs1))
print(next(ixs1))

迭代器实现有`__iter__`方法，可以使用`for`语句来进行迭代循环：

In [None]:
for x in ixs2:
    print(x)

## 生成器（generator）

### 有限的序列

假如要创建一个大的列表，就需要创建很多个对象，自然会耗费大量的内存。如果超出内存限制就会出现内存溢出异常。

在Linux系统，使用`ulimit`命令把内存限制到256M。
```sh
ulimit -v 262144
```

In [None]:
# Don't run the statement. The kernal will be killed.
# alist = list(range(1024*1024*1024*8))

### 无限的生成器

生成器（generator）是一个对象，通过调用内置函数`next()`可以依次返回不同值。

可以使用定义函数的方法来创建一个生成器，要做的工作仅仅是使用`yield`语句：

> 用时间换空间

In [None]:
def mygenerator():
    print('generator 1')
    yield 1
    print('generator 2')
    yield 3.1415
    print('generator 3')
    yield 'string'

In [None]:
print(type(mygenerator))

该函数的返回结果则有所不同：

In [None]:
gen = mygenerator()

print(type(gen), gen)

- 生成器对象包含了`__iter__`, 迭代器，可以像迭代器那样进行迭代操作。
- 生成器对象包含了`__next__`方法, 下面使用内置函数`next()`来迭代生成器元素：

In [None]:
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))

### 简单应用

In [None]:
def srange(n):
    i = 0
    while i < n:
        yield 'id{}'.format(i)
        i += 1

In [None]:
for s in srange(1024*1024*8):
    if s == 'id8000000':
        print(s)

### 元组推导式

In [None]:
xs = (i*i for i in range(3))
print(type(xs), xs)