# 如何理解 Python 迭代器/生成器

## 知识点

### 迭代器

- 迭代器是一个可以记住遍历位置的对象
- 迭代器从集合的第一个元素开始遍历，直至访问完所有元素，只会往前不会后退
- 迭代器有两个基本用法：`iter()` 和 `next()`，也可以用 `for` 循环遍历
- 迭代器遍历完所有元素后会抛出一个 `StopIteration`，表示遍历结束
- 字符串、列表、元组、集合并不是迭代对象，不能用 `next()` 访问，但可以用 `for` 循环遍历

### 生成器

- 生成器是一个使用了 `yield` 的函数
- 与普通函数不同，生成器每次返回一个迭代对象，只能用于迭代操作
- 在调用生成器的过程中，每次遇到 `yield` 时函数暂停并保存当前所有运行信息，返回 `yield` 的值，并在下一次从当前位置继续运行
- 生成器是一种特殊的迭代器，可以通过 `next()` 访问，也可以用 `for` 循环遍历

## 测试

In [1]:
# 迭代器基本用法：`iter()` 和 `next()`
# 遍历完所有元素后将抛出一个 `StopIteration` 表示遍历结束

ss = 'abc'
it = iter(ss)
print(next(it))
print(next(it))
print(next(it))
print(next(it))

a
b
c


StopIteration: 

In [3]:
# 为自定义类添加迭代器行为
# 每次返回一个当前值并记住下一个位置
# 方式一：实现 `__next__`，`__iter__` 返回 `self` 即可

class Reverse:
    """Iterator for looping over a sequence backwards."""
    def __init__(self, data):
        self._data = data
        self._index = len(data)
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self._index == 0:
            raise StopIteration
        self._index -= 1
        return self._data[self._index]

rev = Reverse('abc')
for char in rev:
    print(char)

c
b
a


In [11]:
# 方式二：实现 `__iter__` 返回一个迭代器，无需实现 `__next__`

class Reverse:
    """Iterator for looping over a sequence backwards."""
    def __init__(self, data):
        self._data = data
    
    def __iter__(self):
        lst = list(self._data)
        lst.reverse()
        return iter(lst)

rev = Reverse('abc')
for char in rev:
    print(char)

c
b
a


In [12]:
# 生成器的写法类似标准函数，只是使用了 `yield` 语句

def reverse(data):
    for index in range(len(data)-1, -1, -1):
        yield data[index]

for char in reverse('abc'):
    print(char)

c
b
a


In [15]:
# 普通函数与生成器

def func1():
    print("func1")

def func2():
    print("func2")
    yield 'a'
    yield 'b'
    yield 'c'

f1 = func1()    # 普通函数：进入 func1，输出"func1"
f2 = func2()    # 生成器：不进入 func2，无输出
print("=====")
for char in f2: # f2 被调用后才真正进入 func2 开始输出
    print(char)

func1
=====
func2
a
b
c
