# 迭代器 & 可迭代对象 & 生成器


## 迭代器

迭代器（Iterator）是一种对象，它允许按照一定顺序逐个访问集合或序列中的元素，而不需要事先知道整个集合的内容。迭代器提供了一种惰性计算（lazy evaluation）的方式，只在需要时生成或提供下一个元素。

迭代器既可以通过循环遍历，也可以通过 `next` 方法逐个访问元素。

`iter` 方法可以生成一个可迭代对象的迭代器。


In [136]:
try:
    # 生成一个列表的迭代器
    it = iter([1, 2, 3, 4])

    # 循环遍历迭代器
    for item in it:
        print(item)

    # 通过 next 方法获取迭代器元素，由于循环已经将迭代器迭代完，所以此时没有元素可迭代，会引发 StopIteration 异常
    next(it)
except StopIteration:
    print("迭代器遍历完成")

1
2
3
4
迭代器遍历完成


### 自定义迭代器

迭代器类需要实现两个方法 `__iter__` 与 `__next__`，`__iter__` 返回迭代器对象本身，`__next__` 返回迭代器中的下一个元素，当迭代器中没有元素可供返回时，`__next__` 应引发 `StopIteration` 异常，指示迭代的结束。

当使用循环遍历迭代器时，循环会自动调用 `__next__` 方法来获取下一个元素，直到迭代结束。


In [137]:
class MyIterator:
    def __init__(self, my_list):
        self.my_list = my_list
        self.index = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.index >= len(self.my_list):
            raise StopIteration
        else:
            result = self.my_list[self.index]
            self.index += 1
            return result


try:
    it = MyIterator([1, 2, 3, 4])

    for item in it:
        print(item)

    next(it)
except StopIteration:
    print("迭代器遍历完成")

1
2
3
4
迭代器遍历完成


## 可迭代对象

可迭代对象是指内部实现了迭代器协议的对象。迭代器协议要求对象提供 `__iter__` 方法，该方法返回一个迭代器对象。
`iter` 方法可通过调用 `__iter__` 返回可迭代对象的迭代器对象。


In [138]:
class MyIterable:
    def __init__(self, data):
        self.data = data

    def __iter__(self):
        return MyIterator(self.data)


try:
    my_iterable = MyIterable([1, 2, 3, 4, 5])
    it = iter(my_iterable)

    print(next(it))

    for item in it:
        print(item)

    next(it)
except StopIteration:
    print("迭代器遍历完成")

1
2
3
4
5
迭代器遍历完成


字典（Dictionary）：字典（dict）对象也是可迭代的。在迭代字典时，默认情况下会按照键（key）的顺序逐个返回键值对（key-value pair）。

文件对象（File Object）：打开的文件对象也是可迭代的。在迭代文件对象时，会逐行返回文件的内容。

生成器（Generator）


In [139]:
# 一些可迭代对象


set.__iter__  # 集合
frozenset.__iter__  # 冻结集合

dict.__iter__  # 字典
bytearray.__iter__  # 字节数组
bytes.__iter__  # 字节串

# 序列
str.__iter__  # 字符串
tuple.__iter__  # 元组
list.__iter__  # 列表

<slot wrapper '__iter__' of 'bytes' objects>

## 生成器

生成器（Generator）是一种特殊的迭代器，它使用函数的形式来定义，通过 yield 语句产生值。生成器函数可以暂停执行并在需要时恢复执行，从而实现按需生成值的效果。

相比迭代器，生成器更简洁，更易于维护。


In [140]:
try:
    list = [1, 2, 3, 4]

    def my_generator(val: list):
        for item in val:
            yield item

    gen = my_generator(list)

    for item in gen:
        print(item)

    next(gen)
except StopIteration:
    print("生成器遍历完成")

1
2
3
4
生成器遍历完成
