![](2023-03-16-17-42-09.png)

可迭代对象包含了迭代器，序列，字典等，其中序列包括列表、元组、集合以及字符串。
先理解一下可迭代对象是什么，就是可以通过for in 读取其中每一个元素的对象，换了句话说就是实现了__iter__方法的对象。
那么迭代器作为可迭代对象的子集，说明它一定是实现了__iter__方法的，只是相比于可迭代对象，迭代器对象还实现了__next__方法，可以用来记录每次遍历的位置。
- 可迭代对象实现__iter__方法
- 迭代器对象实现了__iter__和__next__方法\
下面是对比：

In [6]:
X = [1, 2, 3, 4, 5]
print(type(X))
print(1 in X)
print(2 not in X)
for x in X:
    print(x)

<class 'list'>
True
False
1
2
3
4
5


In [7]:
next(X)
# TypeError: 'list' object is not an iterator

TypeError: 'list' object is not an iterator

# 迭代器
它是一个可以记住遍历位置的对象，区别于其他可迭代对象的就是next()方法以及__next__()的实现，可以通过iter()函数将可迭代对象转化为迭代器对象

In [8]:
X = [1, 2, 3, 4, 5]
Y = iter(X)
print(type(X), type(Y))
print(next(Y))
print(next(Y))


<class 'list'>
<class 'list'> <class 'list_iterator'>
1
2


In [4]:
# 这里简单的实现了一个迭代器对象
class Iterator(object):
    def __init__(self, array) -> None:
        self.x = array
        self.index = 0

    def __iter__(self):
        return self
    
    def __next__(self):
        if self.index < len(self.x):
            value = self.x[self.index]
            self.index += 1 
        else:
            raise StopIteration
        return value

t = Iterator([1, 2, 3])
for i in t:
    print(i)

1
2
3


# 生成器
很常见的一句话就是，生成器一定是迭代器，迭代器不一定是生成器。
生成器的关键字yield或yield from，在python函数中替换return返回值。也就是，用yield返回值的就是生成器。

In [11]:
def generator(array):
    for i in array:
        yield(i)

print(type(generator([1, 2, 3])))

<class 'generator'>


In [12]:
def generator(array):
    for sub_array in array:
        yield from sub_array

gen = generator([(1, 2, 3), (4, 5, 6)])
for i in gen:
    print(i)

1
2
3
4
5
6


读到这里可以会有疑惑，从这个示例看来生成器和迭代器并没有什么区别啊？为什么生成器还可以称得上是Python中的一大亮点？

首先它对比于迭代器在编码方面更加简洁，这是显而易见的，其次生成器运行速度更快，最后一点，也是需要着重说明的一点：节省内存。

也许在一些理论性实验、学术论文阶段可以不考虑这些工程化的问题，但是在公司做项目时，内存和资源占用是无法逃避的问题 。如果我们使用其他可迭代对象处理庞大的数据时，当创建或者返回值时会申请用于存储整个可迭代对象的内存，显然这是非常浪费的，因为有的元素当前我们用不到，也不会去访问，但它却一直占用这内存。这时候就体现了生成器的优点，它不是一次性把所有的结果都返回，而是当我们每读取一次，它会返回一个结果，当我们不读取时，它就是一个生成器表达式，几乎不占用内存。

In [13]:
# 生成器表达式
X = [1, 2, 3, 4, 5]
gen = (i for i in X) # 生成器表达式
print(type(gen))

it = [i for i in X] # 列表表达式
print(type(it))

<class 'generator'>
<class 'list'>
