# 迭代器(iterator)

在 python 中，迭代器是一种遵循特定协议的对象，允许我们遍历容器中的元素（如列表、元组、字典等，叫可迭代对象），而无需直接操作容器的内部数据结构。迭代器是 python 中非常重要的概念，它的实现机制和使用方式使得我们能够高效、简洁地处理集合数据。

## 1、 基本概念

迭代器是 python 中为了简化数据遍历而设计的一种机制。它的意义主要体现在以下几个方面：

统一访问接口：迭代器为各种容器提供统一的访问接口，不需要关心容器的具体实现。

懒加载：迭代器支持懒加载（lazy evaluation），即元素在需要时才被计算和返回。这使得它能处理非常大的数据集合，而不会一次性占用过多的内存。

内存效率：迭代器每次只生成一个元素，而不是一次性生成所有元素，从而节省内存。

简单且可扩展：通过迭代器协议，python 允许用户自定义迭代器类。

## 2、 迭代器的工作原理

迭代器遵循以下两个基本协议：

__iter__()：该方法返回一个迭代器对象。一个对象只要实现了 __iter__() 方法，它就可以被迭代。

__next__()：该方法返回容器中的下一个元素。如果没有元素可以返回，则抛出 StopIteration 异常，表示迭代结束。

在实际使用时，python 内部会自动调用 __next__() 方法来获取下一个元素，并在遍历完成后触发 StopIteration 异常，停止迭代。

## 3、 迭代器的用途和用法

迭代器常用于需要遍历集合数据的场景，常见用途包括：

遍历容器（如列表、元组、字典等）中的元素。

按需生成数据流（例如大文件处理、无限序列生成等）。

通过生成器（yield）实现惰性计算。

## 4、 迭代器的特点

惰性计算（Lazy Evaluation）：迭代器是一种惰性求值的方式，每次调用 __next__() 方法时才计算下一个元素。这使得迭代器特别适用于大数据量的处理，因为它不会一次性将所有元素加载到内存中。

一次性遍历：迭代器一旦被消耗，就不能重新遍历。如果需要重新迭代，必须创建一个新的迭代器实例。

节省内存：由于迭代器按需生成元素，而不是一次性加载整个集合，因此它比直接使用列表等数据结构更节省内存，尤其在处理大数据时非常有效。

兼容 for 循环：迭代器与 for 循环兼容，Python 会自动调用迭代器的 __next__() 方法来遍历容器，简化了代码。