# Python迭代器和生成器教程

本教程将深入介绍Python中的迭代器（Iterator）和生成器（Generator）概念，包括它们的实现原理、使用场景和最佳实践。通过实践示例，你将掌握如何创建和使用这些强大的Python特性。

## 1. 迭代器基础

在Python中，迭代器是一个实现了迭代器协议的对象。迭代器协议包含两个方法：
- `__iter__()`: 返回迭代器对象自身
- `__next__()`: 返回下一个值，如果没有更多值可返回，则抛出StopIteration异常

让我们通过示例来理解迭代器的工作原理。

In [None]:
class CountDown:
    """一个简单的倒计时迭代器"""
    def __init__(self, start):
        self.start = start
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.start <= 0:
            raise StopIteration
        self.start -= 1
        return self.start + 1

# 使用示例
count = CountDown(5)
for num in count:
    print(num)

## 2. 迭代器进阶

### 2.1 可迭代对象（Iterable）
可迭代对象是实现了`__iter__`方法的对象，该方法返回一个迭代器。常见的可迭代对象包括列表、元组、字典等。

### 2.2 iter()和next()函数
Python提供了内置函数`iter()`和`next()`来操作迭代器：
- `iter(obj)`: 获取可迭代对象的迭代器
- `next(iterator)`: 获取迭代器的下一个值

In [None]:
# 使用iter()和next()函数
my_list = [1, 2, 3, 4, 5]
iterator = iter(my_list)

try:
    while True:
        item = next(iterator)
        print(item)
except StopIteration:
    print('迭代完成')

## 3. 生成器基础

生成器是一种特殊的迭代器，使用yield语句来生成值。生成器函数在调用时会返回一个生成器对象。

生成器的优点：
1. 内存效率高：值是按需生成的，不需要一次性加载所有数据到内存
2. 代码简洁：不需要实现`__iter__`和`__next__`方法
3. 维护状态：函数会在yield处暂停，保持局部变量的状态

In [None]:
def fibonacci(n):
    """生成斐波那契数列的生成器函数"""
    a, b = 0, 1
    for _ in range(n):
        yield a
        a, b = b, a + b

# 使用生成器
for num in fibonacci(10):
    print(num)

## 4. 生成器表达式

生成器表达式是创建生成器的简洁方式，类似于列表推导式，但使用圆括号而不是方括号。生成器表达式更节省内存，因为它不会一次性生成所有值。

In [None]:
# 列表推导式 vs 生成器表达式
list_comp = [x * x for x in range(1000000)]  # 立即生成所有值
gen_exp = (x * x for x in range(1000000))   # 按需生成值

# 验证内存使用差异
print(f'列表推导式占用内存：{sys.getsizeof(list_comp)} bytes')
print(f'生成器表达式占用内存：{sys.getsizeof(gen_exp)} bytes')

# 使用生成器表达式
for i in (x * x for x in range(5)):
    print(i)

## 5. 生成器的高级特性

生成器除了`__next__`方法外，还有其他重要的方法：
- `send()`: 向生成器发送值
- `throw()`: 向生成器抛出异常
- `close()`: 关闭生成器

这些方法使生成器成为协程的基础。

In [None]:
def counter():
    i = 0
    while True:
        val = yield i
        if val is not None:
            i = val
        else:
            i += 1

# 使用send方法
c = counter()
print(next(c))       # 初始化生成器
print(c.send(10))    # 发送值10
print(next(c))       # 继续生成下一个值
print(next(c))

## 6. yield from

`yield from`是Python 3.3引入的语法，用于重构生成器。它可以：
1. 从其他生成器中yield值
2. 简化生成器嵌套
3. 支持子生成器的委托

In [None]:
def sub_gen(n):
    for i in range(n):
        yield i

def main_gen(n):
    # 使用yield from委托给子生成器
    yield from sub_gen(n)
    yield from 'ABC'  # 字符串也是可迭代对象

# 使用yield from
for item in main_gen(3):
    print(item)

## 7. 最佳实践总结

在使用迭代器和生成器时，请记住以下几点：

1. **选择合适的工具**
   - 需要遍历大量数据时，使用生成器可以节省内存
   - 需要多次遍历同一个序列时，使用列表可能更合适

2. **性能考虑**
   - 生成器表达式比列表推导式更节省内存
   - 生成器一旦遍历完就不能重新开始，需要重新创建

3. **代码可读性**
   - 使用生成器函数来处理复杂的迭代逻辑
   - 使用生成器表达式处理简单的映射和过滤

4. **异常处理**
   - 记得处理StopIteration异常
   - 在生成器中使用try/finally确保资源正确释放

5. **调试技巧**
   - 使用print语句或日志来追踪生成器的执行流程
   - 考虑将生成器转换为列表来查看所有值