# 14_可迭代的对象、迭代器和生成器

- 迭代器用途：
    * for循环；
    * 构建和拓展集合类型；
    * 逐行遍历文本文件；
    * 列表推导、字典推导和集合推导；
    * 元组拆包；
    * 调用函数时，使用*拆包实参。

## 14.1 案例：单次序列

- 定义一个类，通过索引从文本中提取单词。

- 基础版

In [2]:
import re
import reprlib

RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)
    
    def __getitem__(self, index):
        return self.words[index]
    
    def __len__(self): 
        return len(self.words)
    
    def __repr__(self):
        """ 简化字符串的表示形式，最多有30个字符。 """
        return f"Sentence: {reprlib.repr(self.text)}"

In [10]:
s = Sentence('The time has come, the Walrus said,')
display(s)

for w in s:
    print(w)
    
display(list(s), s[1], s[2])

Sentence: 'The time has... Walrus said,'

The
time
has
come
the
Walrus
said


['The', 'time', 'has', 'come', 'the', 'Walrus', 'said']

'time'

'has'

- `iter` 函数
    * 检查对象是否实现了 `__iter__` 方法，如果实现了就调用它，获取一个迭代器。
    * 如果没有实现 `__iter__` 方法，但是实现了 `__getitem__` 方法，Python 会创建一个迭代器，尝试按顺序（从索引0 开始）获取元素。
    * 如果不可迭代，Python 抛出TypeError 异常，通常会提示“C object is not iterable”（C对象不可迭代），其中C 是目标对象所属的类。

In [25]:
class Foo:
    def __iter__(self):
        pass
    
from collections import abc

display(issubclass(Foo, abc.Iterable))

f = Foo()
display(isinstance(f, abc.Iterable))  # 检查是否可以迭代

try:
    iter(f)   # 检查是否可迭代
except Exception as e:
    print(e)

True

True

iter() returned non-iterator of type 'NoneType'


## 14.2 可迭代对象与迭代器的对比

- 可迭代对象：  
    使用 `iter` 内置函数可以获取迭代器的对象。如果对象实现了能返回迭代器的 `__iter__` 方法，那么对象就是可迭代的。序列都可以迭代；实现了 `__getitem__` 方法，而且其参数是从零开始的索引，这种对象也可以迭代。
