迭代是数据处理的基石 扫描内存中放不下的数据集时 我们要找到一种惰性获取数据的方式 即按需一次获取一个数据项 这就是迭代器模式

** 所有的生成器都是迭代器 **

### 可迭代对象和迭代器

#### 可迭代对象
使用iter()内置函数可以获取到迭代器的对象。如果对象实现了能够返回迭代器的`__iter__`方法，或者实现了`__getitem__`方法，而且其参数是从0开始的索引，则为可迭代对象

In [1]:
import re

In [2]:
import reprlib

In [3]:
RE_WORD = re.compile('\w+')

** 下面以Sentence类为例 **

In [5]:
class Sentence:
    
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)
    
    def __getitem__(self, index):
        return self.words[index]
    
    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)

上面的Sentence类实现了 `__getitem__` 方法
注意：当解释器要迭代对象x时 会自动调用iter(x)。
iter函数有以下作用：检查对象是否实现了`__iter__`方法，如果实现了就调用他，获取一个迭代器。
如果没有实现但是实现了`__getitem__`方法 python就会创建一个迭代器，并尝试按照顺序获取元素
#### 下面实现一个正统的可迭代对象

In [6]:
class Sentence:
    
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)
        
    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)
    
    def __iter__(self):
        return SentenceIterator(self.words)

iter方法返回的是一个迭代器对象，也就是下面的对象。
> 迭代器的定义：
> 实现了无参数的`__next__`方法，返回序列的下一个元素 如果没有元素了那么就抛出StopIteration异常
> python中迭代器还实现了`__iter__`方法因此迭代器也可以迭代

In [7]:
class SentenceIterator:
    
    def __init__(self, words):
        self.words = words
        self.index = 0
    
    def __next__(self):
        try:
            word = self.words[self.index]
        except IndexError:
            raise StopIteration()
        self.index += 1
        return word
    
    def __iter__(self):
        return self

#### 用生成器函数简化可迭代对象

In [8]:
class Sentence:
    
    def __init__(self, text):
        self.text = text
        slef.words = RE_WORD.findall(text)
        
    def __iter__(self):
        for word in self.words:
            yield word

#### 使用生成器表达式简化可迭代对象

In [13]:
class Sentence:
    
    def __init__(self, text):
        self.text = text
    
    def __iter__(self):
        return (match.group() for match in RE_WORD.finditer(self.text))
    
    def __repr__(self):
        return 'Sentence(%s)' % reprlib.repr(self.text)

In [14]:
s = Sentence('hi lucky guy')

In [15]:
s

Sentence('hi lucky guy')

In [17]:
st = iter(s)

In [18]:
st

<generator object Sentence.__iter__.<locals>.<genexpr> at 0x109b35200>

In [19]:
next(st)

'hi'

In [21]:
for item in st:
    print(item)

lucky
guy


In [22]:
next(st)

StopIteration: 