In [None]:
import re
import reprlib

RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text):
        self.text = text
        self.words = RE_WORD.findall(text)
    def __repr__(self):
        return 'Sentence(%s)'%reprlib.repr(self.text)
    def __iter__(self):
        # 迭代self.words
        for word in self.words:
            # 产出当前的word
            yield word
        # 这个return语句不是必要的
        return


**生成器函数的工作原理**

In [1]:
# 只要Python函数中包含关键字yield，该函数就是生成器函数。
def gen_123():
    # 生成器函数的定义体中通常都有循环，不过这不是必要条件；这里我重复使用3次yield。
    yield 1
    yield 2
    yield 3

In [2]:
# gen_123是函数对象。
gen_123

<function __main__.gen_123()>

In [3]:
# gen_123返回生成器对象
gen_123()

<generator object gen_123 at 0x000001ECA79F6580>

In [4]:
# 生成器是迭代器，会生成传给yield关键字的表达式的值。
for i in gen_123():
    print(i)

1
2
3


In [5]:
g = gen_123()
# 因为g是迭代器，所以调用next(g)会获取yield生成的下一个元素。
next(g)

1

In [6]:
next(g)

2

In [7]:
next(g)

3

In [8]:
next(g)

StopIteration: 

In [9]:
# 定义生成器函数的方式与普通的函数无异，只不过要使用yield关键字。
def gen_AB():
    print('start')
    # 在for循环中第一次隐式调用next()函数时，会打印'start'，然后停在第一个yield语句，生成值'A'。
    yield 'A'
    print('continue')
    # 在for循环中第二次隐式调用next()函数时，会打印'continue'，然后停在第二个yield语句，生成值'B'。
    yield 'B'
    # 第三次调用next()函数时，会打印'end.'，然后到达函数定义体的末尾，导致生成器对象抛出StopIteration异常。
    print('end')

#  迭代时，for机制的作用与g=iter(gen_AB())一样，用于获取生成器对象，然后每次迭代时调用next(g)。
for c in gen_AB():
    # 循环块打印-->和next(g)返回的值。但是，生成器函数中的print函数输出结果之后才会看到这个输出。
    print('-->', c)

start
--> A
continue
--> B
end
