典型的迭代器

In [2]:
import re
import reprlib

class SentenctIterator:
    def __init__(self, words):
        # SentenceIterator实例引用单词列表。
        self.words = words
        #  self.index用于确定下一个要获取的单词。
        self.index = 0

    # 获取索引位置上的单词，如果没有，就抛出StopIterator异常
    def __next__(self):
        try:
            word = self.words[self.index]
        except IndexError:
            raise StopIteration()
        self.index += 1
        return word

    # 实现iter方法
    def __iter__(self):
        return self


RE_WORD = re.compile('\w+')

class Sentence:
    def __init__(self, text) -> None:
        self.text = text
        # re.findall函数返回一个字符串列表，里面的元素是正则表达式的全部非重叠匹配。
        self.words = RE_WORD.findall(text)

    #————————————V1——————————————
    
    #  为了完善序列协议，我们实现了__len__方法；不过，为了让对象可以迭代，没必要实现这个方法。
    def __len__(self):
        return len(self.words)

    # reprlib.repr这个实用函数用于生成大型数据结构的简略字符串表示形式。
    def __repr__(self) -> str:
        return "Sentence(%s)" % reprlib.repr(self.text)
    
    #————————————V2——————————————
    # 这一版没有__getitem__方法，为的是明确表明这个类可以迭代，因为实现了__iter__方法。
    def __iter__(self):
        # 根据可迭代协议，__iter__方法实例化并返回一个迭代器。
        return SentenceIterator(self.words)
