# itertools - 创建迭代器以实现高效循环的函数
- 这个模块实现了一些迭代器构件，其灵感来自 APL、Haskell 和 SML 的结构。每个迭代器都以适合 Python 的形式进行了重构。

- 该模块将一组核心的快速、高效的内存工具标准化，这些工具本身或结合起来都很有用。它们共同组成了一个 "迭代器代数"，使得在纯 Python 中简洁有效地构建专门的工具成为可能。

- 例如，SML提供了一个制表工具：tabulate(f)，它产生一个序列f(0), f(1), .... 同样的效果可以在Python中通过结合map()和count()形成map(f, count())来实现。

- 这些工具和它们内置的对应工具也能很好地与运算符模块中的高速函数一起工作。例如，乘法运算符可以被映射到两个向量上，形成一个高效的点乘：sum(map(operator.mul, vector1, vector2))。
# 类型
- 无限迭代器
- 终止于最短输入序列的迭代器
- 组合式迭代器


下面的模块函数都构造并返回迭代器。有些函数提供了无限长的流，所以它们只能被截断流的函数或循环所访问。

# itertools.accumulate(iterable[, func, *, initial=None])
- 生成一个迭代器，返回累积的总和，或者其他二进制函数的累积结果（通过可选的func参数指定）。

- 如果func被提供，它应该是一个两个参数的函数。输入迭代器的元素可以是任何可以被接受为func参数的类型。(例如，在默认的加法运算中，元素可以是任何可加类型，包括小数或分数）。)

- 通常情况下，输出的元素数量与输入的可迭代元素相匹配。然而，如果提供了关键字参数initial，累积就会以初始值为先导，这样输出的元素就会比输入的iterable多一个。

## operator
operator模块输出了一组与 Python 本身的操作符相对应的有效函数。例如，operator.add(x, y) 相当于表达式 x+y。许多函数名称是那些用于特殊方法的名称，没有双下划线。为了向后兼容，许多都有一个保留双下划线的变体。为了清晰起见，不含双下划线的变体是首选。

这些函数分为几类，分别执行对象比较、逻辑运算、数学运算和序列运算。

对象比较函数对所有对象都有用，并以它们支持的丰富的比较运算符命名。

operator.lt(a, b)
operator.le(a, b)
operator.eq(a, b)
operator.ne(a, b)
operator.ge(a, b)
operator.gt(a, b)

In [6]:
# 相当于自定义函数实现
import operator
def accumulate(iterable, func=operator.add, *, initial=None):
    '''
    Args:
        iterable: 可迭代对象
        func: 函数对象
        initial: 初始值

    Returns:
    
    '''
    'Return running totals'
    # accumulate([1,2,3,4,5]) --> 1 3 6 10 15
    # accumulate([1,2,3,4,5], initial=100) --> 100 101 103 106 110 115
    # accumulate([1,2,3,4,5], operator.mul) --> 1 2 6 24 120
    it = iter(iterable)
    total = initial
    if initial is None:
        try:
            total = next(it)
        except StopIteration:
            return
    yield total
    for element in it:
        total = func(total, element)
        yield total

In [4]:
data = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
list(accumulate(data, operator.mul))     # 累乘


[3, 12, 72, 144, 144, 1296, 0, 0, 0, 0]

In [7]:
list(accumulate(data, max))         # 球最大值

[3, 4, 6, 6, 6, 9, 9, 9, 9, 9]

In [None]:
itertools.chain(*iterables)∥。
制作一个迭代器，从第一个迭代器中返回元素，直到它被耗尽，然后继续到下一个迭代器，直到所有的迭代器都是e

# itertools.chain(*iterables)
生成一个迭代器，从第一个迭代器返回元素，直到它被耗尽，然后继续到下一个迭代器，直到所有的迭代器被耗尽。用于将连续的序列合成一个单一的序列。大致相当于。

In [15]:
def chain(*iterables):
    # chain('ABC', 'DEF') --> A B C D E F
    for it in iterables:
        for element in it:
            yield element

In [16]:
list(chain('ABC', 'DEF') )

['A', 'B', 'C', 'D', 'E', 'F']

## classmethod chain.from_iterable(iterable)
chain()的备用构造函数。从一个可迭代的参数中获取链式输入，该参数被懒散地评估。
大致相当于。

In [19]:
def from_iterable(iterables):
    # chain.from_iterable(['ABC', 'DEF']) --> A B C D E F
    for it in iterables:
        for element in it:
            yield element

In [23]:
list(from_iterable(['ABC','DEF']))

['A', 'B', 'C', 'D', 'E', 'F']

# itertools.combinations(iterable, r)
- 从输入的迭代器中返回长度为r的元素子序列。
- 元组里面的组合是按照输入迭代器的顺序以词典排序的方式创建的。因此，如果输入的迭代器是排序的，组合图元将以排序的顺序产生。

- 元素的唯一性是基于它们的位置，而不是基于它们的值。因此，如果输入元素是唯一的，每个组合中就不会有重复的值。

大致相当于。

In [8]:
def combinations(iterable, r):
    # combinations('ABCD', 2) --> AB AC AD BC BD CD
    # combinations(range(4), 3) --> 012 013 023 123
    pool = tuple(iterable)
    n = len(pool)
    if r > n:
        return
    indices = list(range(r))
    yield tuple(pool[i] for i in indices)
    while True:
        for i in reversed(range(r)):
            if indices[i] != i + n - r:
                break
        else:
            return
        indices[i] += 1
        for j in range(i+1, r):
            indices[j] = indices[j-1] + 1
        yield tuple(pool[i] for i in indices)

In [11]:
list(combinations('ABCD', 2))

[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D'), ('C', 'D')]

In [13]:
list(combinations(range(4), 3))

[(0, 1, 2), (0, 1, 3), (0, 2, 3), (1, 2, 3)]

In [36]:
list(combinations("ABC",2))

[('A', 'B'), ('A', 'C'), ('B', 'C')]

# itertools.combinations_with_replacement(iterable, r)
- 从输入的迭代器中返回r长度的元素子序列，允许单个元素重复一次以上。

- 组合图元是按照输入迭代器的顺序以词汇学排序的方式发出的。因此，如果输入的迭代器是排序的，组合图元将以排序的顺序产生。

- 元素的唯一性是基于它们的位置，而不是基于它们的值。因此，如果输入元素是唯一的，生成的组合也将是唯一的。

In [25]:
def combinations_with_replacement(iterable, r):
    # combinations_with_replacement('ABC', 2) --> AA AB AC BB BC CC
    pool = tuple(iterable)
    n = len(pool)
    if not n and r:
        return
    indices = [0] * r
    yield tuple(pool[i] for i in indices)
    while True:
        for i in reversed(range(r)):
            if indices[i] != n - 1:
                break
        else:
            return
        indices[i:] = [indices[i] + 1] * (r - i)
        yield tuple(pool[i] for i in indices)

In [33]:
list(combinations_with_replacement("AABB",2))

[('A', 'A'),
 ('A', 'A'),
 ('A', 'B'),
 ('A', 'B'),
 ('A', 'A'),
 ('A', 'B'),
 ('A', 'B'),
 ('B', 'B'),
 ('B', 'B'),
 ('B', 'B')]

In [35]:
list(combinations_with_replacement("ABC",2))

[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]

# itertools.compress(data, selectors)
制作一个迭代器，从数据中过滤元素，只返回那些在选择器中有对应元素且评估为真的元素。当data或selectors的迭代器被用尽时停止。大致相当于。

In [39]:
def compress(data, selectors):
    # compress('ABCDEF', [1,0,1,0,1,1]) --> A C E F
    return (d for d, s in zip(data, selectors) if s)

In [40]:
list(compress('ABCDEF',[1,0,1,0,1,1]))

['A', 'C', 'E', 'F']