In [7]:
import itertools
import operator

# itertools.accumulate(iterable[, func, *, initial=None])
创建一个迭代器，返回累积汇总值或其他双目运算函数的累积结果值（通过可选的 func 参数指定）。  
如果提供了 func，它应当为带有两个参数的函数。 输入 iterable 的元素可以是能被 func 接受为参数的任意类型。

In [8]:
data = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
list(itertools.accumulate(data, operator.mul)) 

[3, 12, 72, 144, 144, 1296, 0, 0, 0, 0]

In [10]:
list(itertools.accumulate(data, max)) 

[3, 4, 6, 6, 6, 9, 9, 9, 9, 9]

In [11]:
cashflows = [1000, -90, -90, -90, -90]
list(itertools.accumulate(cashflows, lambda bal, pmt: bal*1.05 + pmt))

[1000, 960.0, 918.0, 873.9000000000001, 827.5950000000001]

In [13]:
logistic_map = lambda x, _:  r * x * (1 - x)
r = 3.8
x0 = 0.4
inputs = itertools.repeat(x0, 36)     # only the initial value is used
[format(x, '.2f') for x in itertools.accumulate(inputs, logistic_map)]

['0.40',
 '0.91',
 '0.30',
 '0.81',
 '0.60',
 '0.92',
 '0.29',
 '0.79',
 '0.63',
 '0.88',
 '0.39',
 '0.90',
 '0.33',
 '0.84',
 '0.52',
 '0.95',
 '0.18',
 '0.57',
 '0.93',
 '0.25',
 '0.71',
 '0.79',
 '0.63',
 '0.88',
 '0.39',
 '0.91',
 '0.32',
 '0.83',
 '0.54',
 '0.95',
 '0.20',
 '0.60',
 '0.91',
 '0.30',
 '0.80',
 '0.60']

# itertools.chain(*iterables)
创建一个迭代器，它首先返回第一个可迭代对象中所有元素，接着返回下一个可迭代对象中所有元素，直到耗尽所有可迭代对象中的元素。可将多个序列处理为单个序列。

In [15]:
list(itertools.chain('ABC', 'DEF'))

['A', 'B', 'C', 'D', 'E', 'F']

In [16]:
list(itertools.chain('ABC', 'DEF','123'))

['A', 'B', 'C', 'D', 'E', 'F', '1', '2', '3']

# classmethod chain.from_iterable(iterable)
构建类似 chain() 迭代器的另一个选择。从一个单独的可迭代参数中得到链式输入，该参数是延迟计算的。大致相当于：

In [18]:
list(itertools.chain.from_iterable(['ABC', 'DEF']))

['A', 'B', 'C', 'D', 'E', 'F']

In [23]:
list(itertools.chain.from_iterable(['ABC', 'DEF','123']))

['A', 'B', 'C', 'D', 'E', 'F', '1', '2', '3']

# itertools.compress(data, selectors)
创建一个迭代器，它返回 data 中经 selectors 真值测试为 True 的元素。迭代器在两者较短的长度处停止。

In [24]:
list(itertools.compress('ABCDEF', [1,0,1,0,1,1]))

['A', 'C', 'E', 'F']

In [25]:
address = [
     '5001 N Clark',
     '5002 N Clark', 
     '5003 E 58TH', 
     '5004 N RAVENSWOOD', 
     '5005 w ADDISON'
]
counts = [0,3,10,4,1]
more5 = [n>5 for n in counts]
more5

[False, False, True, False, False]

In [26]:
list(itertools.compress(address,more5))

['5003 E 58TH']

# itertools.dropwhile(predicate, iterable)
创建一个迭代器，如果 predicate 为true，迭代器丢弃这些元素，然后返回其他元素。注意，迭代器在 predicate 首次为false之前不会产生任何输出，所以可能需要一定长度的启动时间。


In [27]:
list(itertools.dropwhile(lambda x: x<5, [1,4,6,4,1]))

[6, 4, 1]

# itertools.filterfalse(predicate, iterable)
创建一个迭代器，只返回 iterable 中 predicate 为 False 的元素。如果 predicate 是 None，返回真值测试为false的元素。

In [29]:
list(itertools.filterfalse(lambda x: x%2==0, range(10)))

[1, 3, 5, 7, 9]

In [30]:
list(itertools.filterfalse(lambda x: x%2==1, range(10)))

[0, 2, 4, 6, 8]

# itertools.groupby(iterable, key=None)
创建一个迭代器，返回 iterable 中连续的键和组。key 是一个计算元素键值函数。如果未指定或为 None，key 缺省为恒等函数（identity function），返回元素不变。一般来说，iterable 需用同一个键值函数预先排序。

In [31]:
[k for k, g in itertools.groupby('AAAABBBCCDAABBB')]

['A', 'B', 'C', 'D', 'A', 'B']

In [32]:
[list(g) for k, g in itertools.groupby('AAAABBBCCD')]

[['A', 'A', 'A', 'A'], ['B', 'B', 'B'], ['C', 'C'], ['D']]

In [33]:
[list(g) for k, g in itertools.groupby('AAAABBBCCDAABBB')]

[['A', 'A', 'A', 'A'],
 ['B', 'B', 'B'],
 ['C', 'C'],
 ['D'],
 ['A', 'A'],
 ['B', 'B', 'B']]

# itertools.islice(iterable, stop)
# itertools.islice(iterable, start, stop[, step])
创建一个迭代器，返回从 iterable 里选中的元素。如果 start 不是0，跳过 iterable 中的元素，直到到达 start 这个位置。之后迭代器连续返回元素，除非 step 设置的值很高导致被跳过。如果 stop 为 None，迭代器耗光为止；否则，在指定的位置停止。与普通的切片不同，islice() 不支持将 start ， stop ，或 step 设为负值。

In [35]:
list(itertools.islice('ABCDEFG', 2))

['A', 'B']

In [36]:
list(itertools.islice('ABCDEFG', 2, 4))

['C', 'D']

In [38]:
list(itertools.islice('ABCDEFG', 2, None))

['C', 'D', 'E', 'F', 'G']

In [37]:
list(itertools.islice('ABCDEFG', 0, None, 2) )

['A', 'C', 'E', 'G']

# itertools.pairwise(iterable)
返回从输入 iterable 中获取的连续重叠对。

输出迭代器中 2 元组的数量将比输入的数量少一个。 如果输入可迭代对象中少于两个值则它将为空。

In [39]:
list(itertools.pairwise('ABCDEFG'))

[('A', 'B'), ('B', 'C'), ('C', 'D'), ('D', 'E'), ('E', 'F'), ('F', 'G')]

In [40]:
list(itertools.pairwise('AB'))

[('A', 'B')]

In [41]:
list(itertools.pairwise('A'))

[]

# itertools.starmap(function, iterable)
创建一个迭代器，使用从可迭代对象中获取的参数来计算该函数。当参数对应的形参已从一个单独可迭代对象组合为元组时（数据已被“预组对”）可用此函数代替 map()。map() 与 starmap() 之间的区别可以类比 function(a,b) 与 function(*c) 的区别。

In [42]:
list(itertools.starmap(pow, [(2,5), (3,2), (10,3)]))

[32, 9, 1000]

# itertools.takewhile(predicate, iterable)
创建一个迭代器，只要 predicate 为真就从可迭代对象中返回元素。

In [43]:
list(itertools.takewhile(lambda x: x<5, [1,4,6,4,1]))

[1, 4]

# itertools.tee(iterable, n=2)
从一个可迭代对象中返回 n 个独立的迭代器。

一旦 tee() 实施了一次分裂，原有的 iterable 不应再被使用；否则tee对象无法得知 iterable 可能已向后迭代。

In [49]:
iterator1, iterator2 = itertools.tee([1, 2, 3, 4, 5], 2)

In [50]:
list(iterator1)

[1, 2, 3, 4, 5]

In [51]:
list(iterator2)

[1, 2, 3, 4, 5]

# tertools.zip_longest(*iterables, fillvalue=None)
创建一个迭代器，从每个可迭代对象中收集元素。如果可迭代对象的长度未对齐，将根据 fillvalue 填充缺失值。迭代持续到耗光最长的可迭代对象。

In [53]:
list(itertools.zip_longest('ABCD', 'xy', fillvalue='-'))

[('A', 'x'), ('B', 'y'), ('C', '-'), ('D', '-')]

In [57]:
list(zip('ABCD', 'xy'))

[('A', 'x'), ('B', 'y')]