# itertools

Python的内建模块`itertools`提供了非常有用的用于操作迭代对象的函数。

## 几个无限容器

In [1]:
import itertools

In [None]:
natuals = itertools.count(1)
for n in  natuals:
    print(n)

`count()`会创建一个无限的迭代法器，所以上述代码会打印自然数序列，根本停不下来，只用手动终止`cell`的执行。

In [None]:
cs = itertools.cycle('ABC')
for c in cs:
    print(c)

上面的代码会一直重复的打印：
```txt
'A'
'B'
'C'
'A'
'B'
'C'
...
```

In [3]:
ns = itertools.repeat('A', 5)
for n in ns:
    print(n)

A
A
A
A
A


`repeat()`负责把一个元素无限重复下去，不过如果提供第二个参数就可以限定重复次数。

无限序列只有在`for`迭代时才会无限地迭代下去，如果只是创建了一个迭代对象，它不会事先把无限个元素生成出来，事实上也不可能在内存中创建无限多个元素。

无限序列虽然可以无限迭代下去，但是通常我们会通过`takewhile()`等函数根据条件判断来截取出一个有限的序列：

In [5]:
natuals = itertools.count(1)
ns = itertools.takewhile(lambda x: x <= 10, natuals)
list(ns)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

## `chain()`

`chain()`可以把一组迭代对象串联起来，形成一个更大的迭代器。

In [6]:
for c in itertools.chain('ABC', 'XYZ'):
    print(c)

A
B
C
X
Y
Z


## `groupby()`

groupby()把迭代器中相邻的重复元素挑出来放在一起：

In [7]:
for key, group in itertools.groupby('AAABBBCCAA'):
    print(key, list(group))

A ['A', 'A', 'A']
B ['B', 'B', 'B']
C ['C', 'C']
A ['A', 'A']


实际上挑选规则是通过函数完成的，只要作用于函数的两个元素返回的值相等，这两个元素就被认为是在一组的，而函数返回值作为组的key。如果我们要忽略大小写分组，就可以让元素'A'和'a'都返回相同的key：

In [8]:
for key, group in itertools.groupby('AaaBBbbCccCAAa', lambda c: c.upper()):
    print(key, list(group))

A ['A', 'a', 'a']
B ['B', 'B', 'b', 'b']
C ['C', 'c', 'c', 'C']
A ['A', 'A', 'a']
