[来源](http://wklken.me/posts/2013/08/20/python-extra-itertools.html#) or Evernote

In [1]:
from itertools import *
from operator import itemgetter
import os

# 可无限迭代器

#### 计数器 itertools.count(start=0, step=1)

如果超出了sys.maxint，计数器将溢出并继续从-sys.maxint-1开始计算。

In [70]:
for i,v in enumerate(['a', 'b', 'c']): print i, v
for i in izip(count(1), ['a', 'b', 'c']): print i

0 a
1 b
2 c
(1, 'a')
(2, 'b')
(3, 'c')


#### 循环操作 itertools.cycle(iterable)

创建一个迭代器，对iterable中的元素反复执行循环操作, 内部会生成iterable中的元素的一个副本

In [71]:
i = 0 
for item in cycle(['a', 'b']): 
    i += 1 
    if i == 4: break 
    print (i, item)

(1, 'a')
(2, 'b')
(3, 'a')


#### 重复生成 itertools.repeat(object[, times])

创建一个迭代器，重复生成object，times（如果已提供）指定重复计数，如果未提供times，将无止尽返回该对象。

In [72]:
for i in repeat('over-and-over', 3): print i

over-and-over
over-and-over
over-and-over


# 处理输入序列迭代器

#### 按selectors规则刷选数据 itertools.compress(data, selectors)

见 itertools.ifilter

In [23]:
for i in compress('ABCDEF', cycle([1,0,1,1])):print i

A
C
D
E


#### 刷选特定条件后的所有项 itertools.dropwhile(predicate, iterable)

创建一个迭代器，只要函数predicate(item)为True，就丢弃iterable中的项，如果predicate返回False，就会生成iterable中的项和所有后续项。

itertools.takewhile(predicate, iterable)

In [59]:
for i in dropwhile(lambda x: x < 1, [ -1, 0, 1, 2, 3]): print i

1
2
3


In [60]:
for i in takewhile(lambda x: x < 1, [ -1, 0, 1, 2, 3]): print i

-1
0


#### 按照key进行分组后的值集合的迭代器 tertools.groupby(iterable[, key])

In [33]:
a = ['aa', 'ab', 'abc', 'bcd', 'abcde']
b = [['v1','k1'],['v2','k2'],['v2','k2'],['v3','k3']]
for i, k in groupby(a, len): print i, list(k)
for i, k in groupby(b, itemgetter(1)): print i, list(k)

2 ['aa', 'ab']
3 ['abc', 'bcd']
5 ['abcde']
k1 [['v1', 'k1']]
k2 [['v2', 'k2'], ['v2', 'k2']]
k3 [['v3', 'k3']]


In [37]:
d = dict(a=1, b=2, c=1, d=2, e=1, f=2, g=3)
ds = sorted(d.iteritems(), key=itemgetter(1)) 
print ds
for k, g in groupby(ds, key=itemgetter(1)): print k, map(itemgetter(0), g)

[('a', 1), ('c', 1), ('e', 1), ('b', 2), ('d', 2), ('f', 2), ('g', 3)]
1 ['a', 'c', 'e']
2 ['b', 'd', 'f']
3 ['g']


#### 规则刷选filter iter版 itertools.ifilter(predicate, iterable)

返回的是迭代器类似于针对列表的内置函数 filter() , 它只包括当测试函数返回true时的项. 它不同于 dropwhile()

创建一个迭代器，仅生成iterable中predicate(item)为True的项

itertools.ifilterfalse(predicate, iterable)
和ifilter(函数相反 ， 返回一个包含那些测试函数返回false的项的迭代器)

In [42]:
for i in ifilter(lambda x: x < 1, [ -1, 0, 1, 2, 3]): print i

-1
0


#### 切片返回值 itertools.islice(iterable, start, stop[, step])

iterable[start : stop : step]

In [43]:
for i in islice(count(), 2): print i

0
1


In [44]:
for i in islice(count(), 7, 10): print i 

7
8
9


In [45]:
for i in islice(count(), 70, 100, 10): print i

70
80
90


#### map iter版 itertools.imap(function, *iterables)

In [5]:
for i in imap(lambda x:2*x, xrange(3)): print i

0
2
4


In [None]:
product([Path.GST_SECURITY], os.listdir(Path.GST_SECURITY), date_list, fqtype_list)

#### map iter多参数版（迭代参数）itertools.starmap(function, iterable)

【套路】 starmap(f,product(参数))

`starmap(os.path.join, product([参数a], os.listdir(Path.GST_SECURITY), 参数iter))`

In [6]:
values = [(0, 5), (1, 6)]
for i in starmap(lambda x,y:(x, y, x*y), values):
    print '%d * %d = %d' % i

0 * 5 = 0
1 * 6 = 6


In [None]:
starmap(os.path.join, product([Path.GST_SECURITY], os.listdir(Path.GST_SECURITY), date_list, fqtype_list))

#### 克隆迭代器 itertools.tee(iterable[, n=2])

为了克隆原始迭代器，生成的项会被缓存，并在所有新创建的迭代器中使用，一定要注意，不要在调用tee()之后使用原始迭代器iterable，否则缓存机制可能无法正确工作

In [58]:
r = islice(count(), 2)
i1, i2 = tee(r)

for i in i1:
    print 'i1:', i
for i in i2:
    print 'i2:', i

i1: 0
i1: 1
i2: 0
i2: 1


#### zip iter版 itertools.izip(*iterables)

会按最短的iter对齐

In [63]:
for i in izip([1, 2, 3], ['a', 'b'],['A', 'B', 'C']):
    print i

(1, 'a', 'A')
(2, 'b', 'B')


#### zip iter版  itertools.izip_longest(*iterables[, fillvalue])

会按最长的iter对齐
如果没有使用fillvalue关键字参数指定不同的值，则使用None来填充已经使用的迭代变量的值

In [65]:
for i in izip_longest([1, 2, 3], ['a', 'b'],['A', 'B', 'C']):
    print i

(1, 'a', 'A')
(2, 'b', 'B')
(3, None, 'C')


# 组合生成器

#### 组合多个迭代器 itertools.chain(*iterables)

In [2]:
for i in chain([1, 2], ['a', 'b']): print i

1
2
a
b


In [3]:
def flatmap(f, items): return chain.from_iterable(imap(f, items))

In [4]:
import os
list(flatmap(os.listdir, ['.','..']))

['.DS_Store',
 '.ipynb_checkpoints',
 'itertools.ipynb',
 '.DS_Store',
 'base.md',
 'deep.md',
 'inner_type.png',
 'ipython.md',
 'libs.md',
 'module.md',
 'notebook',
 'numpy.md',
 'project.md',
 'py-ml-algorithms.jpg',
 'pyalgotrade.md',
 'qa.md',
 'README.md',
 'skill.md',
 '\xe3\x80\x8aPython Cookbook\xe3\x80\x8b\xe7\xac\xac\xe4\xb8\x89\xe7\x89\x88\xe4\xb8\xad\xe6\x96\x87v2.0.0.pdf']

#### 笛卡尔积 itertools.product(*iterables[, repeat])

In [75]:
for i in product((1,2),['a']): print i

(1, 'a')
(2, 'a')


#### 排列 itertools.permutations(iterable[, r])

In [76]:
for i in permutations(range(3)):print i

(0, 1, 2)
(0, 2, 1)
(1, 0, 2)
(1, 2, 0)
(2, 0, 1)
(2, 1, 0)


#### 组合 itertools.combinations(iterable, r)

In [78]:
for i in combinations(range(3), 2):print i

(0, 1)
(0, 2)
(1, 2)


#### 组合 带自身 itertools.combinations_with_replacement(iterable, r)

In [79]:
for i in combinations_with_replacement(range(3), 2):print i

(0, 0)
(0, 1)
(0, 2)
(1, 1)
(1, 2)
(2, 2)


# 扩展

In [81]:
from itertools import chain, islice
def chunks(iterable, size, format=iter):
    it = iter(iterable)
    while True:
        yield format(chain((it.next(),), islice(it, size - 1)))

l = ["a", "b", "c", "d", "e", "f", "g"]
for chunk in chunks(l, 3, tuple):print chunk

('a', 'b', 'c')
('d', 'e', 'f')
('g',)


理解迭代的内部机制：

```
迭代(iteration）就是对可迭代对象（iterables，实现了__iter__()方法）和迭代器（iterators，实现了__next__()方法）的一个操作过程。可迭代对象是任何可返回一个迭代器的对象，迭代器是应用在迭代对象中迭代的对象，换一种方式说的话就是：iterable对象的__iter__()方法可以返回iterator对象，iterator通过调用next()方法获取其中的每一个值(译者注)，读者可以结合Java API中的 Iterable接口和Iterator接口进行类比。
```