# itertools模块使用说明


## 1. 无限迭代器
这里讲的3个迭代器可以无限迭代，直到Python里面设置的最大迭代次数就会停止了。

### 1.1 count
默认情况下从0开始计数，每次加1，直到世界的尽头（Python中最大的sys.maxint-1），用法`count(start, [step])`。

In [3]:
from itertools import count
# 不加参数使用默认参数
for i in count():
    if i > 10:
        break
    print i
    
print '-'*15
# 添加起始和间隔步长
for i in count(6,0.5):
    if i > 10:
        break
    print i

0
1
2
3
4
5
6
7
8
9
10
---------------
6
6.5
7.0
7.5
8.0
8.5
9.0
9.5
10.0


### 1.2 cycle
无限循环函数，给定一个序列或字符等可以迭代的对象，可以一直循环输出，`cycle(seq)`

In [7]:
from itertools import cycle
# 如果不加条件会一直循环下去
n = 0
for i in cycle('ATCG'):
    if n > 10:
        break
    print i
    n += 1

A
T
C
G
A
T
C
G
A
T
C


### 1.3 repeat
这个也是默认无限次重复，这里只重复一个元素,`repeat(element, [n])`后面的n可以用于指定重复的次数

In [8]:
from itertools import repeat

for i in repeat('A', 5):
    print i

A
A
A
A
A


## 2. 短序列上的迭代
下面的函数都是在有限序列上进行迭代操作，功能还是很有意思的。

### 2.1 chain
从第一个可迭代的对象开始，一个接一个的迭代下去，`chain(*iterables)`。不明白**\***用法的，可以复习下函数里面参数那一部分内容。

In [9]:
from itertools import chain

for i in chain('ATCG','1234'):
    print i

A
T
C
G
1
2
3
4


### 2.2 compress
compress也就是压缩的意思，就是把不必要的东西过滤掉，过滤的时候需要指定一个选择器来进行选择。`compress(data, selector)`，需要指定一个数据和selector, selector和data之间的长度可以不一样。相当于每次进行一次判断，如果selector里面该位置的值为**True**，data中对应位置的值就保留下来。

In [14]:
from itertools import compress

data = 'ATG'
selector = [0,1,2,'',3,1,0]
print list(compress(data, selector))

data = 'ATGCGTAGT'
selector = [0,1,2,'',1]
print list(compress(data, selector))

['T', 'G']
['T', 'G', 'G']


### 2.3 dropwhile
看字面上的意思，是指while <某个条件>的时候，把相关元素drop了。`dropwhile(predicate, iterable)`， predicate可以是某个表达式用于iterable中输入值的判断，会把前面判断为True的结果都去掉，直到出现False，同时后面的元素不管判断结果是True或False都返回。

In [4]:
from itertools import dropwhile
for i in dropwhile(lambda x : x<4, [1,2,3,2,4,2,1]):
    print i

4
2
1


### 2.4 groupby
根据提供的keyfunction，把每个元素通过keyfunction得到一个key值，按照key值进行分组，一般来说在进行处理前，数据需要进行排序。`groupby(data, keyfunction)`，下面根据这个方法，区分奇偶数

In [13]:
from itertools import groupby

data = range(10)
for k,v in groupby(data, lambda x: x%2):
    print k,list(v)

0 [0]
1 [1]
0 [2]
1 [3]
0 [4]
1 [5]
0 [6]
1 [7]
0 [8]
1 [9]


上面的结果虽然给出了奇偶数，可是还是不能把数字按照奇偶分成两组，我们可以先把数组按照奇偶进行排序，然后再用`groupby`

In [17]:
f = lambda x: 'even' if x%2 == 0 else 'odd'
data = range(10)
data_sorted = sorted(data, key=f)
print data_sorted    # 按照奇偶进行排序

for k,v in groupby(data_sorted, f):
    print '%s, %s' % (k, ','.join(map(str,v)))

[0, 2, 4, 6, 8, 1, 3, 5, 7, 9]
even, 0,2,4,6,8
odd, 1,3,5,7,9


## 3. 排列组合

### 参考：
1. [iteretools文档](https://docs.python.org/2/library/itertools.html)