# Itertools

我们知道，迭代器的特点是：惰性求值（Lazy evaluation），即只有当迭代至某个值时，它才会被计算，这个特点使得迭代器特别适合于遍历大文件或无限集合等，因为我们不用一次性将它们存储在内存中。<br/>

Python 内置的 itertools 模块包含了一系列用来产生不同类型迭代器的函数或类，这些函数的返回都是一个迭代器，我们可以通过 for 循环来遍历取值，也可以使用 next() 来取值。<br/>

itertools 模块提供的迭代器函数有以下几种类型：<br/>

* 无限迭代器：生成一个无限序列，比如自然数序列 1, 2, 3, 4, ...；
* 有限迭代器：接收一个或多个序列（sequence）作为参数，进行组合、分组和过滤等；
* 组合生成器：序列的排列、组合，求序列的笛卡儿积等；

https://docs.python.org/3/library/itertools.html

In [1]:
import itertools
print('\n'.join(itertools.__dict__))

__name__
__doc__
__package__
__loader__
__spec__
tee
accumulate
combinations
combinations_with_replacement
cycle
dropwhile
takewhile
islice
starmap
chain
compress
filterfalse
count
zip_longest
permutations
product
repeat
groupby
_grouper
_tee
_tee_dataobject


## 无限迭代器
itertools 模块提供了三个函数（事实上，它们是类）用于生成一个无限序列迭代器：

* count(firstval=0, step=1)

    创建一个从 firstval (默认值为 0) 开始，以 step (默认值为 1) 为步长的的无限整数迭代器

* cycle(iterable)

    对 iterable 中的元素反复执行循环，返回迭代器

* repeat(object [,times]）

    反复生成 object，如果给定 times，则重复次数为 times，否则为无限

### count
#### itertools.count(start=0,step=1)
接收两个参数，第一个参数指定开始值，默认为 0，第二个参数指定步长，默认为 1.

In [2]:
import itertools

nums = itertools.count()
for i in nums:
    if i > 5:
        break
    print(i)

0
1
2
3
4
5


In [3]:
import itertools

nums = itertools.count(10, 2)
for i in nums:
    if i > 20:
        break
    print(i)

10
12
14
16
18
20


In [38]:
nums = itertools.count(5)
for i in nums:
    if i >10:
        break
    print(i)

5
6
7
8
9
10


### cycle
#### itertools.cycle(iterable)
用于对 iterable 中的元素反复执行循环：

In [4]:
import itertools

cycle_string = itertools.cycle('ABC')
i = 1
for s in cycle_string:
    if i == 10:
        break
    print(i, s)
    i += 1

1 A
2 B
3 C
4 A
5 B
6 C
7 A
8 B
9 C


### repeat
#### itertools.repeat(object[, times])
用于反复生成一个 object：

In [5]:
import itertools

for item in itertools.repeat('Hello world',3):
    print(item)

Hello world
Hello world
Hello world


In [6]:
for item in itertools.repeat([1,2,3,4],3):
    print(item)

[1, 2, 3, 4]
[1, 2, 3, 4]
[1, 2, 3, 4]


## 有限迭代器
itertools 模块提供了多个函数（类），接收一个或多个迭代对象作为参数，对它们进行组合、分组和过滤等：

|Iterator|Arguments|Results|Example|
|--------|---------|-------|--------|
|accumulate()|	p [,func]|	p0, p0+p1, p0+p1+p2, …|	accumulate([1,2,3,4,5]) --> 1 3 6 10 15|
|chain()|	p, q, …	| p0, p1, … plast, q0, q1, …|	chain('ABC', 'DEF') --> A B C D E F|
|chain.from_iterable()|	iterable|	p0, p1, … plast, q0, q1, …|	chain.from_iterable(['ABC', 'DEF']) --> A B C D E F|
|compress()|	data, selectors|	(d[0] if s[0]), (d[1] if s[1]), …|	compress('ABCDEF', [1,0,1,0,1,1]) --> A C E F|
|dropwhile()|	pred, seq|	seq[n], seq[n+1], starting when pred fails|	dropwhile(lambda x: x<5, [1,4,6,4,1]) --> 6 4 1|
|filterfalse()|	pred, seq|	elements of seq where pred(elem) is false|	filterfalse(lambda x: x%2, range(10)) --> 0 2 4 6 8|
|groupby()|	iterable[, key]|	sub-iterators grouped by value of key(v)|	 |
|islice()|	seq, [start,] stop [, step]|	elements from seq[start:stop:step]|	islice('ABCDEFG', 2, None) --> C D E F G|
|starmap()|	func, seq|	func(*seq[0]), func(*seq[1]), …|	starmap(pow, [(2,5), (3,2), (10,3)]) --> 32 9 1000|
|takewhile()|	pred, seq|	seq[0], seq[1], until pred fails|	takewhile(lambda x: x<5, [1,4,6,4,1]) --> 1 4|
|tee()|	it, n|	it1, it2, … itn splits one iterator into n	| |
|zip_longest()|	p, q, …|	(p[0], q[0]), (p[1], q[1]), …|	zip_longest('ABCD', 'xy', fillvalue='-') --> Ax By C- D-|

----
### accumulate 累加迭代器
```python
itertools.accumulate(iterable[, func])
```
创建一个迭代器，返回累加和或其他二元函数的累加结果（通过可选参数 func 指定）。如果提供了 func ，它应是2个参数的函数。输入 iterable 元素类型应是 func 能支持的任意类型。

In [7]:
from itertools import accumulate
import operator
data =  [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
print(list(accumulate(data,operator.mul)))# running product
print(list(accumulate(data,max)))  # running maximum

[3, 12, 72, 144, 144, 1296, 0, 0, 0, 0]
[3, 4, 6, 6, 6, 9, 9, 9, 9, 9]


In [8]:
# Amortize a 5% loan of 1000 with 4 annual payments of 90
cashflows = [1000, -90, -90, -90, -90]
list(accumulate(cashflows,lambda bal,pmt:bal*1.05 + pmt))

[1000, 960.0, 918.0, 873.9000000000001, 827.5950000000001]

---
### Chain 链式迭代

```python
chain(iterable1, iterable2, iterable3, ...)
```

**chain**  接收多个可迭代对象作为参数，将它们『连接』起来，作为一个新的迭代器返回。
迭代器按照顺序一一运行

In [9]:
from itertools import chain

for item in chain([1,2,3],['a','b','c']):
    print(item)

1
2
3
a
b
c


In [4]:
from itertools import chain
def make_interable_to_chain():
    yield[1,2,3]
    yield['a','b','c']

for i in chain.from_iterable(make_interable_to_chain()):
    print(i,end=' ')

1 2 3 a b c 

---
### combination 组合
```python
itertools.combinations(iterable, r)

```
返回由输入 iterable 中元素组成长度为 r 的子序列。

组合按照字典序返回。所以如果输入 iterable 是有序的，生成的组合元组也是有序的。

即使元素的值相同，不同位置的元素也被认为是不同的。如果元素各自不同，那么每个组合中没有重复元素。

In [10]:
from itertools import combinations
for i in combinations('ABCD',2):
    print(i)

('A', 'B')
('A', 'C')
('A', 'D')
('B', 'C')
('B', 'D')
('C', 'D')


In [11]:
for i in combinations(range(4),3):
    print(i)

(0, 1, 2)
(0, 1, 3)
(0, 2, 3)
(1, 2, 3)


#### combinations() 的代码可被改写为 permutations() 过滤后的子序列，（相对于元素在输入中的位置）元素不是有序的

In [12]:
from itertools import permutations
for i in permutations('ABCD',2):
    print(i)

('A', 'B')
('A', 'C')
('A', 'D')
('B', 'A')
('B', 'C')
('B', 'D')
('C', 'A')
('C', 'B')
('C', 'D')
('D', 'A')
('D', 'B')
('D', 'C')


### combinations_with_replacement
```python
combinations_with_replacement(iterable, r)
```


返回由输入 iterable 中元素组成的长度为 r 的子序列，**_允许每个元素可重复出现。_**

In [13]:
from itertools import combinations_with_replacement

for i in combinations_with_replacement('ABC',2):
    print(i)

('A', 'A')
('A', 'B')
('A', 'C')
('B', 'B')
('B', 'C')
('C', 'C')


---
### compress

```python
itertools.compress(data, selectors)
```

创建一个迭代器，返回selectors中**True** 的元素，迭代器在两者较短的长度处停止。

In [14]:
from itertools import compress

for i in compress('ABCDEFG',[1,0,1,0,1,1]):
    print(i)

A
C
E
F


---
### 断言迭代

#### dropwhile 

```python
itertools.dropwhile(predicate, iterable)
```
创建一个迭代器，如果 predicate 为true，迭代器丢弃这些元素，然后返回其他元素。注意，**迭代器在 predicate 首次为false之前不会产生任何输出**，所以可能需要一定长度的启动时间。

In [15]:
from itertools import dropwhile

for i in dropwhile(lambda x:x<5, [1,2,4,7,2,1,9]):
    print(i)

7
2
1
9


In [16]:
from itertools import dropwhile

for i in dropwhile(lambda x:x<5, [7,2,4,7,2,1,9]):
    print(i)

7
2
4
7
2
1
9


#### takewhile

和dropwhile相反，takewhile创建一个迭代器，只要 predicate 为真就从可迭代对象中返回元素。

In [17]:
from itertools import takewhile

for i in takewhile(lambda x:x<5, [1,2,4,7,2,1,9]):
    print(i)

1
2
4


In [18]:
from itertools import takewhile

for i in takewhile(lambda x:x<5, [1,3,4,7,2,1,9]):
    print(i)

1
3
4


----
### 过滤迭代

#### filterfalse

```python
itertools.filterfalse(predicate, iterable)
```

创建一个迭代器，只返回 iterable 中 predicate 为 False 的元素。如果 predicate 是 None，返回真值测试为false的元素。

In [19]:
from itertools import filterfalse

for i in filterfalse(lambda x:x<5, [1,2,4,7,2,1,9]):
    print(i)

7
9


In [20]:
for i in filterfalse(lambda x:x<5, [7,2,4,7,2,1,9]):
    print(i)

7
7
9


In [8]:
from itertools import zip_longest
for i in zip_longest([1,2,3,4,5],['a','b','c']):
    print(i)

(1, 'a')
(2, 'b')
(3, 'c')
(4, None)
(5, None)


In [5]:
from itertools import islice

for i in islice(range(10),5):
    print(i,end= ' ')
    
for i in islice(range(10),5,10):
    print(i,end= ' ')

for i in islice(range(100), 0,100,10):
    print(i,end= ' ')

0 1 2 3 4 
5 6 7 8 9 
0 10 20 30 40 50 60 70 80 90 

In [23]:
from itertools import tee,islice,count

r = islice(count(),5)
i1,i2 = tee(r)
print('i1:', list(i1))
print('i2:', list(i2))
print('r:',list(r))

i1: [0, 1, 2, 3, 4]
i2: [0, 1, 2, 3, 4]
r: []


In [2]:
def multiply(x):
    return x*x

def add(x):
    return x+x

funs = [multiply,add]
for i in range(5):
    value = list(map(lambda x:x(i),funs))
    print(value)

[0, 0]
[1, 2]
[4, 4]
[9, 6]
[16, 8]


In [3]:
res = map(lambda x,y: x+y, range(5),range(5,10))

In [4]:
res

<map at 0x10eca76d8>

In [5]:
for i in res:
    print(i)

5
7
9
11
13
