## Itertools模块
Python引入了迭代器的概念来满足我们的可迭代的要求，既保障了数据的正确的生产还节约了内存  
当我们要处理的**数据对象**非常的庞大的时候，迭代器不失为一个满足我们的优化要求的优秀的工具  

首先我们需要先来了解一下迭代器的本质,先看下面的例子

In [12]:
import itertools
class test:
    def __init__(self):
        pass
    def __iter__(self):
        print("--iter-- function has been called!")
        return self
    def __next__(self):
        print("--next-- function has been called!")

p = test()
print(str(type(p))+'-'*10)
n = 0
for i in p:
    #break
    n += 1
    if n > 5:break


<class '__main__.test'>----------
--iter-- function has been called!
--next-- function has been called!
--next-- function has been called!
--next-- function has been called!
--next-- function has been called!
--next-- function has been called!
--next-- function has been called!


我们从上面的例子中不难发现，我们的迭代器（马上就区分）实际上在被迭代的时候首先调用*\_\_iter\_\_*方法,然后紧接着调用我们的*\_\_next\_\_*方法开始进行迭代（将上面的第一个break去掉可以更好的理解）  

* 所以我们开始定义，存在着\_\_iter\_\_方法（并且返回自身）的对象我们称之为是**可迭代的对象**  
* 我们再次定义**定义并且实现了\_\_next\_\_**方法的对象是迭代器  

原因是这样的，我们的可迭代对象只是强调了我们对象是可以迭代的，但是如果我们没有实现next方法我们还不能称之为是迭代器，因为还不具备迭代的功能，只有我们iter的实现了next方法之后我们的迭代器才算是完成，但是在实际中我们的iter和next函数其实是共存的，缺一不可（可以注释掉任意一个函数运行就会发现）  

我们想要终止地带的时候可以通过StopIteration异常的抛出来实现终止

下面我们开始引入我们的Python內建模块itertools  

我们的Python內建的itertools提供了很多的常用的迭代器函数或者类，他们的作用是帮助我们**返回一个迭代器**,我们可以使用for循环来对迭代器进行迭代（调用next函数）

* 无穷迭代器
* 有限迭代器
* 组合生成器

### 无穷迭代器
itertools中提供了三个无穷迭代器的返回函数，这些函数如果使用默认值的话就会发挥一个无穷的的迭代器，但是我们可以通过增加参数来实现大迭代次数的控制  
* count（f,s）:第一个参数是其实的整数，第二个参数是步长，返回一个无穷整数迭代器
* cycle(iterable):参数是可迭代对象，返回一个迭代器，迭代器的功能是实现循环迭代
* repeat（object,time）:第一个参数是对象，第二个参数是迭代的次数，反复的返回一个相同的迭代器
    repeat函数比较特殊，实际上我们的该函数是不断的返回同一个object对象，下面的紧跟着的例子比较明显的看出来

In [20]:
from itertools import *
class test:
    def __init__(self):
        pass
    pass

a = test()
data = repeat(a,2)
x = data.__next__()
y = data.__next__()
print(x,y)
if x is y:print('True')
else:print('False')

<__main__.test object at 0x7f8264380048> <__main__.test object at 0x7f8264380048>
True


In [25]:
from itertools import *
from sys import *
x = count(3,4)
for i in x:
    if i > 12:break
    else:print(i)

y = cycle([1,2,3,4])
k = 0
for i in y:
    stdout.write(str(i)+' ')
    k += 1
    if k > 6:break


3
7
11
1 2 3 4 1 2 3 

### 有限迭代器
* chain(iterable1,iterable2, ..):将多个可迭代对象来接起来返回成一个新的迭代器,可迭代对象的类型不区分
* compress(data,selectors):selectors必须是一个可迭代对象（只要是可迭代对象就可以）,只要是会被Python解释器翻译成False的对应的位置都会被忽略，但是我们需要注意，len(data) >= len(selectors)必须满足，如果前者长多余的部分会自动的省略
* dropwhile(function,iterable):function将每个iterable的元素判断返回bool类型，作用是不断的吃掉true的开头元素知道第一个不满足的为止，后面全部保存
* takewhile(function,iterable):同上，只不过，保留前面的满足（true）的元素知道遇到第一个不满足的位置后面全部丢弃
* groupby(iterable,function):对iterable中的元素按照相应的函数进行分组，默认是按照是否相同来进行分组(是连续项进行分组)，
将key函数作用于原循环器的各个元素。**根据key函数结果，将拥有相同函数结果的元素分到一个新的循环器。每个新的循环器以函数返回结果为标签。**
这就好像一群人的身高作为循环器。我们可以使用这样一个key函数: 如果身高大于180，返回"tall"；如果身高底于160，返回"short";中间的返回"middle"。最终，所有身高将分为三个循环器，即"tall", "short", "middle"
* fileter(function,seq):对函数中计算是True的元素返回，默认函数是None表示部位None的元素都会被返回
* fileterfalse(function,seq):翻转上述的迭代器的功能
* islice(iterable,[start],stop,[step]):切片函数，扩展的元组和列表的切片操作到可迭代对象上，start和step可选，但是终点必须指定，
* map(function,iter1,iter2,iter3, ..):function接收的参数的个数和提供的可迭代对象的个数是相同的，我们每一次项function提供同一个位置的元素，知道最短的可迭代对象迭代结束,当只提供一个可迭代对象的时候，我们的map相当于对一个可迭代对象每个元素都执行了一遍同一个操作
* tee(iterable,time):不同于repeat，我们的tee返回的是一个对象的不同的副本，用元组的形式返回，time表示返回的副本的个数，默认是2
* zip(iter1,iter2, ..):将可迭代对象按照位置的元组形式返回，默认是短的结束为截止
* zip_longest(iter1, ..,[默认]):同上，不过是默认是一长的解释截止，不足的用提供的默认值填充，没有默认值用None填充

In [106]:
from itertools import *
from sys import *
print('chain:' + '-'*20)
for i in chain(range(10),tuple(range(3,5))):
    stdout.write(str(i)+' ')
print('\ncompress:'+ '-'*20)
for i in compress([1,2,1,2,1,1,2,1,5],tuple([range(3,1),1,None,[],(),{},0,0,1])):
    stdout.write(str(i) + ' ')
print('\ndropwhile/takewhile:'+ '-'*20)
def func(i):
    if i == 1:return True
    else:return False
for i in dropwhile(func,[1,2,2,3,5,1]):
    stdout.write(str(i)+' ')
print('\n'+'-'*20)
for i in takewhile(func,[1,2,2,3,5,1]):
    stdout.write(str(i)+' ')
print('\ngroupby:'+ '-'*20)
for key , value in groupby('aaabbbaaccd'):
    print(str(key) + ':' + str(list(value)))
print('-'*20)
data = ['a','b','aa','c','dc','abc']
for key , value in groupby(data,len):
    print(str(key) + ':' + str(list(value)))
def height_class(h):
    if h > 180:
        return "tall"
    elif h < 160:
        return "short"
    else:
        return "middle"

friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]

friends = sorted(friends, key = height_class)
for m, n in groupby(friends, key = height_class):
    print(m)
    print(list(n))    

print('\nfilter/fileterfalse:' + '-'*20)
p = filter(lambda x : x > 1,[-1,2,-2,3,0])
print(p.__next__())
print(p.__next__())
p = filterfalse(lambda x : x > 1,[-1,2,-2,3,0])
print(p.__next__())
print(p.__next__())
print(p.__next__())
#p.__next__()
print('\nislice:'+'-'*10)
print(list(islice(range(10),2,10,2)))
print('\nmap:'+'-'*10)
print(list(map(pow,[2,3,4,5],[2,2,2])))
print('\ntee:'+'-'*10)
x,y,z = tee([1,2,4],3)
if x is y:print('True')
else:print('False')
print('\nzip/zip_longest:'+'-'*10)
print(list(zip(range(5),map(lambda x:chr(x),range(10)))))
print(list(zip_longest( range(12) , map(lambda x:chr(98+x),range(10)) ,fillvalue='我是默认值')))

chain:--------------------
0 1 2 3 4 5 6 7 8 9 3 4 
compress:--------------------
2 5 
dropwhile/takewhile:--------------------
2 2 3 5 1 
--------------------
1 
groupby:--------------------
a:['a', 'a', 'a']
b:['b', 'b', 'b']
a:['a', 'a']
c:['c', 'c']
d:['d']
--------------------
1:['a', 'b']
2:['aa']
1:['c']
2:['dc']
3:['abc']
middle
[165, 170, 177]
short
[158, 159]
tall
[191, 181, 182, 190]

filter/fileterfalse:--------------------
2
3
-1
-2
0

islice:----------
[2, 4, 6, 8]

map:----------
[4, 9, 16]

tee:----------
False

zip/zip_longest:----------
[(0, '\x00'), (1, '\x01'), (2, '\x02'), (3, '\x03'), (4, '\x04')]
[(0, 'b'), (1, 'c'), (2, 'd'), (3, 'e'), (4, 'f'), (5, 'g'), (6, 'h'), (7, 'i'), (8, 'j'), (9, 'k'), (10, '我是默认值'), (11, '我是默认值')]


### 组合生成器
* product(iter1,iter2,iter3,...[repeat]):生成笛卡尔积，repeat制定重复生成的序列的次数
* permutations（iter1,[r]）生成r排列,默认是全排列
* combinations（iter,r)生成r组合，r参数不可省略

In [105]:
print(list(product([1],[3,4],repeat=2))) #repeat制定一上次的笛卡尔积的结果作为下一次笛卡尔积的输入（自己和自己的笛卡尔积）
print(list(permutations(range(6),1)))
print(list(combinations(range(6),2)))

[(1, 3, 1, 3), (1, 3, 1, 4), (1, 4, 1, 3), (1, 4, 1, 4)]
[(0,), (1,), (2,), (3,), (4,), (5,)]
[(0, 1), (0, 2), (0, 3), (0, 4), (0, 5), (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5)]
