In [1]:
# Iterable 凡是可以返回迭代对象的都可称为迭代对象，迭代器对象一般都含有iter或者getitem方法
# 可以用hassttr（list,'__iter__'） dir(list)查看

In [3]:
hasattr(list,'__iter__')

True

In [4]:
hasattr(list,'__getitem__')

True

In [5]:
dir(list)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

In [6]:
# 可以使用内建函数iter()获取迭代对象，然后用next()方法来获取迭代器内的内容
list_test=['a','bb','ccc','a1']
list_iter = iter(list_test)
print(next(list_iter))

a


In [7]:
print(next(list_iter))

bb


In [8]:
print(next(list_iter))
print(next(list_iter))

ccc
a1


In [9]:
print(next(list_iter))

StopIteration: 

In [10]:
# 如上，迭代器的内容，每次由开始到终点后，就停止迭代了，内容只能遍历一次。
# 迭代器只能往前不能后退，迭代器仅仅在迭代至某个元素时才计算该元素，而这之前或之后，元素可以不存在或者被销毁。惰性求值（lazy evaluation）

In [12]:
# 写一个只返回奇数的迭代器
class MyIter01:
    def __init__(self,start=0,end=0):
        self.start = start
        self.end = end
    
    def __iter__(self):
        print('It is my iterator')
        return self
    
    def __next__(self):
        i = (self.start - 1)*2 + 1
        if i < self.end:
            self.start += 1
            return i
        else:
            raise StopIteration()

In [13]:
iter_test = MyIter01(1,8)
for i in iter_test:
    print(i)

It is my iterator
1
3
5
7


In [14]:
# 用next() 方法来访问迭代器
iter_test = MyIter01(1,8)
print(next(iter_test))

1


In [15]:
print(next(iter_test))

3


In [16]:
print(next(iter_test))

5


In [17]:
# 直接输出迭代器的内容是不行的，需要通过list()转换，或着使用for i in iter的方式
iter_test = MyIter01(1,8)

In [18]:
#显示迭代器本身
print(iter_test)

<__main__.MyIter01 object at 0x7fd4f07c36d8>


In [19]:
#第一次显示列表化的迭代器：
print(list(iter_test))

It is my iterator
[1, 3, 5, 7]


In [20]:
# 第二次再次显示列表化的迭代器
print(list(iter_test))

It is my iterator
[]


In [21]:
# 因为迭代器的特性，第一次值输出完后，就没有输出了

In [22]:
a = iter(list(range(10)))
for i in a:
    print(i)
    next(a)

0
2
4
6
8


In [23]:
# next() 方法将迭代的任务完成了，因此输出的时候，就是一个偶数序列了。

In [25]:
#错误示例： 没有把list()变为迭代器对象
a = list(range(10))
print(a)
for i in a:
    print(i)
    next(a)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
0


TypeError: 'list' object is not an iterator

In [26]:
# Itertools模块
# 该模块有许多高效的循环迭代器，如下：

In [30]:
# 1.  count() 函数
# count(start,[step]) 从start开始，以后每个元素都加上step,step默认值为1,输出一个无限序列
# count() 语法： itertools.count(start = 0, step =1)

In [6]:
# 2.  islice()函数
# 如下2中参数传递方式：
#    1）itertools.islice(iterable,stop)
#    2) itertools.islice(iterable,start,stop,step)

In [8]:
from itertools import islice,count,cycle

In [2]:
list_01 = list(range(10))
print(list_01)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [3]:
list_01 = [i for i in islice(count(2,2),5)]
print(list_01)

[2, 4, 6, 8, 10]


In [5]:
list_02 = [i for i in islice(count(),1,9,2)]
print(list_02)

[1, 3, 5, 7]


In [7]:
# itertools中提供的无限迭代器，分别是count(),cycle(),repeat()

In [9]:
# 3 cycle() 函数
# cycle() 语法：itertools.cycle(iterable), 迭代至序列p最后一个元素后，再从序列p的第一个元素重新循环

In [10]:
list_01 = [i for i in islice(cycle(range(4)),10)]
print(list_01)

[0, 1, 2, 3, 0, 1, 2, 3, 0, 1]


In [11]:
# 4 repeat()函数
# repeat() 语法：itertools.repeat(object,times) ,将object重复times次，如果不指定，则无限循环

In [12]:
from itertools import *
list_01 = [i for i in repeat('a',3)]
print(list_01)

['a', 'a', 'a']


In [13]:
# 其他有趣的函数
# 5. accumulate() 可以将一个函数连续地作用在可迭代序列上，和reduce()函数一样，先对第一个和第二个元素计算，再将结果和第三个元素进行计算
# 语法：accumulate(iterable,func)
# accumulate()作为迭代器的函数，它输出的元素和输入是等长的。
# reduce() 函数是对可迭代对象进行收敛，最后只输出一个元素
# 默认的func是一个add函数
list_01 = list(accumulate([1,2,3,4,5]))
print(list_01)

[1, 3, 6, 10, 15]


In [14]:
# 定义函数
def my_func(a,b):
    return a + b + 3
list_02 = list(accumulate([1,2,3,4,5],my_func))
print(list_02)

[1, 6, 12, 19, 27]


In [15]:
# 生成一个可迭代的对象：
list_01 = list(islice(cycle(range(4)),10))
print(list_01)

[0, 1, 2, 3, 0, 1, 2, 3, 0, 1]


In [16]:
# 对于accumulate引入max（）函数：
list_02 = list(accumulate(list_01,max))
print(list_02)

[0, 1, 2, 3, 3, 3, 3, 3, 3, 3]


In [17]:
# 6. chaiin() 函数  能够将多个可迭代对象合并成一个更长的可迭代对象
print(list(chain([1,2,3],['a','b','c'])))

[1, 2, 3, 'a', 'b', 'c']


In [18]:
i0 = chain([1,2,3],['a','b','c'])
for i in i0:
    print(i)

1
2
3
a
b
c


In [19]:
# 7  compress() 函数   它会交替检查两个可迭代对象，如果第二个的是True，则保留第一个中相应位置的元素，在很多场景下这是非常有用的。
letters='ABCDEFG'
bools=[1,0,0,1,1,0,1]
i0 = compress(letters,bools)
for i in i0:
    print(i)

A
D
E
G


In [20]:
# 8  dropwhile()函数 
# dropwhile() 需要输入两个参数：predicate和iterable,一个预言和一个可迭代对象，然后会根据这个断言应用在可迭代对象上，当不符合
# 预言时，输出后面所有的迭代结果
print(list(dropwhile(lambda x:x<10,[1,5,7,10,30,2,4])))

[10, 30, 2, 4]


In [21]:
# 9  filterfalse()函数
# filterfalse() 是一个过滤器，如果预言为false,输出可迭代内容
def greater_than_ten(x):
    return x>=10
print(list(filterfalse(greater_than_ten,[1,5,7,10,30,2,4])))

[1, 5, 7, 2, 4]


In [23]:
# filterfalse()函数对迭代对象的全部进行都进行比较，而dropwhile()只要是false就停止，然后输出后面的内容
print(list(filterfalse(lambda x:x<10,[1,5,7,10,30,2,4])))
print(list(dropwhile(lambda x:x<10,[1,5,7,10,30,2,4])))

[10, 30]
[10, 30, 2, 4]


In [24]:
# 10  groupby() 函数，可以将元素按照指定的key来归类
# 语法：itertools.groupby(iterable,key=None)

In [25]:
list_0 = sorted([('Apple','iphone'),('Apple','iMac'),('Microsoft','Surface'),('Apple','iPad'),('Huawei','P9'),('Huawei','P10')])
print(list_0)

[('Apple', 'iMac'), ('Apple', 'iPad'), ('Apple', 'iphone'), ('Huawei', 'P10'), ('Huawei', 'P9'), ('Microsoft', 'Surface')]


In [26]:
print(list(groupby(list_0,lambda make:make[0])))

[('Apple', <itertools._grouper object at 0x7f9bf742a208>), ('Huawei', <itertools._grouper object at 0x7f9bf742a550>), ('Microsoft', <itertools._grouper object at 0x7f9bf7065668>)]


In [28]:
for key,group in groupby(list_0,lambda make:make[0]):
    for make,item in group:
        print('{} is made by {}'.format(item,make))
    print('')

iMac is made by Apple
iPad is made by Apple
iphone is made by Apple

P10 is made by Huawei
P9 is made by Huawei

Surface is made by Microsoft



In [29]:
# 如上所示： 循环list_0，取每个元素内的第0个位置的元素，以此来分组。
# 分组后，第二个元组是一个可迭代对象，可以用循环来获得这个迭代对象的值。

In [31]:
# 11. starmap()函数
# 语法：itertools.starmap(function,iterable)
# startmap() 对于一个可迭代对象进行指定函数的计算
print(list(starmap(lambda x,y:(x,y,x*y),[(1,4),(2,4),(3,4),(4,4)])))

[(1, 4, 4), (2, 4, 8), (3, 4, 12), (4, 4, 16)]


In [32]:
# star map, 也叫* map。
# 当传入的参数已经按照tuple元组方式组成的可迭代对象（也就是说这些参数已经被预先zip好了）

In [33]:
# 12.  takewhile() 函数
# 与dropwhile（）相反，它会返回符合条件的元素，但是一旦有元素不符合条件，就停止。
print(list(takewhile(lambda x:x<10,[1,5,7,10,30,2,4])))

[1, 5, 7]


In [35]:
print(list(dropwhile(lambda x:x<10,[1,5,7,10,30,2,4])))

[10, 30, 2, 4]


In [36]:
# 13. tee()函数
# 语法：itertools.tee(iterable,n=2)
# tee() 它从一个迭代器生成几个相同的迭代器。由于迭代器的特殊性质，当你访问过一个迭代器后，数据就没了。用list转换并不是一个很好的办法
# 因为使用迭代器本身就是为了节约内存，如果使用list复制了，这个特点也就没有了。
i1,i2=tee(range(10),2)
print(list(i1))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [37]:
print(list(i1))

[]


In [38]:
print(list(i2))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [39]:
print(list(i2))

[]


In [40]:
# 对一个迭代器进行多次访问

In [41]:
# 14. zip_longest()
# 语法：itertools.zip_longest(*iterables,fillvalue=None)
# 与zip()相似，不同的是，可以把长短不一的迭代对象，组合起来，然后以fillvalue为其填充，结果还是一个可以迭代的序列
for item in zip_longest('ABCD','12',fillvalue='blank'):
    print(item)

('A', '1')
('B', '2')
('C', 'blank')
('D', 'blank')
