用于过滤的生成器函数

In [1]:
def vowel(c):
    return c.lower() in 'aeiou'

list(filter(vowel, 'Aardvark'))

['A', 'a', 'a']

In [2]:
import itertools
list(itertools.filterfalse(vowel, 'Aardvark'))

['r', 'd', 'v', 'r', 'k']

In [3]:
list(itertools.dropwhile(vowel, 'Aardvark'))

['r', 'd', 'v', 'a', 'r', 'k']

In [4]:
list(itertools.compress('Aardvark', (1, 0, 1, 1, 0, 1)))

['A', 'r', 'd', 'a']

In [5]:
list(itertools.islice('Aardvark', 4))

['A', 'a', 'r', 'd']

In [6]:
list(itertools.islice('Aardvark', 4, 7))

['v', 'a', 'r']

In [7]:
list(itertools.islice('Aardvark', 1, 7, 2))

['a', 'd', 'a']

用于映射的生成器函数

In [8]:
sample = [5, 4, 2, 8, 7, 6, 3, 0, 9, 1]
import itertools

# 总和
list(itertools.accumulate(sample))

[5, 9, 11, 19, 26, 32, 35, 35, 44, 45]

In [9]:
# 最小值
list(itertools.accumulate(sample, min))

[5, 4, 2, 2, 2, 2, 2, 0, 0, 0]

In [10]:
# 最大值
list(itertools.accumulate(sample, max))

[5, 5, 5, 8, 8, 8, 8, 8, 9, 9]

In [11]:
import operator
# 乘积
list(itertools.accumulate(sample, operator.mul))

[5, 20, 40, 320, 2240, 13440, 40320, 0, 0, 0]

In [12]:
# 阶乘
list(itertools.accumulate(range(1, 11), operator.mul))

[1, 2, 6, 24, 120, 720, 5040, 40320, 362880, 3628800]

**演示用于映射的生成器函数**

In [14]:
# 从1开始为各个字母编号
list(enumerate('albatroz', 1))

[(1, 'a'),
 (2, 'l'),
 (3, 'b'),
 (4, 'a'),
 (5, 't'),
 (6, 'r'),
 (7, 'o'),
 (8, 'z')]

In [15]:
import operator

#  从0到10，计算各个整数的平方。
list(map(operator.mul, range(11), range(11)))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [16]:
# 计算两个可迭代对象中对应位置上的两个元素之积，元素最少的那个可迭代对象到头后就停止。
list(map(lambda a, b: (a, b), range(11), [2, 4, 8]))

[(0, 2), (1, 4), (2, 8)]

In [17]:
import itertools
# 从1开始，根据字母所在的位置，把字母重复相应的次数。
list(itertools.starmap(operator.mul, enumerate('albatroz', 1)))

['a', 'll', 'bbb', 'aaaa', 'ttttt', 'rrrrrr', 'ooooooo', 'zzzzzzzz']

In [18]:
sample = [5, 4, 2, 8, 7, 6, 3, 0, 9, 1]
# 计算平均值。
list(itertools.starmap(lambda a, b: b / a, enumerate(itertools.accumulate(sample), 1)))

[5.0,
 4.5,
 3.6666666666666665,
 4.75,
 5.2,
 5.333333333333333,
 5.0,
 4.375,
 4.888888888888889,
 4.5]

**演示用于合并的生成器函数**

In [19]:
# 调用chain函数时通常传入两个或更多个可迭代对象。
list(itertools.chain('ABC', range(2)))

['A', 'B', 'C', 0, 1]

In [20]:
# 如果只传入一个可迭代的对象，那么chain函数没什么用。
list(itertools.chain(enumerate('ABC')))

[(0, 'A'), (1, 'B'), (2, 'C')]

In [21]:
# 但是chain.from_iterable函数从可迭代的对象中获取每个元素，然后按顺序把元素连接起来，前提是各个元素本身也是可迭代的对象。
list(itertools.chain.from_iterable(enumerate('ABC')))

[0, 'A', 1, 'B', 2, 'C']

In [22]:
# zip常用于把两个可迭代的对象合并成一系列由两个元素组成的元组。
list(zip('ABC', range(5)))

[('A', 0), ('B', 1), ('C', 2)]

In [23]:
# zip可以并行处理任意数量个可迭代的对象，不过只要有一个可迭代的对象到头了，生成器就停止。
list(zip('ABC', range(5), [10, 20, 30, 40]))

[('A', 0, 10), ('B', 1, 20), ('C', 2, 30)]

In [24]:
# itertools.zip_longest函数的作用与zip类似，不过输入的所有可迭代对象都会处理到头，如果需要会填充None。
list(itertools.zip_longest('ABC', range(5)))

[('A', 0), ('B', 1), ('C', 2), (None, 3), (None, 4)]

In [25]:
# fillvalue关键字参数用于指定填充的值。
list(itertools.zip_longest('ABC', range(5), fillvalue='?'))

[('A', 0), ('B', 1), ('C', 2), ('?', 3), ('?', 4)]

**演示itertools.product生成器函数**

In [26]:
# 三个字符的字符串与两个整数的值域得到的笛卡儿积是六个元组（因为3* 2等于6）
list(itertools.product('ABC', range(2)))  # ➊

[('A', 0), ('A', 1), ('B', 0), ('B', 1), ('C', 0), ('C', 1)]

In [27]:
suits = 'spades hearts diamonds clubs'.split()
# 两张牌（'AK'）与四种花色得到的笛卡儿积是八个元组。
list(itertools.product('AK', suits))

[('A', 'spades'),
 ('A', 'hearts'),
 ('A', 'diamonds'),
 ('A', 'clubs'),
 ('K', 'spades'),
 ('K', 'hearts'),
 ('K', 'diamonds'),
 ('K', 'clubs')]

In [28]:
#  如果传入一个可迭代的对象，product函数产出的是一系列只有一个元素的元组，不是特别有用。
list(itertools.product('ABC'))

[('A',), ('B',), ('C',)]

In [29]:
# repeat=N关键字参数告诉product函数重复N次处理输入的各个可迭代对象。
list(itertools.product('ABC', repeat=2)) 

[('A', 'A'),
 ('A', 'B'),
 ('A', 'C'),
 ('B', 'A'),
 ('B', 'B'),
 ('B', 'C'),
 ('C', 'A'),
 ('C', 'B'),
 ('C', 'C')]

In [30]:
list(itertools.product(range(2), repeat=3))
rows = itertools.product('AB', range(2), repeat=2)
for row in rows: print(row)

('A', 0, 'A', 0)
('A', 0, 'A', 1)
('A', 0, 'B', 0)
('A', 0, 'B', 1)
('A', 1, 'A', 0)
('A', 1, 'A', 1)
('A', 1, 'B', 0)
('A', 1, 'B', 1)
('B', 0, 'A', 0)
('B', 0, 'A', 1)
('B', 0, 'B', 0)
('B', 0, 'B', 1)
('B', 1, 'A', 0)
('B', 1, 'A', 1)
('B', 1, 'B', 0)
('B', 1, 'B', 1)


In [31]:
# 演示count、repeat和cycle的用法。

# 使用count函数构建ct生成器
ct = itertools.count()
# 获取ct中的第一个元素
next(ct)

0

In [32]:
# 不能使用ct构建列表，因为ct是无穷的，所以我获取接下来的3个元素。
next(ct), next(ct), next(ct)

(1, 2, 3)

In [34]:
# 如果使用islice或takewhile函数做了限制，可以从count生成器中构建列表。
list(itertools.islice(itertools.count(1, .3), 3))

[1, 1.3, 1.6]

In [35]:
# 使用'ABC'构建一个cycle生成器，然后获取第一个元素——'A'。
cy = itertools.cycle('ABC')
next(cy)

'A'

In [36]:
# 构建一个repeat生成器，始终产出数字7。
list(itertools.islice(cy, 7))

['B', 'C', 'A', 'B', 'C', 'A', 'B']

In [37]:
# 构建一个repeat生成器，始终产出数字7。
rp = itertools.repeat(7)
next(rp), next(rp)

(7, 7)

In [38]:
# 传入times参数可以限制repeat生成器生成的元素数量：这里会生成4次数字8。
list(itertools.repeat(8, 4))

[8, 8, 8, 8]

In [39]:
# repeat函数的常见用途：为map函数提供固定参数，这里提供的是乘数5。
list(map(operator.mul, range(11), itertools.repeat(5)))

[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50]

**组合学生成器函数会从输入的各个元素中产出多个值**

In [40]:
list(itertools.combinations('ABC', 2))

[('A', 'B'), ('A', 'C'), ('B', 'C')]

In [41]:
list(itertools.combinations_with_replacement('ABC', 2))

[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]

In [42]:
list(itertools.permutations('ABC', 2))

[('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'C'), ('C', 'A'), ('C', 'B')]

In [43]:
list(itertools.product('ABC', repeat=2))

[('A', 'A'),
 ('A', 'B'),
 ('A', 'C'),
 ('B', 'A'),
 ('B', 'B'),
 ('B', 'C'),
 ('C', 'A'),
 ('C', 'B'),
 ('C', 'C')]

**itertools.groupby函数的用法**

In [44]:
# groupby函数产出(key, group_generator)这种形式的元组。
list(itertools.groupby('LLLLAAGGG'))

[('L', <itertools._grouper at 0x26bb0c47910>),
 ('A', <itertools._grouper at 0x26bb0c47b20>),
 ('G', <itertools._grouper at 0x26bb0c47460>)]

In [45]:
#  处理groupby函数返回的生成器要嵌套迭代：这里在外层使用for循环，内层使用列表推导。
for char, group in itertools.groupby('LLLLAAAGG'):
    print(char, '->', list(group))

L -> ['L', 'L', 'L', 'L']
A -> ['A', 'A', 'A']
G -> ['G', 'G']


In [46]:
# 为了使用groupby函数，要排序输入；这里按照单词的长度排序。
animals = ['duck', 'eagle', 'rat', 'giraffe', 'bear',
           'bat', 'dolphin', 'shark', 'lion']
animals.sort(key=len)
animals

['rat', 'bat', 'duck', 'bear', 'lion', 'eagle', 'shark', 'giraffe', 'dolphin']

In [47]:
# 再次遍历key和group值对，把key显示出来，并把group扩展成列表。
for length, group in itertools.groupby(animals, len):
    print(length, '->', list(group))

3 -> ['rat', 'bat']
4 -> ['duck', 'bear', 'lion']
5 -> ['eagle', 'shark']
7 -> ['giraffe', 'dolphin']


In [None]:
# 这里使用reverse生成器从右向左迭代animals。
for length, group in itertools.groupby(reversed(animals), len):
    print(length, '->', list(group))

**itertools.tee函数产出多个生成器，每个生成器都可以产出输入的各个元素**

In [48]:
list(itertools.tee('ABC'))

[<itertools._tee at 0x26bb2079d80>, <itertools._tee at 0x26bb0cdb400>]

In [49]:
g1, g2 = itertools.tee('ABC')
next(g1)

'A'

In [50]:
next(g2)

'A'

In [51]:
next(g2)

'B'

In [52]:
list(g1)

['B', 'C']

In [53]:
list(g2)

['C']

In [54]:
list(zip(*itertools.tee('ABC')))

[('A', 'A'), ('B', 'B'), ('C', 'C')]