# 一、zip

zip() 函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的对象，这样做的好处是节约了不少的内存。

- 可以使用 list() 转换来输出列表。
- 如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同，利用 * 号操作符，可以将元组解压为列表。

语法：zip([iterable, ...])

- iterable——一个或多个迭代器

In [2]:
a = [1,2,3]
b = [4,5,6]
c = [4,5,6,7,8]
zipped = zip(a,b)   # 返回一个对象
list(zipped)     # 转换为列表

[(1, 4), (2, 5), (3, 6)]

In [3]:
list(zip(a,c))      # 元素个数与最短的列表一致

[(1, 4), (2, 5), (3, 6)]

与 zip 相反，zip(*) 可理解为解压，返回二维矩阵式

In [9]:
a1, a2 = zip(*zip(a,b))
print(list(a1))
print(list(a2))

[1, 2, 3]
[4, 5, 6]


# 二、Counter()

Counter() 是 collections 库中的一个函数，可以用来统计一个 python 列表、字符串、元组等可迭代对象中每个元素出现的次数，并返回一个字典。

In [14]:
import numpy as np
from collections import Counter
x = np.random.randint(1,10,100)
counter = Counter(x)
print(counter)

Counter({1: 17, 5: 16, 9: 13, 3: 11, 2: 11, 6: 9, 4: 8, 8: 8, 7: 7})


elements()：将元素返回一个迭代器，每次重复的次数与它的次数相同。元素以任意顺序返回。 如果一个元素的数量少于一个，elements()会忽略它。

In [15]:
x = np.random.randint(1,10,100)
count = Counter(x)
count.elements()

<itertools.chain at 0x25a2e34d160>

In [20]:
x = np.random.randint(1,10,100)
count = Counter(x)
for i in count.elements():
    print(i, end = ',')

7,7,7,7,7,7,7,7,1,1,1,1,1,1,1,1,1,1,1,1,1,5,5,5,5,5,5,5,5,9,9,9,9,9,9,9,9,9,9,6,6,6,6,6,6,6,6,6,6,6,8,8,8,8,8,8,8,8,8,8,8,8,8,8,2,2,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,

most_common(n)：列出n个最常见的元素及其数量。 如果省略n或None，most_common()返回计数器中的所有元素。具有相同计数的元素可以任意排序。

In [22]:
x = np.random.randint(1,10,100)
count = Counter(x)
# 不写参数n，则默认为显示所有元素的数量情况
count.most_common(3)

[(9, 14), (7, 12), (1, 12)]

subtract()：可以看成两个元组之间的加减运算，将各个元素对应的个数进行加减，加减后会更新原数组，也就是本身会被覆盖掉，可以看如下代码：

In [24]:
first = np.random.randint(1,10,20)
second = np.random.randint(1,10,30)
count1 = Counter(first)
count2 = Counter(second)
print(count1)
print(count2)

Counter({6: 6, 2: 3, 9: 3, 4: 3, 5: 2, 3: 1, 7: 1, 1: 1})
Counter({9: 6, 8: 4, 3: 4, 7: 3, 1: 3, 4: 3, 6: 3, 5: 3, 2: 1})


In [25]:
count2.subtract(count1)
print(count2)

Counter({8: 4, 9: 3, 3: 3, 7: 2, 1: 2, 5: 1, 4: 0, 2: -2, 6: -3})


In [26]:
# 多出来的key，得到的结果是随机的负数
x = 'aabbbcc'
y = 'ddeeffffg'
count1 = Counter(x)
count2 = Counter(y)
print(count1)
print(count2)

Counter({'b': 3, 'a': 2, 'c': 2})
Counter({'f': 4, 'd': 2, 'e': 2, 'g': 1})


In [30]:
count2.subtract(count1)
print(count2)

Counter({'f': 4, 'd': 2, 'e': 2, 'g': 1, 'a': -8, 'c': -8, 'b': -12})
