# Collections 容器数据类型
## 1. class collections.ChainMap(*maps)

In [1]:
pass

## 2. class collections.Counter([iterable-or-mapping])
一个计数器工具提供快速和方便的计数

In [2]:
from collections import Counter

cnt = Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1
cnt

In [3]:
# import re

# words = re.findall(r'\w+', open('hamlet.txt').read().lower())
# Counter(words).most_common(10)

In [4]:
c = Counter()
# 从一个iterable的对象创建
c = Counter("gallahad")
c

In [5]:
c = Counter([1, 1, 2, 3, 5])
c

In [6]:
# 从一个mapping的对象创建
c = Counter({'red': 4, 'blue': 2})
c

Counter({'red': 4, 'blue': 2})

In [7]:
c = Counter(['eggs', 'ham'])
c

Counter({'eggs': 1, 'ham': 1})

In [8]:
c['bacon']  

0

In [9]:
c['sausage'] = 0
c

Counter({'eggs': 1, 'ham': 1, 'sausage': 0})

In [10]:
del c['sausage'] 
c

Counter({'eggs': 1, 'ham': 1})

In [11]:
# elements() 返回一个迭代器，每个元素重复计数的个数。元素顺序是任意的。
# 如果一个元素的计数小于1， elements() 就会忽略它。
# 这里a是4个，b是2个，所以elements() 会返回4个a和2个b。
c = Counter(a=4, b=2, c=0, d=-2)
c

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})

In [12]:
sorted(c.elements())

['a', 'a', 'a', 'a', 'b', 'b']

In [13]:
# most_common([n])
# 返回一个包含n个最多元素和他们的计数。如果n没有传入或None，
# most_common()返回所有计数器的元素
c = Counter('abracadabra')
c

Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

In [14]:
c.most_common(3)

[('a', 5), ('b', 2), ('r', 2)]

In [15]:
c.most_common()

[('a', 5), ('b', 2), ('r', 2), ('c', 1), ('d', 1)]

In [16]:
# subtract([iterable-or-mapping])
# 从 迭代对象 或 映射对象 减去元素。
# 像 dict.update() 但是是减去，而不是替换。
# 输入和输出都可以是0或者负数。
c = Counter(a=4, b=2, c=0, d=-2)
c

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})

In [17]:
d = Counter(a=1, b=2, c=3, d=4)
d

Counter({'a': 1, 'b': 2, 'c': 3, 'd': 4})

In [18]:
c.subtract(d)
c

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})

In [19]:
sum(c.values()) # total of all counts

-6

In [20]:
c.clear()   # reset all counts
c

Counter()

In [21]:
c = Counter(a=1, b=2, c=3, d=4)
list(c)

['a', 'b', 'c', 'd']

In [22]:
set(c)

{'a', 'b', 'c', 'd'}

In [23]:
dict(c)

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

In [24]:
c.items()

dict_items([('a', 1), ('b', 2), ('c', 3), ('d', 4)])

In [25]:
# convert from a list of (elem, cnt) pairs
list_of_pairs = (('a', 1), ('b', 2), ('c', 3), ('d', 4))
Counter(dict(list_of_pairs))

Counter({'a': 1, 'b': 2, 'c': 3, 'd': 4})

In [26]:
# n least common elements, 最少的n个元素
# c.most_common()[:-n-1:-1] 
c.most_common()[:-3:-1]

[('a', 1), ('b', 2)]

In [27]:
c = Counter(a=3, b=1)
d = Counter(a=1, b=2)

In [28]:
c + d

Counter({'a': 4, 'b': 3})

In [29]:
c - d

Counter({'a': 2})

In [30]:
c & d

Counter({'a': 1, 'b': 1})

In [31]:
c | d

Counter({'a': 3, 'b': 2})

In [32]:
c = Counter(a=2, b=-4)
+c

Counter({'a': 2})

In [33]:
-c

Counter({'b': 4})

## 3. class collections.deque([iterable[, maxlen]])

* 线程安全
* 双端append和pop复杂度均为O(1)


返回一个新的双向队列对象，从左到右初始化(用方法 append()) ，从 iterable （迭代对象) 数据创建。如果 iterable 没有指定，新队列为空。

Deque队列是由栈或者queue队列生成的（发音是 “deck”，”double-ended queue”的简称）。Deque 支持线程安全，内存高效添加(append)和弹出(pop)，从两端都可以，两个方向的大概开销都是 O(1) 复杂度。

如果 maxlen 没有指定或者是 None ，deques 可以增长到任意长度。否则，deque就限定到指定最大长度。一旦限定长度的deque满了，当新项加入时，同样数量的项就从另一端弹出。限定长度deque提供类似Unix filter tail 的功能。它们同样可以用与追踪最近的交换和其他数据池活动。

append(x)
添加 x 到右端。

appendleft(x)
添加 x 到左端。

pop()
移去并且返回一个元素，deque最右侧的那一个。如果没有元素的话，就升起 IndexError 索引错误。

popleft()
移去并且返回一个元素，deque最左侧的那一个。如果没有元素的话，就升起 IndexError 索引错误。


index(x[, start[, stop]])
返回第 x 个元素（从 start 开始计算，在 stop 之前）。返回第一个匹配，如果没找到的话，升起 ValueError 。


insert(i, x)
在位置 i 插入 x 。

如果插入会导致一个限长deque超出长度 maxlen 的话，就升起一个 IndexError 。



In [34]:
from collections import deque

d = deque('ghi')
d

deque(['g', 'h', 'i'])

In [35]:
# 迭代
for elem in d:
    print(elem.upper())

G
H
I


In [36]:
# 向右添加
d.append('j')
d

deque(['g', 'h', 'i', 'j'])

In [37]:
# 向左添加
d.appendleft('f') 
d

deque(['f', 'g', 'h', 'i', 'j'])

In [38]:
# 从右侧弹出
x = d.pop()
x

'j'

In [39]:
d

deque(['f', 'g', 'h', 'i'])

In [40]:
# 从左侧弹出
x = d.popleft()
x

'f'

In [41]:
d

deque(['g', 'h', 'i'])

In [42]:
list(d)

['g', 'h', 'i']

In [43]:
list(reversed(d))

['i', 'h', 'g']

In [44]:
'h' in d

True

In [45]:
# 向右拓展d
d.extend('abc')
d

deque(['g', 'h', 'i', 'a', 'b', 'c'])

In [46]:
# 向左拓展d，注意结果
d.extendleft('123')
d

deque(['3', '2', '1', 'g', 'h', 'i', 'a', 'b', 'c'])

In [47]:
# 向右移动1位
d.rotate(1)
d

deque(['c', '3', '2', '1', 'g', 'h', 'i', 'a', 'b'])

In [48]:
# 向左移动2位
d.rotate(-2)
d

deque(['2', '1', 'g', 'h', 'i', 'a', 'b', 'c', '3'])

In [49]:
# 清空
d.clear()
d

deque([])

## 4. class collections.defaultdict([default_factory[, ...]])


In [57]:
from collections import defaultdict

s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
d

defaultdict(list, {})

In [51]:
for k, v in s:
    d[k].append(v)
d

defaultdict(list, {'yellow': [1, 3], 'blue': [2, 4], 'red': [1]})

In [53]:
sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

In [58]:
# 上面的代码与下面的等价，但是更快
d = {}
for k, v in s:
    d.setdefault(k, []).append(v)
d

{'yellow': [1, 3], 'blue': [2, 4], 'red': [1]}

In [54]:
s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1
d

defaultdict(int, {'m': 1, 'i': 4, 's': 4, 'p': 2})

In [55]:
sorted(d.items())

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]

## 5. collections.namedtuple(typename, field_names, *, verbose=False, rename=False, module=None)