Python拥有一些内置的数据类型，比如`str,int,float,list,tuple,dict`等，`collections`模块在这些内置数据类型的基础上，提供了几个额外的数据类型：

1. Counter：计数器，主要用来计数
2. deque：双端队列，可以快速地从另外一侧追加和弹出对象
3. defaultdict：默认字典，带有默认值的字典
4. OrderedDict：有序字典
5. namedtuple：可命名元组，生成可以使用名字来访问元素内容的tuple

# collections.Counter

`Counter`作为字典`dicit()`的一个子类用来进行`hashtable`计数，将元素进行数量统计，计数后返回一个字典，键key为元素，值value为元素个数。

## 常用方法

|由Counter()生成的字典，它的方法|用途|
|--|--|
|most_common(num)|按照元素出现的次数进行从高到低的排序，返回前num个元素的字典|
|elements()|返回经过计算器Counter后的元素，返回的是一个迭代器|
|update(element)|和set集合的update一样，对集合进行并集更新|
|subtract(element)|和update类似，只是update是做加法，subtract做减法,从另一个集合中减去本集合的元素|
|items()|返回由Counter生成的字典的所有item|
|keys()|返回由Counter生成的字典的所有key|
|values()|返回由Counter生成的字典的所有value|

## 例子

In [1]:
from collections import Counter

string = 'abababcdefdedfe' # 字符串
lst = ["a","b","c","a","b","b"] # 列表
d = {"1":3, "3":2, "17":2} # 字典

### Counter获取各元素的个数，以字典形式返回

In [2]:
print('Counter(string): ',Counter(string))
print('Counter(lst): ',Counter(lst))
print('Counter(d): ',Counter(d))

Counter(string):  Counter({'a': 3, 'b': 3, 'd': 3, 'e': 3, 'f': 2, 'c': 1})
Counter(lst):  Counter({'b': 3, 'a': 2, 'c': 1})
Counter(d):  Counter({'1': 3, '3': 2, '17': 2})


### most_common(num)按照元素出现的次数进行从高到低的排序，返回前num个元素的字典

In [3]:
d1 = Counter(string)
print('d1.most_common(2): ',d1.most_common(2))

d1.most_common(2):  [('a', 3), ('b', 3)]


### elements返回经过计算器Counter后的元素，返回的是一个迭代器

In [4]:
print('sorted(d1.elements()): ',sorted(d1.elements()))
print("(''.join(d1.elements())): ",''.join(d1.elements()))
print()
#若是字典的话返回value个key
d2 = Counter(d)
print("若是字典的话返回value个key:", sorted(d2.elements()))

sorted(d1.elements()):  ['a', 'a', 'a', 'b', 'b', 'b', 'c', 'd', 'd', 'd', 'e', 'e', 'e', 'f', 'f']
(''.join(d1.elements())):  aaabbbcdddeeeff

若是字典的话返回value个key: ['1', '1', '1', '17', '17', '3', '3']


### update和set集合的update一样，对集合进行并集更新

In [5]:
print('d1.update("sas1"): ',d1.update("sas1"))
print(d1)

d1.update("sas1"):  None
Counter({'a': 4, 'b': 3, 'd': 3, 'e': 3, 'f': 2, 's': 2, 'c': 1, '1': 1})


### items返回Counter生成的字典的所有item

In [6]:
print(d1.items())
print()
print(d1.keys())
print()
print(d1.values())

dict_items([('a', 4), ('b', 3), ('c', 1), ('d', 3), ('e', 3), ('f', 2), ('s', 2), ('1', 1)])

dict_keys(['a', 'b', 'c', 'd', 'e', 'f', 's', '1'])

dict_values([4, 3, 1, 3, 3, 2, 2, 1])


# collections.deque

`deque`其实是 `double-ended queue` 的缩写,即`双端队列`，它最大的好处就是**实现了从队列 头部快速增加和取出对象**: `.popleft()`, `.appendleft()` 。你可能会说，原生的list也可以从头部添加和取出对象啊？就像这样：

1. lst.insert(0, v)
2. lst.pop(0)

但是值得注意的是，**list对象**的这两种用法的**时间复杂度是 O(n)** ，也就是说随着元素数量的增加耗时呈 线性上升。而使用**deque对象**则是 **O(1) 的复杂度**，所以当你的代码有这样的需求的时候， 一定要记得使用deque。

## deque对象的方法

|由deque()生成的双端队列，它的方法|作用|
|--|--|
|append(x)|队列右边添加元素|
|appendleft(x)|队列左边添加元素|
|clear()|清空队列中的所有元素|
|count(x)|返回队列中包含value的个数|
|extend(iterable)|在队列右边扩展，iterable可以是列表、元组或字典，如果是字典则将字典的key加入到deque|
|extendleft(iterable)|同extend，在左边扩展|
|pop()|移除并返回队列右边的元素|
|popleft()|移除并返回队列左边的元素|
|remove(value)|移除队列第一个出现的元素value|
|reverse()|队列的所有元素进行反转|
|rotate(n)|对队列数移动n个元素，移出的元素加到队列的另一端；如果n为负数，则向左移动。|
|maxlen|队列的最大长度，如果为None,则队列没有边界|

## 例子

### 创建队列和迭代队列元素

In [7]:
from collections import deque

# 创建队列
d = deque('ghi')
print('d: ',d)
print()
# 迭代队列元素
for elem in d:
    print(elem)

d:  deque(['g', 'h', 'i'])

g
h
i


### 元素入队：从左侧头部 和 从右侧尾部

In [8]:
d.append('j') # 在右侧给队列尾部添加元素
d.append('f') # 在左侧队列头部添加元素
print('d: ',d)

d:  deque(['g', 'h', 'i', 'j', 'f'])


### 元素出队：从左侧头部 和 从右侧尾部

In [9]:
d.pop() # 从右侧尾部出队，并返回出队的元素

'f'

In [10]:
d.popleft() # 从左侧头部出队，并返回出队的元素

'g'

In [11]:
print('d: ',d)

d:  deque(['h', 'i', 'j'])


### 查看队列头部和尾部元素：队列元素可通过索引查看

In [12]:
d[0] # 队列左侧头部元素

'h'

In [13]:
d[-1] # 队列右侧尾部元素

'j'

In [14]:
d[1] # 索引查看元素

'i'

### 扩展队列：用可迭代的对象来扩展

In [15]:
ex1 = [1,2,3] # 列表
ex2 = {'a':3,'b':5} # 字典
ex3 = (99,88) # 元组

In [16]:
print('d: ',d)

d:  deque(['h', 'i', 'j'])


In [17]:
d.extend(ex1) # 从队列尾部扩展
d

deque(['h', 'i', 'j', 1, 2, 3])

In [18]:
d.extendleft(ex2) # 从队列头部扩展
d

deque(['b', 'a', 'h', 'i', 'j', 1, 2, 3])

In [19]:
d.extend(ex3)
d

deque(['b', 'a', 'h', 'i', 'j', 1, 2, 3, 99, 88])

### 旋转队列：从尾部和头部

In [20]:
d.rotate(1) # 从尾部
d

deque([88, 'b', 'a', 'h', 'i', 'j', 1, 2, 3, 99])

In [21]:
d.rotate(-1)
d

deque(['b', 'a', 'h', 'i', 'j', 1, 2, 3, 99, 88])

### 反转队列元素

In [22]:
d.reverse()
d

deque([88, 99, 3, 2, 1, 'j', 'i', 'h', 'a', 'b'])

### 队列长度

In [23]:
print(d.maxlen)

None


# collections.defaultdict

默认字典，字典的一个子类，继承所有字典的方法，**默认字典**在进行定义初始化的时候,得指定字典 值value 的**默认类型**

In [24]:
from collections import defaultdict

# 可以指定字典的 value 默认类型为 一个字典
dic1 = defaultdict(dict)
dic1['k1'].update({'asda':123})
print('dic1: ',dic1)

dic1:  defaultdict(<class 'dict'>, {'k1': {'asda': 123}})


字典dic在定义的时候，就定义好了值为字典类型。 虽然现在字典中还没有键值key，但仍然可以执行字典的update方法. 这种操作方式在传统的字典类型中是无法实现的,必须赋值以后才能进行值得更新操作，否则会报错。

# collections.OrderedDict

在Python中，`dict`这个数据结构由于hash的特性，是无序的，这在有的时候会给我们带来一些麻烦。 幸运的是，`collections`模块为我们提供了`OrderedDict`，当你要获得一个有序的字典对象时，用它就对了。

In [25]:
from collections import OrderedDict

dic = OrderedDict()
dic['a'] = 123
dic['b'] = 456
dic['c'] = 789
dic['d'] = 963
for k,v in dic.items():
    print(k,v)

a 123
b 456
c 789
d 963


# collections.namedtuple

主要用来产生可以使用名称来访问元素的数据对象，通常用来增强代码的可读性， 在访问一些tuple类型的数据时尤其好用。`namedtuple`由自己的类工厂`namedtuple()`进行创建，而不是由表中的元组进行初始化，通过`namedtuple`创建类的参数 包括**类名称** 和 一个包含**元素名称的字符串**

In [26]:
from collections import namedtuple

# 其中，person是创建的类名称，字符串'name,age,sex'是每个类应的元组：(name,age,sex)
# 它有三个元素，且每个元素都有名称
p = namedtuple('person','name,age,sex',rename=True) 
print('p的类型: ',type(p))
zhangjialin = p('zhangjialin',29,'male')
print(zhangjialin)
print(zhangjialin.name,zhangjialin.age,zhangjialin.sex)

p的类型:  <class 'type'>
person(name='zhangjialin', age=29, sex='male')
zhangjialin 29 male


`参数rename`: 使用namedtuple()来创建类的时候，传递的成员属性参数名称不能非法(不能重复，不能为系统标识符)，否则会报错。`namedtuple`提供`rename=True`参数会使系统自动的将错误的参数通过“下划线+参数索引”的方式将参数名称替换。