# collections

## 0. 分类： 
1. `namedtuple()` : 可命名元组，通过名字来访问元组元素
1. `deque` : 双向队列
1. `ChainMap` : 多个映射创建单一视图的类字典类型
1. `Counter` : 计数器，用于统计可哈希对象的数量；
1. `OrderedDict` : 有序字典
1. `defaultdict` : 值带有默认类型的字典
1. `UserDict` : 
1. `UserList` : 
1. `UserString` : 

In [71]:
import collections

## 1 namedtuple

`collections.namedtuple(typename, field_names, verbose=False, rename=False) `  
参数说明：
1. `typename`：此元组的名称； 
2. `field_names`：元祖中元素的名称（类似于c结构体中的age等），此字段有多种表达方式，见例子； 
3. `rename`：如果元素名称中含有python的关键字，则必须设置为rename=True； 
4. `verbose`：默认就好。

In [3]:
# 其中field_names 有多种表达方式，如下
student = collections.namedtuple('student','name age sex')
student = collections.namedtuple('student',['name','age','sex'])
student = collections.namedtuple('student','name,age,sex')

spark=student(name='sunYang',age=20,sex='male')

print(spark)
print("spark's name is %s" % spark.name)
print("%s is %d years old %s" % spark)

student(name='sunYang', age=20, sex='male')
spark's name is sunYang
sunYang is 20 years old male


In [4]:
# rename=true 的作用
with_class = collections.namedtuple('Person','name age class gender',rename=True)
print(with_class._fields)
two_ages = collections.namedtuple('Person','name age gender age',rename=True)
print(two_ages._fields)

('name', 'age', '_2', 'gender')
('name', 'age', 'gender', '_3')


## 2 deque

1. 概念
    1. list存储数据的优势在于按索引查找元素会很快，但是插入和删除元素就很慢了，因为list是基于数组实现的。
    2. `deque`是为了高效实现插入和删除操作的双向列表，适合用于队列和栈，而且线程安全。
    3. `list`只提供了`append/pop`方法来从list的尾部插入/删除元素;
    `deque`新增了`appendleft/popleft`等方法允许我们高效的在元素的开头来插入/删除元素。  
    而且使用deque在队列两端append或pop元素的算法复杂度大约是O(1)，但是对于list对象改变列表长度和数据位置的操作例如 pop(0)和insert(0, v)操作的复杂度高达O(n)。

2. 方法
    1. `append(x)/appendleft(x)`
    2. `extend(iterable)/extendleft(iterable)`
    3. `pop()/popleft()`
    4. `clear()`
    5. `copy()`
    6. `count(x)`：计数
    7. `index(x[, start[, stop]])`：找出第一个匹配到x的index值
    8. `insert(i, x)`：插入
    9. `remove(value)`：
    10. `reverse()`: 逆序
    11. `rotate(n=1)`：旋转 d.appendleft(d.pop()); d.append(d.popleft())
    12. `maxlen`：最大长度

In [31]:
from collections import deque
dq = deque(range(10))
dq

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [32]:
# 右添加
dq.append(4)
dq

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 4])

In [33]:
# 左添加
dq.appendleft(0)
dq

deque([0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 4])

In [36]:
# 右扩展
dq.extend([5,6,7])
dq

deque([0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, 7])

In [37]:
# 左扩展
dq.extendleft([-5,-6,-7])
dq

deque([-7, -6, -5, 0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, 7])

In [39]:
# 右弹出
r_pop = dq.pop()
r_pop, dq

(7, deque([-7, -6, -5, 0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6]))

In [40]:
# 左弹出
r_pop = dq.popleft()
r_pop, dq

(-7, deque([-6, -5, 0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6]))

In [47]:
dq.reverse()
dq

deque([3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, -6, -5, 0, 0, 1, 2])

In [48]:
dq.rotate(2)
dq

deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, -6, -5, 0, 0])

In [49]:
dq.rotate(-2)
dq

deque([3, 4, 5, 6, 7, 8, 9, 4, 5, 6, 7, 5, 6, -6, -5, 0, 0, 1, 2])

## 3 chainmap

`ChainMap` 可以用来合并多个字典。

In [50]:
from collections import ChainMap
d = ChainMap({'zebra': 'black'}, 
             {'elephant': 'blue'}, 
             {'lion': 'yellow'})
d['lion'] = 'orange'
d['snake'] = 'red'
d

ChainMap({'zebra': 'black', 'lion': 'orange', 'snake': 'red'}, {'elephant': 'blue'}, {'lion': 'yellow'})

In [51]:
del d['lion']

In [53]:
try:
    del d['elephant']
except Exception as e:
    print(e)

"Key not found in the first mapping: 'elephant'"


In [54]:
a = {'a': 'A', 'c': 'C'}
b = {'b': 'B', 'c': 'D'}

m = ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})
m

ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})

In [55]:
m.maps

[{'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'}]

In [57]:
a['c'] = 'E'
m['c']

'C'

In [58]:
m

ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})

In [61]:
m2 = m.new_child()
m2['c'] = 'f'
m2

ChainMap({'c': 'f'}, {'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})

In [62]:
m

ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})

In [63]:
m2.parents

ChainMap({'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'})

## 4 Counter

**功能：**  
Counter 作为字典(dict)的一个子类用来进行hashtable计数，将元素进行数量统计、计数后返回一个字典,键值为元素：值为元素个数

**方法：**
1. `most_common(int)`：按照元素出现的次数进行从高到低的排序,返回前int个元素的字典
2. `elements`：返回经过计数器Counter后的元素,返回的是一个迭代器  
3. `update`: update 和set集合的update一样,对集合进行并集更新  
4. `substract`:substract 和update类似，只是update是做加法，substract做减法,从另一个集合中减去本集合的元素。
5. `iteritems`:与字典dict的items类似，返回由Counter生成的字典的所有item,只是在Counter中此方法返回的是一个迭代器,而不是列表。
6. `iterkeys`: 与字典dict的keys方法类似，返回由Counter生成的字典的所有key,只是在Counter中此方法返回的是一个迭代器,而不是列表。
7. `itervalues`: 与字典dict的values方法类似，返回由Counter生成的字典的所有value,只是在Counter中此方法返回的是一个迭代器,而不是列表。

In [66]:
from collections import Counter
s = 'abcbcaccbbad'  
l = ['a','b','c','c','a','b','b']  
d = {'2': 3, '3': 2, '17': 2}  
# Counter 获取各元素的个数,返回字典  
print(Counter(s))   # Counter({'c': 4, 'b': 4, 'a': 3})  
print(Counter(l))   # Counter({'b': 3, 'a': 2, 'c': 2})  
print(Counter(d))   # Counter({3: 3, 2: 2, 17: 1})  

Counter({'b': 4, 'c': 4, 'a': 3, 'd': 1})
Counter({'b': 3, 'a': 2, 'c': 2})
Counter({'2': 3, '3': 2, '17': 2})


# 5 OrderedDict

**功能：**  
有序字典。 

In [94]:
# 定义传统字典  
dic1 = dict()  
# 按顺序添加字典内容  
dic1['a'] = '123'  
dic1['b'] = 'jjj'  
dic1['c'] = '394'  
dic1['d'] = '999'  
print(dic1)    # 结果： 每次的结果不一样
# 排序  
dic1_key_list = []  
for k in dic1.keys():  
    dic1_key_list.append(k)  
dic1_key_list.sort()  
for key in dic1_key_list:  
    print('dic1字典排序结果 %s:%s' %(key,dic1[key]))  

{'a': '123', 'b': 'jjj', 'c': '394', 'd': '999'}
dic1字典排序结果 a:123
dic1字典排序结果 b:jjj
dic1字典排序结果 c:394
dic1字典排序结果 d:999


In [79]:
# 定义有序字典  
from collections import OrderedDict
dic2 = OrderedDict()  
dic2['a'] = '123'  
dic2['b'] = 'jjj'  
dic2['c'] = 'abc'  
dic2['d'] = '999'  
for k, v in dic2.items():  
    print('有序字典：%s:%s' %(k,v))  

有序字典：a:123
有序字典：b:jjj
有序字典：c:abc
有序字典：d:999


## 6 defaultdict

**功能：**  
带有默认值的
**方法：**  

In [None]:
from collections import defaultdict

In [95]:
dd = defaultdict(lambda: 'N/A')
dd['key1'] = 'abc'

NameError: name 'defaultdict' is not defined