## collections
>collections在python的官方文档中的解释为**High-performance container datatypes**，直接的中文翻译为高性能容量数据类型

In [1]:
import collections

### Counter
>Counterdict的一个子类，主要是用来对你所访问的对象的频率进行次数的统计

常用的方法有：
- elements()：返回一个迭代器，每个元素重复计算的个数，如果一个元素的计数小于1，就会被忽略
- most_common([n])：返回一个列表，提供n个访问访问频率最高的元素和计数
- substract([iterable-or-mapping])：从迭代对象中减去元素，输入输出可以是0或者负数
- update([iterable-or-mapping])：从迭代对象计数元素或者从另一个映射对象（或计数器）添加

In [4]:
# 统计字符出现次数
c = collections.Counter('hello world')
c

Counter({'h': 1, 'e': 1, 'l': 3, 'o': 2, ' ': 1, 'w': 1, 'r': 1, 'd': 1})

In [5]:
# 统计单词出现个数
c = collections.Counter('hello world hello world hello nihao'.split())
c

Counter({'hello': 3, 'world': 2, 'nihao': 1})

In [6]:
# 可以看到collection.Counter返回的是一个字典类型，可以用过keys和values对其进行访问，同时，既然是字典类型，那么可以用dict[key]对value进行访问
c = collections.Counter('hello hello world'.split())
print(c,type(c))
print(c,c.keys(),c.values())

Counter({'hello': 2, 'world': 1}) <class 'collections.Counter'>
Counter({'hello': 2, 'world': 1}) dict_keys(['hello', 'world']) dict_values([2, 1])


In [8]:
# 查看元素
print('查看元素',list(c.elements()))

查看元素 ['hello', 'hello', 'world']


In [15]:
# 追加元素或者减少元素
# update与subtract函数无返回值，直接在原有对象上面进行操作
c = collections.Counter('hello world'.split())
d = collections.Counter('hello'.split())
# 追加元素
add1 = c+d
add2 = c.copy()
add2.update(d)
print('增加元素',add1)
print(list(add1.elements()),list(add2.elements()))
# 减少元素
sub1 = c-d
sub2 = c.copy()
sub2.subtract(d)
print('减少元素',sub1)
print(list(sub1.elements()),list(sub2.elements()))
# 清除元素
c.clear()
print('清除元素',c)

增加元素 Counter({'hello': 2, 'world': 1})
['hello', 'hello', 'world'] ['hello', 'hello', 'world']
减少元素 Counter({'world': 1})
['world'] ['world']
清除元素 Counter()


### defaultdict
>collections.defaultdict(default_factory)为字典的没有的key值提供一个默认的值。参数应该是一个函数，当没有参数调用时返回默认值，如果没有传递任何内容，则默认为None

In [16]:
d = collections.defaultdict()
e = collections.defaultdict(str)
print(d,e)

defaultdict(None, {}) defaultdict(<class 'str'>, {})


defaultdict的一个典型用法是使用其中一种内置类型（如str、int、list或dict）作为默认工厂，因为这些内置类型在没有参数调用时返回空类型

In [22]:
# 可以看到collections中defaultdict与dict类型最大的不同时，在输入字典中没有的key值时，会默认更新一个对应value为指定类型的空值，并不会抛除异常
# str-----> ''
# int-----> 0
# list----> []
d = collections.defaultdict(list)
print(d)
print('hello:',d['hello'])
print(d)

defaultdict(<class 'list'>, {})
hello: []
defaultdict(<class 'list'>, {'hello': []})


### OrderedDict
>Python字典中的键的顺序是任意的：它们不受添加的顺序的控制，**collections.OrderedDict**类提供了保留它们添加顺序的字典对象

In [24]:
# 如果在已经存在的key上添加新的值，将会保留原来的key的位置，然后覆盖value值
orderDict = collections.OrderedDict()
normalDict = dict()
for i in range(10):
    orderDict.update({str(i):i})
    normalDict.update({str(i):i})
print(orderDict,normalDict)

OrderedDict([('0', 0), ('1', 1), ('2', 2), ('3', 3), ('4', 4), ('5', 5), ('6', 6), ('7', 7), ('8', 8), ('9', 9)]) {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}


### namedtuple
>三种定义命名元组的方法：第一个参数是命名元组的构造器（如下的：Person，Human）

In [25]:
Person = collections.namedtuple('Person',['age','height','name'])
Human = collections.namedtuple('Human','age,height,name')
Human2 = collections.namedtuple('Human2','age height name')

In [26]:
# 实例化命名元组
tom = Person(30,178,'Tom')
jack = Human(20,179,'jack')
print(tom,jack)
# 直接通过 实例名+.+属性 来调用
print(tom.age,jack.name)

Person(age=30, height=178, name='Tom') Human(age=20, height=179, name='jack')
30 jack


### deque
>**collections.deque**返回一个新的双向队列对象，从左到右初始化(用方法append()),从iterable(迭代对象)数据创建。如果iterable没有指定，新队列为空
>**collections.deque**队列支持线程安全，对于从两端添加(append)或者弹出(pop)，复杂度为O(1)
>>虽然**list**对象也支持类似操作，但是这里优化了定长操作(pop(0)、insert(0,v))的开销
如果maxlen没有指定或者是None，deques可以增长到任意长度，否则，deque就限定到指定最大长度。**一旦限定长度的deque满了，当新项加入时，同样数量的项就从另一端弹出**
支持的方法：
- append(x)：添加x到右端
- appendleft(x)：添加x到左端
- clear()：清除所有元素，长度变为0
- copy()：创建一份浅拷贝
- count(x)：计算队列中个数等于x的元素
- extend(iterable)：在队列右侧添加iterable中的元素
- extendleft(iterable)：在队列左侧添加iterable中的元素，注：往左侧添加时，iterable参数的顺序将会反过来添加
- index(x[,start[,stop]])：返回第x个元素(从start开始计算，在stop之前)。返回第一个匹配，如果没有找到的话，提出**ValueError**异常
- insert(i,x)：在位置i插入x。注：如果插入会导致一个限长deque超出长度maxlen的话，就抛出一个**IndexError**
- pop()：移除最右侧的元素
- popleft()：移除最左侧的元素
- remove(value)：移去找到的第一个value，没有则抛出**ValueError**
- reverse()：将deque逆序排列，返回None
- maxlen：队列的最大长度，没有限定则为None

In [27]:
d = collections.deque(maxlen=10)
print(d)

d.extend('python')
print([i.upper() for i in d])

d.append('e')
d.appendleft('f')
print(d)

deque([], maxlen=10)
['P', 'Y', 'T', 'H', 'O', 'N']
deque(['f', 'p', 'y', 't', 'h', 'o', 'n', 'e'], maxlen=10)


### ChainMap
>一个ChainMap将多个字典或者其他映射组合在一起，创建一个单独的可更新的试图。如果没有maps被指定，就提供一个默认的空字典。**ChainMap**是管理嵌套上下文和覆盖的有用工具

In [30]:
d1 = {'apple':1,'banana':2}
d2 = {'orange':2,'apple':3,'pike':1}
combined_d = collections.ChainMap(d1,d2)
reverse_combined_d = collections.ChainMap(d2,d1)
print(combined_d)
print(reverse_combined_d)
for k,v in combined_d.items():
    print(k,v)
print('=============reverse===============')
for k,v in reverse_combined_d.items():
    print(k,v)
# 可以看出在多个字典含有相同的key值的情况下，ChainMap仅仅保留第一个key值对应的value值
print(combined_d['apple'],reverse_combined_d['apple'])

ChainMap({'apple': 1, 'banana': 2}, {'orange': 2, 'apple': 3, 'pike': 1})
ChainMap({'orange': 2, 'apple': 3, 'pike': 1}, {'apple': 1, 'banana': 2})
orange 2
apple 1
pike 1
banana 2
apple 3
banana 2
orange 2
pike 1
1 3
