## collections  
collections是Python内建的一个集合模块，提供了许多有用的集合类。

### namedtuple 

namedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，并可以用属性而不是索引来引用tuple的某个元素。

这样一来，我们用namedtuple可以很方便地定义一种数据类型，它具备tuple的不变性，又可以根据属性来引用，使用十分方便。

可以验证创建的Point对象是tuple的一种子类：

In [7]:
from collections import namedtuple

Point = namedtuple('point',['x','y'])
p = Point(1,2)
print(p.x,p.y)
print(isinstance(p,Point))
print(isinstance(p,tuple))

# 如果要用坐标和半径表示一个圆，也可以用namedtuple定义：
# namedtuple('名称'，[属性list])
Circle = namedtuple('Circle',['x','y','r'])
c = Circle(1,1,1)
print('圆的坐标：({},{})；圆的半径为：{}'.format(c.x,c.y,c.r))

1 2
True
True
圆的坐标：(1,1)；圆的半径为：1


### deque

使用list存储数据时，按索引访问元素很快，但是插入和删除元素就很慢了，因为list是线性存储，数据量大的时候，插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向列表，适合用于队列和栈：

deque就是双端队列，是一种具有队列和栈的性质的数据结构，适合于在两端添加和删除，类似与序列的容器。

常用的方法

d=deque([])        #创建一个空的双队列

d.append(item)        #在d的右边(末尾)添加项目item

d.appendleft(item)         #从d的左边(开始)添加项目item

d.clear()              #清空队列,也就是删除d中的所有项目

d.extend(iterable)     #在d的右边(末尾)添加iterable中的所有项目

d.extendleft(item)   #在d的左边(开始)添加item中的所有项目

d.pop()          #删除并返回d中的最后一个(最右边的)项目。如果d为空，则引发IndexError

d.popleft()      #删除并返回d中的第一个(最左边的)项目。如果d为空，则引发IndexError

d.rotate(n=1)       #将d向右旋转n步(如果n<0,则向左旋转)

d.count(n)       #在队列中统计元素的个数，n表示统计的元素

d.remove(n)       #从队列中删除指定的值

d.reverse()      #翻转队列

In [15]:
from collections import deque

q = deque(['a','b','c'])
q.appendleft('y')
print(q)
q.extendleft([1,2,3,'y','e'])
print(q)
print(q.popleft())
print(q)
q.rotate(1)
print(q)
print(q.count('y'))
q.remove('y')
print(q)
q.reverse()
print(q)
q.clear()
print(q)

deque(['y', 'a', 'b', 'c'])
deque(['e', 'y', 3, 2, 1, 'y', 'a', 'b', 'c'])
e
deque(['y', 3, 2, 1, 'y', 'a', 'b', 'c'])
deque(['c', 'y', 3, 2, 1, 'y', 'a', 'b'])
2
deque(['c', 3, 2, 1, 'y', 'a', 'b'])
deque(['b', 'a', 'y', 1, 2, 3, 'c'])
deque([])


### defaultdict

使用dict时，如果引用的Key不存在，就会抛出KeyError。如果希望key不存在时，返回一个默认值，就可以用defaultdict

In [2]:
from collections import defaultdict

dd = defaultdict(lambda:'N/A')
dd['key1'] = 'abc'
print(dd['key1'])
print(dd['key2'])

abc
N/A


注意默认值是调用函数返回的，而函数在创建defaultdict对象时传入。

除了在Key不存在时返回默认值，defaultdict的其他行为跟dict是完全一样的。

### OrderedDict

使用dict时，Key是无序的。在对dict做迭代时，我们无法确定Key的顺序。

如果要保持Key的顺序，可以用OrderedDict：

In [38]:
from collections import OrderedDict

d = dict([('a', 1), ('b', 2), ('c', 3)])
print(d)# dict 是无序的
od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
print(od)

{'a': 1, 'b': 2, 'c': 3}
OrderedDict([('a', 1), ('b', 2), ('c', 3)])


注意，OrderedDict的Key会按照插入的顺序排列，不是Key本身排序：

In [39]:
from collections import OrderedDict

g = OrderedDict()
g['z'] = 1
g['y'] = 2
g['x'] = 3
print(g)

OrderedDict([('z', 1), ('y', 2), ('x', 3)])


### Counter 类

Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型，以字典的键值对形式存储，其中元素作为key，其计数作为value。计数值可以是任意的Interger（包括0和负数）

http://www.pythoner.com/205.html


#### 创建Counter类

Counter类创建的四种方法：

In [41]:
from collections import Counter

a = Counter() # 创建一个空的Counter类
b = Counter('gallahad') # 从一个iterable对象（list,tuple,dict,字符串）创建
c = Counter({'a':4,'b':2}) # 从一个字典对象创建
d = Counter(a=4,b=2) # 从一组键值对创建

print(a,b,c,d)

Counter() Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1}) Counter({'a': 4, 'b': 2}) Counter({'a': 4, 'b': 2})


#### 计数值的访问与缺失的键

当所访问的键不存在时，返回0，而不是KeyError；否则返回它的计数。

In [42]:
from collections import Counter

c = Counter('abcdefgab')
print(c['a'])
print(c['g'])
print(c['h'])

2
1
0


#### 计数器的更新（update and subtract）

可以使用一个iterable对象或者另一个Counter对象来更新键值。

计数器的更新包括增加和减少两种。其中，增加使用update()方法；
减少则使用subtract()方法。

In [49]:
from collections import Counter

# 增加使用update()方法
c = Counter('Which')
print(c['h'])
c.update('Which') # 使用另一个iterable 对象
print(c['h'])

d = Counter('Which')
c.update(d) #使用另一个Counter对象
print(c['h'])

# 减少使用subtract()方法
a = Counter('Which')
print(a['h'])
a.subtract('Whichh')
print(a['h'])

2
4
6
2
-1


#### 键的删除

当计数值为0时，并不意味着元素被删除，删除元素应当使用del。

In [54]:
from collections import Counter

c = Counter('abcdcba')
print(c)
c['b'] = 0
print(c)
del c['a']
print(c)
print(c['a'])
print(c['b'])

Counter({'a': 2, 'b': 2, 'c': 2, 'd': 1})
Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0})
Counter({'c': 2, 'd': 1, 'b': 0})
0
0


#### elements()

返回一个迭代器。元素被重复了多少次，在该迭代器中就包含多少个该元素。元素排列无确定顺序，个数小于1的元素不被包含。

In [4]:
from collections import Counter

c = Counter(a=4,b=2,c=0,e=1)
list(c.elements())

['a', 'a', 'a', 'a', 'b', 'b', 'e']

#### most_common([0])

返回一个TopN列表。如果n没有被指定，则返回所有元素。当多个元素计数值相同时，排列是无确定顺序的。

In [5]:
from collections import Counter

c = Counter('abracadabra')
c.most_common()

[('a', 5), ('b', 2), ('r', 2), ('c', 1), ('d', 1)]