# collections

collections是Python内建的一个集合模块，提供了许多有用的集合类。

## namedtuple

namedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，并可以用属性而不是索引来引用tuple的某个元素。

In [1]:
from collections import namedtuple

In [2]:
Point = namedtuple('Point', ['x', 'y'])
p = Point(1, 2)

In [3]:
p.x

1

In [4]:
p.y

2

In [5]:
isinstance(p, Point)

True

In [6]:
isinstance(p, tuple)

True

In [7]:
# namedtuple('名称', [属性list]):
Circle = namedtuple('Circle', ['x', 'y', 'r'])

## deque

使用list存储数据时，按索引访问元素很快，但是插入和删除元素就很慢了，因为list是线性存储，数据量大的时候，插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向列表，适合用于队列和栈：

In [11]:
from collections import deque

In [12]:
q = deque(['a', 'b', 'c'])
q.append('x')
q.appendleft('y')
q

deque(['y', 'a', 'b', 'c', 'x'])

## defaultdict

In [15]:
from collections import defaultdict

In [16]:
dd = defaultdict(lambda: 'N/A')

In [17]:
dd['key1'] = 'abc'

In [18]:
dd['key1']

'abc'

In [19]:
dd['key2']

'N/A'

## OrderedDict

使用dict时，Key是无序的。在对dict做迭代时，我们无法确定Key的顺序。

如果要保持Key的顺序，可以用OrderedDict：

In [21]:
from collections import OrderedDict

In [22]:
d = dict([('a', 1), ('b', 2), ('c', 3)])
d

{'a': 1, 'b': 2, 'c': 3}

In [23]:
od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])

In [24]:
od

OrderedDict([('a', 1), ('b', 2), ('c', 3)])

## Counter

**Counter**是一个简单的计数器，例如，统计字符出现的个数：

In [1]:
from collections import Counter

In [2]:
c = Counter()
for ch in 'programming':
    c[ch] += 1

In [3]:
c

Counter({'a': 1, 'g': 2, 'i': 1, 'm': 2, 'n': 1, 'o': 1, 'p': 1, 'r': 2})

In [4]:
type(c)

collections.Counter

Counter实际上也是dict的一个子类，上面的结果可以看出，字符'g'、'm'、'r'各出现了两次，其他字符各出现了一次。