# Collections

collections是Python内建的一个集合模块，提供了许多有用的集合类。

## namedtuple

`namedtuple`是一个函数，它用来创建一个自定义的`tuple`类型，并且规定了`tuple`的元素个数，并可以用属性而不是索引来引用`tuple`的某个元素。

它看起来像定义了一个新的`class`，但又不需要那么麻烦。

In [8]:
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
p = Point(1, 2)
print(p[0], p[1])
print(p.x, p.y)
print(p)
print(isinstance(p, Point))
print(isinstance(p, tuple))

1 2
1 2
Point(x=1, y=2)
True
True


## deque

`deque`是一个可以在两端高效地进行插入和删除元素的容器，可以用它来包装一个栈或队列。

In [12]:
from collections import deque

q = deque(['a', 'b', 'c'])
q.append('d')
q.appendleft('x')
print(q)
print(q.pop())
print(q.popleft())
print(q)

deque(['x', 'a', 'b', 'c', 'd'])
d
x
deque(['a', 'b', 'c'])


## defaultdict

使用`dict`时，如果引用的`key`不存在，就会抛出`keyError`。如果希望`key`不存在时，返回一个默认值，就可以使用`defaultdict`

这个功能其实可以使用`get`方法来取代

In [15]:
from collections import defaultdict

dd = defaultdict(lambda: 'N/A')
dd ['key1'] = 'abc'
print(dd['key1'])
print(dd['key2'])

# 和dict里的get方法效果类似
d = dict()
print(d.get('key2', 'N/A'))

abc
N/A
N/A


## OrderedDict

由于`dict`的底层是一个`HashMap`，所以它的元素存储与遍历是无序的。如果我们想要保持`Key`的顺序，可以使用`OrderedDict`。

`OrderedDict`的Key会按照插入的顺序排列，而不是`key`本身的排序。

In [22]:
from collections import OrderedDict

d = dict([('z', 1), ('y', 2), ('x', 3)])
print(d) # 这里每次打印都按插入顺序来排序了，我也没有办法

od = OrderedDict([('z', 1), ('y', 2), ('x', 3)])
print(od)

{'z': 1, 'y': 2, 'x': 3}
OrderedDict([('z', 1), ('y', 2), ('x', 3)])


## ChainMap

`ChainMap`可以把一组`dict`串起来并组成一个逻辑上的`dict`。`ChainMap`本身也是一个`dict`，但是查找的时候，会按照顺序在内部的`dict`依次查找。

什么时候使用`ChainMap`最合适？举个例子：应用程序往往都需要传入参数，参数可以通过命令行传入，可以通过环境变量传入，还可以有默认参数。我们可以用`ChainMap`实现参数的优先级查找，即先查命令行参数，如果没有传入，再查环境变量，如果没有，就使用默认参数。

下面的代码演示了如何查找`user`和`color`这两个参数：

In [None]:
from collections import ChainMap
import os, argparse

# 构造缺省参数:
defaults = {
    'color': 'red',
    'user': 'guest'
}

# 构造命令行参数:
parser = argparse.ArgumentParser()
parser.add_argument('-u', '--user')
parser.add_argument('-c', '--color')
namespace = parser.parse_args()
command_line_args = { k: v for k, v in vars(namespace).items() if v }

# 组合成ChainMap:
combined = ChainMap(command_line_args, os.environ, defaults)

# 打印参数:
print('color=%s' % combined['color'])
print('user=%s' % combined['user'])

## Counter

`Counter`是一个简单的计数器，例如，统计字符出现的个数，它是`dict`的一个子类。

In [25]:
from collections import Counter

c = Counter()
for ch in 'thepythonprogramminglanguage':
    c[ch] = c[ch] + 1
print(c)

Counter({'g': 4, 'n': 3, 'a': 3, 't': 2, 'h': 2, 'e': 2, 'p': 2, 'o': 2, 'r': 2, 'm': 2, 'y': 1, 'i': 1, 'l': 1, 'u': 1})
