collections是python内建的一个集合模块，提供了许多有用的集合类

#### namedtuple

In [3]:
from collections import namedtuple

Point = namedtuple("point", ('x', 'y'))
p = Point(1, 2)
p.x
p.y

2

In [4]:
isinstance(p, Point)

True

In [6]:
isinstance(p, tuple)

True

类似的，如果要用坐标和半径表示一个圆，也可以用namedtuple定义：

In [7]:
circle = namedtuple("Circle", ["x", "y", "z"])

#### deque

In [8]:
from collections import deque

q = deque(['a', 'b', 'c'])
q.append("x")
q.appendleft("y")
q

deque(['y', 'a', 'b', 'c', 'x'])

deque除了实现list的append()和pop()外，还支持appendleft()和popleft()，这样就可以非常高效地往头部添加或删除元素。

#### defaultdict

In [10]:
from collections import defaultdict

dd = defaultdict(lambda: "None")
dd['key1'] = 7
dd["key1"]

7

In [11]:
dd["key2"]

'None'

注意默认值是调用函数返回的，而函数在创建defaultdict对象时传入。

除了在Key不存在时返回默认值，defaultdict的其他行为跟dict是完全一样的。

#### OrderedDict

In [13]:
d = dict([('a', 1), ('c', 3), ('b', 2)])
d

{'a': 1, 'c': 3, 'b': 2}

In [15]:
d.keys()

dict_keys(['a', 'c', 'b'])

In [17]:
from collections import OrderedDict
od = OrderedDict([('a', 1), ('b', 2), ('c', 3)])
od

OrderedDict([('a', 1), ('b', 2), ('c', 3)])

In [18]:
d = dict()

d['a'] = 2
d['c'] = 3
d['b'] = 4
list(d.keys())

['a', 'c', 'b']

In [20]:
od = OrderedDict()
od['z'] = 1
od['y'] = 2
od['x'] = 3
list(od.keys())

['z', 'y', 'x']

In [21]:
from collections import OrderedDict

class LastUpdatedOrderedDict(OrderedDict):

    def __init__(self, capacity):
        super(LastUpdatedOrderedDict, self).__init__()
        self._capacity = capacity

    def __setitem__(self, key, value):
        containsKey = 1 if key in self else 0
        if len(self) - containsKey >= self._capacity:
            last = self.popitem(last=False)
            print('remove:', last)
        if containsKey:
            del self[key]
            print('set:', (key, value))
        else:
            print('add:', (key, value))
        OrderedDict.__setitem__(self, key, value)

#### ChainMap

ChainMap可以把一组dict串起来并组成一个逻辑上的dict。ChainMap本身也是一个dict，但是查找的时候，会按照顺序在内部的dict依次查找。

什么时候使用ChainMap最合适？举个例子：应用程序往往都需要传入参数，参数可以通过命令行传入，可以通过环境变量传入，还可以有默认参数。我们可以用ChainMap实现参数的优先级查找，即先查命令行参数，如果没有传入，再查环境变量，如果没有，就使用默认参数。

下面的代码演示了如何查找user和color这两个参数：

In [23]:
from collections import ChainMap
import os, argparse

# 构造缺省参数:
defaults = {
    'color': 'red',
    'user': 'guest'
}

# 构造命令行参数:
parser = argparse.ArgumentParser()
parser.add_argument('-u', '--user')
parser.add_argument('-c', '--color')
namespace = parser.parse_args()
command_line_args = { k: v for k, v in vars(namespace).items() if v }

# 组合成ChainMap:
combined = ChainMap(command_line_args, os.environ, defaults)

# 打印参数:
print('color=%s' % combined['color'])
print('user=%s' % combined['user'])

usage: ipykernel_launcher.py [-h] [-u USER] [-c COLOR]
ipykernel_launcher.py: error: unrecognized arguments: -f C:\Users\Fly\AppData\Roaming\jupyter\runtime\kernel-a77ac00d-027b-467d-8d89-e1844cac1892.json


SystemExit: 2

没有任何参数时，打印出默认参数：

$ python3 use_chainmap.py 

color=red

user=guest

当传入命令行参数时，优先使用命令行参数：

$ python3 use_chainmap.py -u bob

color=red

user=bob

同时传入命令行参数和环境变量，命令行参数的优先级较高：

$ user=admin color=green python3 use_chainmap.py -u bob

color=green

user=bob

#### Counter

Counter是一个简单的计数器，例如，统计字符出现的个数：

In [24]:
from collections import Counter

c = Counter()

for ch in "programming":
    c[ch] = c[ch] + 1


In [25]:
c

Counter({'p': 1, 'r': 2, 'o': 1, 'g': 2, 'a': 1, 'm': 2, 'i': 1, 'n': 1})

In [27]:
c.update("hello")

In [28]:
c

Counter({'p': 1,
         'r': 2,
         'o': 2,
         'g': 2,
         'a': 1,
         'm': 2,
         'i': 1,
         'n': 1,
         'h': 1,
         'e': 1,
         'l': 2})

Counter实际上也是dict的一个子类，上面的结果可以看出每个字符出现的次数。