# Python标准库之collections使用教程
http://python.jobbole.com/87201/

# 1. defaultdict的使用
defaultdict(default_factory)在普通的dict(字典)之上添加了default_factory，使得key(键)不存在时会自动生成相应类型的value(值)，default_factory参数可以指定成list, set, int等各种合法类型。


## Example 1

In [2]:
from collections import defaultdict
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]

In [3]:
s

[('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]

In [5]:
d = defaultdict(list)
for k,v in s:
    d[k].append(v)

In [6]:
d

defaultdict(list, {'blue': [2, 4, 4], 'red': [1, 3, 1]})

## Example 2
defaultdict(set)来解决这个问题。set(集合)相比list(列表)的不同之处在于set中不允许存在相同的元素。

In [10]:
d2 = defaultdict(set)
for k,v in s:
    d2[k].add(v)

In [11]:
d2

defaultdict(set, {'blue': {2, 4}, 'red': {1, 3}})

## Example 3
通过使用defaultdict(int)的形式我们来统计一个字符串中每个字符出现的个数。

In [18]:
s3 = "http://python.jobbole.com"

In [19]:
d3 = defaultdict(int)
for k in s3:
    d3[k] += 1

In [20]:
d3

defaultdict(int,
            {'.': 2,
             '/': 2,
             ':': 1,
             'b': 2,
             'c': 1,
             'e': 1,
             'h': 2,
             'j': 1,
             'l': 1,
             'm': 1,
             'n': 1,
             'o': 4,
             'p': 2,
             't': 3,
             'y': 1})

# 2. OrderedDict的使用

我们知道默认的dict(字典)是无序的，但是在某些情形我们需要保持dict的有序性，这个时候可以使用OrderedDict，它是dict的一个subclass(子类)，但是在dict的基础上保持了dict的有序型，下面我们来看一下使用方法。

## Example 1

In [22]:
from collections import OrderedDict
d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

In [23]:
d

{'apple': 4, 'banana': 3, 'orange': 2, 'pear': 1}

In [24]:
OrderedDict(sorted(d.items(),key=lambda t:t[0]))

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])

In [25]:
OrderedDict(sorted(d.items(),key=lambda t:t[1]))

OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('apple', 4)])

In [27]:
OrderedDict(sorted(d.items(),key=lambda t:len(t[0])))

OrderedDict([('pear', 1), ('apple', 4), ('orange', 2), ('banana', 3)])

In [28]:
d

{'apple': 4, 'banana': 3, 'orange': 2, 'pear': 1}

## Example 2
使用popitem(last=True)方法可以让我们按照LIFO(先进后出)的顺序删除dict中的key-value，即删除最后一个插入的键值对，如果last=False就按照FIFO(先进先出)删除dict中key-value。

In [30]:
d2 = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

In [31]:
d2 = OrderedDict(sorted(d.items(), key = lambda t:t[0]))

In [32]:
d2

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])

In [33]:
d2.popitem()

('pear', 1)

In [34]:
d2

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2)])

In [35]:
d2.popitem(last=False)

('apple', 4)

In [36]:
d2

OrderedDict([('banana', 3), ('orange', 2)])

## Example 3
使用move_to_end(key, last=True)来改变有序的OrderedDict对象的key-value顺序，通过这个方法我们可以将排序好的OrderedDict对象中的任意一个key-value插入到字典的开头或者结尾。

In [43]:
d3 = OrderedDict.fromkeys('abcdeabc.')

In [44]:
d3

OrderedDict([('a', None),
             ('b', None),
             ('c', None),
             ('d', None),
             ('e', None),
             ('.', None)])

In [45]:
d3.move_to_end('b')

In [46]:
d3

OrderedDict([('a', None),
             ('c', None),
             ('d', None),
             ('e', None),
             ('.', None),
             ('b', None)])

In [47]:
''.join(d3.keys())

'acde.b'

In [49]:
d3.move_to_end('e',last=False)

In [50]:
d3

OrderedDict([('e', None),
             ('a', None),
             ('c', None),
             ('d', None),
             ('.', None),
             ('b', None)])

# 3. deque的使用

list存储数据的优势在于按找索引查找元素会很快，但是插入和删除元素就很慢了，因为它是是单链表的数据结构。deque是为了高效实现插入和删除操作的双向列表，适合用于队列和栈，而且线程安全。

list只提供了append和pop方法来从list的尾部插入/删除元素，但是deque新增了appendleft/popleft允许我们高效的在元素的开头来插入/删除元素。而且使用deque在队列两端添加（append）或弹出（pop）元素的算法复杂度大约是O(1)，但是对于list对象改变列表长度和数据位置的操作例如 pop(0)和insert(0, v)操作的复杂度高达O(n)。由于对deque的操作和list基本一致，这里就不重复了。

# 4. ChainMap的使用

ChainMap用来将多个dict(字典)组成一个list(只是比喻)，可以理解成合并多个字典，但和update不同，而且效率更高。

In [90]:
from collections import ChainMap
a = {'a': 'A', 'c': 'C'}
b = {'b': 'B', 'c': 'D'}
m = ChainMap(a,b)

In [91]:
m

ChainMap({'c': 'C', 'a': 'A'}, {'c': 'D', 'b': 'B'})

In [92]:
# 从m复制一个ChainMap对象，更新这个复制的对象并不会对m造成影响
m2 = m.new_child()

In [93]:
m2

ChainMap({}, {'c': 'C', 'a': 'A'}, {'c': 'D', 'b': 'B'})

In [94]:
m['a']

'A'

In [95]:
m['c']

'C'

In [96]:
# 将m变成一个list
m.maps

[{'a': 'A', 'c': 'C'}, {'b': 'B', 'c': 'D'}]

In [97]:
a['c'] = 'E'

In [98]:
m

ChainMap({'c': 'E', 'a': 'A'}, {'c': 'D', 'b': 'B'})

In [99]:
m2

ChainMap({}, {'c': 'E', 'a': 'A'}, {'c': 'D', 'b': 'B'})

In [100]:
m2['c'] = 'f'
m2

ChainMap({'c': 'f'}, {'c': 'E', 'a': 'A'}, {'c': 'D', 'b': 'B'})

In [101]:
m['c']

'E'

In [102]:
a['c']

'E'

In [103]:
m2.parents

ChainMap({'c': 'E', 'a': 'A'}, {'c': 'D', 'b': 'B'})

# 5. Counter的使用

## Example 1
Counter也是dict的一个subclass，它是一个无序容器，可以看做一个计数器，用来统计相关元素出现的个数。

In [106]:
from collections import Counter
cnt = Counter()
s51 = ['red', 'blue', 'red', 'green', 'blue', 'blue']
for word in s51:
     cnt[word] += 1

In [107]:
cnt

Counter({'blue': 3, 'green': 1, 'red': 2})

In [110]:
cnt1 = Counter()
s51a = 'hello world from alvin'
for ch in s51a:
    cnt1[ch] += 1

In [114]:
cnt1

Counter({' ': 3,
         'a': 1,
         'd': 1,
         'e': 1,
         'f': 1,
         'h': 1,
         'i': 1,
         'l': 4,
         'm': 1,
         'n': 1,
         'o': 3,
         'r': 2,
         'v': 1,
         'w': 1})

## Example2

使用elements()方法按照元素的出现次数返回一个iterator(迭代器)，元素以任意的顺序返回，如果元素的计数小于1，将忽略它。

In [133]:
c2 = Counter(a=4, b=2, c=0, d = 1, e = 2)

In [134]:
c2

Counter({'a': 4, 'b': 2, 'c': 0, 'd': 1, 'e': 2})

In [135]:
type(c2)

collections.Counter

In [136]:
c2.elements()

<itertools.chain at 0x10473a2b0>

In [137]:
type(c2.elements())

itertools.chain

In [138]:
next(c2.elements())

'd'

In [139]:
# 排序
sorted(c2.elements())

['a', 'a', 'a', 'a', 'b', 'b', 'd', 'e', 'e']

In [141]:
#使用most_common(n)返回一个list, list中包含Counter对象中出现最多前n个元素。
c2.most_common(3)


[('a', 4), ('b', 2), ('e', 2)]

# 6. namedtuple的使用
使用namedtuple(typename, field_names)命名tuple中的元素来使程序更具可读性。


In [143]:
from collections import namedtuple
Point = namedtuple('PointExtension',['x','y'])

In [145]:
Point

__main__.PointExtension

In [150]:
p = Point(1,2)
p

PointExtension(x=1, y=2)

In [152]:
p.__class__.__name__

'PointExtension'

In [153]:
p.x

1