## 3.5 字典的变种

### collections.OrderedDict  
+ 这个类型在添加键的时候会保持顺序，因此键的迭代次序总是一致的。 OrderedDict 的 popitem 方法默认删除并返回的是字典里的最后一个元素，但是如 果像 my_odict.popitem(last=False) 这样调用它，那么它删除并返回第一个被 添加进去的元素。
+ https://docs.python.org/3/library/collections.html?highlight=ordereddict#collections.OrderedDict

In [1]:
from collections import *

#### 构造

In [5]:
od = OrderedDict([('a',97), ('b',98), ('c',99)])
od

OrderedDict([('a', 97), ('b', 98), ('c', 99)])

#### fromkeys()函数构造

In [6]:
od = OrderedDict.fromkeys('abcde')
od

OrderedDict([('a', None), ('b', None), ('c', None), ('d', None), ('e', None)])

#### move_to_end(key, last=True)

In [8]:
od.move_to_end('b') # 将key为b的键移动到最后
''.join(od.keys())

'acdeb'

In [10]:
od.move_to_end('e', last = False)
''.join(od.keys())

'eacdb'

#### popitem(last=True)

In [11]:
od.popitem()

('b', None)

In [12]:
od.popitem(last = False)

('e', None)

### collections.ChainMap
+ 该类型可以容纳数个不同的映射对象，然后在进行键查找操作的时候，这些对象会 被当作一个整体被逐个查找，直到键被找到为止。这个功能在给有嵌套作用域的语言做 解释器的时候很有用，可以用一个映射对象来代表一个作用域的上下文。
+ 在collections 文档介绍 ChainMap 对象的那一部分（https://docs.python.org/3/library/collections.html#collections.ChainMap ）里有一些具体的使用示例

In [25]:
baseline = {'music': 'bach', 'art': 'rembrandt'}
adjustments = {'art': 'van gogh', 'opera': 'carmen'}

cm = ChainMap(baseline, adjustments)
cm

ChainMap({'music': 'bach', 'art': 'rembrandt'}, {'art': 'van gogh', 'opera': 'carmen'})

In [26]:
list(cm)

['art', 'opera', 'music']

In [34]:
cm['art']

'rembrandt'

In [28]:
combined = baseline.copy()
combined.update(adjustments)
list(combined)

['music', 'art', 'opera']

In [30]:
combined['art']

'van gogh'

#### maps  
+ 一个可以更新的映射列表。这个列表是按照第一次搜索到最后一次搜索的顺序组织的。它是仅有的存储状态，可以被修改。列表最少包含一个映射。

In [39]:
cm.maps

[{'music': 'bach', 'art': 'rembrandt'}, {'art': 'van gogh', 'opera': 'carmen'}]

In [45]:
cm.maps[1]

{'art': 'van gogh', 'opera': 'carmen'}

In [46]:
cm.maps[1]['art']

'van gogh'

In [48]:
cm.maps[0]['music'] = 'guzhen'
cm.maps

[{'music': 'guzhen', 'art': 'rembrandt'},
 {'art': 'van gogh', 'opera': 'carmen'}]

#### new_child(m=None)  
+ 返回一个新的 ChainMap 类，包含了一个新映射(map)，后面跟随当前实例的全部映射(map)。如果 m 被指定，它就成为不同新的实例，就是在所有映射前加上 m，如果没有指定，就加上一个空字典，这样的话一个 d.new_child() 调用等价于 ChainMap({}, *d.maps) 。这个方法用于创建子上下文，不改变任何父映射的值。

In [35]:
cm_child = cm.new_child()
list(cm_child)

['art', 'opera', 'music']

In [37]:
new_dict = {'fruit':'apple', 'vehicle':'bus'}
cm_child2 = cm.new_child(new_dict)
cm_child2

ChainMap({'fruit': 'apple', 'vehicle': 'bus'}, {'music': 'bach', 'art': 'rembrandt'}, {'art': 'van gogh', 'opera': 'carmen'})

#### parents  
+ 属性返回一个新的 ChainMap 包含所有的当前实例的映射，除了第一个。这样可以在搜索的时候跳过第一个映射。 使用的场景类似在 nested scopes 嵌套作用域中使用 nonlocal 关键词。用例也可以类比内建函数 super() 。一个 d.parents 的引用等价于 ChainMap(*d.maps[1:]) 。

In [50]:
cm_child2.parents # 显示父类的内容

ChainMap({'music': 'guzhen', 'art': 'rembrandt'}, {'art': 'van gogh', 'opera': 'carmen'})

### collections.Counter
+ collections.Counter这个映射类型会给键准备一个整数计数器。每次更新一个键的时候都会增加这个计数器。所以这个类型可以用来给可散列表对象计数，或者是当成多重集来用——多重集合就是集合里的元素可以出现不止一次。
+ Counter 实现了 + 和 - 运算符用来合并记录，还有像 most_common([n]) 这类很有用的方法。most_common([n]) 会按照次序返回映射里最常见的 n 个键和它们的计数，详情参阅文档 （https://docs.python.org/zh-cn/3/library/collections.html#collections.Counter ）。

#### 初始化方式  
一个 Counter 是一个 dict 的子类，用于计数可哈希对象。它是一个集合，元素像字典键(key)一样存储，它们的计数存储为值。计数可以是任何整数值，包括0和负数。  
元素从一个 iterable 被计数或从其他的 mapping (or counter)初始化：  

In [67]:
from collections import Counter

c = Counter()
c

Counter()

In [65]:
c = Counter('gallahad') 
c

Counter({'g': 1, 'a': 3, 'l': 2, 'h': 1, 'd': 1})

In [66]:
c = Counter({'red': 4, 'blue': 2})
c

Counter({'red': 4, 'blue': 2})

In [57]:
c = Counter(cats=4, dogs=8)
c

Counter({'cats': 4, 'dogs': 8})

Counter对象有一个字典接口，如果引用的键没有任何记录，就返回一个0，而不是弹出一个 KeyError  
设置一个计数为0不会从计数器中移去一个元素。使用 del 来删除它:  

In [60]:
c = Counter(['eggs', 'ham'])
c['eggs'] = 0
c

Counter({'eggs': 0, 'ham': 1})

In [62]:
del c['eggs']
c

Counter({'ham': 1})

#### elements()
+ 返回一个迭代器，其中每个元素将重复出现计数值所指定次。 元素会按首次出现的顺序返回。 如果一个元素的计数值小于一，elements() 将会忽略它。

In [68]:
c = Counter(a=4, b=2, c=0, d=-2)
sorted(c.elements())  # 忽略小于等于0的元素

['a', 'a', 'a', 'a', 'b', 'b']

In [70]:
c

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})

#### most_common([n])
+ 返回一个列表，其中包含 n 个最常见的元素及出现次数，按常见程度由高到低排序。 如果 n 被省略或为 None，most_common() 将返回计数器中的 所有 元素。 计数值相等的元素按首次出现的顺序排序：

In [69]:
Counter('abracadabra').most_common(3)

[('a', 5), ('b', 2), ('r', 2)]

#### subtract([iterable-or-mapping])
+ 从 迭代对象 或 映射对象 减去元素。像 dict.update()。
+ 但是是减去，而不是替换。输入和输出都可以是0或者负数。

In [93]:
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d) # 对应数字相减
c

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})

除了通过函数实现，Counter类可以通过运算符实现某些运算

In [94]:
c+d  # 注意四则运算只会返回结果大于0的结果

Counter({'a': 4, 'b': 2})

In [96]:
c-d

Counter({'a': 2})

In [100]:
c & d                       # intersection:  min(c[x], d[x]) 

Counter({'a': 1})

In [101]:
c | d                       # union:  max(c[x], d[x])

Counter({'a': 3, 'b': 2, 'c': 3, 'd': 4})

#### update([iterable-or-mapping])
+ 从 ‘迭代对象’ 计数元素或者 从另一个 ‘映射对象’ (或计数器) 添加。 像 dict.update()。
+ 但是是加上，而不是替换。另外，迭代对象 应该是序列元素，而不是一个 (key, value) 对。

In [74]:
c = Counter('abracadabra')
c.update('aaaazzzz')
c.most_common(2)

[('a', 9), ('z', 4)]

#### Counter 对象的常用案例

In [103]:
c = Counter(a=4, b=3, c=0, d=-2)
sum(c.values())                 # total of all counts

5

In [104]:
+c                              # remove zero and negative counts

Counter({'a': 4, 'b': 3})

In [105]:
-c

Counter({'d': 2})

In [106]:
c.clear()                       # reset all counts
c

Counter()

In [107]:
c = Counter(a=4, b=2, c=0, d=-2)
list(c)                         # list unique elements

['a', 'b', 'c', 'd']

In [108]:
set(c)                          # convert to a set

{'a', 'b', 'c', 'd'}

In [82]:
dict(c)                         # convert to a regular dictionary

{'a': 4, 'b': 2, 'c': 0, 'd': -2}

In [83]:
c.items()                       # convert to a list of (elem, cnt) pairs

dict_items([('a', 4), ('b', 2), ('c', 0), ('d', -2)])

In [85]:
list_of_pairs = c.items()
Counter(dict(list_of_pairs))    # convert from a list of (elem, cnt) pairs

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})

In [89]:
n = len(list(c))
c.most_common()[:-n-1:-1]       # n least common elements

[('d', -2), ('c', 0), ('b', 2), ('a', 4)]

#### 统计单词数

In [51]:
# Tally occurrences of words in a list
cnt = Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1  # 这一步说明当key不存在时，调用cnt[key]会返回0
cnt

Counter({'red': 2, 'blue': 3, 'green': 1})

In [53]:
import re

words = re.findall(r'\w+', open('file_for_exp3_5.txt').read().lower())
Counter(words).most_common(10)

[('sufe', 3),
 ('i', 2),
 ('a', 2),
 ('in', 2),
 ('is', 2),
 ('good', 2),
 ('am', 1),
 ('student', 1),
 ('study', 1),
 ('school', 1)]