### 字典
- 常见的字典方法
- 如何处理查找不到的键
- 标准库中 dict 类型的变种
- set 和 frozenset 类型
- 散列表的工作原理
- 散列表带来的潜在影响（什么样的数据类型可作为键、 不可预知的顺序， 等等）

#### 字典有很多构造方法

In [2]:
a = dict(one=1,two=2,three=3)
b = {'one':1,'two':2,'three':3}
c = dict(zip(['one','two','three'],[1,2,3]))
d = dict([('one',1),('two',2),('three',3)])
e = dict({'three':3,'two':2,'one':1})
a == b == c == d == e

True

- 字典推导

In [4]:
DIAL_CODES = [ 
 (86, 'China'),
 (91, 'India'),
 (1, 'United States'),
 (62, 'Indonesia'),
 (55, 'Brazil'),
 (92, 'Pakistan'),
 (880, 'Bangladesh'),
 (234, 'Nigeria'),
 (7, 'Russia'),
 (81, 'Japan'),
 ]

In [5]:
country_code = {country:code for code,country in DIAL_CODES}
country_code

{'China': 86,
 'India': 91,
 'United States': 1,
 'Indonesia': 62,
 'Brazil': 55,
 'Pakistan': 92,
 'Bangladesh': 880,
 'Nigeria': 234,
 'Russia': 7,
 'Japan': 81}

In [6]:
{code: country.upper() for country,code in country_code.items() if code < 66}

{1: 'UNITED STATES', 62: 'INDONESIA', 55: 'BRAZIL', 7: 'RUSSIA'}

- Counters

In [8]:
import collections
ct = collections.Counter('abracadabra')
ct

Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

In [10]:
ct.update('aaaaazzz')
ct

Counter({'a': 10, 'b': 2, 'r': 2, 'c': 1, 'd': 1, 'z': 3})

In [11]:
ct.most_common(2)

[('a', 10), ('z', 3)]

### 集合

集合的本质是许多唯一对象的聚集。 因此， 集合可以用于去重：

In [12]:
l = ['spam','spam','spam','eggs']
set(l)

{'eggs', 'spam'}

In [13]:
list(set(l))

['eggs', 'spam']

除了保证唯一性， 集合还实现了很多基础的中缀运算符。 给定两个集合a 和 b， a | b 返回的是它们的合集， a & b 得到的是交集， 而 a - b得到的是差集。 

In [17]:
needles = ['a','b','c','f']
haystack = ['a','b','c','d','e']
found = (set(needles) & set(haystack))
found

{'a', 'b', 'c'}

In [18]:
found = (set(needles) | set(haystack))
found

{'a', 'b', 'c', 'd', 'e', 'f'}

In [19]:
found = (set(needles) - set(haystack))
found

{'f'}

In [20]:
found = (set(haystack) - set(needles))
found

{'d', 'e'}

- 集合推导

In [21]:
from unicodedata import name
{chr(i) for i in range(32,256) if 'SIGN' in name(chr(i),'')}

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

In [25]:
chr(60),ord('<')

('<', 60)

In [28]:
c = {i*3 for i in range(15) if i%2 ==0 }
c

{0, 6, 12, 18, 24, 30, 36, 42}

In [29]:
type(c)

set

- 集合里的元素必须是可散列的。
- 集合很消耗内存。

字典算得上是 Python 的基石。 除了基本的 dict 之外， 标准库还提供现成且好用的特殊映射类型， 比如 defaultdict、 OrderedDict、 ChainMap 和 Counter。 这些映射类型 都属于 collections 模块， 这个模块还提供了便于扩展的 UserDict类。