# 字典和集合

## 3.1泛映射类型

标准库中的所有映射类型都是利用dict来实现的，因此都有个限制： 只有可散列的数据类型才能作为键。

**可散列：** 一个对象可散列，那么它的生命周期中散列值是不变，并且需要实现 __hash__()、__eq__()方法，才能与其他键进行比较。
    
- 原子不可变数据类型：str, bytes, 数值类型
- 不可变集合：frozenset
- 元组：元组里的所有元素必须均为可散列类型

In [1]:
hash((1, 2, [3,  4]))

TypeError: unhashable type: 'list'

In [2]:
hash((1, 2, frozenset([3, 4])))

-19024239

In [3]:
frozenset([3, 4])

frozenset({3, 4})

- 一般用户自定义的类型都是可散列的，散列值为id()函数的返回值，所以一般是唯一的
- 如果有实现了__hash__，那么需要用到该对象的内部状态，且必须都是不可变

## 3.2字典推导
可以从任何以键值对作为元素的可迭代对象中构建出字典

In [4]:
CODES = [(86, "China"), (1, "US"), (91, "India")]

{country: code for code, country in CODES}

{'China': 86, 'India': 91, 'US': 1}

In [5]:
{code: country for code, country in CODES if code > 50}

{86: 'China', 91: 'India'}

上述推导式中，country:code 告诉python解释器这是dict中的键值对形式
## 3.3常见的映射方法

映射类型有：dict, collection.defaultdict, collections.OrderDice

In [6]:
d = {}
d.fromkeys(range(5), range(5))

{0: [0, 1, 2, 3, 4],
 1: [0, 1, 2, 3, 4],
 2: [0, 1, 2, 3, 4],
 3: [0, 1, 2, 3, 4],
 4: [0, 1, 2, 3, 4]}

In [7]:
i = 0
def get_i():
    global i
    i += 1
    return i
d.fromkeys(range(5), get_i())

{0: 1, 1: 1, 2: 1, 3: 1, 4: 1}

In [8]:
d = dict.fromkeys(range(5), range(5))
d

{0: [0, 1, 2, 3, 4],
 1: [0, 1, 2, 3, 4],
 2: [0, 1, 2, 3, 4],
 3: [0, 1, 2, 3, 4],
 4: [0, 1, 2, 3, 4]}

#### 部分函数用法说明
函数原型：d.fromkeys(it,[initial])

将迭代器 it 里的元素设置为映射里的键，如果有initial 参数，就把它作为这些键对应的值（默认是None）【不能动态绑定】

函数原型：d.__missing__(k) 

当 __getitem__ 找不到对应键的时候，这个方法会被调用，这个过程是python解释器自动执行的

函数原型： d.update(m, [**kargs])

m可以是映射类型，可以使键值对构成的序列。python解释器会先检查m是否有keys()方法，没有则按照(key, value)的方式处理m

#### 用setdefault来处理找不到的键
d.setdefault(key, []).append(value)

这个方法只需要查找一次键，而传统方法需要2-3次。

## 3.4映射的弹性键查询
找不到键时得到一个默认值的两种方法：
1. 通过defaultdict
|
2. 自己定义一个dict, 实现__missing__方法
