# 字典和集合

## 泛映射类型 

标准库里所有映射类型都是利用dict来实现的，因此只有可散列的数据类型才能用作这些映射里的键。

## 字典推导

In [2]:
DIAL_CODES = [
    (86, 'China'), (91, 'India'), (1, 'United States'),
    (62, 'Indonesia'), (55, 'Brazil'), (234, 'Nigeria')]
country_code = {country: code for code,country in DIAL_CODES}
country_code

{'Brazil': 55,
 'China': 86,
 'India': 91,
 'Indonesia': 62,
 'Nigeria': 234,
 'United States': 1}

In [4]:
{code: country.upper() for country,code in country_code.items() if code < 66}

{1: 'UNITED STATES', 55: 'BRAZIL', 62: 'INDONESIA'}

## 常见的映射方法

dict/Defaultdict/OrderedDict

## 映射的弹性键查询

如果某一个键在映射里不存在，我们希望通过这个键读取值的时候，可以返回一个默认值。

### defaultdict: 处理找不到的键的一个选择

### 特殊方法 __missing__

### 字典的变种

### 不可变映射类型



## 集合

对于空集合，一定要使用set()而不是{}，后者创建的始终还是空字典。

### 集合推导



In [6]:
from unicodedata import name
{chr(i) for i in range(32, 256) if "SIGN" in name(chr(i), '')}

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

## dict和set的背后

### dict的实现及其导致的结果

1.key必须是可哈希的
+ 支持hash()函数，通过__hash__()方法得到的散列值是不变的;
+ 支持通过__eq__()方法来检测相等性;
+ 若a==b，则has(a) == hash(b)

2. 字典在内存上的开销巨大

3. 键查询很快

4. 键的次序取决与添加顺序

5. 往字典里添加新键，可能会改变已有键的顺序


### set的实现以及导致的结果
集合也是依赖哈希表，存放的是元素的引用。

+ 集合里的元素必须是可哈希的
+ 集合很消耗内存
+ 可以很高效地判断元素是否在某个集合
+ 元素的次序取决于被添加到集合里的次序
+ 往集合里添加元素，可能会改变集合里已有元素的次序