# 流畅的 Python

## 第二部分 数据结构

## 第3章 字典和集合

### 3.1 泛映射类型

collections.abc 模块中有 Mapping 和 MutableMapping 这两个抽象基类，他们的作用是为 dict 和其它类似的类型定义形式接口。

In [2]:
from collections import abc

my_dict = {}
isinstance(my_dict, abc.Mapping)

True

In [4]:
# 多种字典构造方法
a = dict(one=1, two=2, three=3)
b = {'one': 1, 'two': 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('one', 1), ('two', 2), ('three', 3)])
e = dict({'one': 1, 'two': 2, 'three': 3})
a == b == c == d == e

True

### 3.2 字典推导 list comprehension

In [9]:
DIAL_CODES = [
    (86, 'China'),
    (91, 'India'),
    (1, 'United States'),
    (62, 'Indonesia'),
    (55, 'Brazil'),
    (92, 'Pakistan'),
    (880, 'Bangladesh'),
    (234, 'Nigeria'),
    (7, 'Russia'),
    (81, 'Japan')
]
country_code = {country: code for code, country in DIAL_CODES}
country_code

{'Bangladesh': 880,
 'Brazil': 55,
 'China': 86,
 'India': 91,
 'Indonesia': 62,
 'Japan': 81,
 'Nigeria': 234,
 'Pakistan': 92,
 'Russia': 7,
 'United States': 1}

In [12]:
{code: country for country, code in country_code.items() if code < 66}

{1: 'United States', 7: 'Russia', 55: 'Brazil', 62: 'Indonesia'}

### 3.3 常见的映射方法

### 3.7 不可变映射类型

In [1]:
# types 模块中的封装类 MappingProxyType
from types import MappingProxyType

d = {1: 'A'}
d_proxy = MappingProxyType(d)
d_proxy

mappingproxy({1: 'A'})

In [2]:
d_proxy[1]

'A'

In [4]:
d_proxy[2] = 'B'

TypeError: 'mappingproxy' object does not support item assignment

In [5]:
d[2] = 'B'
d_proxy

mappingproxy({1: 'A', 2: 'B'})

In [6]:
d_proxy[2]

'B'

#### 如果给 MappingProxyType 一个映射，它会返回一个只读的映射视图。虽然只读，但是它是动态的。这意味着如果对原映射做出了改动，我们通过这个视图可以观察到，但是无法通过这个视图对原映射做出修改。

> * d 中的内容可以通过 d_proxy 看到
> * 但是通过 d_proxy 不能做任何修改
> * d_proxy 是动态的，也就是说对 d 做的任何改动都会反馈到它上面

### 3.8 集合论

In [9]:
# 集合的本质是许多唯一对象的聚集。因此，集合可以用于去重：
l = ['s', 's', 'a', 's']
sl = set(l)
print(sl)
print(list(sl))

{'a', 's'}
['a', 's']


#### 中缀运算符
> * a | b 合集
> * a & b 交集
> * a - b 差集

合理利用这些操作可以：
> * 减少代码行数
> * 减少程序运行时间
> * 增加可读性
> * 省去不必要的循环和逻辑操作

In [13]:
a = {'s', 'a', 'b', 'l'}
b = {'a', 'b', 'c'}
len(a & b)

2

In [14]:
a - b

{'l', 's'}

In [15]:
a | b

{'a', 'b', 'c', 'l', 's'}

In [19]:
# a 的元素在 b 中出现的次数（循环方案）
n = 0
for i in a:
    if i in b:
        n += 1
print(n)

2


In [20]:
a = ['s', 'a', 'b', 'l']
b = ['a', 'b', 'c']
# 以下两种写法牵扯到把对象转化为集合的成本，不过如果其中任意一个对象已经是集合，那么就可能比循环方案要高效
print(len(set(a) & set(b)))
print(len(set(a).intersection(b)))

2
2


#### 集合字面量

除空集之外，集合的字面量——{1}，{1, 2}等等——看起来跟它的数学形式一模一样。

语法陷阱
> * 如果是空集，必须用不带任何参数的构造方法 set()
> * 如果只是写成{}的形式，创建的其实是个空字典

像{1, 2, 3}这样的字面量，Python 会利用一个专门的叫作 BUILD_SET 的字节码来创建集合。

In [21]:
# 由于 Python 里没有针对 frozenset 的特殊字面量句法，只能采用构造方法。
frozenset(range(10))

frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})

#### 集合推导

In [28]:
from unicodedata import name

ch = {chr(i) for i in range(32, 256) if 'SIGN' in name(chr(i), '')}
print(ch)

{'>', 'µ', '×', '¤', '<', '°', '+', '§', '®', '÷', '¢', '#', '±', '%', '£', '©', '=', '¥', '¬', '¶', '$'}


#### 集合的操作
中缀运算符需要两侧的被操作对象都是集合类型，但是其它的所有方法则只要求传入的参数是可迭代对象。

集合的数学运算

集合的比较运算符

集合类型的其他方法

#### dict 和 set 的背后