# 13-字典与集合

大纲：

- 字典的现代句法
- 使用`match\case`语句匹配映射
- 映射类型的标准API
- 自动处理缺失的键
- `dict`的变体
- 集合论
- 集合的实现方式对实践的影响
- 字典视图的集合运算

## 字典的现代句法

创建字典的一些方法：

- 字典推导
- `dict`函数
- 映射拆包
- 合并两个字典

字典推导

In [13]:
dial_codes = [                                                  # <1>
    (880, 'Bangladesh'),
    (55,  'Brazil'),
    (86,  'China'),
    (91,  'India'),
    (62,  'Indonesia'),
    (81,  'Japan'),
    (234, 'Nigeria'),
    (92,  'Pakistan'),
    (7,   'Russia'),
    (1,   'United States'),
]

country_dial = {country: code for code, country in dial_codes}
country_dial

{'Bangladesh': 880,
 'Brazil': 55,
 'China': 86,
 'India': 91,
 'Indonesia': 62,
 'Japan': 81,
 'Nigeria': 234,
 'Pakistan': 92,
 'Russia': 7,
 'United States': 1}

In [12]:
{code: country.upper() 
    for country, code in sorted(country_dial.items())
    if code < 70}

{55: 'BRAZIL', 62: 'INDONESIA', 7: 'RUSSIA', 1: 'UNITED STATES'}

`dict`函数, 成对的序列数据可以直接转换成`dict`

In [9]:
dict(dial_codes)

{880: 'Bangladesh',
 55: 'Brazil',
 86: 'China',
 91: 'India',
 62: 'Indonesia',
 81: 'Japan',
 234: 'Nigeria',
 92: 'Pakistan',
 7: 'Russia',
 1: 'United States'}

映射拆包

In [14]:
# 函数参数传入任意个键值对，返回包含所有键值对的dict
def dump(**kwargs):
    return kwargs

dump(x=1, y=2, z=3)

{'x': 1, 'y': 2, 'z': 3}

In [15]:
dump(a=1, b=2, **{'y' : 3, 'z' : 4}, )

{'a': 1, 'b': 2, 'y': 3, 'z': 4}

在Python字面量中使用**拆包

In [16]:
{'a': 0, **{'x': 1}, 'y': 2, **{'z': 3, 'x': 4}}

{'a': 0, 'x': 4, 'y': 2, 'z': 3}

使用 `|` 合并映射

In [17]:
d1 = {'a': 1, 'b': 3}
d2 = {'a': 2, 'b': 4, 'c': 6}
d1 | d2

{'a': 2, 'b': 4, 'c': 6}

## 使用match/case语句匹配映射

`match/case` 语句能够匹配`collections.abc.Mapping`的任何具体子类或虚拟子类, 我们经常需要从 JSON API和具有半结构化模式的数据库（例如 MongoDB、EdgeDB 或 PostgreSQL）中读取这类记录.

In [1]:
def get_creators(record: dict) -> list:
    match record:
        # 匹配'type'为'book', 'api'为2, 'authors'对应一个作者列表，返回该作者列表
        case {'type': 'book', 'api': 2, 'authors': [*names]}:  # <1>
            return names
        
        # 匹配'type'为'book', 'api'为2, 'author'对应一个作者，返回一个作者的列表
        case {'type': 'book', 'api': 1, 'author': name}:  # <2>
            return [name]
        
        # 匹配'type'为'book', 其他键值没有匹配的情况, 抛出ValueError
        case {'type': 'book'}:  # <3>
            raise ValueError(f"Invalid 'book' record: {record!r}")
        
        # 匹配'type'为'movie', 'director'对应导演的名字，返回该导演的列表
        case {'type': 'movie', 'director': name}:  # <4>
            return [name]
        case _:  # <5>
            raise ValueError(f'Invalid record: {record!r}')

In [2]:
# 匹配到一个book作者的情况
b1 = dict(api=1, author='Douglas Hofstadter',
            type='book', title='Gödel, Escher, Bach')
get_creators(b1)

['Douglas Hofstadter']

In [3]:
# 匹配到book作者列表的情况
from collections import OrderedDict
b2 = OrderedDict(api=2, type='book',
            title='Python in a Nutshell',
            authors='Martelli Ravenscroft Holden'.split())
get_creators(b2)

['Martelli', 'Ravenscroft', 'Holden']

In [None]:
# book没有作者时，抛出异常
get_creators({'type': 'book', 'pages': 770})

In [None]:
# 没有匹配到任意一种情况（case分支）
get_creators('Spam, spam, spam')

## 映射类型的标准API

常用的映射类型：

- `dict`
- `collections.defaultdict`
- `collections.OrderedDict`
- `collections.ChainMap`
- `collections.Counter`
- `shelve.Shelf`
- `collections.UserDict`

## 自动处理缺失的键

## `dict`的变体

## 集合论

## 集合的实现方式对实践的影响

## 字典视图的集合运算