# 字典的访问与管理

In [1]:
dc = {"Beijing": 110000, "Shanghai": 310000, "Guangzhou": 440100, 
        "Wuhan": 420100, "Chengdu": 510100, "Chongqing": 500000, 
        "Zhengzhou": 410100, "Nanjing": 320100, "Changsha": 430100}; 

## 用索引访问单个元素
`dict`是键值对关系, 利用键访问对应的值. 
* 利用中括号括注键索引`dict`的值
    * 若`dict`中不存在对应的键, 过程将报`KeyError`错误, 不返回结果(需要编写异常处理程序). 
* 调用dict对象的get方法, 查找键, 并指定缺省值
    * 若`dict`中不存在对应的键, `get`方法将自动实现异常处理, 返回设置的缺省值. 
    
`dict`的索引是由其定义中的各个键的内容确立的, 是无序的. 

`dict`在内存中的实现形式是Hash查找表. 
* 因此, 同一个字典下, 同一个键只能保留一个键值对. 
* 在字典的构造过程中, 若对同一个键定义了两个以上的键值对, 在构造结束后, 所得的字典中, 该键所对应的值以最近的一次定义为准. 

In [4]:
print(dc); 
print(dc.get("Beijing")); 
print(dc["Beijing"]); 
print([dc.get(loc, "Missing") for loc in ["Beijing", "Moscow", "Washington DC"]]); 
try: 
    print([dc[loc] for loc in ["Beijing", "Moscow", "Washington DC"]])
    #[ ∙ for ∙]将会循环将每一个键名代入dc指向的字典中去查找, 并在第一个差找不到的键上停止并报错. 
except Exception as err: 
    #报错后执行except子句, 显示错误类型和描述. 
    print(type(err), str(err)); 

{'Beijing': 110000, 'Shanghai': 310000, 'Guangzhou': 440100, 'Wuhan': 420100, 'Chengdu': 510100, 'Chongqing': 500000, 'Zhengzhou': 410100, 'Nanjing': 320100, 'Changsha': 430100}
110000
110000
[110000, 'Missing', 'Missing']
<class 'KeyError'> 'Moscow'


## 用`generator`对象检索字典中的内容

### 按一定顺序和条件检索字典的键值对, 使得符合条件的检索结果, 按照检索顺序应用变换, 并构成子字典, 
* 功能上相当于Mathematica中, `Select`函数和`Map`函数的合体, 但只能`Map`到第一层. 

用法: 
* 只需要处理字典中的键
```python
{mapping(key) for key in dict.keys() if cond(key)}
```
* 处理键值对互作的情况
```python
{mapping(key, val) for (key, val) in dict.items() if cond(key, val)}
```

注意: 对字典的键值对进行遍历, 不建议使用`enumerate`. 
> `enumerate`直接作用于`dict`, 所得的是键(迭代器无法直接获取对应的值), 以及枚举过程中自动形成的下标. 
> 这一下标是构造`enumerate`对象的过程产生的, **`dict`本身仍然是无序的**. 

In [2]:
print(dc)
print({key: val for (key, val) in dc.items() if key[0] <= "M"}); 
print({key: val // 10000 for (key, val) in dc.items()}); 

{'Beijing': 110000, 'Shanghai': 310000, 'Guangzhou': 440100, 'Wuhan': 420100, 'Chengdu': 510100, 'Chongqing': 500000, 'Zhengzhou': 410100, 'Nanjing': 320100, 'Changsha': 430100}
{'Beijing': 110000, 'Guangzhou': 440100, 'Chengdu': 510100, 'Chongqing': 500000, 'Changsha': 430100}
{'Beijing': 11, 'Shanghai': 31, 'Guangzhou': 44, 'Wuhan': 42, 'Chengdu': 51, 'Chongqing': 50, 'Zhengzhou': 41, 'Nanjing': 32, 'Changsha': 43}


## 字典中计数信息的查询
* 查询字典的长度
* 在字典中查询...
    * ...一个键是否存在
    * ...一个值是否存在
    * ...一个值在其中出现的次数

In [3]:
print(dc)
print(len(dc))
print([(x in dc) for x in ["Beijing", "Moscow", "Washington DC"]]); 
province = (13, 14, 21, 22, 23, 32, 33, 34, 35, 36, 37, 38, 
            41, 42, 43, 44, 46, 51, 52, 53, 61, 62, 63); 
print([(x, int(10000 * x + 100 in dc.values())) for x in province]); 
print(list(dc.values()).count(110000))

{'Beijing': 110000, 'Shanghai': 310000, 'Guangzhou': 440100, 'Wuhan': 420100, 'Chengdu': 510100, 'Chongqing': 500000, 'Zhengzhou': 410100, 'Nanjing': 320100, 'Changsha': 430100}
9
[True, False, False]
[(13, 0), (14, 0), (21, 0), (22, 0), (23, 0), (32, 1), (33, 0), (34, 0), (35, 0), (36, 0), (37, 0), (38, 0), (41, 1), (42, 1), (43, 1), (44, 1), (46, 0), (51, 1), (52, 0), (53, 0), (61, 0), (62, 0), (63, 0)]
1


## 利用变量所对应的`dict`对象的取值, 另建一个与原对象相互独立的对象 / 字典中个别元素的修改. 
通过对变量名-键名的索引重新使用挂载语句, 会将变量所指向的`dict`的结构修改. 
* 若`dict`中不存在该键名, 将根据挂载语句, 创建相应的键值对. 

In [6]:
dc_dupli = dc.copy(); dc_dupli_alias = dc_dupli; 
print([hex(id(obj)) for obj in [dc, dc_dupli, dc_dupli_alias]]); 
print([obj["Chongqing"] for obj in [dc, dc_dupli, dc_dupli_alias]]); 
dc_dupli["Chongqing"] = 500100; 
print([obj["Chongqing"] for obj in [dc, dc_dupli, dc_dupli_alias]]); 
dc_dupli["Shenzhen"] = 440300; 
print([len(obj) for obj in [dc, dc_dupli, dc_dupli_alias]]); 

['0x5110278', '0x5466cc8', '0x5466cc8']
[500000, 500000, 500000]
[500000, 500100, 500100]
[9, 10, 10]


## 字典的结构编辑
以下方法若通过字典**所挂载变量直接调用**, 会直接**修改对应的**`dict`对象. 

若只需要用一个变量链接到编辑结果, 但**不修改起初被访问的字典**, 需要先调用`copy()`方法. 

由于`dict`内键值对的无序性, 因此, 很多与**元素顺序**有关的方法**只适用于`list`, 不适用于`dict`**. 

In [7]:
dc_dupli = dc.copy(); print(dc_dupli); 
#dict对象的update方法, 指定新字典, 将新字典中的键值对中, 覆盖与原字典重复的键所对应的值, 
#  并将原字典中不存在的键合并至原字典. 
print(dc_dupli.update({"Chongqing": 500100})); 
print(dc_dupli); 
print(dc_dupli.update({"Xi'an": 610100, "Shenyang": 210100, "Kunming": 530100})); 
print(dc_dupli); 
print([key for (key, val) in dc.items()]); 
#dict对象的pop方法必须指定键, 执行时会删除dict的对应键值对, 并返回键值对中的值. 
[print(dc_dupli.pop(key), id(dc_dupli), len(dc_dupli)) for (key, val) in dc.items()]; 
print(dc_dupli); 

{'Beijing': 110000, 'Shanghai': 310000, 'Guangzhou': 440100, 'Wuhan': 420100, 'Chengdu': 510100, 'Chongqing': 500000, 'Zhengzhou': 410100, 'Nanjing': 320100, 'Changsha': 430100}
None
{'Beijing': 110000, 'Shanghai': 310000, 'Guangzhou': 440100, 'Wuhan': 420100, 'Chengdu': 510100, 'Chongqing': 500100, 'Zhengzhou': 410100, 'Nanjing': 320100, 'Changsha': 430100}
None
{'Beijing': 110000, 'Shanghai': 310000, 'Guangzhou': 440100, 'Wuhan': 420100, 'Chengdu': 510100, 'Chongqing': 500100, 'Zhengzhou': 410100, 'Nanjing': 320100, 'Changsha': 430100, "Xi'an": 610100, 'Shenyang': 210100, 'Kunming': 530100}
['Beijing', 'Shanghai', 'Guangzhou', 'Wuhan', 'Chengdu', 'Chongqing', 'Zhengzhou', 'Nanjing', 'Changsha']
110000 89035384 11
310000 89035384 10
440100 89035384 9
420100 89035384 8
510100 89035384 7
500100 89035384 6
410100 89035384 5
320100 89035384 4
430100 89035384 3
{"Xi'an": 610100, 'Shenyang': 210100, 'Kunming': 530100}
