# Python 字典

鉴于 JSON 在大数据中的大量使用，字典的重要性也不言而喻。

本文从以下几个方面介绍字典：

1. 创建
2. 获取
3. 更新
4. 遍历
5. 排序
6. 删除
7. 字典与JSON
8. `collections.defaultdict()`
9. `setdefault()`

## 1. 创建

In [1]:
ndict = {}
ndict

{}

## 2. 获取

有两种方法可以获取单个键值：

In [2]:
# 方法一

ndict = {"name": "luochang212", "age": "18", "nationality": "China"}
ndict['name']

'luochang212'

In [3]:
# 方法二

ndict = {"name": "luochang212", "age": "18", "nationality": "China"}
ndict.get('name')

'luochang212'

如果希望获取所有的键和值，可以使用字典的 `keys()` 和 `values()` 方法。

In [4]:
# 获取所有键

ndict.keys()

dict_keys(['name', 'age', 'nationality'])

In [5]:
# 获取所有值

ndict.values()

dict_values(['luochang212', '18', 'China'])

PS：需要注意的是，在字典中键和值的存储都是无序的，因此类似 `dict.keys()[1]` 这样的命令将会导致报错。

## 3. 更新

对于字典 `dict`，使用命令 `dict['[new_key]'] = '[new_value]'` 即可添加新的键值对。

In [6]:
# 添加键值对

ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}
ndict['gender'] = 'male'
ndict

{'name': 'luochang212', 'age': '18', 'nationality': 'China', 'gender': 'male'}

如果键名已经存在，上述方法可以用来更新已有的键值。

In [7]:
# 更新已有键值

ndict['name'] = 'luochang'
ndict

{'name': 'luochang', 'age': '18', 'nationality': 'China', 'gender': 'male'}

此外，还可以使用 `update()` 方法更新键值对。

该方法的一般形式为：`dict1.update(dict2)`，即把 `dict2` 更新到 `dict1` 中。

In [8]:
ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}
ndict.update({"name": "luochang"})
ndict

{'name': 'luochang', 'age': '18', 'nationality': 'China'}

## 4. 遍历

下面介绍几种遍历字典的方法：

In [9]:
# 方法一

ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}

for i in ndict.keys():
    print(i + ':', ndict[i])

name: luochang212
age: 18
nationality: China


In [10]:
# 方法二

ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}

for i in ndict:
    print(i)

name
age
nationality


In [11]:
# 方法三

ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}

for i in ndict.items():
    print(i)

('name', 'luochang212')
('age', '18')
('nationality', 'China')


In [12]:
# 方法四

ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}

for key, value in ndict.items():
    print(key + ':', value)

name: luochang212
age: 18
nationality: China


## 5. 排序

问题：动物园里有3只大熊猫，5只老虎和7只河马，如何按数量对它们从大到小进行排序呢？

In [13]:
ndict = {"panda": "3", "tiger": "5", "hippo": "7"}

nlist = sorted(ndict.items(), key=lambda e:e[1], reverse=True)
nlist

[('hippo', '7'), ('tiger', '5'), ('panda', '3')]

## 6. 删除

In [14]:
ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}

del ndict['name']  # 删除键为 name 的元素
print('删除键为 name 的元素:', ndict)

ndict.clear()  # 删除字典的所有元素
print('删除字典所有元素:', ndict)

del ndict  # 删除字典

删除键为 name 的元素: {'age': '18', 'nationality': 'China'}
删除字典所有元素: {}


## 7. 字典与 JSON

### 7.1 字典与 JSON 的区别

仅从外观来看，字典与 JSON 一模一样。但 JSON 的本质是字符串，而字典则是一种数据结构。

### 7.2 字典与 JSON 的相互转换

|  函数 | 作用 |
|---|----------|
| loads( ) | 将 JSON 串转为字典 |
| dumps( ) | 将字典转为 JSON 串 |

在运行以下代码之前，请检查自己是否安装了 `json` 库。

In [15]:
# JSON 转字典
import json


njson = '{"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}'

ndict = {}
ndict = json.loads(njson)
ndict

{'name': 'luochang212', 'age': '18', 'nationality': 'China'}

In [16]:
# 字典转 JSON
import json


ndict = {"name": "luochang212", "age": "18", "nationality": "China", "nationality": "China"}

njson = ''
njson = json.dumps(ndict)
njson

'{"name": "luochang212", "age": "18", "nationality": "China"}'

### 7.3 JSON 文件读写

读 JSON 文件。

In [17]:
file_name = "./data/info.json"
with open(file_name,'r') as f:
    njson = json.load(f)

njson

{'John': 'job1', 'Bob': 'job2', 'rose': 'job3'}

在每个元素的 value 里加一个 finished.

In [18]:
for key in njson:
    njson[key] += ' finished'

将 JSON 串写入文件。

In [19]:
file_name = "./data/output.json"
with open(file_name,'w') as f:
    json.dump(njson, f)

从文件中读出 JSON 串，确认一下是否写入成功。

In [20]:
# check
with open(file_name,'r') as f:
    data = f.read()
    
data

'{"John": "job1 finished", "Bob": "job2 finished", "rose": "job3 finished"}'

## 8. `collections.defaultdict()`

collections 是 Python 的一个 built-in module. `collections.defaultdict()` 是 Python 字典的一个子类。它接受一个参数，该参数用于指定字典 value 的初始值。更多信息参见 [collections docs](https://docs.python.org/3.7/library/collections.html#defaultdict-objects).

`defaultdict()` 的用法如下：

`defaultdict(list)`: 在每次创建新 key 时，将 value 初始化为一个空列表。

In [21]:
from collections import defaultdict

ndict = defaultdict(list)
ndict[1].append('A')
ndict[2].append('B')
ndict[3].append('C')
ndict[3].append('D')
ndict

defaultdict(list, {1: ['A'], 2: ['B'], 3: ['C', 'D']})

`defaultdict(int)`: 在每次创建新 key 时，将 value 初始化为 `0`。这在实现计数功能时很有用。

In [22]:
from collections import defaultdict

s = "abccbaaaa"
ndict = defaultdict(int)
for e in s:
    ndict[e] += 1
ndict

defaultdict(int, {'a': 5, 'b': 2, 'c': 2})

LeetCode [460. LFU缓存](https://leetcode-cn.com/problems/lfu-cache/) 很好地展示了 `OrderedDict` 的用途。`OrderedDict` 除了具有普通字典的功能之外，还能记录操作字典的顺序。如果你的语言版本晚于 Python 3.7，那么 `OrderedDict` 对你就不那么重要了。因为在该版本之后，普通的字典 `dict()` 也实现了此功能。

`defaultdict(OrderedDict)`: 创建有序字典。

In [23]:
from collections import defaultdict, OrderedDict

ndict = defaultdict(OrderedDict)
ndict[1] = 'A'
ndict[2] = 'B'
ndict[3] = 'C'
ndict

defaultdict(collections.OrderedDict, {1: 'A', 2: 'B', 3: 'C'})

`defaultdict(OrderedDict)` 的 `popitem()` 方法能实现后进后出。

In [24]:
ndict.popitem()

(3, 'C')

但修改操作似乎不算在内：

In [25]:
ndict = defaultdict(OrderedDict)
ndict[1] = 'A'
ndict[2] = 'B'
ndict[3] = 'C'
ndict[2] = 'D'
ndict

defaultdict(collections.OrderedDict, {1: 'A', 2: 'D', 3: 'C'})

In [26]:
ndict.popitem()

(3, 'C')

Python 3.7 以后，普通的字典也可以实现这个功能了。

In [27]:
try:
    ndict = {}
    ndict[1] = 'A'
    ndict[2] = 'B'
    ndict[3] = 'C'
    print(ndict.popitem())
except:
    print('Check your Python version.')

(3, 'C')


## 9. `setdefault()`

在创建字典时，为了后面获取的时候，取到不存在的键值对引发错误，可使用 `setdefault()` 方法指定不存在的键的返回值。`setdefault()` 方法在返回指定返回值以后，也会把该键值对加入字典。

文档中对 `setdefault()` 方法的解释如下：

> If key is in the dictionary, return its value. If not, insert key with a value of default and return default. default defaults to None.

In [28]:
ndict = {1: 'A', 2: 'B'}
ndict.setdefault('hi', 'add hi')
ndict['hi']

'add hi'

In [29]:
ndict

{1: 'A', 2: 'B', 'hi': 'add hi'}