## 常用数据结构之字典
***
迄今为止，已经介绍了Python中的三种窗口型数据类型（列表、元组、集合），但是这些数据类型仍不足以帮助解决所有的问题。例如，需要一个亦是来保存一个人的多项信息，包括：姓名、年龄、身高、体重、住址、本人手机号、紧急联系人手机号，这些之前的类型都不好用。

In [None]:
person1 = ['chenzq', 55, 168, 60, 'nanjing', '13100000000', '13800000000']
person2 = ['chenzq', 55, 168, 60, 'nanjing', '13100000000', '13800000000']
person3 = ['chenzq', 55, 168, 60, 'nanjing', '13100000000', '13800000000']

集合肯定是最不合适的，因为集合中不能有重复元素，如果一个人年龄和体重刚好相同，那么集合中就会少一项信息；同理，如果这个人的手机号和紧急联系人的手机号是相同的，那么集合中又会少一项信息。另一方面，虽然列表和元组可以把一个人的所有信息都保存下来，但是当想要获取这个人的手机号或家庭住址的时候，需要先知道他的手机号是列表或元组中的第几个元素。总之，在遇到上述场景时，列表、元组、集合都不是最合适的选择，此时则需要字典（dictionary）类型，这种类型最适合把相关联的信息组装到一起，可以帮助我们解决Python程序中**为真实事物建模**的问题。

说到字典这个词，常见的《新华字典》如图所示：
![image_dictionary](./image/image_dictionary.jpg)
Python程序中的字典，以键值对（键和值组合）的方式把数据组织到一起，可以通过键找到与之对应的值并进行操作

## 创建和使用字典

Python中创建字典可以使用`{}`字面量语法，这一点与集合是一样的。但是字典中的`{}`中的元素是以键值对的形式存在的，每个元素由`:`分隔的两俱值构成，`:`前面是键，`:`后面是值，代码如下面所示：

In [1]:
xinhua = {
    '麓':'山脚下',
    '路':'道，往来通行的地方；方面，地区：南～货，外～货；各类：他俩是一～人',
    '蕗':'甘草的别名',
    '潞':'潞水，水名，即今山西省的浊漳河；潞江，水名，即云南省的怒江'
}
print(xinhua)

{'麓': '山脚下', '路': '道，往来通行的地方；方面，地区：南～货，外～货；各类：他俩是一～人', '蕗': '甘草的别名', '潞': '潞水，水名，即今山西省的浊漳河；潞江，水名，即云南省的怒江'}


In [2]:
person = {
    'name':'王大锤',
    'age': 55,
    'height': 168,
    'addr':'Nanjin',
    'tel':'13000000000',
    'emergency contact':'13800000000'
}
print(person)

{'name': '王大锤', 'age': 55, 'height': 168, 'addr': 'Nanjin', 'tel': '13000000000', 'emergency contact': '13800000000'}


通过上面的代码，相信已经可以看出，用字典来保存一个人的信息远远优于使用列表或都元组，困为可以用`:`前面的键来表示条目的含义，而`:`后面就是这个条目所对应的值。

当然，也可以使用内置函数`dict`或者是字典的生成式语法来创建字典，代码如下所示。

In [3]:
# dict函数（构造器）中第一组参数就是字典中的一组键值对
person = dict(name = 'wangdachui', age = 55, height = 168, weight = 58, addr = 'nanjing')
print(person)

{'name': 'wangdachui', 'age': 55, 'height': 168, 'weight': 58, 'addr': 'nanjing'}


In [5]:
# 可以通过Python内置函数zip压缩两个序列并创建字典
items1 = dict(zip('ABCDE', '12345'))
print(items1) # {'A': '1', 'B': '2', 'C': '3', 'D': '4', 'E': '5'}

items2 = dict(zip('ABCDE', range(1,10)))
print(items2) # {'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5}

{'A': '1', 'B': '2', 'C': '3', 'D': '4', 'E': '5'}
{'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5}


In [6]:
# 用生成式语法创建字典
items3 = {x: x ** 3 for x in range(1, 6)}
print(items3) # {1: 1, 2: 8, 3: 27, 4: 64, 5: 125}

{1: 1, 2: 8, 3: 27, 4: 64, 5: 125}


想知道字典中一共有多少组键值对，仍然是使用`len`函数；如果相对字典进行遍历，可以用`for`循环，但是需要注意，for循环只是对字典的键进行了遍历，不过没有关系，在学习了字典的索引去处后，可以通过字典的键访问它所对应的值。

In [9]:
person = {
    'name' : 'wangdachui',
    'age' : 55,
    'height' : 168,
    'weight' : 60,
    'addr' : 'nanjing'
}
print(len(person)) # 5

for key in person:
    print(key)

5
name
age
height
weight
addr


## 字典的运算
对于字典类型来说，成员运算和索引运算是非常重要的，前者可以判定指定的键在不在字典中，后者可以通过键访问对应的值或者向字典中添加新的键值对。值得注意的是，字典的索引不同于列表的索引，列表中的元素因为有属于自己的序号，所以列表的索引是一个整数；字典中因为保存的是键值对，所以字典需要**用键去索引对应的值**。需要特别注意的是，**字典中的键必须是不可变类型**，例如整数(`int`)、浮点数(`float`)、字符串(`str`)、元组(`tuple`)等类型，这一点跟集合类型对元素的要求是一样的；很显然，列表(`list`)和集合(`set`)不能作为字典中的键，字典(`dict`)类型本身也不能再作为字典中的键，因为字典也是可变类型，但是列表、集合、字典都可以作为字典中的值，例如：

In [10]:
person = {
    'name' : 'wangdachui',
    'age' : 55,
    'height' : 168,
    'weight' : 60,
    'addr' : ['nanijng', 'beijing'],
    'car' : {
        'brand' : 'BMW X7',
        'maxSpeed' : '250',
        'length' : 5170,
        'width' : 2000,
        'height' : 1835,
        'displacement' : 3.0
    }
}
print(person)

{'name': 'wangdachui', 'age': 55, 'height': 168, 'weight': 60, 'addr': ['nanijng', 'beijing'], 'car': {'brand': 'BMW X7', 'maxSpeed': '250', 'length': 5170, 'width': 2000, 'height': 1835, 'displacement': 3.0}}


In [7]:
# 以下是字典的成员运算和索引运算
person = {'name': 'wangdachui', 'age': 55, 'height': 168, 'weight': 60, 'addr': 'nanjing'}

# 成员运算
print('name' in person) # True
print('tel' in person) # False

# 索引运算
print(person['name']) # wangdachui
print(person['addr']) # nanjing
person['age'] = 25
person['height'] = 178
person['tel'] = '13100000000'
person['signature'] = '你的男朋友是一个盖世垃圾，他会踏着五彩祥云去迎娶你的闺蜜'

print(person)

# 循环遍历
for key in person:
    print(f'{key}:\t{person[key]}')

True
False
wangdachui
nanjing
{'name': 'wangdachui', 'age': 25, 'height': 178, 'weight': 60, 'addr': 'nanjing', 'tel': '13100000000', 'signature': '你的男朋友是一个盖世垃圾，他会踏着五彩祥云去迎娶你的闺蜜'}
name:	wangdachui
age:	25
height:	178
weight:	60
addr:	nanjing
tel:	13100000000
signature:	你的男朋友是一个盖世垃圾，他会踏着五彩祥云去迎娶你的闺蜜


## 字典的方法
字典类型的方法基础是都跟字典的键值对操作相关，其中`get`方法可以通过键来获得对应的值。跟索引运算不同的是，`get`方法在字典中没有指定的键时不会产生异常，而是返回`None`或指定的默认值，代码如下所示：

In [10]:
person = {'name': 'wangdachui', 'age': 55, 'height': 168, 'weight': 60, 'addr': 'nanjing'}

print(person.get('name')) # wangdachui
print(person.get('sex')) # None
print(person.get('sex', True)) # True

wangdachui
None
True


如果需要获取字典中所有的键，还可以使用`keys`方法；如果需要获取字典中的所有的值，可以使用`values`方法。字典还有一个名为`items`的方法，它会将键和值组装成二元组，通过该方法来遍历字典中的元素也是非常方便的。

In [15]:
person = {'name': 'wangdachui', 'age': 55, 'height': 168}

print(person.keys()) # dict_keys(['name', 'age', 'height'])
print(person.values) # <built-in method values of dict object at 0x104dfd440>
print(person.values()) # dict_values(['wangdachui', 55, 168])
for key, value in person.items():
    print(f'{key}:\t{value}')

dict_keys(['name', 'age', 'height'])
<built-in method values of dict object at 0x104dfa200>
dict_values(['wangdachui', 55, 168])
name:	wangdachui
age:	55
height:	168


字典的`update`方法实现两个字典的合并操作。例如，有两个字典`x`和`y`，当执行`x.update(y)`操作时，`x`跟`y`相同的键会被`y`中的值更新，而`y`中有但`x`中没有的键值对直接添加到x中，代码如下所示。

In [17]:
person1 = {'name': 'wangdachui', 'age': 55, 'height': 168}
person2 = {'age' : 25, 'addr' : 'nanjing'}

# person1 |= person2
person1.update(person2)
print(person1) # {'name': 'wangdachui', 'age': 25, 'height': 168, 'addr': 'nanjing'}


{'name': 'wangdachui', 'age': 25, 'height': 168, 'addr': 'nanjing'}


可以通过`pop`或`popitem`方法从字典中删除元素，前者会返回（获得）键对应的值，但是如果字典中不存在指定的键，会引发`KeyError`错误；后者在删除元素时，会返回（获得）键和值组成的二元组。字典的`clear`方法会清空字典中所有的键值对，代码如下所示：

In [22]:
person = {'name': 'wangdachui', 'age': 55, 'height': 168, 'weight': 60, 'addr': 'nanjing'}
print(person.pop('age')) # 55
print(person) # {'name': 'wangdachui', 'height': 168, 'weight': 60, 'addr': 'nanjing'}

print(person.popitem()) # ('addr', 'nanjing')
print(person) # {'name': 'wangdachui', 'height': 168, 'weight': 60}

person.clear()
print(person) # {}

55
{'name': 'wangdachui', 'height': 168, 'weight': 60, 'addr': 'nanjing'}
('addr', 'nanjing')
{'name': 'wangdachui', 'height': 168, 'weight': 60}
{}


跟列表一样，从字典中删除元素也要以使用`del`关键字，在删除元素的时候如果指定的键索引找不到对应的值，一样会引发KeyError错误，具体的做法如下所示。

In [26]:
person = {'name': 'wangdachui', 'age': 55, 'height': 168, 'weight': 60, 'addr': 'nanjing'}
del person['age']
del person['addr']
print(person) # {'name': 'wangdachui', 'height': 168, 'weight': 60}

if 'height' in person:
    del person['height']
    print(person) # {'name': 'wangdachui', 'weight': 60}

# del person['signature']
# print(person) # KeyError:'signature'

{'name': 'wangdachui', 'height': 168, 'weight': 60}
{'name': 'wangdachui', 'weight': 60}


## 字典的应用
以下通过几个例子看一下字典类型解决一些实际的问题：

**例子1**：输入一段等方面，统计每个英文字母出现的次数，按出从高到低输入。

In [1]:
sentence = input('请输入一段话（英文）：')
# Man is distinguished, not only by his reason, but by this singular passion from other animals, which is a lust of the mind, that by a perseverance of delight in the continued and indefatigable generation of knowledge, exceeds the short vehemence of any carnal pleasure.
counter = {}
for ch in sentence:
    if 'A' <= ch <= 'Z' or 'a' <= ch <= 'z':
        counter[ch] = counter.get(ch, 0) + 1 # 获取键 ch 对应的值，如果键不存在则返回默认值 0,安全地获取字典值，避免 KeyError
        '''
        # 等价于：
        if ch in counter:
            counter[ch] = counter[ch] + 1
        else:
            counter[ch] = 1
        '''
sorted_keys = sorted(counter, key = counter.get, reverse = True)

for key in sorted_keys:
    print(f'{key}出现了{counter[key]}次')

e出现了27次
n出现了21次
a出现了18次
i出现了18次
s出现了16次
t出现了16次
o出现了14次
h出现了13次
r出现了10次
d出现了9次
l出现了9次
g出现了6次
u出现了6次
f出现了6次
c出现了6次
y出现了5次
b出现了5次
m出现了4次
p出现了3次
w出现了2次
v出现了2次
M出现了1次
k出现了1次
x出现了1次


**例子2**：在一个字典中保存了股票的代码和价格，找出股价大于100元的股票，并创建一个新的字典。
> 说明：可以用字典的生成式语法来创建这个字典

In [2]:
stocks = {
    'APPL' : 199.88,
    'GOOG' : 1186.96,
    'IBM' : 149.24,
    'OCRL' : 48.44,
    'ACN' : 166.89,
    'FB' : 208.09,
    'SYMC' : 21.29
}

stocks2 = {key: value for key, value in stocks.items() if value > 100}
print(stocks2) # {'APPL': 199.88, 'GOOG': 1186.96, 'IBM': 149.24, 'ACN': 166.89, 'FB': 208.09}

{'APPL': 199.88, 'GOOG': 1186.96, 'IBM': 149.24, 'ACN': 166.89, 'FB': 208.09}


## 总结
Python程序中的字典跟现实生活中的字典非常像，允许我们以键值对的形式保存数据，再通过键访问对应的值。字典是一种非常有利于数据检索的数据类型，但是需要再次明确，**字典中的键必须是不可变类型**， 列表、集合、字典等类型的数据都不能作为字典的键。