# 4 字典

> **映射（mapping）：**可以通过名称来访问其各个值的数据结构

&emsp;&emsp;字典是 Python 中唯一的内置映射类型，其中的值不按顺序排列，而是存储在键下。键可能是数、字符串或元组。

## 4.1 字典的用途

&emsp;&emsp;**字典**（日常生活中的字典和Python字典）旨在轻松地找到特定的单词（键），以获悉其定义（值）。例如用字典来存储电话簿：

In [1]:
phonebook = {'Alice': '2341', 'Beth': '5354', 'Gaius': '9527'}

## 4.2 创建和使用字典

### 4.2.0 字典概述

&emsp;&emsp;字典由**键**及其相应的**值**组成，这种键.值对称为**项（item）**。在前面的示例中，键为名字，而值为电话号码。每个键与其值之间都用冒号 `:` 分隔，项之间用逗号分隔，而整个字典放在花括号内。空字典（没有任何项）用两个花括号表示，类似于下面这样：`{}`。

> **注意：**在字典（以及其他映射类型）中，键必须是独一无二的，而字典中的值无需如此。

### 4.2.1 函数 dict

&emsp;&emsp;可使用函数 `dict` 从其他映射（如其他字典）或键-值对序列创建字典：

In [2]:
items = [('name', 'Gaius'), ('age', 42)]

In [3]:
d = dict(items)

In [4]:
d

{'age': 42, 'name': 'Gaius'}

In [5]:
d['name']

'Gaius'

&emsp;&emsp;还可使用**关键字实参**来调用这个函数：

In [6]:
d = dict(name='Gumby', age=42)

In [7]:
d

{'age': 42, 'name': 'Gumby'}

### 4.2.2 基本的字典操作

&emsp;&emsp;字典的基本行为在很多方面都类似于序列：
- `len(d)` 返回字典d包含的项（键.值对）数。
- `d[k]` 返回与键 k 相关联的值。
- `d[k] = v` 将值 v 关联到键 k。
- `del d[k]` 删除键为 k 的项。
- `k in d` 检查字典 d 是否包含键为 k 的项。

&emsp;&emsp;虽然字典和列表有多个相同之处，但也有一些重要的不同之处：
- **键的类型：**字典中的键可以是整数，但并非必须是整数。字典中的键可以是任何不可变的类型，如浮点数（实数）、字符串或元组。
- **自动添加：**即便是字典中原本没有的键，也可以给它赋值，这将在字典中创建一个新项。然而，如果不使用 `append` 或其他类似的方法，就不能给列表中没有的元素赋值。
- **成员资格：**表达式k in d（其中d是一个字典）查找的是键而不是值，而表达式 `v in l`（ l 是一个列表）查找的是值而不是索引。这看似不太一致，但你习惯后就会觉得相当自然。毕竟如果字典包含指定的键，检查相应的值就很容易。

**代码清单4-1**

&emsp;&emsp;创建电话簿字典

In [8]:
# 一个将人名用作键的字典
phonedick = {
    
    'Alice': {
        'phone': '2341',
        'addr': 'Foo drive 23',
    },
    
    'Beth': {
        'phone': '5354',
        'addr': 'Baz avenue 38',
    },
    
    'Gaius': {
        'phone': '9527',
        'addr': 'Bar street 42',
    },
    
}

# 电话号码和地址的描述性标签，供打印输出时使用
labels = {
    'phone': 'phone number',
    'addr': 'address'
}

# 输入姓名
name = input('Name: ')

# 要查找电话号码还是地址？
request = input('Phone number (p) or address (a)? ')

# 使用正确的键：
if request == 'p': key = 'phone'
if request == 'a': key = 'addr'
    
# 仅当名字是字典包含的键时才打印信息：
if name in phonedick: print("{}'s {} is {}.".format(name, labels[key], phonedick[name][key]))

Name: Gaius
Phone number (p) or address (a)? p
Gaius's phone number is 9527.


### 4.2.3 将字符串格式设置功能用于字典

&emsp;&emsp;可使用字符串格式设置功能来设置值的格式，这些值是作为命名或非命名参数提供给方法 `format` 的。在有些情况下，通过在字典中存储一系列命名的值，可让格式设置更容易些。例如，可在字典中包含各种信息，这样只需在格式字符串中提取所需的信息即可。为此，必须使用 `format_map` 来指出你将通过一个映射来提供所需的信息：

In [9]:
phonebook

{'Alice': '2341', 'Beth': '5354', 'Gaius': '9527'}

In [10]:
"Gaius's phone number is {Gaius}.".format_map(phonebook)

"Gaius's phone number is 9527."

&emsp;&emsp;在模板系统中，这种字符串格式设置方式很有用：

In [11]:
template = '''
<!DOCTYPE html>
    <head>
        <title>{title}</title>
    </head>
    
    <body>
        <h1>{title}</h1>
        <p>{text}</p>
    </body>'''

In [12]:
data = {'title': 'My Home Page', 'text': 'Welcome to my home page!'}

In [13]:
print(template.format_map(data))


<!DOCTYPE html>
    <head>
        <title>My Home Page</title>
    </head>
    
    <body>
        <h1>My Home Page</h1>
        <p>Welcome to my home page!</p>
    </body>


### 4.2.4 字典方法

#### 1. clear

&emsp;&emsp;方法 `clear` 删除（就地执行，返回 `None`）所有的字典项：

In [14]:
d = {}

In [15]:
d['name'] = 'Gaius'

In [16]:
d['age'] = 42

In [17]:
d

{'age': 42, 'name': 'Gaius'}

In [18]:
returned_value = d.clear()

In [19]:
d

{}

In [20]:
print(returned_value)

None


#### 2. copy

&emsp;&emsp;方法 `copy` 返回一个新字典，其包含的键-值对与原来的字典相同（这个方法执行的是**浅复制**，因为值本身是原件，而非副本）：

In [21]:
x = {'username': 'admin', 'machines': ['foo', 'bar', 'baz']}

In [22]:
y = x.copy()

In [23]:
y['username'] = 'mlh'

In [24]:
y['machines'].remove('bar')

In [25]:
y

{'machines': ['foo', 'baz'], 'username': 'mlh'}

In [26]:
x

{'machines': ['foo', 'baz'], 'username': 'admin'}

&emsp;&emsp;因为是浅复制，当替换副本中的值时，原件不受影响。然而，如果修改副本中的值（就地修改而不是替换），原件也将发生变化。为避免这种问题，一种办法是执行**深复制**，即同时复制值及其包含的所有值。为此，可使用模块 `copy` 中的函数 `deepcopy`。

In [27]:
from copy import deepcopy

In [28]:
d = {}

In [29]:
d['names'] = ['Alfred', 'Bertrand']

In [30]:
c = d.copy()

In [31]:
dc = deepcopy(d)

In [32]:
d['names'].append('Clive')

In [33]:
c

{'names': ['Alfred', 'Bertrand', 'Clive']}

In [34]:
dc

{'names': ['Alfred', 'Bertrand']}

#### 3. fromkeys

&emsp;&emsp;方法 `fromkeys` 创建一个新字典，其中包含指定的键，且每个键对应的值都是 `None`。

In [35]:
{}.fromkeys(['name', 'age'])

{'age': None, 'name': None}

In [36]:
dict.fromkeys(['name', 'age'])

{'age': None, 'name': None}

&emsp;&emsp;如果不想使用默认值 `None`，可提供特定的值：

In [37]:
dict.fromkeys(['name', 'age'], '(unknown)')

{'age': '(unknown)', 'name': '(unknown)'}

#### 4. get

&emsp;&emsp;方法 `get` 为访问字典项提供了宽松的环境。通常，如果你试图访问字典中没有的项，将引发错误。

In [38]:
d = {}

In [39]:
try:
    print(d['name'])
except Exception as  e:
    print('KeyError:\n{0}'.format(e))

KeyError:
'name'


&emsp;&emsp;而使用 `get` 不会这样：

In [40]:
print(d.get('name'))

None


&emsp;&emsp;可指定默认值，这样将返回指定的值而不是 `None`：

In [41]:
d.get('name', 'N/A')

'N/A'

&emsp;&emsp;如果字典包含指定的键， `get` 的作用将与普通字典查找相同：

In [42]:
d['name'] = 'Eric'

In [43]:
d.get('name')

'Eric'

**代码清单4-2**

&emsp;&emsp;使用方法 `get` 来访问电话簿字典：

In [44]:
name = input('Name: ')

# 要查找电话号码还是地址？
request = input('Phone number (p) or address (a)? ')

# 使用正确的键：
key = request # 如果request既不是'p'也不是'a'
if request == 'p': key = 'phone'
if request == 'a': key = 'addr'
    
# 使用get提供默认值
person = phonedick.get(name, {})
label = labels.get(key, key)
result = person.get(key, 'not available')

print("{}'s {} is {}.".format(name, label, result))

Name: Ken
Phone number (p) or address (a)? p
Ken's phone number is not available.


#### 5. items

&emsp;&emsp;方法 `items` 返回一个包含所有字典项的列表，其中每个元素都为 `(key, value)` 的形式，字典项在列表中的排列顺序不确定：

In [45]:
d = {'title': 'Python Web Site', 'url': 'http://www.python.org', 'spam': 0}

In [46]:
d.items()

dict_items([('title', 'Python Web Site'), ('url', 'http://www.python.org'), ('spam', 0)])

&emsp;&emsp;返回值属于一种名为**字典视图**的特殊类型。字典视图可用于迭代。另外，还可确定其长度以及对其执行成员资格检查：

In [47]:
it = d.items()

In [48]:
len(it)

3

In [49]:
('spam', 0) in it

True

> **注意：**视图始终是底层字典的反映。

#### 6. keys

&emsp;&emsp;方法 `keys` 返回一个字典视图，其中包含指定字典中的键。

#### 7. pop

&emsp;&emsp;方法 `pop` 可用于获取与指定键相关联的值，并将该键-值对从字典中删除：

In [50]:
d = {'x': 1, 'y': 2}

In [51]:
d.pop('x')

1

In [52]:
d

{'y': 2}

#### 8. popitem

&emsp;&emsp;方法 `popitem` 类似于 `list.pop`，但 `list.pop` 弹出列表中的最后一个元素，而 `popitem` 随机地弹出一个字典项，因为字典项的顺序是不确定的，即字典是**无序**的，没有“最后一个元素”的概念。如果你要以高效地方式逐个删除并处理所有字典项，这可能很有用，因为这样无需先获取键列表。

In [53]:
d = {'url': 'http://www.python.org', 'spam': 0, 'title': 'Python Web Site'}

In [54]:
d.popitem()

('title', 'Python Web Site')

In [55]:
d

{'spam': 0, 'url': 'http://www.python.org'}

#### 9. setdefault

&emsp;&emsp;方法 `setdefault` 有点像 `get`，因为它也获取与指定键相关联的值，但除此之外， `setdefault` 还在字典不包含指定的键时，在字典中添加指定的键-值对：

In [56]:
d = {}

In [57]:
d.setdefault('name', 'N/A')

'N/A'

In [58]:
d

{'name': 'N/A'}

#### 10. update

&emsp;&emsp;方法 `update` 使用一个字典中的项来更新另一个字典：

In [59]:
d = {
    'title': 'Python Web Site',
    'url': 'http://www.python.org',
    'changed': 'Mar 14 22:09:15 MET 2016'
}

In [60]:
x = {'title': 'Python Language Website'}

In [61]:
d.update(x)

In [62]:
d

{'changed': 'Mar 14 22:09:15 MET 2016',
 'title': 'Python Language Website',
 'url': 'http://www.python.org'}

#### 11. values

&emsp;&emsp;方法 `values` 返回一个由字典中的值组成的字典视图。不同于方法 `keys`，方法 `values` 返回的视图可能包含重复的值：

In [63]:
d = {}

In [64]:
d[1] = 1

In [65]:
d[2] = 2

In [66]:
d[3] = 3

In [67]:
d[4] = 4

In [68]:
d.values()

dict_values([1, 2, 3, 4])