# 字典

字典是许多值的集合，key-value pair.

## 1. 字典的基本操作

#### 创建字典

字典使用```{...}```存储数据

In [52]:
my_cat = {'size':'fat', 'color':'gray'}
my_cat

{'size': 'fat', 'color': 'gray'}

#### 通过key 来访问值

In [15]:
my_cat['size']

'fat'

当访问一个不存在的key 的时候，会出现KeyError 错误。

In [23]:
my_cat['no_existing_key']

KeyError: 'no_existing_key'

#### 检查一个key 是否存在

In [40]:
'size' in my_cat # 这个操作相当于'size' in my_cat.keys(), 参见下一节：遍历字典

True

In [27]:
'no_existing_key' in my_cat

False

#### `get()` 方法

每次访问一个key 的时候，都要判断一个key 是否存在（避免`KeyError`），这样很麻烦。可以使用`get()` 方法。

`get()` 方法需要两个参数：
- 需要访问的key
- key 不存在是返回的备用值

In [47]:
my_cat.get('size', 'normal')

'fat'

In [48]:
my_cat.get('color', 'black')

'gray'

In [50]:
my_cat.get('age', 5) # key = age 不存在，返回5

5

#### `setdefault()` 方法

可以为字典的某个key 设置一个default 值。

In [57]:
my_cat.setdefault('age', 5)

5

In [58]:
my_cat

{'size': 'fat', 'color': 'gray', 'age': 5}

setdefault 使用场景很多，例如，统计一句话中每个字符出现的个数，可以首先对每个key 设置default value = 0

In [60]:
message = 'this is a sample message for counting the number of occurance for each letter...'
count = {}

for char in message:
    count.setdefault(char, 0) # 下面一句便不会报错，问题是每次都要执行一次，效率不高。
    count[char] += 1
    
print(count)

{'t': 5, 'h': 3, 'i': 3, 's': 5, ' ': 13, 'a': 5, 'm': 3, 'p': 1, 'l': 2, 'e': 9, 'g': 2, 'f': 3, 'o': 5, 'r': 5, 'c': 5, 'u': 3, 'n': 4, 'b': 1, '.': 3}


#### 可以使用数字作为key

In [16]:
my_cat[1] = 'Age'

In [17]:
my_cat

{'size': 'fat', 'color': 'gray', 1: 'Age'}

#### 删除一个key-value pair

In [18]:
del my_cat[1]

In [19]:
my_cat

{'size': 'fat', 'color': 'gray'}

#### pretty print

In [51]:
import pprint

pprint.pprint(my_cat)

{'color': 'gray', 'size': 'fat'}


我们可以看出，key 经过排序。
当一个字典里包含字典，或者列表，pprint 的效果就很明显了。例如，下面这个长字典。

In [62]:
pprint.pprint(count)

{' ': 13,
 '.': 3,
 'a': 5,
 'b': 1,
 'c': 5,
 'e': 9,
 'f': 3,
 'g': 2,
 'h': 3,
 'i': 3,
 'l': 2,
 'm': 3,
 'n': 4,
 'o': 5,
 'p': 1,
 'r': 5,
 's': 5,
 't': 5,
 'u': 3}


## 2. 遍历字典

#### 遍历键 `keys()`

In [28]:
for key in my_cat.keys():
    print(key)

size
color


注意，`keys()`方法返回一个`dict_keys` 类型的变量，用于遍历元素。

In [37]:
my_cat.keys()

dict_keys(['size', 'color'])

`dict_keys` 不是一个列表，不能执行append操作

In [38]:
my_cat.keys().append('another_key')

AttributeError: 'dict_keys' object has no attribute 'append'

如果像得到一个字典，需要显式转换

In [39]:
list(my_cat.keys())

['size', 'color']

检查某个key 是否存在

In [43]:
'size' in my_cat.keys()

True

上述操作等价于：

In [44]:
'size' in my_cat

True

#### 遍历值 `values()`

In [29]:
for value in my_cat.values():
    print(value)

fat
gray


判断某个value是否存在

In [45]:
'gray' in my_cat.values()

True

In [46]:
'black' in my_cat.values()

False

#### 遍历键值对 `items()`

In [35]:
for kv in my_cat.items():
    print ('key: {}, value: {}'.format(kv[0], kv[1]))

key: size, value: fat
key: color, value: gray


更常见的一种写法是：

In [36]:
for key, value in my_cat.items():
    print ('key: {}, value: {}'.format(key, value))

key: size, value: fat
key: color, value: gray


## 3. 字典与列表

字典的值并非有序的。

In [20]:
lst1 = ['fat', 'gray']
lst2 = ['normal', 'black']
lst1 == lst2

False

In [21]:
another_cat = {'color':'gray', 'size':'fat'}

In [22]:
another_cat == my_cat

True

我们可以看到，字典的元素顺序不同，并不影响字典相等的判断。

因为字典元素间是没有顺序关系的，所以字典不能使用下标来访问元素，也不能像列表一样切片。