# 字典（dict）和集合（set）

## 字典（dict）##

Python中对dict进行了支持，使用键-值（key-value）存储，查找速度很快。

比如，要用dict实现根据商品名查找销量，只需要一个“商品”-“销量”的对照表，直接通过商品就可以查到销量：

In [10]:
d = {'rice':35, 'wheat':101, 'corn':67}
d['rice']

35

把数据放入dict还可以直接通过key放入：

In [11]:
d['egg'] = 33
d

{'corn': 67, 'egg': 33, 'rice': 35, 'wheat': 101}

一个key只能对应一个value，多次对一个key放入value，后面的值会把前面的值冲掉：

In [12]:
d['corn'] = 88
d

{'corn': 88, 'egg': 33, 'rice': 35, 'wheat': 101}

如果key不存在，dict就会报错。要避免key不存在的错误，有两种办法，一是通过<font color=#0099ff> in </font>判断key是否存在，二是通过dict提供的<font color=#0099ff> get </font>方法，如果key不存在，可以返回None（返回None的时候Python的交互式命令行不显示结果），或者自己指定的value：

In [13]:
d['meat']

KeyError: 'meat'

In [14]:
'meat' in d

False

In [15]:
d.get('meat')

In [16]:
d.get('meat',45)

45

删除一个key，使用<font color=#0099ff>pop(key)</font>方法，对应的value也会从dict中删除：

In [17]:
d.pop('rice')
d

{'corn': 88, 'egg': 33, 'wheat': 101}

有下面几点需要注意：

1. dict内部存放的顺序和key放入的顺序是没有关系的
2. dict查找和插入的速度极快，不会随着key的增加而增加，但是需要占用大量的内存，内存浪费多
3. dict的key必须是<font color=red>**不可变对象**</font>。字符串、整数等都是不可变的，可以放心地作为key，而list是可变的，就不能作为key：

In [22]:
k = [3,4,5]
d[k] = 6

TypeError: unhashable type: 'list'

## 集合（set）##

与dict类似，set也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。创建一个set，需要提供一个list作为输入集合：

In [23]:
s = set([3,4,5])
s

{3, 4, 5}

重复元素在set中会被自动被过滤，通过<font color=#0099ff>add(key)</font>方法往set中添加元素，重复添加不会有效果，通过<font color=#0099ff>remove(key)</font>方法可以删除元素,例如：

In [24]:
s = set([3,3,4,4,5,5,6,6,7])
s

{3, 4, 5, 6, 7}

In [25]:
s.add(1)
s

{1, 3, 4, 5, 6, 7}

In [26]:
s.add(1)
s

{1, 3, 4, 5, 6, 7}

In [27]:
s.remove(5)
s

{1, 3, 4, 6, 7}

由于set是无序和无重复元素的集合，所以两个set可以做数学意义上的交并集等操作：

In [28]:
s1 = set([3,4,5,6])
s2 = set([5,6,7,8,9])
s1 & s2

{5, 6}

In [29]:
s1 | s2

{3, 4, 5, 6, 7, 8, 9}

与dict一样，set同样不可以放入可变对象，因为无法判断两个可变对象是否相等，也就无法保证set内部不会有重复元素。所以把list放入set，会报错。

In [17]:
s = set([1,2,[1,2]])

TypeError: unhashable type: 'list'