# 第三章 字典和集合
正是因为字典至关重要，Python 对它的实现做了高度优化，而散列表则
是字典类型性能出众的根本原因。

集合（set）的实现其实也依赖于散列表，因此本章也会讲到它。反过
来说，想要进一步理解集合和字典，就得先理解散列表的原理
## 3.1 泛映射类型
collections.abc 模块中有 Mapping 和 MutableMapping 这两个
抽象基类，它们的作用是为 dict 和其他类似的类型定义形式接口
isinstance 一起被用来判定某个数
据是不是广义上的映射类型：

In [2]:
from collections import abc
my_dict={}
isinstance(my_dict,abc.Mapping)

True

**什么是可散列的数据**
如果一个对象是可散列的，那么在这个对象的生命周期中，它
的散列值是不变的，而且这个对象需要实现 __hash__() 方
法。另外可散列对象还要有 __qe__() 方法，这样才能跟其
他键做比较。如果两个可散列对象是相等的，那么它们的散列
值一定是一样的……

原子不可变数据类型（str、bytes 和数值类型）都是可散列类
型，frozenset 也是可散列的，因为根据其定义，frozenset
里只能容纳可散列类型。元组的话，只有当一个元组包含的所有元
素都是可散列类型的情况下，它才是可散列的。来看下面的元组
tt、tl 和 tf：

In [4]:
tt=(1,2,(30,40))
hash(tt)

8027212646858338501

In [6]:
tl=(1,2,[30,40])
hash(tl)

TypeError: unhashable type: 'list'

In [7]:
tf=(1,2,frozenset([30,40]))
hash(tf)

-4118419923444501110

**创建字典不同的方式**：

In [10]:
a=dict(one=1,two=2,three=3)
b={'one':1,'two':2,'three':3}
c=dict(zip(['one','two','three'],[1,2,3]))
d=dict([('two',2),('one',1),('three',3)])
e=dict({'one':1,'two':2,'three':3})
a==b==c==d==e

True

## 3.2 字典推导
字典推导（dictcomp）可以从任何以键值对作为元素的可迭代对象中构建出字典

In [13]:
DIAL_CODES=[
    (86,'China'),
    (91,'India'),
    (1,'United States'),
    (62,'Indonesia'),
    (55,'Brazil'),
    (92,'Pakistan'),
    (880,'Bangladesh'),
    (234,'Negeria'),
    (7,'Russia'),
    (81,'Japan')
]
country_code={country:code for code,country in DIAL_CODES}
country_code

{'Bangladesh': 880,
 'Brazil': 55,
 'China': 86,
 'India': 91,
 'Indonesia': 62,
 'Japan': 81,
 'Negeria': 234,
 'Pakistan': 92,
 'Russia': 7,
 'United States': 1}

用区域码作为键，国家名称转换为大写，并且过滤掉区域码大于或等于 66 的地区。

In [14]:
{code:country for country,code in country_code.items() if code>=66}

{81: 'Japan',
 86: 'China',
 91: 'India',
 92: 'Pakistan',
 234: 'Negeria',
 880: 'Bangladesh'}

**用serdefault处理找不到的键**

`my_dict.setdefault(key, []).append(new_value)`

和下面的效果一样：

`if key not in my_dict:
    my_dict[key]=[]
my_dict[key].append(new_value)`

## 3.5字段的变种
collections.Counter 这个映射类型会给键准备一个整数计数器。每次更新一个键的时候
都会增加这个计数器。

下面的小例子利用 Counter 来计算单词中各个字母出现的次数：

In [15]:
from collections import Counter
ct=Counter('abracadabra')
ct

Counter({'a': 5, 'b': 2, 'c': 1, 'd': 1, 'r': 2})

In [17]:
ct.update('abc')
ct

Counter({'a': 7, 'b': 4, 'c': 3, 'd': 1, 'r': 2})

In [18]:
ct.most_common(2)

[('a', 7), ('b', 4)]

## 3.8 集合论

In [19]:
#集合的本质是许多唯一对象的聚集。因此，集合可以用于去重：
l=['spam', 'spam', 'eggs', 'spam']
set(l)

{'eggs', 'spam'}

In [20]:
list(set(l))

['spam', 'eggs']

**集合字面变量**
除空集之外，集合的字面量——{1}、{1, 2}，等等——看起来跟它
的数学形式一模一样。如果是空集，那么必须写成 set() 的形式。

In [22]:
s={1}
type(s)

set

In [23]:
s

{1}

In [24]:
s.pop()

1

In [25]:
s

set()