In [4]:
from collections import abc
my_dict = {}
isinstance(my_dict, abc.Mapping)

True

In [5]:
tt = (1, 2, (30, 40))
hash(tt)

8027212646858338501

In [7]:
tl = (1, 2, [30, 40])
hash(tl)

TypeError: unhashable type: 'list'

In [8]:
tf = (1, 2, frozenset([30, 40]))
hash(tf)

985328935373711578

In [9]:
a = dict(one=1, two=2, three=3)
b = {'one': 1, 'two': 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three': 3, 'one': 1, 'two': 2})
a == b == c == d == e

True

In [11]:
DIAL_CODES = [(86, 'China'),(91, 'India'),(1, 'United States')]
country_code = {country: code for code, country in DIAL_CODES}
country_code

{'China': 86, 'India': 91, 'United States': 1}

In [12]:
country_code = {code: country.upper() for code, country in DIAL_CODES}
country_code

{86: 'CHINA', 91: 'INDIA', 1: 'UNITED STATES'}

In [13]:
class StrKeyDict0(dict):
    
    def __missing(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    
    def get(self, key, default=None):
        try:
            return self[key]
        except KeyError:
            return default
    
    def __contains__(self, key):
        return key in self.keys() or str(key) in self.keys()


In [14]:
d = StrKeyDict0([('2', 'two'), ('4', 'four')])
d['2']

'two'

In [15]:
d[1]

KeyError: 1

In [16]:
1 in d

False

In [17]:
2 in d

True

In [18]:
'5' in d

False

In [20]:
import collections
ct = collections.Counter('asdfasdfasdf')
ct

Counter({'a': 3, 's': 3, 'd': 3, 'f': 3})

In [21]:
ct.update('aaaazzzz')
ct

Counter({'a': 7, 's': 3, 'd': 3, 'f': 3, 'z': 4})

In [22]:
ct.most_common(2)

[('a', 7), ('z', 4)]

In [23]:
class StrKeyDict(collections.UserDict):
    
    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError(key)
        return self[str(key)]
    
    def __contains__(self, key):
        return str(key) in self.data
    
    def __setitem__(self, key, item):
        self.data[str(key)] = item

In [24]:
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)
d_proxy

mappingproxy({1: 'A'})

In [25]:
d_proxy[1]

'A'

In [26]:
d_proxy[2] = 'x'

TypeError: 'mappingproxy' object does not support item assignment

In [27]:
d[2] = 'B'

In [28]:
d_proxy

mappingproxy({1: 'A', 2: 'B'})

In [1]:
from dis import dis
dis('{1}')

  1           0 LOAD_CONST               0 (1)
              2 BUILD_SET                1
              4 RETURN_VALUE


In [2]:
dis('set([1])')

  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (1)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE


In [3]:
frozenset(range(10))

frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})

In [5]:
from unicodedata import name
{chr(i) for i in range(32, 256) if 'SIGN' in name(chr(i), '')}

{'#',
 '$',
 '%',
 '+',
 '<',
 '=',
 '>',
 '¢',
 '£',
 '¤',
 '¥',
 '§',
 '©',
 '¬',
 '®',
 '°',
 '±',
 'µ',
 '¶',
 '×',
 '÷'}

In [8]:
DIAL_CODES = [ (86, 'China'), (91, 'India'), (1, 'United States'), (62, 'Indonesia'), (55, 'Brazil'), (92, 'Pakistan'), (880, 'Bangladesh'), (234, 'Nigeria'), (7, 'Russia'), (81, 'Japan'), ]
d1 = dict(DIAL_CODES)
print('d1:', d1.keys())

d1: dict_keys([86, 91, 1, 62, 55, 92, 880, 234, 7, 81])


In [10]:
d2 = dict(sorted(DIAL_CODES))
print('d2:', d2.keys())

d2: dict_keys([1, 7, 55, 62, 81, 86, 91, 92, 234, 880])


In [11]:
d3 = dict(sorted(DIAL_CODES, key=lambda x:x[1]))
print('d3:', d3.keys())

d3: dict_keys([880, 55, 86, 91, 62, 81, 234, 92, 7, 1])


In [15]:
assert d1 == d2 and d2 == d3
{i for i in range(5)}

{0, 1, 2, 3, 4}

## 字典推导
```python
DIAL_CODES = [(86, 'China'),(91, 'India'),(1, 'United States')]
country_code = {country: code for code, country in DIAL_CODES}
```
## 用setdefault处理找不到的键
```python
# 如果key不存在，把key和一个空列表放进映射，然后返回这个空列表
my_dict.setdefault(key, []).append(new_value)
```
## defaultdict：处理找不到的键的一个选择
- collections.defaultdict创建找不到时的默认值
```python
# 如果index没有key的记录，default_factory会被调用，为查询不到的键创建一个值。
index = collections.defaultdict(list)
```
## 字典的变种
- collections.Counter：会给键准备一个整数计数器。每次更新一个键的时候都会增加这个计数器。
```python
# 每个字母出现的次数
ct = collections.Counter('asdfasdfasdf')
ct.update('aaaafffgggzzz')
# 出现最多的前2个
ct.most_common(2)
```
## 不可变映射类型
- types.MappingProxyType：给这个类一个映射，返回只读的映射视图，且是动态的。
```python 
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)
# d_proxy[2] = 'x' 会抛出TypeError
d[2] = 'B'
# d_proxy会跟d动态改变
d_proxy[2]
```
## 集合
- 可以用于去重
- needles的元素在haystack里出现的次数，要求都是set类型。
```python
found = len(needles & haystack)
# 任何可迭代对象
found = len(set(needles) & (set(haystack))
```
- 空集合表示：set()
- 反汇编函数dis.dis查看字节码
```python
from dis import dis
dis('{1}')
# 用列表构建较慢，需要新建一个列表，再把这个列表传入到构造方法。
dis('[1]')
```
- 集合推导
```python
{i for i in range(5)}
```
## 字典中的散列表
- 散列表是一个稀疏数组。
- dict的实现及其导致的结果
    - 键必须是可散列的
    - 字典在内存上的开销巨大，可以用元组或具名元组构成的列表替代，避免了散列表所耗费的空间和无需把记录中的字段的名字在每个元素里都存一遍。
    - 键查询很快，空间换时间
    - 键的次序取决于添加顺序，但是当添加新建又发生散列冲突的时候，新键可能会被按排存放到另一个位置。
    - 往字典里添加新键可能会改变已有键的顺序，所以，不要对字典同时进行迭代和修改。
- set的实现以及导致的结果
    - 集合里的元素必须是可散列的
    - 集合很消耗内存
    - 可以很高效的判断元素是否存在于某个集合
    - 元素的次序取决于被添加到集合里的次序
    - 往集合里添加元素，可能会改变集合里已有元素的次序
    
## 总结
- 字典、集合也可以和列表一样进行推导
- 字典和集合都使用到了散列表、稀疏数组等牺牲空间换时间的概念