# 3.1 字典构造方法

In [1]:
a = dict(one=1, two=2, three=3)
b = {'one': 1, 'two': 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three': 3, 'one': 1, 'two': 2})
a == b == c == d == e

True

# 3.3 用 setdefault 处理找不到的键

对 d.update(m, [**kargs])
函数首先检查 m 是否有 keys 方法，如果有， 那么 update 函数就把它当作映射对象处理
如果没有， 会把 m 当作包含了键值对 (key, value) 元素的迭代器

In [None]:
# 用 setdefault 处理找不到的键
import sys
import re

WORE_RE = re.compile('r\w+')

index = {}
with open(sys.argv[1], encoding='utf-8') as fp:
    for line_no, line in enumerate(fp, 1):
        for match in WORE_RE.finditer(line):
            word = match.group()
            column_no = match.start()+1
            location = (line_no, column_no)
            # 使用 setdefault 处理这种情况
            # occurrences = index.get(word, [])
            # occurrences.append(location)
            # index[word] = occurrences
            index.setdefault(word, []).append(location)

for word in sorted(index, key=str.upper):
    print(word, index[word])

In [None]:
index = {'a': '1', 'b': [5]}
index.setdefault('a', []) + '3'
index.setdefault('b', []).append(10)
c= []
d= []
d.append(5)
e = (c + d)
e.append(10)

In [None]:
my_dict.setdefault(key, []).append(new_value)
# 这样与
if key not in my_dict:
    my_dict[key] = []
my_dict[key].append(new_value)
#作用相同

# 3.4 defaultdict 处理找不到的键

In [None]:
import sys
import re
import collections

'''
创建新字典
dd = defaultdict(list)
如果键 'new-key' 在 dd 中不存在的话，表达式 dd['new-key'] 会按照以下的步骤行事:
(1) 调用 list() 来建立一个新列表
(2) 把这个新列表作为值, 'new-key' 作为键， 放到 dd 中
(3) 返回这个新列表的引用

这个用来生成默认值的可调用对象放在名为 default_factory 的实例属性里
'''
index = collections.defaultdict(list)
index['a'].append(5)
index.default_factory

# 注意 default_factory 只会在 __getitem__ 里调用，在其他的方法里不会生效，比如：
# dd 是个 defaultdict， k 是个找不到的键，dd[k] 这个表达式会调用 default_factory，而 dd.get(k) 则会返回 None

list

# 3.5 字典的变种

##### collections.OrdereDict  
这个类型添加键的时候会保持顺序，因此键的迭代总是一致的。  
OrderedDict 的 popitem 方法默认删除并返回的是字典里的最后一个元素  
##### collections.Chainmap  
该类型可以容纳数个不同的映射对象，然后在进行键值查找的时候将他们作为一个整体被逐个查找  
> ```python
>import builtins
>pylookup = ChainMap(locals(), globals(), vars(builtins))
> ```
##### collections.Counter  
这个映射器会给键准备一个整数计数器，每次更新一个键的时候都会增加这个计数器

In [None]:
import collections
ct = collections.Counter('abcasdsad')
ct
ct.update('witch')
ct

##### collections.UserDict
这个类其实就是把标准的 dict 用纯 python 又实现了一遍

# 3.6 子类化 UserDict

In [None]:
# 无论添加、更新还是查询操作，StrKeyDict 都会把非字符串的键转换为字符串
import collections

class StrKeyDict(collections.UserDict):

    def __missing__(self, key):
        if isinstance(key, str):
            raise KeyError
        return self[str(key)]
    
    def __contains__(self, key):
        return str(key) in self.data
    
    def __setitem__(self, key, item):
        self.data[str(key)] = item

# 3.7 不可变映射类型

In [None]:
# 用 MappingProxyType 来获取字典的只读实例 mappingproxy
from types import MappingProxyType
d = {1: 'A'}
d_proxy = MappingProxyType(d)
d_proxy

mappingproxy({1: 'A'})

In [None]:
# d 的内容可以通过 d_proxy 看到
d_proxy[1]

'A'

In [None]:
# 但通过 d_proxy  并不能做任何修改
d_proxy[2] = 'B'

TypeError: 'mappingproxy' object does not support item assignment

In [None]:
# d_proxy 是动态的，对 d 的任何改动都会反馈到它上面
d[2] = 'B'
d_proxy

mappingproxy({1: 'A', 2: 'B'})

# 3.8 集合论

In [None]:
# 集合可以用来去重
l = ['A', 'D', 'C', 'D']
set(l)

{'A', 'C', 'D'}

In [None]:
list(set(l))

['C', 'D', 'A']

In [None]:
a = {1, 2, 3, 4, 5}
b = {2, 4, 6, 8, 10}
# 并集
print(a | b)
# 交集
print(a & b)
# 差集
a - b

{1, 2, 3, 4, 5, 6, 8, 10}
{2, 4}


{1, 3, 5}

In [None]:
# 计算 b 中元素在 a 中出现的次数
len(b & a)

2

In [None]:
# 同上，一种在任何一共对象是集合时速度更快的方法
len(set(b) & set(a))

# 另一种写法
len(set(b).intersection(a))

2

In [None]:
# 注意 : 空集必须用 set() 表示
set()

set()

In [None]:
# 集合推导
from unicodedata import name
{chr(i) for i in range(32, 256) if 'SIGN' in name(chr(i), '')}

'QUOTATION MARK'