## 5.5 ptrhon标准库

### 5.5.1 使用setdefault()和defaultdict()处理缺失的键

1、读取字典中不存在的键的值会抛出异常。使用字典函数get() 返回一个默认值会避免异常
发生。函数setdefault() 类似于get()， 但当键不存在时它会在字典中添加一项：

In [None]:
>>> periodic_table = {'Hydrogen': 1, 'Helium': 2}
>>> print(periodic_table)

如果键不在字典中，新的默认值会被添加进去：

In [None]:
>>> carbon = periodic_table.setdefault('Carbon', 12)
>>> carbon

In [None]:
>>> periodic_table

如果试图把一个不同的默认值赋给已经存在的键，不会改变原来的值，仍将返回初始值：

In [None]:
>>> helium = periodic_table.setdefault('Helium', 947)
>>> helium

In [None]:
>>> periodic_table

2、defaultdict() 也有同样的用法，但是在创建字典时，对每个新的键都会指定默认值。它的
参数是一个函数。

在本例中，把函数int 作为参数传入，会按照int() 调用，返回整数0：

In [None]:
>>> from collections import defaultdict
>>> periodic_table = defaultdict(int)

In [None]:
>>> periodic_table['Hydrogen'] = 1
>>> periodic_table['Lead']

In [None]:
periodic_table

3、函数defaultdict() 的参数是一个函数，它返回赋给缺失键的值。

在下面的例子中，no_
idea() 在需要时会被执行，返回一个值：

In [None]:
>>> from collections import defaultdict
>>> def no_idea():
    return 'Huh?'
>>> bestiary = defaultdict(no_idea)
>>> bestiary['A'] = 'Abominable Snowman'
>>> bestiary['B'] = 'Basilisk'
>>> bestiary['A']

In [None]:
>>> bestiary['B']

In [None]:
>>> bestiary['C']

同样，可以使用函数int()、list() 或者dict() 返回默认空的值：int() 返回0，list()
返回空列表（[]），dict() 返回空字典（{}）。如果你删掉该函数参数，新键的初始值会被
设置为None。

顺便提一下，也可以使用lambda 来定义你的默认值函数：

In [None]:
>>> bestiary = defaultdict(lambda: 'Huh?')
>>> bestiary['E']

4、使用int 是一种定义计数器的方式：

In [None]:
>>> from collections import defaultdict
>>> food_counter = defaultdict(int)
>>> for food in ['spam', 'spam', 'eggs', 'spam']:
    food_counter[food] += 1
>>> for food, count in food_counter.items():
        print(food, count)

In [None]:
food_counter

上面的例子中，如果food_counter 已经是一个普通的字典而不是defaultdict 默认字典，
那每次试图自增字典元素food_counter[food] 值时，Python 会抛出一个异常，因为我们没
有对它进行初始化

In [None]:
>>> from collections import defaultdict
>>> food_counter = dict()
>>> for food in ['spam', 'spam', 'eggs', 'spam']:
    food_counter[food] += 1
>>> for food, count in food_counter.items():
        print(food, count)

### 5.5.2 使用Counter()计数

说起计数器，标准库有一个计数器，它可以胜任之前或者更多示例所做的工作：

In [None]:
>>> from collections import Counter
>>> breakfast = ['spam', 'spam', 'eggs', 'spam']
>>> breakfast_counter = Counter(breakfast)
>>> breakfast_counter

函数most_common() 以降序返回所有元素，或者如果给定一个数字，会返回该数字前的的
元素：

In [None]:
>>> breakfast_counter.most_common()

In [None]:
>>> breakfast_counter.most_common(1)

In [None]:
>>> breakfast_counter.most_common(2)

也可以组合计数器。首先来看一下breakfast_counter：

In [None]:
>>> breakfast_counter
>>> Counter({'spam': 3, 'eggs': 1})

这一次，新建一个列表lunch 和一个计数器lunch_counter：

In [None]:
>>> lunch = ['eggs', 'eggs', 'bacon']
>>> lunch_counter = Counter(lunch)
>>> lunch_counter

第一种组合计数器的方式是使用+：

In [None]:
>>> breakfast_counter + lunch_counter

你也可能想到，从一个计数器去掉另一个，可以使用-。什么是早餐有的而午餐没有的呢？

In [None]:
>>> breakfast_counter - lunch_counter

那么什么又是午餐有的而早餐没有的呢?

In [None]:
>>> lunch_counter - breakfast_counter

和第4 章中的集合类似，可以使用交集运算符& 得到二者共有的项：

In [None]:
>>> breakfast_counter & lunch_counter

最后，使用并集运算符| 得到所有元素：

In [None]:
>>> breakfast_counter | lunch_counter

'eggs' 又是两者共有的项。不同于合并，并集没有把计数加起来，而是取其中较大的值。

### 5.5.3 使用有序字典OrderedDict()按键排序

在前面几章的代码示例中可以看出，一个字典中键的顺序是不可预知的：你可以按照顺序
添加键a、b 和c，但函数keys() 可能返回c、a 和b。

In [None]:
>>> quotes = {
        'Moe': 'A wise guy, huh?',
        'Curly': 'Nyuk nyuk!',
        'Larry': 'Ow!',
    }
>>> for stooge in quotes:
        print(stooge)

有序字典OrderedDict() 记忆字典键添加的顺序，然后从一个迭代器按照相同的顺序返
回。 试着用元组（键，值）创建一个有序字典：

In [12]:
>>> from collections import OrderedDict
>>> quotes = OrderedDict([
        ('Moe', 'A wise guy, huh?'),
        ('Larry', 'Ow!'),
        ('Curly', 'Nyuk nyuk!'),
    ])
>>> for stooge in quotes:
        print(stooge)

Moe
Larry
Curly


### 5.5.4 双端队列：栈+队列

deque 是一种双端队列，同时具有栈和队列的特征。它可以从序列的任何一端添加和删除
项。现在，我们从一个词的两端扫向中间，判断是否为回文。函数popleft() 去掉最左边
的项并返回该项，pop() 去掉最右边的项并返回该项。从两边一直向中间扫描，只要两端
的字符匹配，一直弹出直到到达中间：

In [None]:
>>> def palindrome(word):
        from collections import deque
        dq = deque(word)
        while len(dq) > 1:
            if dq.popleft() != dq.pop():
                return False
        return True

In [None]:
>>> palindrome('a')

In [None]:
>>> palindrome('racecar')

In [None]:
>>> palindrome('')

In [None]:
>>> palindrome('radar')

In [None]:
>>> palindrome('halibut')

### 5.5.5 使用itertools迭代代码结构

itertools在
for ... in 循环中调用迭代函数，每次会返回一项，并记住当前调用的状态。

即使chain() 的参数只是单个迭代对象，它也会使用参数进行迭代：

In [5]:
>>> import itertools
>>> for item in itertools.chain([1, 2], ['a', 'b']):
        print(item)

1
2
a
b


In [8]:
itertools.chain([1, 2], ['a', 'b'])

<itertools.chain at 0x126f4cb5b40>

cycle() 是一个在它的参数之间循环的无限迭代器：

In [4]:
>>> import itertools
itertools.cycle([1, 2])

<itertools.cycle at 0x126f4d79e80>

accumulate() 计算累积的值。默认的话，它计算的是累加和：

In [9]:
>>> import itertools
>>> for item in itertools.accumulate([1, 2, 3, 4]):
        print(item)

1
3
6
10


你可以把一个函数作为accumulate() 的第二个参数，代替默认的加法函数。这个参数函数
应该接受两个参数，返回单个结果。下面的例子计算的是乘积：

In [10]:
>>> import itertools
>>> def multiply(a, b):
        return a * b
>>> for item in itertools.accumulate([1, 2, 3, 4], multiply):
        print(item)

1
2
6
24


itertools 模块有很多其他的函数，有一些可以用在需要节省时间的组合和排列问题上。

### 5.5.6 使用pprint()友好输出

In [13]:
>>> from pprint import pprint
>>> quotes = OrderedDict([
        ('Moe', 'A wise guy, huh?'),
        ('Larry', 'Ow!'),
        ('Curly', 'Nyuk nyuk!'),
        ])

In [14]:
>>> print(quotes)

OrderedDict([('Moe', 'A wise guy, huh?'), ('Larry', 'Ow!'), ('Curly', 'Nyuk nyuk!')])


In [16]:
>>> pprint(quotes)

OrderedDict([('Moe', 'A wise guy, huh?'),
             ('Larry', 'Ow!'),
             ('Curly', 'Nyuk nyuk!')])
