    统计strings中某个单词出现的次数，并在counts字典中作记录。单词每出现一次，在counts相对应的键所存的值数字加1。

In [1]:
strings = ('puppy', 'kitten', 'puppy', 'puppy',
           'weasel', 'puppy', 'kitten', 'puppy')
counts = {}

for kw in strings:
    counts[kw] += 1

KeyError: 'puppy'

    是的，运行这段代码会抛出KeyError异常，出现的时机是每个单词第一次统计的时候，因为Python的dict中不存在默认值的说法

### 方法一：使用判断语句检查
    在单词第一次统计的时候，在counts中相应的键存下默认值1。需要在处理时添加一个判断语句：

In [2]:
strings = ('puppy', 'kitten', 'puppy', 'puppy',
           'weasel', 'puppy', 'kitten', 'puppy')
counts = {}

for kw in strings:
    if kw not in counts:
        counts[kw] = 1
    else:
        counts[kw] += 1

print(counts)

{'puppy': 5, 'kitten': 2, 'weasel': 1}


### 方法二：使用dict.setdefault()方法设置默认值

    dict.setdefault()方法接收两个参数，第一个参数是键名称，第二个参数是默认值。假如字典中不存在给定的键，则返回参数中提供的默认值；反之，则返回字典中保存的值。

In [3]:
strings = ('puppy', 'kitten', 'puppy', 'puppy',
           'weasel', 'puppy', 'kitten', 'puppy')
counts = {}

for kw in strings:
    counts[kw] = counts.setdefault(kw, 0) + 1    #等价于counts.setdefault(kw, 0)   counts[kw] += 1
    
print(counts)

{'puppy': 5, 'kitten': 2, 'weasel': 1}


### 方法三：使用collections.defaultdict
    以上两种方法虽然在一定程度上解决了dict中不存在默认值的问题，但是有更简洁的方法：collections.defaultdict。

    defaultdict类就像是一个dict，但是它使用一个类型来初始化。

In [4]:
from collections import defaultdict

strings = ('puppy', 'kitten', 'puppy', 'puppy',
           'weasel', 'puppy', 'kitten', 'puppy')
counts = defaultdict(lambda: 0)  # 使用lambda来定义简单的函数

for s in strings:
    counts[s] += 1
    
print(counts)

defaultdict(<function <lambda> at 0x000000000588E158>, {'puppy': 5, 'kitten': 2, 'weasel': 1})


## 接下来介绍collections.defaultdict

In [5]:
from collections import defaultdict
dd = defaultdict(list)
dd

defaultdict(list, {})

    defaultdict类的初始化函数接受一个类型作为参数，当所访问的键不存在的时候，可以实例化一个值作为默认值

In [6]:
dd['foo']

[]

In [7]:
dd

defaultdict(list, {'foo': []})

In [8]:
dd['bar'].append('quux')
dd

defaultdict(list, {'bar': ['quux'], 'foo': []})

    这种形式的默认值只有在通过dict[key]或者dict.__getitem__(key)访问的时候才有效

    另外、defaultdict除了可以接受类型名为参数，还可以接受任何不带参数的可调用函数，函数的返回结果为默认值，这样、默认值的取值更加灵活。

In [9]:
def zero():
    return 0
dd = defaultdict(zero)

In [10]:
dd

defaultdict(<function __main__.zero>, {})

In [11]:
dd['foo']

0

In [12]:
dd

defaultdict(<function __main__.zero>, {'foo': 0})

## 那么，defaultdict类是如何实现的？
    关键是__missing__()方法：

In [13]:
defaultdict.__missing__.__doc__

'__missing__(key) # Called by __getitem__ for missing key; pseudo-code:\n  if self.default_factory is None: raise KeyError((key,))\n  self[key] = value = self.default_factory()\n  return value\n'

    当使用__getitem__()方法访问一个不存在的键时(dict[key]这种形式实际上是__getitem__()方法的简化形式)，会调用__missing__()方法获取默认值，并将该键添加到字典中去。

    关于__missing__()方法的具体介绍可以参考Python官方文档中的"Mapping Types — dict"一节。

In [14]:
#注意：虽然dict支持__missing__()方法，但是在dict本身是不存在这个方法的，而是需要在派生的子类中自行实现这个方法
#验证：
dict.__missing__.__doc__

AttributeError: type object 'dict' has no attribute '__missing__'