# defaultdict

* 先來看個例子，假設我有個單詞的list如下，然後我想去計算詞頻

In [1]:
word_list = ['is', 'who', 'when', 'it', 'is', 'who', 'is']

* 那，比較簡單的做法，就是寫個 dictionary，裡面的 key，就是詞頻裡的字，然後用 for 迴圈，把詞頻填進 value 裡面

In [6]:
result = dict()

for word in word_list:
    if word not in result.keys():
        result[word] = 1
    else:
        result[word] += 1

print(result)

{'is': 3, 'who': 2, 'when': 1, 'it': 1}


* 那，上面的寫法，可以改的優雅一點，如下：

In [7]:
result = dict()

for word in word_list:
    result.setdefault(word, 0) # 看一下目前的 dictionary 中，有沒有 word 這個 key，沒的話，用預設為 0 填入
    result[word] += 1

print(result)

{'is': 3, 'who': 2, 'when': 1, 'it': 1}


* 那，最優雅的做法，就是用 `defaultdict`

In [13]:
from collections import defaultdict

result = defaultdict(
    int # 這邊要放的參數，是任何 callable object。例如這邊我寫 int，那他的預設值就會是 call int() 所得到的結果 -> 0
)

# 做個實驗看看
result["hahahaha"]
print(result)

result = defaultdict(list)
result["hahahahahahahahaha"]
print(result)

# function 也是 object，所以也算 callable object
def my_func():
    return "ok I see"
result = defaultdict(my_func)
result["hahahahahahaha"]
print(result)

defaultdict(<class 'int'>, {'hahahaha': 0})
defaultdict(<class 'list'>, {'hahahahahahahahaha': []})
defaultdict(<function my_func at 0x10cb753a0>, {'hahahahahahaha': 'ok I see'})


* 所以，我可以這樣改寫剛剛的 code

In [15]:
from collections import defaultdict

result = defaultdict(int)
for word in word_list:
    result[word] += 1

print(result)


defaultdict(<class 'int'>, {'is': 3, 'who': 2, 'when': 1, 'it': 1})
