## defaultdict 容器工具
---
`defaultdict` 是 Python collections 模組中的一個特殊字典，當訪問不存在的鍵時，會自動創建一個預設值而不是拋出 KeyError。
這使它在處理數據分組、計數和創建嵌套結構時非常有用。

In [1]:
# 基本用法
from collections import defaultdict

# 創建一個預設值為整數 0 的字典
int_dict = defaultdict(int)
print(f"訪問不存在的鍵 'a': {int_dict['a']}")  # 不會拋出錯誤，返回 0
int_dict['b'] += 5
print(f"int_dict: {dict(int_dict)}")

訪問不存在的鍵 'a': 0
int_dict: {'a': 0, 'b': 5}


In [2]:
# 使用不同的預設工廠函數
list_dict = defaultdict(list)
list_dict['fruits'].append('蘋果')
list_dict['fruits'].append('香蕉')
list_dict['vegetables'].append('胡蘿蔔')
print(f"list_dict: {dict(list_dict)}")

set_dict = defaultdict(set)
set_dict['A'].add(1)
set_dict['A'].add(2)
set_dict['A'].add(1)  # 重複元素不會添加
print(f"set_dict: {dict(set_dict)}")

list_dict: {'fruits': ['蘋果', '香蕉'], 'vegetables': ['胡蘿蔔']}
set_dict: {'A': {1, 2}}


In [3]:
# 自定義預設值函數
def default_value():
    return "未知"
custom_dict = defaultdict(default_value)
print(f"訪問不存在的鍵 'name': {custom_dict['name']}")
custom_dict['age'] = 25
print(f"custom_dict: {dict(custom_dict)}")

訪問不存在的鍵 'name': 未知
custom_dict: {'name': '未知', 'age': 25}


In [4]:
# 常見用例：計數（頻率統計）
words = ['蘋果', '香蕉', '蘋果', '橘子', '香蕉', '蘋果', '西瓜']
# 使用 defaultdict
word_counts = defaultdict(int)
for word in words:
    word_counts[word] += 1
print(f"單詞計數: {dict(word_counts)}")

單詞計數: {'蘋果': 3, '香蕉': 2, '橘子': 1, '西瓜': 1}


In [5]:
# 對比：不使用 defaultdict
regular_dict = {}
for word in words:
    if word in regular_dict:
        regular_dict[word] += 1
    else:
        regular_dict[word] = 1
print(f"使用普通字典計數: {regular_dict}")

使用普通字典計數: {'蘋果': 3, '香蕉': 2, '橘子': 1, '西瓜': 1}


In [6]:
# 分組數據
students = [
    ('張三', '數學'),
    ('李四', '物理'),
    ('王五', '數學'),
    ('趙六', '化學'),
    ('李四', '化學')
]
# 按照科目分組
subjects = defaultdict(list)
for name, subject in students:
    subjects[subject].append(name)
print(f"科目分組:\n{dict(subjects)}")

科目分組:
{'數學': ['張三', '王五'], '物理': ['李四'], '化學': ['趙六', '李四']}


In [8]:
# 嵌套 defaultdict - 二維結構 (相對於Java就是Map<String, Map<String, Integer>>)
nested = defaultdict(lambda: defaultdict(int))
nested['張三']['數學'] = 90
nested['張三']['英語'] = 85
nested['李四']['數學'] = 78
print("成績表:")
for student, scores in nested.items():
    print(f"{student}: {dict(scores)}")

成績表:
張三: {'數學': 90, '英語': 85}
李四: {'數學': 78}


In [12]:
# 使用 defaultdict 處理 JSON 資料
import json
json_data = '''
{
    "台北市": {
        "人口": 2646204,
        "面積": 271.8
    },
    "高雄市": {
        "人口": 2765932,
        "面積": 2951.85
    }
}
'''
# 轉換 JSON 為 defaultdict
city_data = defaultdict(lambda: defaultdict(str))
loaded_data = json.loads(json_data)
for city, info in loaded_data.items():
    for key, value in info.items():
        city_data[city][key] = value
# 可以安全訪問不存在的鍵
print(f"台中市人口: {city_data['台中市']['人口']}")  # 返回空字符串
print(f"台北市人口: {city_data['台北市']['人口']}")

台中市人口: 
台北市人口: 2646204
