# Teacher
> **何思賢**     
shho@fcu.edu.tw  
如需請益，務必事先以 email 聯繫，確認時間。  

<a id='HOME'></a>
# 6. Dictionaries
## 字典

* [6.1 字典 (Dictionary)](#dictionaries)
    * [6.1.1 建立字典](#creat_or_covert_a_dictionary)
    * [6.1.2 字典取值](#get_an_item_in_a_dictionary)
    * [6.1.3 新增或修改字典的元素值](#add_or_change_an_item_in_a_dictionary)
    * [6.1.4 刪除字典](#clear_or_delete_a_dictionary)
    * [6.1.5 檢查某個鍵 (key) 是否存在](#check_if_some_key_exists)
    * [6.1.6 字典的長度](#get_length_of_a_dictionary)
* [6.2 字典方法](#dictionary_methods)
    * [6.2.1 取得所有鍵值的方法：keys(), values() 及 items() 方法](#dict_keys_values_and_items)
    * [6.2.2 合併字典：update() 與 {\*\*a, \*\*b} 方法](#combine_dictionaries)
    * [6.2.3 補充：字典複製：copy() 方法與其他](#dict_copy_and_others)
* [6.3 補充：Python 風格的字典生成語法](#dict_comprehension)
* [6.4 補充：collections 模組中的 defaultdict() 和 Counter()](#defaultdict_and_counter)

<a id='dictionaries'></a>
## 6.1 字典 (Dictionary)

* 字典也是一種有結構的資料型態。它和串列有點像，在串列中，我們用位置索引值 0, 1, 2......標定元素（item）順序，而字典沒有這樣的順序。
* 字典用另一種方式標記元素。我們必須為每一個值（value）指定一個**獨一無二**的鍵（key），而「鍵-值」組合稱為一個元素（item）或項目。
    * 例如：`abc000001_grades = {'英文': 78, '數學': 89, '中文':'?'}` 表示學號 `abc000001` 的各科得分，科目名 `'英文'`、`'數學'`、`'中文'` 就是鍵，各科對應的成績就是值，這個例子中，中文的成績可能還沒有公布。
    * 鍵的資料型態通常是字串，但其實可以是任何「不可變」的物件，如：整數、浮點數、元組。
    * 字典本身則是「可變」的類型，參考 [6.2.3](#dict_copy_and_others) 節；關於「可變」與「不可變」的說明，參考「串列與元組」那一講中的 4.4 節。
    * 不同的元素必須有不同的鍵，但值可以相同，也可以不同。假如將鍵視為 x，值視為 y，則 x 到 y 是一種函數關係（一對一，或者多對一）。
* 我們可以透過查詢**鍵**得到**值**。

**問題：為什麼需要「字典」這種資料型態？**
* 以「串列與元組」那一講的開頭例子來說明：學校每年都有數千個學生，每個學生都要記錄各科成績，經年累月有相當龐大的資料。
* 若用串列來儲存成績，每個學生成績可以用一個串列表示，而索引值對應不同的科目，例如：每一個串列的索引值 0 都是英文，索引值 1 都是微積分......
* 學生時間有限，能修的科目遠少於學校開的課程，因此每個串列都只有在少許科目對應的索引值有成績，由於大多數科目都沒修過，只能記為 `None`。
* 缺點一：每個成績串列都會充斥大量的 `None`，而真正有價值的數字指出現在少許索引值，相當占用空間；  
缺點二：若抽樣一位學生，發現他在索引值 287 的科目獲得滿分，我們很好奇這是哪一科，那麼還要額外去搜尋索引值 287 對應的科目名稱，實在費事。
* 串列的結構整齊，但是，從存儲以及理解資料的角度而言，顯得臃腫笨重。
* 我們改用字典型態來記錄分數：以修過的科目作為鍵，各科對應的成績為值。這樣，每個學生的修課科目不同，彼此的鍵都不同，不會浪費空間儲存沒修過的科目，而且修過的科目與對應成績（鍵-值配對）也一目了然。
* 綜上，「字典」這種資料型態的優點就是靈活、好懂。


* 以更專業的說法總結，字典較串列勝出的理由有兩個：其一是泛用性，串列能實現的，字典都能實現，最簡單的想法是將字典的鍵取成 0, 1, 2... 即可，這樣 `字典[n]` 與 `串列[n]` 對應，因此，字典泛用性更佳；其二是效率，Python 建立字典時使用雜湊 (hash) 的算法，導致在字典內搜尋資料會遠比串列迅速，例如：`in` 操作在串列資料型態的搜尋時間正比於串列長度，因此，串列越大搜尋越久；而建立好字典後，`in` 操作的搜尋時間則不超過一個常數。


* 現行網路傳輸、交換資料時，經常以 JSON 作為資料格式（一種字串格式，副檔名是 `.json`），而這種字串格式完全能用字典的方式來理解，因此，相當容易與字典相互轉換。

<a id='creat_or_covert_a_dictionary'></a>
### 6.1.1 建立字典
[回目錄](#HOME)

* 字典的結構，其元素是以「鍵-值」對方式儲存，這樣就可使用「鍵」來取得「值」。
* 建立字典最簡單的方式為將元素置於一對大括弧 `{}` 中，其語法為：  
`字典名稱 = {鍵1: 值1, 鍵2 : 值2, ...} `

    * 字串、整數、浮點數等**不可變的物件類型**皆可做為「鍵」，但以字串做為「鍵」的情況最多。
    * 值則沒有限制，甚至可以是串列或字典。
    * 若同一個鍵出現多次，後面的值會取代前面
    * 若大括弧 `{}` 中沒有任何鍵值，建立的字典是空字典。
    
    
* 也可以用 `dict()` 函式將各種雙元素的串列或元組轉換成字典。基本語法是：  
`字典名稱 = dict([[鍵1, 值1], [鍵2, 值2], ...])`

    * 此處，串列的中括弧 `[]` 皆可以改成元組的小括弧 `()`。
    * 雙元素甚至可以是雙字元字串，第一個字元會被指派為鍵，第二個會指派為值。
    

* 另一種以 `dict()` 函式建立字典的語法是：  
`字典名稱 = dict(鍵1 = 值1, 鍵2 = 值2, ...)`

    * 將各個值指派給各個鍵，再轉換成字典。此處，鍵必須滿足變數名稱的規則：不能是數字開頭，特殊符號只能是 `_`, 可以是中文。
    * 鍵是變數名稱，不是字串，因此，語法中的鍵名不能有 `""` 或 `''`。
    * 然而，這種語法會將鍵轉換成字串。
    * 由於建立的字典限制較大（鍵只能是字串），也容易違反語法規則，我不建議使用這種語法。

In [None]:
fruits1 = {'香蕉':20, '蘋果':45, '橘子':25, '橘子':30, '橘子':35} # 若同一個鍵出現多次，後面的值會取代前面
print(type(fruits1), fruits1) # <class 'dict'> {'香蕉': 20, '蘋果': 45, '橘子': 35}

fruits2 = dict([['香瓜', 25], ('水蜜桃', 40), ['草莓', 100], ['草莓', '非產季']])
print(type(fruits2), fruits2) # <class 'dict'> {'香瓜': 25, '水蜜桃': 40, '草莓': '非產季'}

# 鍵可以是元組、但不能是串列或字典，而值可以是串列、甚至是字典
non_fruits1 = dict((('榴槤', None), '#$', ((1,2), {1:2}), [(3,4,5), [6,7]])) 
print(type(non_fruits1), non_fruits1) # <class 'dict'> {'榴槤': None, '#': '$', (1, 2): {1: 2}, (3, 4, 5): [6, 7]}

non_fruits2 = dict(茄子 = 20, a ='b', c2 = [1,2], _d = 0.7) # 注意: 這裡的鍵會被轉成字串; 另外, 改成 '茄子'=20, a=b, 都會報錯
print(type(non_fruits2), non_fruits2) # <class 'dict'> {'茄子': 20, 'a': 'b', 'c2': [1, 2], '_d': 0.7}

empty_dict = {} # 大括弧也是集合的資料型態, 但默認為字典
print(type(empty_dict), empty_dict)

# empty_set = set()
# print(type(empty_set), empty_set)
# set1 = {'a', 1}
# print(type(set1), set1)

<a id='get_an_item_in_a_dictionary'></a>
### 6.1.2 字典取值
[回目錄](#HOME)

* 串列元素在記憶體中是依序排列，而字典元素則是隨意放置，沒有一定順序。
* 取得字典元素值的方法非常簡單，其語法為：  
`字典名稱[鍵]`


* 這種取值方法，當輸入的鍵不存在時，執行會出現 `KeyError` 錯誤。為了避免錯誤，可以使用 `get()` 方法避免出錯，其語法為：  
`字典名稱.get(鍵, 選擇傳回值)`

    * 若鍵存在，傳回鍵對應的值；若鍵不存在，傳回 `選擇傳回值`。
    * `選擇傳回值` 預設為 `None`，若省略它，傳回 `None` 值。
    
    
* 另外，也可以使用 `setdefault()` 取值或對鍵賦值，其語法與 `get()` 方法相同：  
`字典名稱.setdefault(鍵, 選擇傳回值)`

    * 若鍵存在，傳回鍵對應的值；若鍵不存在，修改字典：新增此鍵對應的值為 `選擇傳回值`，並傳回 `選擇傳回值`。
    * `選擇傳回值` 預設為 `None`，若省略它，新增此鍵對應的值為 `None`，並傳回 `None` 值。  

In [None]:
fruits1 = {'香蕉':20, '蘋果':45, '橘子':25, '橘子':30, '橘子':35}
print(fruits1['香蕉']) # 20
print(fruits1['橘子']) # 35
# print(fruits1[0]) # 字典的排列順序是隨機的，不能用位置作為索引值，執行此行會報錯
# print(fruits1['西瓜']) # 西瓜不是 fruits1 的鍵，執行此行會報錯

print()
print(fruits1.get('蘋果')) # 45
print(fruits1.get('蘋果', 60)) # 45
print(fruits1.get('葡萄')) # None
print(fruits1.get('芭樂', 40)) # 40
print(fruits1.get('16號鳳梨', '本店暫時沒進過這種水果')) # 本店暫時沒進過這種水果 
print(fruits1) # {'香蕉': 20, '蘋果': 45, '橘子': 35}

print()
print(fruits1.setdefault('蘋果')) #45
print(fruits1.setdefault('蘋果', 60)) #45
print(fruits1.setdefault('葡萄')) # None
print(fruits1.setdefault('芭樂', 40)) # 40
print(fruits1.setdefault('16號鳳梨', '本店暫時沒進過這種水果')) # 本店暫時沒進過這種水果 
print(fruits1) # {'香蕉': 20, '蘋果': 45, '橘子': 35, '葡萄': None, '芭樂': 40, '鳳梨': '本店暫時沒有這種水果'}

<a id='add_or_change_an_item_in_a_dictionary'></a>
### 6.1.3 新增或修改字典的元素值
[回目錄](#HOME)

* 在字典中，新增元素的語法與修改元素的語法相同，皆為：  
`字典名稱[鍵x] = 值y`

    * 若 `鍵x` 不存在，就代表新增元素 `鍵x: 值y`。
    * 若 `鍵x` 本身存在，就是修改既有元素，將其 `鍵x` 對應到新的 `值y`。



In [None]:
fruits1 = {'香蕉':20, '蘋果':45, '橘子':25}
fruits1['香蕉'] = 25
fruits1['西瓜'] = 40
print(fruits1) # {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 40}

<a id='clear_or_delete_a_dictionary'></a>
### 6.1.4 刪除字典
[回目錄](#HOME)

* 刪除字典的特定元素，其語法為：  
`del 字典名稱[鍵]`


* 刪除字典的所有元素，**留下一個空字典**，其語法為：  
`字典名稱.clear()`

    * 一般情況下，這完全可以重新建立新字典的方式 `字典名稱={}` 來替代。
    * 補充：兩者區別在於，`clear()` 方法不會改變字典記憶體位置，但是重新宣告同樣名稱的字典就會改變記憶體位置。參考 [6.2.3](#dict_copy_and_others) 節的範例。
    

* 刪除字典，**字典本身不復存在**，其語法為：  
`del 字典名稱`

In [None]:
fruits1 = {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 40}
del fruits1['西瓜']
print(fruits1) # {'香蕉': 25, '蘋果': 45, '橘子': 25}

fruits1.clear()
print(fruits1) # {}

fruits1 = {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 40}
fruits1 = {}
print(fruits1) # {}


del fruits1
try:
    print(fruits1)
except:
    print('fruits1 不存在!') # 會顯示這行

<a id='check_if_some_key_exists'></a>
### 6.1.5 檢查某個鍵 (key) 是否存在
[回目錄](#HOME)

* 使用時機：程式用到字典的「鍵」作為參數，而「鍵」不存在可能會導致錯誤，中斷執行。那麼，可以用 `in` 功能先行判斷，再決定後續的程式運作。
* 檢查某個「鍵」是否在字典中的語法為：  
`鍵 in 字典名稱`

    * 若「鍵」在字典中，傳回 `True`；若「鍵」不在字典中，就傳回 `False`。    


* 判斷某著「值」是否在字典中，會用到 `values()` 方法，請參考 [6.2.1](#dict_keys_values_and_items) 節。

<a id='get_length_of_a_dictionary'></a>
### 6.1.6 字典的長度
[回目錄](#HOME)

* 與串列的語法相同，`len(字典名稱)` 可以顯示字典的長度，其值為鍵的個數（或元素的個數）。

In [None]:
"""
本例調查每個人最愛的水果，根據原始資料的串列統計各種水果的受歡迎人次，以字典方式呈現。未來可以進一步繪成長條圖。
"""

favorite_fruit = [['Liam', '蘋果'], ['Olivia', '葡萄'], ['Noah', '蓮霧'], ['Emma', '草莓'], ['Oliver', '西瓜'], \
                  ['Ava', '香蕉'], ['William', '蘋果'], ['Sophia', '西瓜'], ['Elijah', '西瓜'], ['Isabella', '草莓'], \
                  ['James', '蘋果'], ['Charlotte', '蓮霧'], ['Benjamin', '橘子'], ['Amelia', '蓮霧'], ['Lucas', '西瓜'], \
                  ['Mia', '草莓'], ['Mason', '香蕉'], ['Harper', '西瓜'], ['Ethan', '草莓'], ['Evelyn', '草莓']]

fav_fruit_stats = {}

for name_fruit in favorite_fruit: # name_fruit 是長度為 2 的串列
    
    if name_fruit[1] in fav_fruit_stats: # 在統計資料中，若某個水果先前已經記錄到了，紀錄的數值加 1
        fav_fruit_stats[name_fruit[1]] += 1
        
    else: # 若某個水果先前未記錄於統計資料，字典新增此水果為鍵名，對應的初始值為 1
        fav_fruit_stats[name_fruit[1]] = 1

print(fav_fruit_stats) # {'蘋果': 3, '葡萄': 1, '蓮霧': 3, '草莓': 5, '西瓜': 5, '香蕉': 2, '橘子': 1}
print(f'本次統計共出現 {len(fav_fruit_stats)} 種水果。')

<a id='dictionary_methods'></a>
## 6.2 字典方法
[回目錄](#HOME)

* 字典方法的一般語法為：  
`字典.某種方法(輸入參數)`


* 這節的字典方法都是對字典這種資料型態特有的操作。常見方法如下：（**D** 和 **D1** 表示字典）

|語法|效果|
|:--|:--|
|D.clear()|清除 D 的所有內容成空字典|
|D.keys()|獲得 D 的所有鍵|
|D.values()|獲得 D 的所有值|
|D.items()|獲得 D 全部的元素 (key, value)|
|D.update(D1)|將 D1 的鍵-值更新到 D 中|
|D.copy()|建立 D 的複本到新的記憶體位置|

<a id='dict_keys_values_and_items'></a>
### 6.2.1 取得所有鍵值的方法：keys(), values() 及 items() 方法
[回目錄](#HOME)

* 字典的 `keys()` 方法可取得字典中所有「鍵」，資料型態為 `dict_keys`。    
* 字典的`values()` 方法可取得字典中所有「值」， 資料型態為 `dict_values`。
    * 雖然 `dict_keys` 或 `dict_values` 資料型態看起來像串列，但它不能以索引方式取得元素值，必須以 `list()` 先行轉換成串列，才可以使用串列的操作方式。
    * 想要檢查某個「值」是否在字典中，可以用 `值 in 字典名稱.values()` 判斷。
    
    
* 字典的 `items()` 功能可同時取得所有「鍵-值」組成的組合，資料型態為 `dict_items`。
    * 將 `dict_items` 資料型態以 `list()` 函式轉換成串列後，每個串列元素都是一個元組：(鍵, 值)。

In [None]:
favorite_fruit = [['Liam', '蘋果'], ['Olivia', '葡萄'], ['Noah', '蓮霧'], ['Emma', '草莓'], ['Oliver', '西瓜'], \
                  ['Ava', '香蕉'], ['William', '蘋果'], ['Sophia', '西瓜'], ['Elijah', '西瓜'], ['Isabella', '草莓'], \
                  ['James', '蘋果'], ['Charlotte', '蓮霧'], ['Benjamin', '橘子'], ['Amelia', '蓮霧'], ['Lucas', '西瓜'], \
                  ['Mia', '草莓'], ['Mason', '香蕉'], ['Harper', '西瓜'], ['Ethan', '草莓'], ['Evelyn', '草莓']]

name_fruit_dict = dict(favorite_fruit)

names = name_fruit_dict.keys()
print(type(names), names)
# print(names[0]) # 執行此行會報錯

print()
names = list(names)
print(type(names), names)
print(names[0]) #Liam

print()
fruits = name_fruit_dict.values()
print(type(fruits), fruits)
print('西瓜' in fruits) # True
print('香瓜' in fruits) # False

print()
name_fruits = name_fruit_dict.items()
print(type(name_fruits), name_fruits)

print()
name_fruits = list(name_fruits)
print(type(name_fruits), name_fruits)

print()
print(name_fruits[0]) # ('Liam', '蘋果')

In [None]:
"""
本例示範：如何從任一字典建立反向查詢的字典。
"""

name_fruit_dict = {'Liam': '蘋果', 'Olivia': '葡萄', 'Noah': '蓮霧', 'Emma': '草莓', 'Oliver': '西瓜', \
                   'Ava': '香蕉', 'William': '蘋果', 'Sophia': '西瓜', 'Elijah': '西瓜', 'Isabella': '草莓', \
                   'James': '蘋果', 'Charlotte': '蓮霧', 'Benjamin': '橘子', 'Amelia': '蓮霧', 'Lucas': '西瓜', \
                   'Mia': '草莓', 'Mason': '香蕉', 'Harper': '西瓜', 'Ethan': '草莓', 'Evelyn': '草莓'}

fruit_name_dict = {}

for name, fruit in name_fruit_dict.items():
    
    # 反向查詢字典的值是 "串列" 
    if fruit in fruit_name_dict:
        fruit_name_dict[fruit].append(name) 
    else:
        fruit_name_dict[fruit] = [name]
    
    # # 反向查詢字典的值是 "集合" 
    # if fruit in fruit_name_dict:
    #     fruit_name_dict[fruit].add(name)    
    # else:
    #     fruit_name_dict[fruit] = {name}
        
print(fruit_name_dict)

<a id='combine_dictionaries'></a>
### 6.2.2 合併字典：update() 與 {\*\*a, \*\*b} 方法
[回目錄](#HOME)

* 我們可以用 `update()` 方法將兩個字典的「鍵-值」合併，語法為：  
`字典1.update(字典2)`

    * 合併後，`字典1` 的「鍵-值」更新 (update)，而 `字典2` 不變。
    * 若 `字典2` 與 `字典1` 有相同的鍵，則 `字典1` 更新後採取 `字典2` 的值。
    
    
* 若想合併三個字典呢，若寫要執行 `字典1.update(字典2).update(字典3)` 將會出現語法錯誤。
    * 原因：`update()` 傳回 `None`，亦即：`字典1.update(字典2) = None`。
    * 上述語句相當於 `None.update(字典3)`，然而 `update()` 方法不能用在 `None` 類別上。('NoneType' object has no attribute 'update'.) 故不合語法。
    
    
* 更一般的合併方法是採用如下的語法：  
`合併後的新字典 = {**字典1, **字典2, ...}`

    * 這個方法可以一次合併多個字典。
    * 若不同字典有相同的鍵，最後一個字典的值勝出。
    * 這種方法是創造一個新字典，不會改變 `字典1`、`字典2`......

In [None]:
fruits1 = {'香蕉': 20, '蘋果': 45, '橘子': 25}
fruits2 = {'香蕉': 25, '西瓜': 50}
fruits1.update(fruits2)

print(fruits1) # {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 50}
print(fruits2) # {'香蕉': 25, '西瓜': 50}

fruits1 = {'香蕉': 20, '蘋果': 45, '橘子': 25}
fruits2 = {'香蕉': 25, '西瓜': 50}
fruits3 = {'香蕉': 30, '西瓜': 55, '葡萄': 40}
# fruits1.update(fruits2).update(fruits3) # 執行此行會出現錯誤

print()
fruits_all = {**fruits1, **fruits2, **fruits3}
print(fruits1) # {'香蕉': 20, '蘋果': 45, '橘子': 25}
print(fruits2) # {'香蕉': 25, '西瓜': 50}
print(fruits3) # {'香蕉': 30, '西瓜': 55, '葡萄': 40}
print(fruits_all) # {'香蕉': 30, '蘋果': 45, '橘子': 25, '西瓜': 55, '葡萄': 40}

<a id='dict_copy_and_others'></a>
### 6.2.3 補充：字典複製：copy() 方法與其他
[回目錄](#HOME)

* 「字典」與「串列」相同，皆是「可變」的資料型態。
    * 關於「可變」與「不可變」的說明，參考「串列與元組」那一講中的 4.4 節。
* 由於字典是「可變」的資料型態，操作上必須特別小心。

In [None]:
fruits1 = {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 40}
print(f'字典剛建立的記憶體位置: {id(fruits1)}')

del fruits1['西瓜']
print(f'改變元素後的記憶體位置: {id(fruits1)}') # 注意記憶體位置沒有變化，代表字典這種資料型態是可變的

fruits2 = {'蘋果': 50}
fruits1.update(fruits2)
print(f'字典更新後的記憶體位置: {id(fruits1)}')

fruits1.clear()
print(f'清空元素後的記憶體位置: {id(fruits1)}')

fruits1 = {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 40}
print(f'重新建立字典後的記憶體位置: {id(fruits1)} 改變了!')

fruits1 = {'香蕉': 25, '蘋果': 45, '橘子': 25, '西瓜': 40}
print(f'再次重新建立相同字典後的記憶體位置: {id(fruits1)} 再度變了!')

fruits1 = {}
print(f'以一樣名稱建立空字典後的記憶體位置: {id(fruits1)} 當然也變了!')

In [None]:
dict1 = {'a': 1, 'b': 2}
dict2 = dict1
print(id(dict1))
print(id(dict2)) # 兩者記憶體相同

dict1['a'] = 3
dict2['c'] = 5

print(dict1) # {'a': 3, 'b': 2, 'c': 5}
print(dict2) # {'a': 3, 'b': 2, 'c': 5}
print(id(dict1)) # 注意：當進行操作時，dict1 的記憶體位置不變
print(id(dict2)) # 注意：dict2 的記憶體位置始終與 dict1 共用

* 在寫程式時，我們常常需要「複製字典」。
* 設想底下的情境：`new_dict` 在每次迴圈中都**根據原始串列 `old_dict` 製造出來**，我們會對 `new_dict` 做各種操作，但**不能影響到原始的 `old_dict`。**
* 由上面的範例，我們知道：**若只是簡單指派** `new_dict = old_dict`**，那麼，對** `new_dict` **的操作通常會影響到** `old_dict`，這樣不符合我們的需求。
    * 原因一：這樣的指派會讓 `new_dict` 與 `old_dict` 初始就共用同樣的記憶體（一個記憶體貼了兩個標籤 `old_dict` 和 `new_dict`）。
    * 原因二：字典是可變的資料型態，所以對於 `new_dict` 的操作可以覆寫這個記憶體的值（不必找一個新的記憶體重新貼 `new_dict` 標籤），由於 `old_dict` 也對應同一個記憶體，因此 `old_dict` 也被改變了！
    
    
* 關鍵在於：`new_dict` **與** `old_dict` **初始就不能共用記憶體，這樣，對** `old_dict` 和 `new_dict` **的後續操作都不會影響彼此。**
* 對於這樣的需求，Python 有數種複製字典的做法。底下的範例將實踐兩種做法：  
`new_dict = old_dict.copy()`  
`new_dict = dict(old_dict)`  
* 請注意記憶體位置的變化。

In [None]:
dict1 = {'a': 1, 'b': 2}
dict2 = dict1.copy()
dict3 = dict(dict1)
print(id(dict1))
print(id(dict2)) 
print(id(dict3)) # 記憶體位置彼此不同

dict1['a'] = 3
dict2['c'] = 5
del dict3['b']

print(dict1) # {'a': 3, 'b': 2}
print(dict2) # {'a': 1, 'b': 2, 'c': 5}
print(dict3) # {'a': 1}
print(id(dict1)) # 注意：當進行操作時，dict1 的記憶體位置不變
print(id(dict2)) # 注意：當進行操作時，dict2 的記憶體位置不變，但一開始就與 dict1 不同，因此不會互相影響
print(id(dict3)) # 注意：當進行操作時，dict3 的記憶體位置不變，但一開始就與 dict1, dict2 不同，因此不會互相影響

**補充的補充：**

* 字典的「鍵」限制為是「不可變」的資料型態，「值」則沒有限制。
* 若「值」是可變的資料型態， `copy()` 方法在複製時，並未將「值」的位址指向新的記憶體。
    * 這樣的複製是**淺層複製**。
    * 因此，對某字典的更新仍然可能影響到其它字典。


* 若要進行安全的**深層複製**，可以採用 `copy` 模組下的 `deepcopy()` 函式，語法為：  
`new_dict = copy.deepcopy(old_dict)`

    * `deepcopy()` 函式可以確保：複製大型資料結構時，**這個結構中任何可變的資料型態，其複本都指向不同的記憶體位址。**
    * 至於原本是不可變的資料型態，對它操作本來就會改變記憶體位址，所以是安全的。複製時為了節省記憶體空間，暫時以相同的記憶體位址儲存即可。
    * 結論：`copy` 模組下的 `deepcopy()` 函式，可以確保複製後的**新資料與原資料「徹底相互獨立」**。

In [None]:
dict1 = {'a': [1,2], 'b': 3}
dict2 = dict1.copy()
dict3 = dict(dict1)

from copy import deepcopy
dict4 = deepcopy(dict1)

print(id(dict1), id(dict1['a']), id(dict1['b']))
print(id(dict2), id(dict2['a']), id(dict2['b']))
print(id(dict3), id(dict3['a']), id(dict3['b'])) # 注意 dict1 到 dict3 的鍵 'a' 共用同一記憶體位址
print(id(dict4), id(dict4['a']), id(dict4['b'])) # 鍵 'b' 的值是不可變的整數，縱使深層複製，也毋須改變記憶體位址

dict1['a'] += [4]
dict1['b'] = 8

dict2['a'].append(5) 
dict2['b'] = 9

dict4['a'] += [6, 7]
dict4['b'] = 10

print(dict1) # {'a': [1, 2, 4, 5], 'b': 8} # 淺層複製時，鍵 'a' 的值是可變的串列，所以會影響到其他字典
print(dict2) # {'a': [1, 2, 4, 5], 'b': 9}
print(dict3) # {'a': [1, 2, 4, 5], 'b': 3}
print(dict4) # {'a': [1, 2, 6, 7], 'b': 10}

<a id='dict_comprehension'></a>
## 6.3 補充：Python 風格的字典生成語法
[回目錄](#HOME)

* 我們常常需要製造一個字典儲存資料，作為結果輸出或進一步取用。
* 參考「串列與元組」那一講中的 4.4 節。類似串列生成的 Pythonic style，字典生成也有其專屬語法：  
```python
{鍵的表達式 : 值的表達式 for 變數 in 可迭代物件}
```

In [None]:
word = "pneumonoultramicroscopicsilicovolcanoconiosis" # 火山矽肺症
letters = set(word) # letters 是一種集合，蒐集 word 用到哪些字母
print(letters)

# 任務： 這個字用到的字母各出現幾次，以字典方式呈現

# 方法 1:
count1 = {}
for letter in letters:
    count1[letter] = word.count(letter)
print(count1)

# 方法 2:
count2 = {letter: word.count(letter) for letter in letters}
print(count2)

<a id='defaultdict_and_counter'></a>
## 6.4 補充：collections 模組中的 defaultdict() 和 Counter()
[回目錄](#HOME)

* [這個網址](https://docs.python.org/zh-tw/3/library/collections.html) 是 `collections` 模組的說明文件。
* 本小節介紹 `collections` 模組中的兩種函式 `defaultdict()` 與 `Counter()`，分別建立特殊目的的字典。


* 回顧 [6.1.6](#get_length_of_a_dictionary) 的範例，我們建立一個空字典，再配合 `in` 功能判斷要「添入鍵」（初始化）或「更新鍵的值」。
    * 在此例，更新動作都是將既有的值 `+1`。
    * 若有一種特殊的建立字典方法：當遇到新的「鍵」就自動設定其初始的「對應值」為 `0`，則 `+1` 動作就可以一視同仁了。而這正是 `defaultdict()` 的功能。
    
    
* 具體而言，`defaultdict(參數)` 的一種「對初始值預先做手腳」的字典，其作用是：每逢添入一個新的鍵，其初始值根據括號內的 `參數` 設定。
    * 參數值可以是 `int`, `list`, `dict`, 和 `set`，其對應的「新鍵初始值」分別設定成 `0`, `[]`, `{}`, 和空集合 `set()`。
    
    
* `Counter(可迭代物件)` 則會自動將``可迭代物件``（包括字串、串列、元組）的元素分別計數，以字典方式呈現。

In [None]:
name_fruit_dict = {'Liam': '蘋果', 'Olivia': '葡萄', 'Noah': '蓮霧', 'Emma': '草莓', 'Oliver': '西瓜', \
                   'Ava': '香蕉', 'William': '蘋果', 'Sophia': '西瓜', 'Elijah': '西瓜', 'Isabella': '草莓', \
                   'James': '蘋果', 'Charlotte': '蓮霧', 'Benjamin': '橘子', 'Amelia': '蓮霧', 'Lucas': '西瓜', \
                   'Mia': '草莓', 'Mason': '香蕉', 'Harper': '西瓜', 'Ethan': '草莓', 'Evelyn': '草莓'}

from collections import defaultdict as ddict, Counter as ct

fav_fruit_stats = ddict(int)
fav_fruit_stats1 = ct(name_fruit_dict.values())
fruit_name_dict = ddict(list)
fruit_name_dict1 = ddict(set)

for name, fruit in name_fruit_dict.items():
    
    fav_fruit_stats[fruit] += 1
    fruit_name_dict[fruit].append(name)
    fruit_name_dict1[fruit].add(name)
    
# print(fav_fruit_stats) # defaultdict(<class 'int'>, {'蘋果': 3, '葡萄': 1, '蓮霧': 3, '草莓': 5, '西瓜': 5, '香蕉': 2, '橘子': 1})
print(dict(fav_fruit_stats)) # {'蘋果': 3, '葡萄': 1, '蓮霧': 3, '草莓': 5, '西瓜': 5, '香蕉': 2, '橘子': 1}
print()

# print(fav_fruit_stats1) # Counter({'草莓': 5, '西瓜': 5, '蘋果': 3, '蓮霧': 3, '香蕉': 2, '葡萄': 1, '橘子': 1})
print(dict(fav_fruit_stats1)) # {'蘋果': 3, '葡萄': 1, '蓮霧': 3, '草莓': 5, '西瓜': 5, '香蕉': 2, '橘子': 1}
print()

# print(fruit_name_dict) # defaultdict(<class 'list'>, {'蘋果': ['Liam', 'William', 'James'], '葡萄': ['Olivia'], '蓮霧': ['Noah', 'Charlotte', 'Amelia'], '草莓': ['Emma', 'Isabella', 'Mia', 'Ethan', 'Evelyn'], '西瓜': ['Oliver', 'Sophia', 'Elijah', 'Lucas', 'Harper'], '香蕉': ['Ava', 'Mason'], '橘子': ['Benjamin']})
print(dict(fruit_name_dict)) # {'蘋果': ['Liam', 'William', 'James'], '葡萄': ['Olivia'], '蓮霧': ['Noah', 'Charlotte', 'Amelia'], '草莓': ['Emma', 'Isabella', 'Mia', 'Ethan', 'Evelyn'], '西瓜': ['Oliver', 'Sophia', 'Elijah', 'Lucas', 'Harper'], '香蕉': ['Ava', 'Mason'], '橘子': ['Benjamin']}
print()

# print(fruit_name_dict1) # defaultdict(<class 'set'>, {'蘋果': {'Liam', 'James', 'William'}, '葡萄': {'Olivia'}, '蓮霧': {'Charlotte', 'Noah', 'Amelia'}, '草莓': {'Ethan', 'Isabella', 'Emma', 'Evelyn', 'Mia'}, '西瓜': {'Harper', 'Oliver', 'Elijah', 'Lucas', 'Sophia'}, '香蕉': {'Ava', 'Mason'}, '橘子': {'Benjamin'}})
print(dict(fruit_name_dict1)) # {'蘋果': {'Liam', 'James', 'William'}, '葡萄': {'Olivia'}, '蓮霧': {'Charlotte', 'Noah', 'Amelia'}, '草莓': {'Ethan', 'Isabella', 'Emma', 'Evelyn', 'Mia'}, '西瓜': {'Harper', 'Oliver', 'Elijah', 'Lucas', 'Sophia'}, '香蕉': {'Ava', 'Mason'}, '橘子': {'Benjamin'}}

In [None]:
word = "pneumonoultramicroscopicsilicovolcanoconiosis" # 火山矽肺症
# 任務： 這個字用到的字母各出現幾次，以字典方式呈現

from collections import defaultdict as ddict, Counter as ct

# 方法 3:
count3 = ddict(int)
for letter in word:
    count3[letter] += 1
print(dict(count3))

# 方法 4:
count4 = ct(word)
print(dict(count4))