# Chapter 4 - Collections：集合物件

## Lists：串列

串列 (Lists) 是種序列 (Sequence) 物件，用中括號 (`[]`, Square brackets) 收集許多物件，並在物件之間以逗號 (`,`) 分隔。

串列裡並不限於裝載相同資料型態的物件。

Reference:

* [List - Python Documentation](https://docs.python.org/3/library/stdtypes.html#lists)

> 備註：可能有讀者在其他的程式語言中學過陣列 (Array) 的概念與用法，雖然類似，但 Python 的串列與其他程式語言的陣列畢竟本質上仍稍有不同，不能混為一談。

### 串列的基本用法

In [None]:
# 創建一個空的串列
empty = []
print(empty)

[]


> 備註：或許有些讀者會有從其他程式語言帶來的習慣，也可能曾經看過用 `list()` 建立一個新的、空的串列的用法，在此我表示不建議。在 Python 的設計中，用中括號 `[]` 就是建立一個全新的串列的標準方法，透過 `list()` constructor 的操作的意義並不一樣，連帶的會影響效率。詳情可以查看 `help(list)`。
>
> 所以，除非有將物件轉換為串列的用途，其餘建立串列的用途，建議都用中括號 `[]` 的寫法代替就好。而且，寫 Python 就是要寫得優雅、簡潔，何苦又將它複雜化呢？

In [None]:
letters = ["a", "b", "c"]     # 放入字串
numbers = [6, 5, 4, 3, 2, 1]  # 放入數字

In [None]:
mixed = ["one", 2, "3", [4, 5, "F"]]  # 混合不同資料型態物件的串列

在先前的內容中，我們理解字串物件是由很多的單一字元所組成，其實與串列的概念是相仿的。所以在字串中用來索引的方法，在串列也同樣適用：

In [None]:
# 索引
print(letters[1])  # 在充滿字串的串列中索引
print(numbers[4])  # 在充滿數字的串列中索引

b
2


In [None]:
print(mixed[2])     # 在混合不同資料型態物件的串列中索引
print(mixed[3][1])  # 索引串列中的串列物件

3
5


In [None]:
print(mixed[1::2])  # 索引的格式一樣是 list[start:stop:step]

[2, [4, 5, 'F']]


字串中的字元是無法單獨被置換的，但串列可以，只要直接用等號 `=` 將新的物件指定到特定的索引值位置即可：

In [None]:
letters[1] = "B"  # 置換串列內的物件
print(letters)

['a', 'B', 'c']


與字串當的還有可以使用 `in`: 包含測試運算子，可以驗證某物件是否包含在串列內

In [None]:
print("3" in mixed)  # 驗證字串是否存在於串列內
print(3 in mixed)    # 驗證數字是否存在於串列內

True
False


In [None]:
print("F" in mixed)  # "F" 實際是包含在 mixed 串列中、index = 3 的串列內
                     # 那麼驗證的結果是如何呢？

False


### 搭配內建函式使用

#### `len()`：計算串列內有多少物件

References:

* [len() - Python Documentation](https://docs.python.org/3/library/functions.html#len)

In [None]:
numbers = [6, 5, 4, 3, 2, 1]
print(len(numbers))

6


In [None]:
mixed = ["one", 2, "3", [4, 5, "F"]]  # 思考一下：如果串列中還有串列，這樣到底有幾個物件呢？
print(len(mixed))

4


#### `sorted()`：對串列內的內容排序

要注意的是：`sorted()` 函式僅會回傳排序後的結果，串列本身並不會被修改：

References:

* [sorted() - Python Documentation](https://docs.python.org/3/library/functions.html#sorted)

In [None]:
numbers = [6, 5, 4, 3, 2, 1]
print(sorted(numbers))  # 觀察經過 sorted() 函式處理後的內容
print(numbers)          # 觀察 numbers 串列本身：並不會被更動

[1, 2, 3, 4, 5, 6]
[6, 5, 4, 3, 2, 1]


`sorted()` 預設是使用遞增排序，也可以使用遞減排序，方法是加上設定 `reverse` 參數 (Parameter) 為 `True`：

In [None]:
numbers = [1, 2, 3, 4, 5, 6]
print(sorted(numbers, reverse=True))  # 遞減排序

[6, 5, 4, 3, 2, 1]


> 備註：參數 (Parameters) 是什麼？我們將會在自訂函式的章節中提及。

> 順帶一提：如果要永久將串列的內容變更為排序後的結果，我們可以調用串列本身的 `list.sort()` 方法，這會在底下：串列方法的小節中介紹。

#### `del()`：移除串列中的物件

References:

* [The del statement - Python Documentation](https://docs.python.org/3/reference/simple_stmts.html#grammar-token-del-stmt)

In [None]:
letters = ["a", "b", "c", "d", "e", "f", "g"]
del(letters[1])  # 直接在 del() 函式指定串列物件的索引值，即可移除該物件
print(letters)

['a', 'c', 'd', 'e', 'f', 'g']


In [None]:
letters = ["a", "b", "c", "d", "e", "f", "g"]
del(letters[3:6])  # 也可以一次刪除多個物件
print(letters)

['a', 'b', 'c', 'g']


> 備註：眼尖的各位可能有機會發現，其實 `del` 關鍵字在 Python 的官方文件裡是個陳述式 (statements)，其實在執行時不用寫成函式 `del()` 的型態也可以執行。
>
> 有什麼差異呢？執行上的感覺是沒有差異的，但礙於篇幅，暫時不多作解釋。有興趣的各位可以自行搜尋看看！

In [None]:
letters = ["a", "b", "c", "d", "e", "f", "g"]
del letters[0]  # 用陳述式的方式來操作刪除功能
letters

['b', 'c', 'd', 'e', 'f', 'g']

### 串列方法

#### `list.append()`：新增物件至串列內

使用 `list.append()` 方法將**一個**物件加入至現有串列內：

In [None]:
letters = ["a", "b", "c", "d", "e", "f", "g"]
letters.append("h")
print(letters)

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']


但 `list.append()` 方法無法一次新增多個物件：

In [None]:
letters = ["a", "b", "c", "d", "e", "f", "g"]

# letters.append("h", "i")  # 無法一次新增多個物件，執行此段會出現錯誤

letters.append(["h", "i"])  # 雖然可以將另一個串列加入
                            # 但這個串列依然是以「一個物件」的身份被加入到串列內的
print(letters)

['a', 'b', 'c', 'd', 'e', 'f', 'g', ['h', 'i']]


若要將另一個串列的物件**一個個**的加入現有串列中，有兩個方法：

1. 透過 `list.extend()` 方法
2. 透過 `+` 運算子來連接兩個串列

In [None]:
# 透過 list.extend() 方法
letters = ["a", "b", "c", "d", "e", "f", "g"]
letters.extend(["h", "i"])
print(letters)

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']


In [None]:
# 透過 + 運算子來連接兩個串列
letters = ["a", "b", "c", "d", "e", "f", "g"]
more_letters = letters + ["h", "i", "j"]
print(more_letters)

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']


#### `list.remove()`：移除串列內的物件

透過 `list.remove()` 的方式，並直接指定要刪除的物件內容。不同於使用 `del()` 或 `del` 陳述式需要指定索引值去刪除。

但若有多個相符的物件，只會將**第一個**相符的物件移除：

In [None]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
numbers.remove(3)  # 移除串列內的數字物件 3
print(numbers)
print(len(numbers))

[1, 2, 4, 5, 6, 7, 8, 9, 10]
9


In [None]:
numbers = [1, 1, 2, 3, 4, 5]
numbers.remove(1)  # 移除串列內的數字物件 1，但因有多個相符的物件，只會刪除第一個
print(numbers)

[1, 2, 3, 4, 5]


In [None]:
mixed_numbers = [[1, 2, 3], [4, 5], 6]
mixed_numbers.remove([4, 5])  # 也可以移除串列裡的串列，只要物件相符都沒有問題
print(mixed_numbers)

[[1, 2, 3], 6]


#### `list.pop()`：依照後進先出規則移除物件並回傳結果

而另一個移除物件的方法是呼叫 `list.pop()`。

若在執行時不代入需要移除的物件，預設會以「後進先出」的方式，將索引值最大的物件給移除，並在執行的時候回傳該物件。

In [None]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
dropped_number = numbers.pop()  # 不代入需要移除的物件，則物件將會移除並回傳
                                # 所以我們可以將回傳的內容存放於一個物件中
print(numbers)
print(dropped_number)
print(len(numbers))

[1, 2, 3, 4, 5, 6, 7, 8, 9]
10
9


也可以代入欲移除的索引值，一樣會移除並回傳物件內容：

In [None]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
dropped_number = numbers.pop(7)  # 指定要移除的物件索引值
print(numbers)
print(dropped_number)
print(len(numbers))

[1, 2, 3, 4, 5, 6, 7, 9, 10]
8
9


#### `list.sort()`：排序串列內的物件

與使用 `sorted()` 函式不同的地方是：調用 `list.sort()` 方法將永久改變串列的內容，且執行的當下不會回傳任何結果。

In [None]:
numbers = [6, 5, 4, 3, 2, 1]
print(numbers)

# 使用 list.sort() 方法排序
numbers.sort()  # 串列的 list.sort() 方法並不會回傳結果，所以可以單獨執行
print(numbers)  # 串列內容已被變更為排序後的結果

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


## Dicts: Dictionaries 字典

就如其名「字典」一樣的形式，`dict` 物件需要由 Key（鍵）去對應到相對的 Value（值），所以有時候會稱這種物件為 Mapping type：對應的資料型態，或稱為 Key : Value pair：鍵值對（每一筆資料都是由成對的鍵與值組成）。

字典的建立是用大括號 `{}` (Curly brackets) 將一個一個鍵值對以冒號 `:` 隔開後，置於大括號之內。每一個鍵必須是獨一無二的內容，不可重複。

Reference:

* [Dict - Python Documentation](https://docs.python.org/3/library/stdtypes.html#mapping-types-dict)

### 字典的基本用法

In [None]:
# 創建一個空的字典
d = {}
print(d)

{}


> 備註：如同前面串列提到的相似，在此還是建議：建立一個新的字典物件一律使用大括號 `{}` 建立，`dict()` constructor 還是建議在需要做型態轉換時使用。
>
> 保持程式的簡潔及可讀性，是 Python 開發者留給這個世界的最佳禮物！

In [None]:
# 拿個人的基本資料，做一個簡單的範例
profile = {
    "name": "Vivi",  # 名字
    "age": 18        # 年齡
}
print(profile)

{'name': 'Vivi', 'age': 18}


> 補充：現在起，各位應該會寫一些較複雜、多行的表達式。在 Python 中，要表示物件的階層關係，是在底下多一層時，加入用**四個空白鍵**空白組成的縮排。
> 或許有讀者在其他語言的習慣是兩個空白鍵，或是用 <button>Tab ↹</button> 按鈕來縮排，不過不建議這樣做。詳情請參考 [PEP 8](https://www.python.org/dev/peps/pep-0008/#indentation) 及 [Google Python Style Guide](https://google.github.io/styleguide/pyguide.html#s3.4-indentation) 文件中關於 Indentation 的章節。
>
> 
> 以下舉例說明：

In [None]:
obj = {
    "Level-1": {
        "Level-2": {
            "Level-3": {
                # ......依此類推
            }
        }
    }
}

> 備註：因為字典物件的內容通常比較複雜，為了讓各位比較好閱讀，這裡用個內建的模組 `pprint` 來輔助顯示：

In [None]:
from pprint import pprint

備註：`import` 跟 `from` 都是在載入模組 (Module) 時會用到的陳述句，在本次的課程中會比較少見，請大家先記著就好。

In [None]:
# 再做得稍微複雜一點
profile = {
    "name": "Vivi",
    "age": 18,
    "skills": [
        "eating",
        "sleeping",
        "doing nothing",
        "being lazy",
    ],
    "memo": "I wanna go home",
}
pprint(profile)

{'age': 18,
 'memo': 'I wanna go home',
 'name': 'Vivi',
 'skills': ['eating', 'sleeping', 'doing nothing', 'being lazy']}


In [None]:
# 索引
print(profile["name"])    # 調閱個人檔案內的名字
print(profile["skills"])  # 調閱個人檔案內的技能

Vivi
['eating', 'sleeping', 'doing nothing', 'being lazy']


In [None]:
# 置換已經存在的內容
profile["age"] = 32
print(profile["age"])

32


In [None]:
# 新增內容
profile["deposit"] = 100000  # 透過指定內容到不存在的鍵上以新增內容
pprint(profile)

{'age': 32,
 'deposit': 100000,
 'memo': 'I wanna go home',
 'name': 'Vivi',
 'skills': ['eating', 'sleeping', 'doing nothing', 'being lazy']}


In [None]:
# 刪除內容
del(profile["memo"])  # 刪除指定的鍵
pprint(profile)

{'age': 32,
 'deposit': 100000,
 'name': 'Vivi',
 'skills': ['eating', 'sleeping', 'doing nothing', 'being lazy']}


使用 `in`: 包含測試運算子，可以驗證某物件是否包含在字典的鍵之內：

In [None]:
# 驗證 skills 是否存在於 profile 字典物件的鍵之內
print("skills" in profile)

True


In [None]:
# 測試一下：是否可以用 in 來檢查物件是否存在於該字典的值之內？不行。
print("eating" in profile)

False


> 備註：那是否可以用別的方法，來檢查某物件是否存在於字典內的任何值之內？這邊先緩緩，等到後面的章節教完以後，就會有方法了。

### 字典方法

#### `dict.get()`：獲得字典內特定鍵的值

In [None]:
print(profile.get("name"))
print(profile["name"])

Vivi
Vivi


在上面的範例中，`profile.get("name"))` 與 `print(profile["name"]` 的表達式是等價的。那差別在哪裡呢？在於今天如果無法確定某鍵是否存在於字典內，用 `dict.get()` 方法可以在遇到鍵不存在的情況值回傳 `None` 物件，而用索引的方式則會直接出現錯誤。

In [None]:
# 測試從不存在的鍵之內獲得值
print(profile.get("salary"))
# print(profile["salary"])  # 用索引的方式獲值，在該鍵不存在時會引發 Runime error

None


#### `dict.key()`：獲得字典內的所有鍵

In [None]:
print(profile.keys())

dict_keys(['name', 'age', 'skills', 'deposit'])


#### `dict.pop()`：移除字典內的物件並回傳結果

與串列的用法相似，調用 `dict.pop()` 並代入欲從字典內移除的鍵，將可以將該鍵值對移除、並回傳該鍵的值。

In [None]:
# 將個人資料中的年齡移除，並存放於物件中
vivi_age = profile.pop("age")
print(vivi_age)
pprint(profile)

32
{'deposit': 100000,
 'name': 'Vivi',
 'skills': ['eating', 'sleeping', 'doing nothing', 'being lazy']}


## 複製可變型別物件

在 Python 物件中，其實有著**可變** (Mutable) 型態與**不可變** (Immutable) 型態的區別。到目前為止，在我們學到的物件中：

* 不可變 (Immutable) 型態：`int`, `float`, `str`
* 可變型態 (Mutable) 型態：`list`, `dict`

而對於可變型態的物件，在想要複製此物件時，如果沒有透過呼叫該物件的 `copy()` 方法，存粹用等號 `=` 將可變型態物件指定到一個新的物件上，將導致兩個物件實際上依然指向同一個記憶體位置，而編輯一個物件時，另一個物件依然會被更動到。

以下我們分別針對串列及字典來處理這個問題。

### 複製串列

我們先測試用等號 `=` 將串列指定給一個新的物件，並嘗試對任意一個串列操作：

In [None]:
list_1 = [1, 2, 3, 4, 5]  # 建立新串列物件
list_2 = list_1           # 將原串列指定給新的物件
print(list_1)
print(list_2)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


In [None]:
list_1.pop()  # 移除串列中的物件
print(list_1)
print(list_2)

[1, 2, 3, 4]
[1, 2, 3, 4]


原本我們只執行 `list_1` 串列的 `pop()` 方法，移除了 `list_1` 串列中的最後一個物件，實際發生的情況是：`list_2` 串列中的物件也一併被移除了。

所以我們可以調用 `list.copy()` 方法來複製串列物件：

In [None]:
list_1 = [1, 2, 3, 4, 5]  # 建立新串列物件
list_2 = list_1.copy()    # 複製串列為新的物件
print(list_1)
print(list_2)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


In [None]:
list_1.pop()      # 將 list_1 串列中的最後一個物件移除
list_2.remove(2)  # 將 list_2 串列中的 2 物件移除
print(list_1)
print(list_2)

[1, 2, 3, 4]
[1, 3, 4, 5]


由此可見，兩個物件就有成功被獨立開來了。

### 複製字典

接著，我們一樣先測試用等號 `=` 將字典指定給另一個物件，並嘗試對任意一個字典進行操作：

In [None]:
dict_1 = {       # 建立新字典物件
    "one": 1,
    "two": 2,
    "more": {
        "three": 3,
        "four": 4
    }
}
dict_2 = dict_1  # 將原字典指定給新的物件
pprint(dict_1)
pprint(dict_2)

{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 2}
{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 2}


In [None]:
dict_1["one"] = "The first number"  # 新增一個鍵值對
pprint(dict_1)
pprint(dict_2)

{'more': {'four': 4, 'three': 3}, 'one': 'The first number', 'two': 2}
{'more': {'four': 4, 'three': 3}, 'one': 'The first number', 'two': 2}


看起來我們在 `dict_1` 新增了一個鍵，但是 `dict_2` 也一樣受到影響了。

接著我們就來調用 `dict.copy()` 方法來複製字典：

In [None]:
dict_1 = {                           # 建立新字典物件
    "one": 1,
    "two": 2,
    "more": {
        "three": 3,
        "four": 4
    }
}
dict_2 = dict_1.copy()               # 複製字典為新的物件
dict_1["two"] = "The second number"  # 新增一個鍵值對
pprint(dict_1)
pprint(dict_2)

{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 'The second number'}
{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 2}


看似可以正確地將字典複製出來了！接著我們看一個更進階的範例：如果在字典物件裡面對裡面的字典操作呢？

In [None]:
dict_1["more"]["three"] = "The third number"  # 對 dict_1["mode"] 字典新增一個鍵值對
pprint(dict_1)
pprint(dict_2)

{'more': {'four': 4, 'three': 'The third number'},
 'one': 1,
 'two': 'The second number'}
{'more': {'four': 4, 'three': 'The third number'}, 'one': 1, 'two': 2}


看起來，`dict.copy()` 方法雖然可以成功地複製出字典，但針對「字典中的字典」卻沒有辦法好好複製出來、成為一個獨立的物件。於是我們要透過內建的 `copy` 模組中的 `deepcopy` 函式來解決這個問題：

In [None]:
from copy import deepcopy

In [None]:
dict_1 = {                 # 建立新字典物件
    "one": 1,
    "two": 2,
    "more": {
        "three": 3,
        "four": 4
    }
}
dict_2 = deepcopy(dict_1)  # 使用 deepcopy() 函式來複製字典
pprint(dict_1)
pprint(dict_2)

{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 2}
{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 2}


In [None]:
dict_1["two"] = "The second number"           # 在字典中新增鍵值對
dict_1["more"]["three"] = "The third number"  # 在字典中的字典新增鍵值對
pprint(dict_1)
pprint(dict_2)

{'more': {'four': 4, 'three': 'The third number'},
 'one': 1,
 'two': 'The second number'}
{'more': {'four': 4, 'three': 3}, 'one': 1, 'two': 2}
