# 容器 Containers

容器可以裝入許多變數，妥善運用容器不僅僅是可以處理更複雜的問題，也可以讓我們的程式碼更簡潔也更好除錯。

其實在這份 python 官方教學文件中也稱呼它[資料結構](https://docs.python.org/zh-tw/3.9/tutorial/datastructures.html)。\
資料結構與資料之間的關係就像是書架與書本的關係，我們把書本集中到一個地方管理，甚至用索引的方式找出我們想要的書本。

我們這次不會深入討論這些容器的細節 (這起碼可以講一個學期)，我們的內容還是著重在如何以 python 完成一些簡單的任務。\
再次強調，python 的優勢就是用簡單的語法完成任務，所以不少的資料結構已經內建在 python 裡面了。


# 串列 `list`

串列 (list) 是將一連串的元素，只要依據某個元素在序列中的索引 (index)，就可以將之取出。

---
#### Syntax
```python
empty_list = []
empty_list = list() # 跟上面一樣

numbers = [0, 1, 2, 3, 4, 5] # 裝在容器內的變數以 "," 分隔
```
---

## 新增元素
```python
list.append(object)
```
在你想要新增元素的 list 後面輸入 `.append(object)`。

`object` 的意思是物件，你可以簡單理解成任何變數你都可以放，甚至可以把一個容器裝進另一個


In [17]:
fruits = []
print(fruits)
fruits.append("apple") # fruits 是已經建立的 list
print(fruits)


new_fruit = "banana"
fruits.append(new_fruit)
print(fruits)

new_fruit = "orange"
fruits.append(new_fruit)
print(fruits)

[]
['apple']
['apple', 'banana']
['apple', 'banana', 'orange']


## 取出元素
* 使用中括號 `[ ]` 來取出串列中特定位置的元素。
* 編號是**從 0 開始數**
* 也可以倒過來數，**負數 -1 則表示從串列倒數第 1 個位置**。

### 我們用從 0 數到 5 的串列來看每個位置的編號

```
numbers = [0, 1, 2, 3, 4, 5]

+---+---+---+---+---+---+
| 0 | 1 | 2 | 3 | 4 | 5 |
+---+---+---+---+---+---+
  0   1   2   3   4   5   <- 從 0 開始數
 -6  -5  -4  -3  -2  -1   <- 也可以倒著數
```

In [1]:
numbers = [0, 1, 2, 3, 4, 5]

print(numbers[0])
print(numbers[2])

0
2


In [3]:
print(numbers[4])  # 兩者的結果相同哦
print(numbers[-2])

4
4


### 取出部分元素
`[ ]` 其實不只支援取出一個元素，我們還可以指定一個範圍，取出範圍中的元素

---
#### Syntax

```python
numbers[START:STOP]
```
---
`START` 是起始元素的索引，`STOP` 是數到這個索引的時候會**停止**。

因此 `numbers[0:3]` 可以理解成: 從 `0` 開始數，直到數到 `3` 的時候停下來 (不包含 `3`) 

In [8]:
numbers[:3] # [0, 1, 2] 如果是 0 的情況可以省略

[0, 1, 2]

而如果是要擷取某個元素開始之後的所有元素，比起寫 `numbers[3:len(numbers)]`，在 python 可以直接寫 `numbers[3:]` 就好

> `len(object)` 會給出 `object` 中有幾個元素，目前為止課程提到的有 `list` 和 `str` 可以適用，今天會提到更多

In [13]:
numbers[3:] # 直到結尾的話也可以省略

[3, 4, 5]

### 設定步數

不只是取連續的串列片段，也可以設定步數 (`STEP`) 讓 python 每數過幾個元素後才取值。

比如說我想取索引是 0, 2, 4, 6, 8, ... 的所有元素，這個情況的 `STEP` 就是 `2`

---
#### Syntax
```python
numbers[START:STOP:STEP]
numbers[::STEP] # 如果沒有要指定 START, STOP 的話可以省略
```
---

最常見的應用是取出**逆轉**的序列，只要把 `STEP` 設定 `-1` 就可以了。

In [15]:
numbers[::-1] # 逆轉

[5, 4, 3, 2, 1, 0]

## 更改元素

list 允許更改容器裡面的元素，我們知道如何指定元素之後，就能用 `=` 改變裡面的元素

以 `fruits` 為例，目前 `fruits = ['apple', 'banana', 'orange']`

In [19]:
fruits[2] = "cherry"
fruits # orange 變成 cherry 了

['apple', 'banana', 'cherry']

# 字串 `str`

其實 list 取出元素的方式，也適用在字串上。

In [22]:
word = "desserts"
word[-1]

's'

In [52]:
word[::-1]

'stressed'

## 不能更改元素

字串並不像 list 可以自由地更改元素，他會直接丟出 `TypeError` 說我不支援這件事情

不過字串也提供許多方法來完成相關的任務，如果是要開頭大寫的話可以用 `str.capitalize()` 完成

更多細節可以參考[官方文件](https://docs.python.org/3.9/library/stdtypes.html#string-methods)

In [77]:
word[0] = "D"

TypeError: 'str' object does not support item assignment

In [89]:
word.capitalize()

'Desserts'

### `str.join(iterator)`

`str.join(iterator)` 可以將迭代器 iterator 裡面所有的**字串**，以字串作為分隔符號串連起來變成**單一個字串**
* 迭代器 iterator 是總稱，list 是迭代器
* 其實字串本身也可以是迭代器



In [141]:
print(fruits)
print("! ".join(fruits)) # fruit 有 3 個元素，只有出現兩個 !

print("-".join(fruits[0])) # fruit[0] 是 "apple"

['apple', 'banana', 'cherry']
apple! banana! cherry
a-p-p-l-e


# 字典 `dict`

字典的概念是以一個值當作鍵值 key 查詢後，會給出對應的值 value。

一個生活中會遇到的例子就是菜單，我們看到商品名稱，然後得到旁邊寫的價格。

---
#### Syntax
```python
empty_dict = {}
empty_dict = dict() # 和上面一樣

menu = {"甘蔗清茶": 55, "黃金香橙大吉嶺": 60} # 以 : 分隔哦
```
---

在字典的後方一樣可以加上中括號 `[]` 取值，只是這時候變成要寫鍵值到括號裡面

In [35]:
menu = {"甘蔗清茶": 55, "黃金香橙大吉嶺": 60}
print(menu)
print(menu["黃金香橙大吉嶺"])

{'甘蔗清茶': 55, '黃金香橙大吉嶺': 60}
60


## 新增元素

字典新增元素很簡單，不用呼叫甚麼函式或方法。

---
#### Syntax
```python
menu[new_key] = new_value
```
---


In [36]:
menu["皇家拿鐵"] = 55
print(menu)

{'甘蔗清茶': 55, '黃金香橙大吉嶺': 60, '皇家拿鐵': 55}


## 當鍵值重複的時候

新的值會**覆蓋**舊的值。

`dict` 不會同時儲存兩個對應的值，下面示範覆蓋舊的值的情況

In [38]:
menu["黃金香橙大吉嶺"] = 48
print(menu)

{'甘蔗清茶': 55, '黃金香橙大吉嶺': 48, '皇家拿鐵': 55}


## 與 list 搭配使用

當資料越來越多的時候，兩者搭配使用可以減少變數的數量，使用靈活 list 和 dict 是處理大量資料的起點

拿 Homework 2 part 2 舉例

In [42]:
testcases = {
    "input": [
        [-5, 12, 1, 13, 16, 8],
        [1234, 5678, 1234, 5678, 1234, 5678],
        [52634, 7421, -9285, 45013, 52634, 7421],
        [2578, 5169, -5, 3, -42309, -84605],
    ],
    "result": [
        False,
        True,
        True,
        True,
    ],
}
print(testcases["input"][0], ":", testcases["result"][0])

[-5, 12, 1, 13, 16, 8] : False


# 集合 Set

集合裡面的元素不會重複，如果想要找出不重複的元素時很好用

---
#### Syntax
```python
empty_set = set() # 只有以函式的方式才能建立空 set

unique_nums = set(nums) # nums 是 iterator
unique_nums = {1, 4, 2, 4, 4, 2, 1, 3, 4, 0}
```
---

通常都是有了一個容器後，想要找出其獨立的元素時會使用，也就是上面第二行的情況

In [43]:
nums = [1, 4, 2, 4, 0]
unique_nums = set(nums)

print(unique_nums)
print({1, 4, 2, 4, 0})

{0, 1, 2, 4}
{0, 1, 2, 4}


# 容器之間的共同之處
## 迭代器 iterator

迭代器 iterator 的定義很單純，迭代器可以在 for loop 將其內部的元素傳到指定的變數裡。

### Example
在 Lecture 2 的最後有提到這些程式碼
```python
food_expenses = [145, 75, 100] # 三餐的費用
for price in food_expenses:
    print(price) # 在 for loop 裡面做的事情記得要縮排!
```

這段做的事情就是將 `food_expenses` 的元素複製到 `price` 裡，接著印出 `price` 後，再將下一個元素複製到 `price` 後印出，直到結束。

In [44]:
food_expenses = [145, 75, 100] # 三餐的費用
for price in food_expenses:
    print(price) # 在 for loop 裡面做的事情記得要縮排!

145
75
100


這正是因為 list 是迭代器而能這麼寫，字串、字典、集合也都是迭代器。

在 python 檢驗是不是迭代器的方法也很簡單，把他換到上面 `food_expenses` 的部分就知道能不能當迭代器了。

### 字串

In [143]:
for i in "apple": # 字串的情況
    print(i)

a
p
p
l
e


### 集合
集合並不保證出來元素的順序，所以如果是有先後需求的情況可能還是要用其他的容器替代。這邊的結果由小到大排列只是巧合

In [145]:
for num in unique_nums:
    print(num)

0
1
2
4


### 字典
字典的情況比較特別一些，在 for loop 裡面只會丟出鍵值，如果要取出對應的 value 可以以鍵取值，舉例:

In [46]:
for drink in menu:
    print(drink, ":", menu[drink])

甘蔗清茶 : 55
黃金香橙大吉嶺 : 48
皇家拿鐵 : 55


### 補充： 其他常用迭代器
* `range(START, STOP, STEP)`: 從 START 數到 STOP 為止
* `enumerate(iterator)`: 給出元素的編號及元素本身
* `zip(iterator_1, iterator_2, ...)`: 同時迭代多個迭代器

還有[更多迭代器](https://docs.python.org/3/library/itertools.html)可以選擇

In [154]:
numbers = []
for i in range(10):
    numbers.append(i)

print(numbers)
print(list(range(10))) # 也可以這樣快速建立 list

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [156]:
print(nums)
for index, num in enumerate(nums): # index 從 0 往上數值到結束
    print(index, ":", num)

[1, 4, 2, 4, 0]
0 : 1
1 : 4
2 : 2
3 : 4
4 : 0


In [155]:
for i, j in zip(nums, numbers): # 一但有迭代器停止就會停下來
    print(i, j)

1 0
4 1
2 2
4 3
0 4


In [157]:
from itertools import zip_longest # zip_longest 不是內建的，這行告訴 python 從哪個函式庫找 code

# zip_longest
for i, j in zip_longest(nums, numbers):
    print(i, j)
# 已經迭代完的迭代器會以 None 來補足缺少的值

1 0
4 1
2 2
4 3
0 4
None 5
None 6
None 7
None 8
None 9


## 檢查元素是否存在

用 `in` 這個字就可以檢查該元素是否存在。字串的話還可以檢查長度不為 1 的字串是不是包含在裡面。

---
#### Syntax
```python
"app" in "apple" # True
```
---

也可以用在 if else 的情況，舉例

In [161]:
for i in range(5):
    if i in unique_nums:
        print(str(i) + " is in unique_nums")

0 is in unique_nums
1 is in unique_nums
2 is in unique_nums
4 is in unique_nums


如果要檢查不存在可以直接寫 `... not in ...`

In [None]:
for i in range(5):
    if i not in unique_nums:
        print(str(i) + " is not in unique_nums")