# Python 程式語言進階課程：程式設計（第三部分）

> 監察院，2023-02-09

[數聚點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@ntu.edu.tw>

## 資料結構

- 起：任務 20
- 迄：任務 39

## 什麼是資料結構

> 資料結構是電腦儲存、組織以及取得資料的機制，可以透過程式語言所提供的類別與自行定義類別實現，一個設計良好的資料結構，會在盡可能使用較少的時間與空間資源下，支援各種程式執行。

來源：<https://en.wikipedia.org/wiki/Data_structure>

## 為什麼需要資料結構

- 在資料科學家日常的工作任務中，資料處理佔有相當高的比例。
- 需要有一個機制能夠協助他們輸入、處理最後輸出資料。
- 這個「機制」就是**資料結構**。
- 適當地選擇資料結構，讓資料科學家能夠有效率地儲存與取得資料。
- 就像是將食物放置在冰箱、衣服放置在衣櫥、鞋子放置在鞋櫃。

## Python 內建的四個資料結構類別

1. `list`
2. `tuple`
3. `dict`(dictionary)
4. `set`

## `list`

- `list` 是一種「有序」且能夠「更新」的資料結構。
- `list` 可以透過「逗號」`,` 分隔值與「中括號」`[]` 形成。

In [None]:
primes = [2, 3, 5, 7, 11]
type(primes)

## 使用內建函數 `len()`  得知一個 `list` 中有幾個資料值

In [None]:
len(primes)

## 從一個 `list` 中取出資料的方式有兩種

1. **indexing** 指的是從一個 `list` 中取出特定位置的單個資料值。
2. **slicing** 指的是從一個 `list` 中擷取特定片段。

## indexing `[index]`

`list` 採用兩個方向的索引機制：

1. 由左至右：「從 0 開始」的索引機制。
2. 由右至左：「從 -1 開始」的索引機制。

In [None]:
print(primes[0])  # the first element
print(primes[1])  # the second element
print(primes[-1]) # the last element
print(primes[-2]) # the second last element

## slicing `[start:stop:step]`

除了可以取出特定位置的單個資料值，`list` 也支援擷取特定片段，藉此獲得一個較短長度 `list` 的語法。

- `start` 起始位置（包含）。
- `stop` 終止位置（排除）。
- `step` 間隔。

In [None]:
print(primes[0:3:1])            # slicing the first 3 elements
print(primes[-3:len(primes):1]) # slicing the last 3 elements 
print(primes[0:len(primes):2])  # slicing every second element

## slicing 如果沒有指定 `start:stop:step` 就採用預設值

- `start` 起始位置（包含）預設為 `0`。
- `stop` 終止位置（排除）預設為 `list` 的長度。
- `step` 間隔預設為 `1`。

In [None]:
print(primes[:3])  # slicing the first 3 elements
print(primes[-3:]) # slicing the last 3 elements 
print(primes[::2]) # slicing every second element

## `str` 也適用 indexing 與 slicing

In [None]:
luke_skywalker = "Luke Skywalker"
print(luke_skywalker[0])
print(luke_skywalker[-1])
print(luke_skywalker[:4])
print(luke_skywalker[5:])

## 更新 `list` 中的資料值

In [None]:
print(primes)   # before update
primes[-1] = 13 # update
print(primes)   # after update

## 也可以透過 `list` 的多種方法更新

- `list.append()`
- `list.pop()`
- `list.remove()`
- `list.insert()`
- `list.sort()`
- ...等。

## 查詢 `list` 方法的說明

In [None]:
help(primes.append)
#primes.append() # 在小括號中按 Shift - Tab 查詢方法的說明

## `list` 支援的運算符

- `+` 運算符：連接 lists
- `*` 運算符：複製 `list` 中的元素。

In [None]:
primes = [2, 3, 5, 7, 11]
primes_to_concatenate = [13, 17, 19, 23, 29]
primes + primes_to_concatenate

In [None]:
print(primes * 2)
print(primes_to_concatenate * 3)

## 在應用 `list` 的多種方法之前，先注意函數的兩種使用形式

1. 對物件應用函數，語法為 `function(object)`
2. 使用附屬於物件的函數，稱為使用物件的方法，語法為 `object.method()`

## 除了使用函數與方法的差異，也要留意物件更新的兩種方式

1. 將更新的結果回傳（Return），物件本身維持不變。
2. 更新物件本身並回傳 `None`

## 兩種更新方式的範例：排序一個 `list`

1. 使用內建函數 `sorted()` 採取將更新的結果回傳（Return），物件本身維持不變的更新方式。
2. 使用 `list.sort()` 採取更新物件本身並回傳 `None` 的更新方式。

In [None]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted_primes = sorted(unsorted_primes)
print(unsorted_primes)
print(sorted_primes)

In [None]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted_primes = unsorted_primes.sort()
print(unsorted_primes)
print(sorted_primes)

## 如何判斷兩種更新方式

- 詳細閱讀函數與方法的文件。
- 注意函數與方法使用後儲存格是否有 Out 顯示。

## 釐清兩種更新方式是至關重要的

- 雖然是利用 `list` 作為範例，但不管任何的資料或者資料結構都適用。
- 多數的函數更新機制都是回傳（Return），但並不是絕對。
- 不論函數或者方法，都要詳細閱讀文件或注意使用後儲存格是否有 Out 顯示。

## `tuple`

- `tuple` 是一種「有序」且「不能夠更新」的資料結構。
- `tuple` 可以透過「逗號」`,` 分隔值與「小括號」`()` 形成。

In [None]:
primes = (2, 3, 5, 7, 11)
type(primes)

## 使用內建函數 `len()`  得知一個 `tuple` 中有幾個資料值

In [None]:
len(primes)

## `tuple` 在許多地方的表現與 `list` 相同，像是 indexing 以及 slicing

In [None]:
print(primes[0])   # the first element
print(primes[:3])  # slicing the first 3 elements

## `tuple` 與 `list` 最大的不同點，在於 `tuple`「不能夠更新」的特性

- 以更新 `list` 的語法更新 `tuple` 會產生錯誤。
- `try…except…` 是例外處理的語法，之後會說明。

In [None]:
try:
    primes[-1] = 13
except TypeError as error_message:
    print(error_message)

## 在 Python 中有眾多的應用場景會遭遇到 `tuple`

- 自行定義函數預設「多個輸出」的資料結構。
- `dict.items()` 輸出。
- 函數的彈性參數 `*args`
- ...等。

## `dict`

- `dict` 是一種使用「鍵值對應」關係的資料結構。
- `dict` 可以透過「逗號」`,`、「鍵值對應」`key: value` 與「大括號」`{}` 形成。

In [None]:
the_shawshank_redemption = {
    "title": "The Shawshank Redemption",
    "year": 1995,
    "rating": 9.3,
    "director": "Frank Darabont"
}
type(the_shawshank_redemption)

## 使用內建函數 `len()`  得知一個 `dict` 中有幾組鍵值對應

In [None]:
len(the_shawshank_redemption)

## `dict` 採用以「鍵」取「值」的索引機制

```python
dict["key"]
```

In [None]:
print(the_shawshank_redemption["title"])
print(the_shawshank_redemption["year"])
print(the_shawshank_redemption["rating"])
print(the_shawshank_redemption["director"])

## 用來檢視 `dict` 的三個方法

1. `dict.keys()` 檢視鍵。
2. `dict.values()` 檢視值。
3. `dict.items()` 檢視鍵值對應。

In [None]:
print(the_shawshank_redemption.keys())
print(the_shawshank_redemption.values())
print(the_shawshank_redemption.items())  # (key, value) as a tuple

## 新增 `dict` 中的鍵值對應

In [None]:
the_shawshank_redemption['lead_actors'] = ['Tim Robbins', 'Morgan Freeman']
the_shawshank_redemption

## 使用 `del` 保留字刪除 `dict` 中的鍵值對應

In [None]:
del the_shawshank_redemption['lead_actors']
the_shawshank_redemption

## 指定 `dict` 的「鍵」更新「值」

In [None]:
the_shawshank_redemption["year"] = 1994
the_shawshank_redemption

## `set`

- `set` 是一種「無序」、儲存「獨一值」並且能夠進行「集合運算」的資料結構。
- `set` 可以透過「逗號」`,` 分隔值與「大括號」`{}` 形成。

In [None]:
primes = {2, 3, 5, 7, 7}  # 7 is duplicated
odds = {1, 3, 5, 7, 9, 9} # 9 is duplicated
print(type(primes))
print(type(odds))

## 使用內建函數 `len()`  得知一個 `set` 中有幾個獨一值

In [None]:
print(len(primes))
print(primes)
print(len(odds))
print(odds)

## `set` 重要的兩個特性

1. 不支援 indexing
2. 支援集合運算（Set operations）。

## `set` 不支援 indexing

In [None]:
try:
    primes[0]
except TypeError as error_message:
    print(error_message)

## `set` 支援集合運算

- 使用集合運算符（Set operators）。
- 使用 `set` 類別的方法。

## 常用的集合運算

- 交集。
- 聯集。
- 差集。
- 對稱差集。

## 使用 `&` 交集運算符或者 `set.intersection()` 方法

In [None]:
print(primes & odds)             # with an operator
print(primes.intersection(odds)) # equivalently with a method

## 使用 `|` 聯集運算符或者 `set.union()` 方法

In [None]:
print(primes | odds)      # with an operator
print(primes.union(odds)) # equivalently with a method

## 使用 `-` 差集運算符或者 `set.difference()` 方法

In [None]:
print(primes - odds)           # with an operator
print(primes.difference(odds)) # equivalently with a method
print(odds - primes)           # with an operator
print(odds.difference(primes)) # equivalently with a method

## 使用 `^` 對稱差集運算符或者 `set.symmetric_difference()` 方法

In [None]:
print(primes ^ odds)                      # with an operator
print(primes.symmetric_difference(odds))  # equivalently with a method

## 資料結構類別判斷的兩種方式

1. 將 `type()` 函數的輸出與資料結構類別名稱比較。
2. 透過內建函數 `isinstance()` 判斷。

## 資料結構類別可以透過內建函數 `isinstance()` 判斷

`isinstance(x, classinfo)` 函數判斷輸入物件 `x` 是否為某個資料結構類別的實例，其中 `classinfo` 參數輸入欲判斷的資料結構類別名稱。

## 資料結構類別可以透過與其同名的內建函數轉換

- `list()` 可以將輸入資料結構轉換為 `list`。
- `tuple()` 可以將輸入資料結構轉換為 `tuple`。
- `dict()` 可以將輸入資料結構轉換為 `dict`。
- `set()` 可以將輸入資料結構轉換為 `set`。

## 任務 20：`DataFrame` 是 Python 內建的資料結構類別

In [None]:
def task_20() -> bool:
    # 寫作
    return None
    # 寫作

## 任務 21：`list` 與 `tuple` 是兩種完全相同的資料結構類別

In [None]:
def task_21() -> bool:
    # 寫作
    return None
    # 寫作

## 任務 22：下列何者不屬於 Python 內建的資料結構類別？

1. `ndarray`
2. `list`
3. `dict`
4. `set`

In [None]:
def task_22() -> int:
    # 寫作
    return None
    # 寫作

## 任務 23：下列程式碼會印出什麼樣的結果？

```python
odds = [1, 3, 5, 7, 9]
print(odds[-2])
```

1. `[1, 3, 7, 9]`
2. `7`
3. `[7]`
4. `[7, 9]`

In [None]:
def task_23() -> int:
    # 寫作
    return None
    # 寫作

## 任務 24：下列程式碼會印出什麼樣的結果？

```python
odds = [3, 5, 1, 9, 7]
sorted(odds)
print(odds)
```

1. `[1, 3, 5, 7, 9]`
2. `[9, 7, 5, 3, 1]`
3. `[7, 9, 1, 5, 3]`
4. `[3, 5, 1, 9, 7]`

In [None]:
def task_24() -> int:
    # 寫作
    return None
    # 寫作

## 任務 25：建立一個長度為 7 的 `list`

In [None]:
def task_25() -> list:
    """
    >>> output = task_25()
    >>> type(output)
    list
    >>> len(output)
    7
    """
    # 寫作
    return None
    # 寫作

## 任務 26：建立一個長度為 5 的 `tuple`

In [None]:
def task_26() -> tuple:
    """
    >>> output = task_26()
    >>> type(output)
    tuple
    >>> len(output)
    5
    """
    # 寫作
    return None
    # 寫作

## 任務 27：建立一個長度為 3 的 `dict`

In [None]:
def task_27() -> dict:
    """
    >>> output = task_27()
    >>> type(output)
    dict
    >>> len(output)
    3
    """
    # 寫作
    return None
    # 寫作

## 任務 28：建立一個長度為 5 的 `set`

In [None]:
def task_28() -> set:
    """
    >>> output = task_28()
    >>> type(output)
    set
    >>> len(output)
    5
    """
    # 寫作
    return None
    # 寫作

## 任務 29：排序一個 `list`

In [None]:
def task_29(x: list) -> list:
    """
    >>> task_29([1, 3, 7, 5, 9])
    [1, 3, 5, 7, 9]
    >>> task_29([9, 3, 7, 5, 1])
    [1, 3, 5, 7, 9]
    """
    # 寫作
    return None
    # 寫作

## 任務 30：取出第一個與最後一個元素

In [None]:
def task_30(x: list) -> dict:
    """
    >>> task_30([2, 3, 5, 7, 11])
    {'first': 2, 'last': 11}
    >>> task_30(["Python", "Reticulate", "Anaconda"])
    {'first': 'Python', 'last': 'Anaconda'}
    """
    # 寫作
    return None
    # 寫作

## 任務 31：取出前三個字元

In [None]:
def task_31(x: str) -> str:
    """
    >>> task_31("Python")
    "Pyt"
    >>> task_31("Reticulate")
    "Ret"
    >>> task_31("Anaconda")
    "Ana"
    """
    # 寫作
    return None
    # 寫作

## 任務 32：移除第一個與最後一個元素

In [None]:
def task_32(x: list) -> list:
    """
    >>> task_32([2, 3, 5, 7, 11])
    [3, 5, 7]
    >>> task_32(["Python", "Reticulate", "Anaconda"])
    ["Reticulate"]
    """
    # 寫作
    return None
    # 寫作

## 任務 33：取出中間的元素

In [None]:
def task_33(x: list) -> int:
    """
    >>> task_33([2, 3, 5])
    3
    >>> task_33([2, 3, 5, 7, 11])
    5
    >>> task_33([2, 3, 5, 7, 11, 13, 17])
    7
    """
    # 寫作
    return None
    # 寫作

## 任務 34：取出中間的三個字元

In [None]:
def task_34(x: str) -> str:
    """
    >>> task_34("Steve")
    "tev"
    >>> task_34("Stark")
    "tar"
    >>> task_34("Natasha")
    "tas"
    """
    # 寫作
    return None
    # 寫作

## 任務 35：台北市行政區郵遞區號

來源：[臺北市行政區劃](https://zh.wikipedia.org/wiki/%E8%87%BA%E5%8C%97%E5%B8%82%E8%A1%8C%E6%94%BF%E5%8D%80%E5%8A%83)

In [None]:
def task_35(area_name: str) -> int:
    """
    >>> task_35("中正區")
    100
    >>> task_35("大同區")
    103
    >>> task_35("中山區")
    104
    """
    # 寫作
    return None
    # 寫作

## 任務 36：剔除重複值

In [None]:
def task_36(x: list) -> list:
    """
    >>> task_36([5, 5, 6, 6])
    [5, 6]
    >>> task_36([2, 2, 6, 6])
    [2, 6]
    >>> task_36([9, 9, 8, 1])
    [1, 8, 9]
    """
    # 寫作
    return None
    # 寫作

## 任務 37：相同元素

In [None]:
def task_37(x: set, y: set) -> set:
    """
    >>> task_37({5, 5, 6, 6}, {5, 6, 7, 8})
    {5, 6}
    >>> task_37({1, 3, 5, 7, 9}, {2, 3, 5, 7})
    {3, 5, 7}
    >>> task_37({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9})
    {1, 3, 5, 7, 9}
    >>> task_37({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10})
    {}
    """
    # 寫作
    return None
    # 寫作

## 任務 38：相同元素個數

In [None]:
def task_38(x: set, y: set) -> int:
    """
    >>> task_38({5, 5, 6, 6}, {5, 6, 7, 8})
    2
    >>> task_38({1, 3, 5, 7, 9}, {2, 3, 5, 7})
    3
    >>> task_38({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9})
    5
    >>> task_38({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10})
    0
    """
    # 寫作
    return None
    # 寫作

## 任務 39：相異元素個數

In [None]:
def task_39(x: set, y: set) -> int:
    """
    >>> task_39({5, 5, 6, 6}, {5, 6, 7, 8})
    2
    >>> task_39({1, 3, 5, 7, 9}, {2, 3, 5, 7})
    3
    >>> task_39({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9})
    0
    >>> task_39({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10})
    10
    """
    # 寫作
    return None
    # 寫作

## 測試：任務 20-39

In [None]:
import unittest
# 測試
class TestTask2039(unittest.TestCase):
    def test_task_20(self):
        output = task_20()
        self.assertIsInstance(output, bool)
        self.assertFalse(output)
    def test_task_21(self):
        output = task_21()
        self.assertIsInstance(output, bool)
        self.assertFalse(output)
    def test_task_22(self):
        self.assertEqual(task_22(), 1)
    def test_task_23(self):
        self.assertEqual(task_23(), 2)
    def test_task_24(self):
        self.assertEqual(task_24(), 4)
    def test_task_25(self):
        output = task_25()
        self.assertIsInstance(output, list)
        self.assertEqual(len(output), 7)
    def test_task_26(self):
        output = task_26()
        self.assertIsInstance(output, tuple)
        self.assertEqual(len(output), 5)
    def test_task_27(self):
        output = task_27()
        self.assertIsInstance(output, dict)
        self.assertEqual(len(output), 3)
    def test_task_28(self):
        output = task_28()
        self.assertIsInstance(output, set)
        self.assertEqual(len(output), 5)
    def test_task_29(self):
        self.assertEqual(task_29([1, 3, 7, 5, 9]), [1, 3, 5, 7, 9])
        self.assertEqual(task_29([9, 3, 7, 5, 1]), [1, 3, 5, 7, 9])
    def test_task_30(self):
        self.assertEqual(task_30([2, 3, 5, 7, 11]), {'first': 2, 'last': 11})
        self.assertEqual(task_30(["Python", "Reticulate", "Anaconda"]), {'first': 'Python', 'last': 'Anaconda'})
    def test_task_31(self):
        self.assertEqual(task_31("Python"), "Pyt")
        self.assertEqual(task_31("Reticulate"), "Ret")
        self.assertEqual(task_31("Anaconda"), "Ana")
    def test_task_32(self):
        self.assertEqual(task_32([2, 3, 5, 7, 11]), [3, 5, 7])
        self.assertEqual(task_32(["Python", "Reticulate", "Anaconda"]), ["Reticulate"])
    def test_task_33(self):
        self.assertEqual(task_33([2, 3, 5]), 3)
        self.assertEqual(task_33([2, 3, 5, 7, 11]), 5)
        self.assertEqual(task_33([2, 3, 5, 7, 11, 13, 17]), 7)
    def test_task_34(self):
        self.assertEqual(task_34("Steve"), "tev")
        self.assertEqual(task_34("Stark"), "tar")
        self.assertEqual(task_34("Natasha"), "tas")
    def test_task_35(self):
        self.assertEqual(task_35("中正區"), 100)
        self.assertEqual(task_35("大同區"), 103)
        self.assertEqual(task_35("中山區"), 104)
    def test_task_36(self):
        self.assertEqual(task_36([5, 5, 6, 6]), [5, 6])
        self.assertEqual(task_36([2, 2, 6, 6]), [2, 6])
        self.assertEqual(task_36([9, 9, 8, 1]), [1, 8, 9])
    def test_task_37(self):
        self.assertEqual(task_37({5, 5, 6, 6}, {5, 6, 7, 8}), {5, 6})
        self.assertEqual(task_37({1, 3, 5, 7, 9}, {2, 3, 5, 7}), {3, 5, 7})
        self.assertEqual(task_37({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9}), {1, 3, 5, 7, 9})
        self.assertEqual(task_37({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10}), {})
    def test_task_38(self):
        self.assertEqual(task_38({5, 5, 6, 6}, {5, 6, 7, 8}), 2)
        self.assertEqual(task_38({1, 3, 5, 7, 9}, {2, 3, 5, 7}), 3)
        self.assertEqual(task_38({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9}), 5)
        self.assertEqual(task_38({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10}), 0)
    def test_task_39(self):
        self.assertEqual(task_39({5, 5, 6, 6}, {5, 6, 7, 8}), 2)
        self.assertEqual(task_39({1, 3, 5, 7, 9}, {2, 3, 5, 7}), 3)
        self.assertEqual(task_39({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9}), 0)
        self.assertEqual(task_39({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10}), 10)

suite = unittest.TestLoader().loadTestsFromTestCase(TestTask2039)
runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite)