# Python 程式語言進階課程：程式設計（第二部分）

> 監察院，2023-02-09

[數聚點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@ntu.edu.tw>

## 資料類別

- 起：任務 10
- 迄：任務 19

## 什麼是函數

一段被賦予名稱的程式碼，能夠完成某一個文字處理或者數值計算任務，在使用函數之前，必須先確定這個函數在執行的環境中已經被定義妥善。

```python
def function_name(inputs: type, arguments: type) -> type:
    """
    docstring
    """
    # function's code block
    return outputs
```

## 函數有四個來源

1. 來自內建函數。
2. 來自標準模組。
3. 來自第三方模組。
4. 來自使用者的定義。

## 來自內建函數可以直接使用

- 哪些內建函數可以直接使用：<https://docs.python.org/3/library/functions.html>
- 使用方式為輸入資料或引數（Parameters）到函數名稱後的小括號。

In [1]:
negative_integer = -5566
abs(negative_integer) # 輸入資料

5566

In [2]:
pi = 3.14159
round(pi, 2) # 輸入資料與引數

3.14

## 現階段我們先瞭解一些關於自行定義函數的組成

- `def` 保留字用來定義函數的名稱。
- 縮排部分稱為程式區塊（Code block），是函數的主體，也是任務要學員運用預期輸入與參數來完成的部分。
- 不要忘記把函數的預期輸出寫在 `return` 保留字後。
- 函數的類別提示（Typing）並不是必要的，但它能幫助我們更快理解任務內容。

## 如何描述 `negative_integer = -5566` 以及 `pi = 3.14159`

- `negative_integer` 物件是 `int` 類別的實例（Instance）。
- `pi` 物件是 `float` 類別的實例（Instance）。
- 我們可以使用 `=` 符號讓 `object_name` 成為常數 `literal_value` 類別的實例，供後續的程式使用。

```python
object_name = literal_value
```

## 物件與函數的命名規則

- 使用全小寫英文，採用蛇形命名法（Snake case），不同單字之間以底線 `_` 相隔。
- 不能使用保留字作命名。
- 使用單數名詞為資料類別的物件命名、使用複數名詞為資料結構類別的物件命名、使用動詞為函數或方法命名，盡量讓名稱簡潔且具有意義。
- 不要使用內建函數作物件的命名，避免覆蓋內建函數的功能。

來源：[PEP 8 -- Style Guide for Python Code](https://www.python.org/dev/peps/pep-0008/#function-and-variable-names)

## 什麼是保留字

- 保留字是具有特殊作用的指令。
- 目前有看過的 `import`、`def` 與 `return` 等都是 Python 的保留字。
- Python 的保留字一覽：<https://docs.python.org/3/reference/lexical_analysis.html#keywords>

## 有時候我們在程式碼之中會看到用來解釋的說明文字

- 註解（Comments）是口語化的文字敘述，以 `#` 標記，並不能夠被翻譯成電腦語言。
- 註解可以細分為單行註解、行末註解。

In [3]:
# 使用內建函數 <-- 單行註解
negative_integer = -5566
abs(negative_integer) # 輸入資料 <-- 行末註解

5566

## 五種基礎資料類別

1. `int`(integer)
2. `float`
3. `str`(string)
4. `bool`(boolean)
5. `NoneType`

## 使用內建函數 `type()` 確認物件所參照的資料類別

我們通常都會用一個物件去參照常數，物件名稱或 `print()` 函數並不能反映資料類別。

In [4]:
favorite = "5566" # favorite boy group?
print(favorite)
favorite = 5566   # favorite number?
print(favorite)

5566
5566


In [5]:
my_lucky_number = 5566
full_marathon_distance_in_km = 42.195
my_favorite_boy_group = "5566"
print(type(my_lucky_number))
print(type(full_marathon_distance_in_km))
print(type(my_favorite_boy_group))

<class 'int'>
<class 'float'>
<class 'str'>


## 數值運算符

- 直觀的加減乘除 `+`, `-`, `*`, `/`
- 次方 `**`
- 計算餘數 `%`
- 計算商數 `//`
- 優先運算 `()`

## 數值運算符的順位

1. 最高順位是優先運算 `()`
2. 第二順位是次方 `**`
3. 第三順位是計算餘數 `%` 計算商數 `//` 乘 `*` 以及除 `/`
4. 第四順位是加 `+` 減 `-`

## 優先運算的範例：將華氏溫度轉換為攝氏溫度的自行定義函數 `convert_fahrenheit_to_celsius()`

\begin{equation}
\text{Celsius}(^{\circ} \text{C}) = (\text{Fahrenheit}(^{\circ} \text{F}) - 32) \times \frac{5}{9}
\end{equation}

In [6]:
def convert_fahrenheit_to_celsius(fahrenheit: int) -> float:
    celsius = (fahrenheit - 32) * 5/9  # the formula converts fahrenheit to celsius.
    return celsius

print(convert_fahrenheit_to_celsius(32))
print(convert_fahrenheit_to_celsius(212))

0.0
100.0


## 使用成對的單引號 `'`、雙引號 `"` 或三個雙引號 `"""` 形成 `str`

In [7]:
str_with_single_quotes = 'Hello, world!'
str_with_double_quotes = "Hello, world!"
str_with_triple_double_quotes = """Hello, world!"""
print(type(str_with_single_quotes))
print(type(str_with_double_quotes))
print(type(str_with_triple_double_quotes))

<class 'str'>
<class 'str'>
<class 'str'>


## `str` 中可能會包含單引號或雙引號，有兩種解決方式

1. 以反斜線 `\`（又稱跳脫符號）作為標註。
2. 以不同樣式的引號來形成 `str` 藉此區隔。

In [8]:
mcd = 'I\'m lovin\' it!'   # escape with \
mcd = "I'm lovin' it!"     # use different quotation marks
mcd = """I'm lovin' it!""" # use different quotation marks

## 能對 `str` 使用的文字運算符

- 加號 `+` 能夠連接 `str`
- 乘號 `*` 能夠複製 `str` 出現次數。

In [9]:
m = """I'm"""
c = """ lovin'"""
d = """ it!"""
print(m + c + d)

I'm lovin' it!


In [10]:
mcd = m + c + d
print(mcd*3)

I'm lovin' it!I'm lovin' it!I'm lovin' it!


## 另一個 `str` 的重要技巧是特定顯示格式

- 具體來說是在 `str` 中嵌入物件，如此顯示的內容將隨著物件中所儲存的值而變動。
- 透過 f-string 語法搭配大括號 `{}` 指定顯示格式。

```python
f"{object_name}"         # f-string 語法
```

In [11]:
def say_hello_to_anyone(anyone: str) -> str:
    return f"Hello, {anyone}!" # f-string syntax

print(say_hello_to_anyone("world"))
print(say_hello_to_anyone("Python"))

Hello, world!
Hello, Python!


## 我個人常用的特定顯示格式

- 指定小數點 `n` 位的浮點數格式 `:.nf`
- 具有千分位逗號的金額格式 `:,`

In [12]:
def fahrenheit_to_celsius(fahrenheit) -> str:
    celsius = (fahrenheit - 32) * 5/9
    msg = f"{fahrenheit:.1f} degrees fahrenheit is equal to {celsius:.1f} degrees celsius."
    return msg

print(fahrenheit_to_celsius(32))
print(fahrenheit_to_celsius(212))

32.0 degrees fahrenheit is equal to 0.0 degrees celsius.
212.0 degrees fahrenheit is equal to 100.0 degrees celsius.


In [13]:
def big_mac_index(country, currency, price):
    msg = f"A Big Mac costs {price:,.2f} {currency} in {country}."
    return msg

print(big_mac_index("Taiwan", "TWD", 72))
print(big_mac_index("US", "USD", 5.65))
print(big_mac_index("South Korea", "Won", 6520))

A Big Mac costs 72.00 TWD in Taiwan.
A Big Mac costs 5.65 USD in US.
A Big Mac costs 6,520.00 Won in South Korea.


## 什麼是 `bool`

布林（Boolean）是程式設計中用來表示邏輯的資料類別，以發明布林代數的數學家 George Boole 為名，它只有兩種值：假（`False`）和真（`True`），在程式設計與資料科學可以進行流程控制以及資料篩選。

## 有三種方式可以形成 `bool`

1. 直接使用保留字 `False` 或 `True`
2. 使用關係運算符。
3. 使用邏輯運算符。

## 直接使用保留字 `False` 或 `True`

In [14]:
bool_false = False
bool_true = True

print(bool_false)
print(bool_true)
print(type(bool_false))
print(type(bool_true))

False
True
<class 'bool'>
<class 'bool'>


## 使用關係運算符形成 `bool` 

在關係運算符兩側放置物件或字面值形成 `bool` 稱為條件運算式（Conditional expression）。

- 等於 `==`
- 不等於 `!=`
- 大於 `>` 小於 `<`
- 大於等於 `>=` 小於等於 `<=`
- 包含於 `in` 不包含於 `not in`

In [15]:
my_lucky_number = 5566
my_favorite_boy_group = "5566"

print(my_lucky_number == 5566)
print(my_lucky_number != 5566)
print(my_lucky_number > 5566)
print(my_lucky_number >= 5566)
print('56' in my_favorite_boy_group)
print('78' not in my_favorite_boy_group)

True
False
False
True
True
True


## 要將 `==` 以及 `=` 明確地區分出來

- `==` 是關係運算符，用來判斷符號兩側是否相等。
- `=` 是賦值運算符，用來讓左側的物件名稱成為右側類別的實例。

In [16]:
my_favorite_boy_group = "5566"
my_favorite_boy_group == 5566

False

## 使用邏輯運算符形成 `bool`

- 交集 `and`
- 聯集 `or`
- 非 `not`

## 非 `not` 運算符將 `bool` 反轉

In [17]:
bool_false = False
bool_true = True
print(not bool_false)
print(not bool_true)

True
False


## 邏輯運算符針對已經是 `bool` 的資料進行集合運算

- 在交集 `and` 運算符兩側必須都是 `True` 判斷結果才會是 `True`
- 在聯集 `or` 運算符兩側必須都是 `False` 判斷結果才會是 `False`

## 在交集 `and` 運算符兩側必須都是 `True` 判斷結果才會是 `True`

In [18]:
bool_false = False
bool_true = True
print(bool_true and bool_true)
print(bool_true and bool_false)
print(bool_false and bool_true)
print(bool_false and bool_false)

True
False
False
False


## 在聯集 `or` 運算符兩側必須都是 `False` 判斷結果才會是 `False`

In [19]:
bool_false = False
bool_true = True
print(bool_false or bool_false)
print(bool_true or bool_true)
print(bool_true or bool_false)
print(bool_false or bool_true)

False
True
True
True


## 交集 `and` 運算符的範例：`is_a_good_marathon_weather()` 函數

如果一個適合跑馬拉松的天氣定義是「乾」**並且**「冷」，假設比賽日乾燥與低溫的機率均為 50%，適合跑馬拉松的機率為 25%。

In [20]:
def is_a_good_marathon_weather(is_dry: bool, is_cold: bool) -> bool:
    return is_dry and is_cold

print(is_a_good_marathon_weather(True, True))
print(is_a_good_marathon_weather(True, False))
print(is_a_good_marathon_weather(False, True))
print(is_a_good_marathon_weather(False, False))

True
False
False
False


## 聯集 `or` 運算符的範例：`is_a_good_marathon_weather()` 函數

如果一個適合跑馬拉松的天氣定義是「乾」**或者**「冷」，假設比賽日乾燥與低溫的機率均為 50%，適合跑馬拉松的機率為 75%。

In [21]:
def is_a_good_marathon_weather(is_dry: bool, is_cold: bool) -> bool:
    return is_dry or is_cold

print(is_a_good_marathon_weather(False, False))
print(is_a_good_marathon_weather(True, True))
print(is_a_good_marathon_weather(True, False))
print(is_a_good_marathon_weather(False, True))

False
True
True
True


## 未定義值 `NoneType`

- Python 表示未定義值、空值或者虛無值的特殊資料類別，只有一個值：`None`。
- `NoneType` 既不是 `False`。
- `NoneType` 也不是空的 `str` 類別 `''`。
- `NoneType` 也不是 `0`。

In [22]:
a_none_type = None
print(type(a_none_type))
print(a_none_type == None)
print(a_none_type == False)
print(a_none_type == '')
print(a_none_type == 0)

<class 'NoneType'>
True
False
False
False


## 如果在自行定義函數時沒有使用 `return`，函數將輸出 `NoneType`

若只是用 `print()` 函數將預期輸出印出並無法通過測試的根本原因，輸出 `NoneType` 無法通過和預期輸出比對的測試資料。

In [23]:
def convert_fahrenheit_to_celsius(fahrenheit: int) -> None:
    celsius = (fahrenheit - 32) * 5/9
    print(celsius) # Instead of return celsius, we just print celsius.
    
function_output = convert_fahrenheit_to_celsius(212)
print(function_output)
print(type(function_output))

100.0
None
<class 'NoneType'>


## 資料類別判斷的兩種方式

1. 將 `type()` 函數的輸出與資料類別名稱比較。
2. 透過內建函數 `isinstance()` 判斷。

## 資料類別可以透過內建函數 `type()` 判斷

將 `type()` 函數的輸出與資料類別名稱比較。

In [24]:
a_bool_false = False
a_str_false = "False"
print(type(a_bool_false) == bool)
print(type(a_str_false) == bool)

True
False


In [25]:
an_integer_5566 = 5566
a_str_5566 = "5566"
print(type(an_integer_5566) == int)
print(type(a_str_5566) == int)

True
False


In [26]:
a_none_type = None
a_none_str = "None"
print(type(a_none_type) == type(None))
print(type(a_none_str) == type(None))

True
False


## 資料類別可以透過內建函數 `isinstance()` 判斷

`isinstance(x, classinfo)` 函數判斷輸入物件 `x` 是否為某個資料類別的實例，其中 `classinfo` 參數輸入欲判斷的資料類別名稱。

In [27]:
a_bool_false = False
a_str_false = "False"
print(isinstance(a_bool_false, bool))
print(isinstance(a_str_false, bool))

True
False


In [28]:
# Use int as classinfo
an_integer_5566 = 5566
a_str_5566 = "5566"
print(isinstance(an_integer_5566, int))
print(isinstance(a_str_5566, int))

True
False


In [29]:
# Use type(None) as classinfo
a_none_type = None
a_none_str = "None"
print(isinstance(a_none_type, type(None)))
print(isinstance(a_none_str, type(None)))

True
False


## 資料類別可以透過與其同名的內建函數轉換

- `bool()` 可以將輸入資料轉換為 `bool`
- `int()` 可以將輸入資料轉換為 `int`
- `float()` 可以將輸入資料轉換為 `float`
- `str()` 可以將輸入資料轉換為 `str`

## 資料類別轉換的包容性

由資料類別的子集合往資料類別的母集合轉換可以確保不會出錯。

\begin{equation}
\text{bool} \in \text{int} \in \text{float} \in \text{str}
\end{equation}

In [30]:
# Upcasting is always allowed.
print(int(False))
print(float(0))
print(str(0.0))

0
0.0
0.0


## 資料類別轉換的包容性（續）

由資料類別的母集合往資料類別的子集合轉換需要注意是否符合邏輯、是否正確。

\begin{equation}
\text{bool} \in \text{int} \in \text{float} \in \text{str}
\end{equation}

In [31]:
print(bool("0"))
print(bool("False"))

True
True


## 任務 10：定義函數不需要 `return` 也能夠獲得輸出。

In [32]:
def task_10() -> bool:
    # 寫作
    return None
    # 寫作

## 任務 11：`=` 是關係運算符，用來判斷符號兩側是否相等。

In [33]:
def task_11() -> bool:
    # 寫作
    return None
    # 寫作

## 任務 12：下列語法何者可以形成文字？

1. `str_with_single_quotes = 'Hello, world!'`
2. `str_with_double_quotes = "Hello, world!"`
3. `str_with_triple_double_quotes = """Hello, world!"""`
4. 以上皆是。

In [34]:
def task_12() -> int:
    # 寫作
    return 0
    # 寫作

## 任務 13：下列條件運算式何者可以形成 `True`？

1. `True and True`
2. `True and False`
3. `False and True`
4. `False and False`

In [35]:
def task_13() -> int:
    # 寫作
    return 0
    # 寫作

## 任務 14：下列條件運算式何者可以形成 `False`？

1. `True or True`
2. `True or False`
3. `False or True`
4. `False or False`

In [36]:
def task_14() -> int:
    # 寫作
    return 0
    # 寫作

## 任務 15：轉換公里為英里

\begin{equation}
1 \; \text{km} = 0.62137 \; \text{mile}
\end{equation}

In [37]:
def task_15(km: float) -> float:
    """
    >>> task_15(42.195) # a full marathon
    26.21870715
    >>> task_15(21.095) # a half marathon
    13.10780015
    """
    # 寫作
    return None
    # 寫作

## 任務 16：計算 BMI

\begin{equation}
\text{BMI} = \frac{\text{weight}_{kg}}{\text{height}_{m}^2}
\end{equation}

In [38]:
def task_16(height: int, weight: int) -> float:
    """
    >>> task_16(206, 113) # LeBron James
    26.628334433028563
    >>> task_16(211, 110) # Giannis Antetokounmpo
    24.70744143213315
    >>> task_16(201, 104) # Luka Doncic
    25.74193708076532
    """
    # 寫作
    return None
    # 寫作

## 任務 17：顯示逗號與兩位小數格式

In [39]:
def task_17(x: int) -> str:
    """
    >>> task_17(1000)
    '1,000.00'
    >>> task_17(10000)
    '10,000.00'
    >>> task_17(100000)
    '100,000.00'
    """
    # 寫作
    return None
    # 寫作

## 任務 18：是否為正數

In [40]:
def task_18(x: int) -> bool:
    """
    >>> task_18(-1)
    False
    >>> task_18(0)
    False
    >>> task_18(1)
    True
    """
    # 寫作
    return None
    # 寫作

## 任務 19：是否為兩位數

In [41]:
def task_19(x: int) -> bool:
    """
    >>> task_19(9)
    False
    >>> task_19(10)
    True
    >>> task_19(100)
    False
    """
    # 寫作
    return None
    # 寫作

## 測試：任務 10-19

In [42]:
import unittest
# 測試
class TestTask1019(unittest.TestCase):
    def test_task_10(self):
        output = task_10()
        self.assertIsInstance(output, bool)
        self.assertFalse(output)
    def test_task_11(self):
        output = task_11()
        self.assertIsInstance(output, bool)
        self.assertFalse(output)
    def test_task_12(self):
        self.assertEqual(task_12(), 4)
    def test_task_13(self):
        self.assertEqual(task_13(), 1)
    def test_task_14(self):
        self.assertEqual(task_14(), 4)
    def test_task_15(self):
        output = task_15(42.195) # a full marathon
        self.assertTrue(output >= 26.2)
        output = task_15(21.095) # a half marathon
        self.assertTrue(output >= 13.1)
    def test_task_16(self):
        output = task_16(206, 113) # LeBron James
        self.assertTrue(output >= 26)
        output = task_16(211, 110) # Giannis Antetokounmpo
        self.assertTrue(output >= 24)
        output = task_16(201, 104) # Luka Doncic
        self.assertTrue(output >= 25)
    def test_task_17(self):
        self.assertEqual(task_17(1000), '1,000.00')
        self.assertEqual(task_17(10000), '10,000.00')
        self.assertEqual(task_17(100000), '100,000.00')
    def test_task_18(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
    def test_task_19(self):
        self.assertFalse(task_19(9))
        self.assertFalse(task_19(100))
        self.assertTrue(task_19(99))
        self.assertTrue(task_19(10))
suite = unittest.TestLoader().loadTestsFromTestCase(TestTask1019)
runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite)

test_task_10 (__main__.TestTask1019) ... FAIL
test_task_11 (__main__.TestTask1019) ... FAIL
test_task_12 (__main__.TestTask1019) ... FAIL
test_task_13 (__main__.TestTask1019) ... FAIL
test_task_14 (__main__.TestTask1019) ... FAIL
test_task_15 (__main__.TestTask1019) ... ERROR
test_task_16 (__main__.TestTask1019) ... ERROR
test_task_17 (__main__.TestTask1019) ... FAIL
test_task_18 (__main__.TestTask1019) ... FAIL
test_task_19 (__main__.TestTask1019) ... FAIL

ERROR: test_task_15 (__main__.TestTask1019)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/var/folders/0b/r__z5mpn6ldgb_w2j7_y_ntr0000gn/T/ipykernel_30368/2026896047.py", line 20, in test_task_15
    self.assertTrue(output >= 26.2)
TypeError: '>=' not supported between instances of 'NoneType' and 'float'

ERROR: test_task_16 (__main__.TestTask1019)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/var

<unittest.runner.TextTestResult run=10 errors=2 failures=8>

## 資料結構

- 起：任務 20
- 迄：任務 39

## 什麼是資料結構

> 資料結構是電腦儲存、組織以及取得資料的機制，可以透過程式語言所提供的類別與自行定義類別實現，一個設計良好的資料結構，會在盡可能使用較少的時間與空間資源下，支援各種程式執行。

來源：<https://en.wikipedia.org/wiki/Data_structure>

## 為什麼需要資料結構

- 在資料科學家日常的工作任務中，資料處理佔有相當高的比例。
- 需要有一個機制能夠協助他們輸入、處理最後輸出資料。
- 這個「機制」就是**資料結構**。
- 適當地選擇資料結構，讓資料科學家能夠有效率地儲存與取得資料。
- 就像是將食物放置在冰箱、衣服放置在衣櫥、鞋子放置在鞋櫃。

## Python 內建的四個資料結構類別

1. `list`
2. `tuple`
3. `dict`(dictionary)
4. `set`

## `list`

- `list` 是一種「有序」且能夠「更新」的資料結構。
- `list` 可以透過「逗號」`,` 分隔值與「中括號」`[]` 形成。

In [43]:
primes = [2, 3, 5, 7, 11]
type(primes)

list

## 使用內建函數 `len()`  得知一個 `list` 中有幾個資料值

In [44]:
len(primes)

5

## 從一個 `list` 中取出資料的方式有兩種

1. **indexing** 指的是從一個 `list` 中取出特定位置的單個資料值。
2. **slicing** 指的是從一個 `list` 中擷取特定片段。

## indexing `[index]`

`list` 採用兩個方向的索引機制：

1. 由左至右：「從 0 開始」的索引機制。
2. 由右至左：「從 -1 開始」的索引機制。

In [45]:
print(primes[0])  # the first element
print(primes[1])  # the second element
print(primes[-1]) # the last element
print(primes[-2]) # the second last element

2
3
11
7


## slicing `[start:stop:step]`

除了可以取出特定位置的單個資料值，`list` 也支援擷取特定片段，藉此獲得一個較短長度 `list` 的語法。

- `start` 起始位置（包含）。
- `stop` 終止位置（排除）。
- `step` 間隔。

In [46]:
print(primes[0:3:1])            # slicing the first 3 elements
print(primes[-3:len(primes):1]) # slicing the last 3 elements 
print(primes[0:len(primes):2])  # slicing every second element

[2, 3, 5]
[5, 7, 11]
[2, 5, 11]


## slicing 如果沒有指定 `start:stop:step` 就採用預設值

- `start` 起始位置（包含）預設為 `0`。
- `stop` 終止位置（排除）預設為 `list` 的長度。
- `step` 間隔預設為 `1`。

In [47]:
print(primes[:3])  # slicing the first 3 elements
print(primes[-3:]) # slicing the last 3 elements 
print(primes[::2]) # slicing every second element

[2, 3, 5]
[5, 7, 11]
[2, 5, 11]


## `str` 也適用 indexing 與 slicing

In [48]:
luke_skywalker = "Luke Skywalker"
print(luke_skywalker[0])
print(luke_skywalker[-1])
print(luke_skywalker[:4])
print(luke_skywalker[5:])

L
r
Luke
Skywalker


## 更新 `list` 中的資料值

In [49]:
print(primes)   # before update
primes[-1] = 13 # update
print(primes)   # after update

[2, 3, 5, 7, 11]
[2, 3, 5, 7, 13]


## 也可以透過 `list` 的多種方法更新

- `list.append()`
- `list.pop()`
- `list.remove()`
- `list.insert()`
- `list.sort()`
- ...等。

## 查詢 `list` 方法的說明

In [50]:
help(primes.append)
#primes.append() # 在小括號中按 Shift - Tab 查詢方法的說明

Help on built-in function append:

append(object, /) method of builtins.list instance
    Append object to the end of the list.



## `list` 支援的運算符

- `+` 運算符：連接 lists
- `*` 運算符：複製 `list` 中的元素。

In [51]:
primes = [2, 3, 5, 7, 11]
primes_to_concatenate = [13, 17, 19, 23, 29]
primes + primes_to_concatenate

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]

In [52]:
print(primes * 2)
print(primes_to_concatenate * 3)

[2, 3, 5, 7, 11, 2, 3, 5, 7, 11]
[13, 17, 19, 23, 29, 13, 17, 19, 23, 29, 13, 17, 19, 23, 29]


## 在應用 `list` 的多種方法之前，先注意函數的兩種使用形式

1. 對物件應用函數，語法為 `function(object)`
2. 使用附屬於物件的函數，稱為使用物件的方法，語法為 `object.method()`

## 除了使用函數與方法的差異，也要留意物件更新的兩種方式

1. 將更新的結果回傳（Return），物件本身維持不變。
2. 更新物件本身並回傳 `None`

## 兩種更新方式的範例：排序一個 `list`

1. 使用內建函數 `sorted()` 採取將更新的結果回傳（Return），物件本身維持不變的更新方式。
2. 使用 `list.sort()` 採取更新物件本身並回傳 `None` 的更新方式。

In [53]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted_primes = sorted(unsorted_primes)
print(unsorted_primes)
print(sorted_primes)

[11, 5, 7, 2, 3]
[2, 3, 5, 7, 11]


In [54]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted_primes = unsorted_primes.sort()
print(unsorted_primes)
print(sorted_primes)

[2, 3, 5, 7, 11]
None


## 如何判斷兩種更新方式

- 詳細閱讀函數與方法的文件。
- 注意函數與方法使用後儲存格是否有 Out 顯示。

## 釐清兩種更新方式是至關重要的

- 雖然是利用 `list` 作為範例，但不管任何的資料或者資料結構都適用。
- 多數的函數更新機制都是回傳（Return），但並不是絕對。
- 不論函數或者方法，都要詳細閱讀文件或注意使用後儲存格是否有 Out 顯示。

## `tuple`

- `tuple` 是一種「有序」且「不能夠更新」的資料結構。
- `tuple` 可以透過「逗號」`,` 分隔值與「小括號」`()` 形成。

In [55]:
primes = (2, 3, 5, 7, 11)
type(primes)

tuple

## 使用內建函數 `len()`  得知一個 `tuple` 中有幾個資料值

In [56]:
len(primes)

5

## `tuple` 在許多地方的表現與 `list` 相同，像是 indexing 以及 slicing

In [57]:
print(primes[0])   # the first element
print(primes[:3])  # slicing the first 3 elements

2
(2, 3, 5)


## `tuple` 與 `list` 最大的不同點，在於 `tuple`「不能夠更新」的特性

- 以更新 `list` 的語法更新 `tuple` 會產生錯誤。
- `try…except…` 是例外處理的語法，之後會說明。

In [58]:
try:
    primes[-1] = 13
except TypeError as error_message:
    print(error_message)

'tuple' object does not support item assignment


## 在 Python 中有眾多的應用場景會遭遇到 `tuple`

- 自行定義函數預設「多個輸出」的資料結構。
- `dict.items()` 輸出。
- 函數的彈性參數 `*args`
- ...等。

## `dict`

- `dict` 是一種使用「鍵值對應」關係的資料結構。
- `dict` 可以透過「逗號」`,`、「鍵值對應」`key: value` 與「大括號」`{}` 形成。

In [59]:
the_shawshank_redemption = {
    "title": "The Shawshank Redemption",
    "year": 1995,
    "rating": 9.3,
    "director": "Frank Darabont"
}
type(the_shawshank_redemption)

dict

## 使用內建函數 `len()`  得知一個 `dict` 中有幾組鍵值對應

In [60]:
len(the_shawshank_redemption)

4

## `dict` 採用以「鍵」取「值」的索引機制

```python
dict["key"]
```

In [61]:
print(the_shawshank_redemption["title"])
print(the_shawshank_redemption["year"])
print(the_shawshank_redemption["rating"])
print(the_shawshank_redemption["director"])

The Shawshank Redemption
1995
9.3
Frank Darabont


## 用來檢視 `dict` 的三個方法

1. `dict.keys()` 檢視鍵。
2. `dict.values()` 檢視值。
3. `dict.items()` 檢視鍵值對應。

In [62]:
print(the_shawshank_redemption.keys())
print(the_shawshank_redemption.values())
print(the_shawshank_redemption.items())  # (key, value) as a tuple

dict_keys(['title', 'year', 'rating', 'director'])
dict_values(['The Shawshank Redemption', 1995, 9.3, 'Frank Darabont'])
dict_items([('title', 'The Shawshank Redemption'), ('year', 1995), ('rating', 9.3), ('director', 'Frank Darabont')])


## 新增 `dict` 中的鍵值對應

In [63]:
the_shawshank_redemption['lead_actors'] = ['Tim Robbins', 'Morgan Freeman']
the_shawshank_redemption

{'title': 'The Shawshank Redemption',
 'year': 1995,
 'rating': 9.3,
 'director': 'Frank Darabont',
 'lead_actors': ['Tim Robbins', 'Morgan Freeman']}

## 使用 `del` 保留字刪除 `dict` 中的鍵值對應

In [64]:
del the_shawshank_redemption['lead_actors']
the_shawshank_redemption

{'title': 'The Shawshank Redemption',
 'year': 1995,
 'rating': 9.3,
 'director': 'Frank Darabont'}

## 指定 `dict` 的「鍵」更新「值」

In [65]:
the_shawshank_redemption["year"] = 1994
the_shawshank_redemption

{'title': 'The Shawshank Redemption',
 'year': 1994,
 'rating': 9.3,
 'director': 'Frank Darabont'}

## `set`

- `set` 是一種「無序」、儲存「獨一值」並且能夠進行「集合運算」的資料結構。
- `set` 可以透過「逗號」`,` 分隔值與「大括號」`{}` 形成。

In [66]:
primes = {2, 3, 5, 7, 7}  # 7 is duplicated
odds = {1, 3, 5, 7, 9, 9} # 9 is duplicated
print(type(primes))
print(type(odds))

<class 'set'>
<class 'set'>


## 使用內建函數 `len()`  得知一個 `set` 中有幾個獨一值

In [67]:
print(len(primes))
print(primes)
print(len(odds))
print(odds)

4
{2, 3, 5, 7}
5
{1, 3, 5, 7, 9}


## `set` 重要的兩個特性

1. 不支援 indexing
2. 支援集合運算（Set operations）。

## `set` 不支援 indexing

In [68]:
try:
    primes[0]
except TypeError as error_message:
    print(error_message)

'set' object is not subscriptable


## `set` 支援集合運算

- 使用集合運算符（Set operators）。
- 使用 `set` 類別的方法。

## 常用的集合運算

- 交集。
- 聯集。
- 差集。
- 對稱差集。

## 使用 `&` 交集運算符或者 `set.intersection()` 方法

In [69]:
print(primes & odds)             # with an operator
print(primes.intersection(odds)) # equivalently with a method

{3, 5, 7}
{3, 5, 7}


## 使用 `|` 聯集運算符或者 `set.union()` 方法

In [70]:
print(primes | odds)      # with an operator
print(primes.union(odds)) # equivalently with a method

{1, 2, 3, 5, 7, 9}
{1, 2, 3, 5, 7, 9}


## 使用 `-` 差集運算符或者 `set.difference()` 方法

In [71]:
print(primes - odds)           # with an operator
print(primes.difference(odds)) # equivalently with a method
print(odds - primes)           # with an operator
print(odds.difference(primes)) # equivalently with a method

{2}
{2}
{1, 9}
{1, 9}


## 使用 `^` 對稱差集運算符或者 `set.symmetric_difference()` 方法

In [72]:
print(primes ^ odds)                      # with an operator
print(primes.symmetric_difference(odds))  # equivalently with a method

{1, 2, 9}
{1, 2, 9}


## 資料結構類別判斷的兩種方式

1. 將 `type()` 函數的輸出與資料結構類別名稱比較。
2. 透過內建函數 `isinstance()` 判斷。

## 資料結構類別可以透過內建函數 `isinstance()` 判斷

`isinstance(x, classinfo)` 函數判斷輸入物件 `x` 是否為某個資料結構類別的實例，其中 `classinfo` 參數輸入欲判斷的資料結構類別名稱。

## 資料結構類別可以透過與其同名的內建函數轉換

- `list()` 可以將輸入資料結構轉換為 `list`。
- `tuple()` 可以將輸入資料結構轉換為 `tuple`。
- `dict()` 可以將輸入資料結構轉換為 `dict`。
- `set()` 可以將輸入資料結構轉換為 `set`。

## 任務 21：`DataFrame` 是 Python 內建的資料結構類別

In [73]:
def task_21() -> bool:
    # 寫作
    return None
    # 寫作

## 任務 22：`list` 與 `tuple` 是兩種完全相同的資料結構類別

In [74]:
def task_22() -> bool:
    # 寫作
    return None
    # 寫作

## 任務 23：下列何者不屬於 Python 內建的資料結構類別？

1. `ndarray`
2. `list`
3. `dict`
4. `set`

In [75]:
def task_23() -> int:
    # 寫作
    return None
    # 寫作

## 任務 24：下列程式碼會印出什麼樣的結果？

```python
odds = [1, 3, 5, 7, 9]
print(odds[-2])
```

1. `[1, 3, 7, 9]`
2. `7`
3. `[7]`
4. `[7, 9]`

In [76]:
def task_24() -> int:
    # 寫作
    return None
    # 寫作

## 任務 25：下列程式碼會印出什麼樣的結果？

```python
odds = [3, 5, 1, 9, 7]
sorted(odds)
print(odds)
```

1. `[1, 3, 5, 7, 9]`
2. `[9, 7, 5, 3, 1]`
3. `[7, 9, 1, 5, 3]`
4. `[3, 5, 1, 9, 7]`

In [77]:
def task_25() -> int:
    # 寫作
    return None
    # 寫作

## 測試：任務 20-39

In [78]:
import unittest
# 測試
class TestTask2039(unittest.TestCase):
    def test_task_20(self):
        output = task_20()
        self.assertIsInstance(output, bool)
        self.assertFalse(output)
    def test_task_21(self):
        output = task_21()
        self.assertIsInstance(output, bool)
        self.assertFalse(output)
    def test_task_22(self):
        self.assertEqual(task_22(), 1)
    def test_task_23(self):
        self.assertEqual(task_23(), 2)
    def test_task_24(self):
        self.assertEqual(task_24(), 4)
    def test_task_25(self):
        output = task_15(42.195) # a full marathon
        self.assertTrue(output >= 26.2)
        output = task_15(21.095) # a half marathon
        self.assertTrue(output >= 13.1)
    def test_task_26(self):
        output = task_16(206, 113) # LeBron James
        self.assertTrue(output >= 26)
        output = task_16(211, 110) # Giannis Antetokounmpo
        self.assertTrue(output >= 24)
        output = task_16(201, 104) # Luka Doncic
        self.assertTrue(output >= 25)
    def test_task_27(self):
        self.assertEqual(task_17(1000), '1,000.00')
        self.assertEqual(task_17(10000), '10,000.00')
        self.assertEqual(task_17(100000), '100,000.00')
    def test_task_28(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
    def test_task_29(self):
        self.assertFalse(task_19(9))
        self.assertFalse(task_19(100))
        self.assertTrue(task_19(99))
        self.assertTrue(task_19(10))
    def test_task_28(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
    def test_task_28(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
    def test_task_28(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
    def test_task_28(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
    def test_task_28(self):
        self.assertFalse(task_18(-1))
        self.assertFalse(task_18(0))
        self.assertTrue(task_18(1))
suite = unittest.TestLoader().loadTestsFromTestCase(TestTask2039)
runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite)

test_task_20 (__main__.TestTask2039) ... ERROR
test_task_21 (__main__.TestTask2039) ... FAIL
test_task_22 (__main__.TestTask2039) ... FAIL
test_task_23 (__main__.TestTask2039) ... FAIL
test_task_24 (__main__.TestTask2039) ... FAIL
test_task_25 (__main__.TestTask2039) ... ERROR
test_task_26 (__main__.TestTask2039) ... ERROR
test_task_27 (__main__.TestTask2039) ... FAIL
test_task_28 (__main__.TestTask2039) ... FAIL
test_task_29 (__main__.TestTask2039) ... FAIL

ERROR: test_task_20 (__main__.TestTask2039)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/var/folders/0b/r__z5mpn6ldgb_w2j7_y_ntr0000gn/T/ipykernel_30368/531508529.py", line 5, in test_task_20
    output = task_20()
NameError: name 'task_20' is not defined

ERROR: test_task_25 (__main__.TestTask2039)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/var/folders/0b/r__z5mpn6ldgb_w2j7_y_ntr0000gn/T/ip

<unittest.runner.TextTestResult run=10 errors=3 failures=7>