# Python 資料科學學習手冊

> Python 程式設計

[數聚點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 什麼是程式設計

以程式語言來指定電腦來解決特定問題的過程，常見的問題包含數值計算、文字搜尋取代、圖像或音訊處理等，程式設計過程包含分析、設計、寫作、測試與除錯等軟體開發的重要步驟。

## 什麼是資料科學

資料科學是一門將資料（Data）提煉為資訊（Information）的學科，提煉過程中可能包含資料載入、資料操作、探索性分析以及監督式學習等。

## 現代資料科學：以程式設計做資料科學的應用

![](r-for-data-science.png)

來源：[R for Data Science](https://r4ds.had.co.nz)

## 關於 Python 的二三事

1. Python 的作者是荷蘭電腦科學家 Guido van Rossum
2. Python 的命名源於 Guido van Rossum 非常喜歡電視喜劇 Monty Python's Flying Circus
3. Python 的第一版釋出於 1991 年。

## 如何寫作與執行 Python 程式

## 先從已經設定妥善的環境起步

需要使用 Google 帳號登入、能夠儲存變更的 [Google Colab](https://colab.research.google.com/)

## Google Colab 快速入門

- 前往 [Google Colab](https://colab.research.google.com/) 新增筆記本（New notebook）。
- 登入 Google 帳戶。
- 調整介面為英文。
- 點選 `Connect` 連線取得算力（Computing power）。
- 點選 `+ Code` 增加程式碼儲存格。
- 點選 `+ Text` 增加文字儲存格。

## Google Colab 快速入門（續）

- 點選程式碼儲存格左側的「執行」按鈕執行該程式碼儲存格。
- 點選 Runtime -> Run all 執行 Google Colab 中所有的儲存格。

## 初登場的兩個 Python 程式

1. 哈囉世界。
2. Python 禪學（The Zen of Python）。

## 哈囉世界

- `print()` 是 Python 的內建函數，可以將小括號中的輸入印出。
- `"Hello, world!"` 是屬於 `str` 類別的字面值（Literal value）。

In [1]:
print("Hello, world!")

Hello, world!


## Python 禪學（The Zen of Python）

- `import` 是 Python 的保留字（Keywords），可以載入模組。
- `this` 是 Python 的一個標準模組，可以印出 Python 禪學。

In [2]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## 解析哈囉世界

## 哈囉世界

- 哈囉世界中的 `print()` 是什麼？
- 哈囉世界中的 `"Hello, world!"` 是什麼？

In [3]:
print("Hello, world!")

Hello, world!


## 哈囉世界中的 `print()` 是什麼

- `print()` 是 Python 的內建函數。
- 內建函數是不需要先行「定義」就可以使用的函數。

## 什麼是函數

一段被賦予名稱的程式碼，能夠完成某一個文字處理或者數值計算任務，在使用函數之前，必須先確定這個函數在執行的環境中已經被定義妥善。

## 函數有四個來源

1. 來自內建函數。
2. 來自標準模組。
3. 來自第三方模組。
4. 來自使用者的定義。

## 來自內建函數可以直接使用

- 哪些內建函數可以直接使用：<https://docs.python.org/3/library/functions.html>
- 使用方式為輸入資料或引數（Parameters）到函數名稱後的小括號。

In [4]:
abs(-55) # -55 as data

55

## 哈囉世界中的 `"Hello, world!"` 是什麼

- `"Hello, world!"` 是 `str` 類別的字面值（Literal value）。
- 除了 `str` 類別，字面值也可以是其他的資料或資料結構類別。
- 單純的字面值不太實用，更好的做法是以一個物件名稱去參照字面值！

In [5]:
hello_world = "Hello, world!"
hello_world

'Hello, world!'

## 如何說明 `hello_world = "Hello, world!"`

- `hello_world` 物件是 `str` 類別的實例（Instance）。
- 我們可以使用 `=` 符號讓 `object_name` 成為 `literal_value` 類別的實例，供後續的程式使用。

```python
object_name = literal_value
```

## 筆記本的顯示規則

- 會將程式儲存格最後一列的字面值、物件或函數輸出。
- 如果想要有多個輸出，必須明確地使用 `print()` 函數。

## 常見的筆記本使用習慣

- 如果程式儲存格只需要一個輸出，直接參照字面值、物件或函數。
- 如果程式儲存格需要多個輸出，全部都使用 `print()` 函數。

In [6]:
# Single output in a code cell
hello_world = "Hello, world!"
hello_world

'Hello, world!'

In [7]:
# Multiple outputs in a code cell
print(hello_world)
print(hello_world)
print(hello_world)

Hello, world!
Hello, world!
Hello, world!


## 物件與函數的命名規則

- 使用全小寫英文，採用蛇形命名法（Snake case），不同單字之間以底線 `_` 相隔。
- 不能使用保留字作命名。
- 使用單數名詞為資料類別的物件命名、使用複數名詞為資料結構類別的物件命名、使用動詞為函數或方法命名，盡量讓名稱簡潔且具有意義。
- 不要使用內建函數作物件的命名，避免覆蓋內建函數的功能。

來源：[PEP 8 -- Style Guide for Python Code](https://www.python.org/dev/peps/pep-0008/#function-and-variable-names)

## 什麼是保留字

- 保留字是具有特殊作用的指令。
- 目前有看過的 `import`、`def` 與 `return` 等都是 Python 的保留字。
- Python 的保留字一覽：<https://docs.python.org/3/reference/lexical_analysis.html#keywords>

## 有時候我們在程式碼之中會看到用來解釋的說明文字

- 註解（Comments）是口語化的文字敘述，以 `#` 標記，並不能夠被翻譯成電腦語言。
- 註解可以細分為單行註解、行末註解。

In [8]:
# A hello world example
hello_world = "Hello, world!" # hello_world is an instance of str class
hello_world                   # show hello_world object

'Hello, world!'

## 各司其職的資料類別

## 五種基礎資料類別

1. `int`(integer)
2. `float`
3. `str`(string)
4. `bool`(boolean)
5. `NoneType`

## 使用內建函數 `type()` 確認物件所參照的資料類別

我們通常都會用一個物件去參照字面值，而物件名稱或 `print()` 函數並不能反映資料類別。

In [9]:
favorite = "5566" # favorite boy group?
print(favorite)
favorite = 5566   # favorite number?
print(favorite)

5566
5566


In [10]:
my_lucky_number = 5566
full_marathon_distance_in_km = 42.195
my_favorite_boy_group = "5566"
print(type(my_lucky_number))
print(type(full_marathon_distance_in_km))
print(type(my_favorite_boy_group))

<class 'int'>
<class 'float'>
<class 'str'>


## 數值與數值運算符

## 數值

- `int`(integer)
- `float`

In [11]:
my_lucky_number = 5566
full_marathon_distance_in_km = 42.195
print(type(my_lucky_number))
print(type(full_marathon_distance_in_km))

<class 'int'>
<class 'float'>


## 數值運算符

- 直觀的加減乘除 `+`, `-`, `*`, `/`
- 次方 `**`
- 計算餘數 `%`
- 計算商數 `//`
- 優先運算 `()`

## 數值運算符的順位

1. 最高順位是優先運算 `()`
2. 第二順位是次方 `**`
3. 第三順位是計算餘數 `%` 計算商數 `//` 乘 `*` 以及除 `/`
4. 第四順位是加 `+` 減 `-`

## 科學計號 `e`

- 數值可以支援科學記號（Scientific notation）`e`
- 注意不要和自然對數函數的底數 $e = 2.71828...$ 搞混了。

In [12]:
print(3e0)
print(3e2)
print(3e-2)

3.0
300.0
0.03


## 文字與文字運算符

## 使用成對的單引號 `'`、雙引號 `"` 或三個雙引號 `"""` 形成 `str`

In [13]:
str_with_single_quotes = 'Hello, world!'
str_with_double_quotes = "Hello, world!"
str_with_triple_double_quotes = """Hello, world!"""
print(type(str_with_single_quotes))
print(type(str_with_double_quotes))
print(type(str_with_triple_double_quotes))

<class 'str'>
<class 'str'>
<class 'str'>


## `str` 中可能會包含單引號或雙引號，有兩種解決方式

1. 以反斜線 `\`（又稱跳脫符號）作為標註。
2. 以不同樣式的引號來形成 `str` 藉此區隔。

In [14]:
mcd = 'I\'m lovin\' it!'   # escape with \
mcd = "I'm lovin' it!"     # use different quotation marks
mcd = """I'm lovin' it!""" # use different quotation marks

## 善用成對的三個雙引號 `"""` 形成 `str`

- 常用來形成有換行、段落、有單引號以及有雙引號的文章或其他語言的程式碼。
- 放置在自行定義函數的主體第一列可以作為說明（Docstring）。
- 利用反斜線 `\` 讓程式碼在顯示換行但作用連續。

## 使用內建函數 `help()` 查詢函數的使用方法

In [15]:
help(abs)

Help on built-in function abs in module builtins:

abs(x, /)
    Return the absolute value of the argument.



## 使用筆記本寫程式可以在函數的小括號中按 `Shift - Tab` 查詢使用方法

In [16]:
#abs()
#pow()

## 將 `str` 放置在自行定義函數主體第一列可以作為說明（Docstring）

In [17]:
def power(x, n):
    return x**n

help(power)

Help on function power in module __main__:

power(x, n)



In [18]:
def power(x, n):
    """
    Equivalent to x**n.
    """
    return x**n

help(power)

Help on function power in module __main__:

power(x, n)
    Equivalent to x**n.



## 能對 `str` 使用的文字運算符

- 加號 `+` 能夠連接 `str`
- 乘號 `*` 能夠複製 `str` 出現次數。

In [19]:
m = """I'm"""
c = """ lovin'"""
d = """ it!"""
print(m + c + d)

I'm lovin' it!


In [20]:
mcd = m + c + d
print(mcd*3)

I'm lovin' it!I'm lovin' it!I'm lovin' it!


## 另一個 `str` 的重要技巧是特定顯示格式

- 具體來說是在 `str` 中嵌入物件，如此顯示的內容將隨著物件中所儲存的值而變動。
- 可以透過加號來操作，但是這個做法可讀性較低且無法指定顯示格式。

In [21]:
def say_hello_to_anyone(anyone):
    return "Hello, " + anyone + "!"

print(say_hello_to_anyone("world"))
print(say_hello_to_anyone("Python"))

Hello, world!
Hello, Python!


## 透過 `str.format()` 方法以及 f-string 語法搭配大括號 `{}` 指定顯示格式

```python
"{}".format(object_name) # str.format() 方法
f"{object_name}"         # f-string 語法
```

## 特定顯示格式的範例：`say_hello_to_anyone()` 函數

In [22]:
def say_hello_to_anyone(anyone):
    return "Hello, {}!".format(anyone) # str's format method

print(say_hello_to_anyone("world"))
print(say_hello_to_anyone("Python"))

Hello, world!
Hello, Python!


In [23]:
def say_hello_to_anyone(anyone):
    return f"Hello, {anyone}!" # f-string syntax

print(say_hello_to_anyone("world"))
print(say_hello_to_anyone("Python"))

Hello, world!
Hello, Python!


## 布林、關係運算符與邏輯運算符

## 什麼是 `bool`

布林（Boolean）是程式設計中用來表示邏輯的資料類別，以發明布林代數的數學家 George Boole 為名，它只有兩種值：假（`False`）和真（`True`），在程式設計與資料科學可以進行流程控制以及資料篩選。

## 有三種方式可以形成 `bool`

1. 直接使用保留字 `False` 或 `True`
2. 使用關係運算符。
3. 使用邏輯運算符。

## 直接使用保留字 `False` 或 `True`

In [24]:
bool_false = False
bool_true = True

print(bool_false)
print(bool_true)
print(type(bool_false))
print(type(bool_true))

False
True
<class 'bool'>
<class 'bool'>


## 使用關係運算符形成 `bool`

- 等於 `==`
- 不等於 `!=`
- 大於 `>` 小於 `<`
- 大於等於 `>=` 小於等於 `<=`
- 包含於 `in` 不包含於 `not in`

## 在關係運算符兩側放置物件或字面值形成 `bool` 稱為條件運算式（Conditional expression）

In [25]:
my_lucky_number = 5566
my_favorite_boy_group = "5566"

print(my_lucky_number == 5566)
print(my_lucky_number != 5566)
print(my_lucky_number > 5566)
print(my_lucky_number >= 5566)
print('56' in my_favorite_boy_group)
print('78' not in my_favorite_boy_group)

True
False
False
True
True
True


## 要將 `==` 以及 `=` 明確地區分出來

- `==` 是關係運算符，用來判斷符號兩側是否相等。
- `=` 是賦值運算符，用來讓左側的物件名稱成為右側類別的實例。

In [26]:
my_favorite_boy_group = "5566"
my_favorite_boy_group == 5566

False

## 使用邏輯運算符形成 `bool`

- 交集 `and`
- 聯集 `or`
- 非 `not`

## 非 `not` 運算符將 `bool` 反轉

In [27]:
bool_false = False
bool_true = True
print(not bool_false)
print(not bool_true)

True
False


## 邏輯運算符針對已經是 `bool` 的資料進行集合運算

- 在交集 `and` 運算符兩側必須都是 `True` 判斷結果才會是 `True`
- 在聯集 `or` 運算符兩側必須都是 `False` 判斷結果才會是 `False`

## 在交集 `and` 運算符兩側必須都是 `True` 判斷結果才會是 `True`

In [28]:
bool_false = False
bool_true = True
print(bool_true and bool_true)
print(bool_true and bool_false)
print(bool_false and bool_true)
print(bool_false and bool_false)

True
False
False
False


## 在聯集 `or` 運算符兩側必須都是 `False` 判斷結果才會是 `False`

In [29]:
bool_false = False
bool_true = True
print(bool_false or bool_false)
print(bool_true or bool_true)
print(bool_true or bool_false)
print(bool_false or bool_true)

False
True
True
True


## 未定義值 `NoneType`

## 什麼是 `NoneType`

- Python 表示未定義值、空值或者虛無值的特殊資料類別，只有一個值：`None`。
- `NoneType` 既不是 `False`。
- `NoneType` 也不是空的 `str` 類別 `''`。
- `NoneType` 也不是 `0`。

In [30]:
a_none_type = None
print(type(a_none_type))
print(a_none_type == None)
print(a_none_type == False)
print(a_none_type == '')
print(a_none_type == 0)

<class 'NoneType'>
True
False
False
False


## 如果在自行定義函數時沒有使用 `return`，函數將輸出 `NoneType`

In [31]:
def convert_fahrenheit_to_celsius(fahrenheit):
    celsius = (fahrenheit - 32) * 5/9
    print(celsius) # Instead of return celsius, we just print celsius.
    
function_output = convert_fahrenheit_to_celsius(212)
print(function_output)
print(type(function_output))

100.0
None
<class 'NoneType'>


## 關於資料結構

## 什麼是資料結構

> 資料結構是電腦儲存、組織以及取得資料的機制，可以透過程式語言所提供的類別與自行定義類別實現，一個設計良好的資料結構，會在盡可能使用較少的時間與空間資源下，支援各種程式執行。

來源：<https://en.wikipedia.org/wiki/Data_structure>

## 為什麼需要資料結構

- 在資料科學家日常的工作任務中，資料處理佔有相當高的比例。
- 需要有一個機制能夠協助他們輸入、處理最後輸出資料。
- 這個「機制」就是**資料結構**。
- 適當地選擇資料結構，讓資料科學家能夠有效率地儲存與取得資料。
- 就像是將食物放置在冰箱、衣服放置在衣櫥、鞋子放置在鞋櫃。

## Python 內建的四個資料結構類別

1. `list`
2. `tuple`
3. `dict`(dictionary)
4. `set`

## 基礎的 `list` 類別

## `list`

- `list` 是一種「有序」且能夠「更新」的資料結構。
- `list` 可以透過「逗號」`,` 分隔值與「中括號」`[]` 形成。

## 命名物件作為 `list` 類別的實例

In [32]:
primes = [2, 3, 5, 7, 11]
type(primes)

list

## 使用內建函數 `len()`  得知一個 `list` 中有幾個資料值

In [33]:
len(primes)

5

## 從一個 `list` 中取出資料的方式有兩種

1. **indexing** 指的是從一個 `list` 中取出特定位置的單個資料值。
2. **slicing** 指的是從一個 `list` 中擷取特定片段。

## indexing `[index]`

`list` 採用兩個方向的索引機制：

1. 由左至右：「從 0 開始」的索引機制。
2. 由右至左：「從 -1 開始」的索引機制。

In [34]:
print(primes[0])  # the first element
print(primes[1])  # the second element
print(primes[-1]) # the last element
print(primes[-2]) # the second last element

2
3
11
7


## slicing `[start:stop:step]`

除了可以取出特定位置的單個資料值，`list` 也支援擷取特定片段，藉此獲得一個較短長度 `list` 的語法。

- `start` 起始位置（包含）。
- `stop` 終止位置（排除）。
- `step` 間隔。

In [35]:
print(primes[0:3:1])            # slicing the first 3 elements
print(primes[-3:len(primes):1]) # slicing the last 3 elements 
print(primes[0:len(primes):2])  # slicing every second element

[2, 3, 5]
[5, 7, 11]
[2, 5, 11]


## slicing 如果沒有指定 `start:stop:step` 就採用預設值

- `start` 起始位置（包含）預設為 `0`。
- `stop` 終止位置（排除）預設為 `list` 的長度。
- `step` 間隔預設為 `1`。

In [36]:
print(primes[:3])  # slicing the first 3 elements
print(primes[-3:]) # slicing the last 3 elements 
print(primes[::2]) # slicing every second element

[2, 3, 5]
[5, 7, 11]
[2, 5, 11]


## `str` 也適用 indexing 與 slicing

In [37]:
luke_skywalker = "Luke Skywalker"
print(luke_skywalker[0])
print(luke_skywalker[-1])
print(luke_skywalker[:4])
print(luke_skywalker[5:])

L
r
Luke
Skywalker


## 更新 `list` 中的資料值

In [38]:
print(primes)   # before update
primes[-1] = 13 # update
print(primes)   # after update

[2, 3, 5, 7, 11]
[2, 3, 5, 7, 13]


## 也可以透過 `list` 的多種方法更新

- `list.append()`
- `list.pop()`
- `list.remove()`
- `list.insert()`
- `list.sort()`
- ...等。

## `list` 支援的運算符

- `+` 運算符：連接 lists
- `*` 運算符：複製 `list` 中的元素。

In [39]:
primes = [2, 3, 5, 7, 11]
primes_to_concatenate = [13, 17, 19, 23, 29]
primes + primes_to_concatenate

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]

In [40]:
print(primes * 2)
print(primes_to_concatenate * 3)

[2, 3, 5, 7, 11, 2, 3, 5, 7, 11]
[13, 17, 19, 23, 29, 13, 17, 19, 23, 29, 13, 17, 19, 23, 29]


## 兩種函數的使用形式

## 在應用 `list` 的多種方法之前，先注意函數的兩種使用形式

1. 對物件應用函數，語法為 `function(object)`
2. 使用附屬於物件的函數，稱為使用物件的方法，語法為 `object.method()`

## 除了使用函數與方法的差異，也要留意物件更新的兩種方式

1. 將更新的結果回傳（Return），物件本身維持不變。
2. 更新物件本身並回傳 `None`

## 兩種更新方式的範例：排序一個 `list`

1. 使用內建函數 `sorted()` 採取將更新的結果回傳（Return），物件本身維持不變的更新方式。
2. 使用 `list.sort()` 採取更新物件本身並回傳 `None` 的更新方式。

In [41]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted_primes = sorted(unsorted_primes)
print(unsorted_primes)
print(sorted_primes)

[11, 5, 7, 2, 3]
[2, 3, 5, 7, 11]


In [42]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted_primes = unsorted_primes.sort()
print(unsorted_primes)
print(sorted_primes)

[2, 3, 5, 7, 11]
None


## 如何判斷兩種更新方式

- 詳細閱讀函數與方法的文件。
- 注意函數與方法使用後儲存格是否有 Out 顯示。

## 詳細閱讀函數與方法的說明

內建函數 `sorted()`：**Return** a new list containing all items from the iterable in ascending order.

In [43]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



## 詳細閱讀函數與方法的說明（續）

`list.sort()`：Sort the list in ascending order and **return None**.

In [44]:
help(unsorted_primes.sort)

Help on built-in function sort:

sort(*, key=None, reverse=False) method of builtins.list instance
    Sort the list in ascending order and return None.
    
    The sort is in-place (i.e. the list itself is modified) and stable (i.e. the
    order of two equal elements is maintained).
    
    If a key function is given, apply it once to each list item and sort them,
    ascending or descending, according to their function values.
    
    The reverse flag can be set to sort in descending order.



## 注意函數與方法使用後儲存格是否有 Out 顯示

In [45]:
unsorted_primes = [11, 5, 7, 2, 3]
sorted(unsorted_primes)

[2, 3, 5, 7, 11]

In [46]:
unsorted_primes.sort()

## 兩種更新方式並不一定是「擇一」也可能都有

In [47]:
primes = [2, 3, 5, 7, 11]
the_last_element = primes.pop()
print(primes)
print(the_last_element)

[2, 3, 5, 7]
11


## 釐清兩種更新方式是至關重要的

- 雖然是利用 `list` 作為範例，但不管任何的資料或者資料結構都適用。
- 多數的函數更新機制都是回傳（Return），但並不是絕對。
- 不論函數或者方法，都要詳細閱讀文件或注意使用後儲存格是否有 Out 顯示。

## 不能更新資料的 `tuple` 類別

## `tuple`

- `tuple` 是一種「有序」且「不能夠更新」的資料結構。
- `tuple` 可以透過「逗號」`,` 分隔值與「小括號」`()` 形成。

## 命名物件作為 `tuple` 類別的實例

In [48]:
primes = (2, 3, 5, 7, 11)
type(primes)

tuple

## 使用內建函數 `len()`  得知一個 `tuple` 中有幾個資料值

In [49]:
len(primes)

5

## `tuple` 在許多地方的表現與 `list` 相同，像是 indexing 以及 slicing

In [50]:
print(primes[0])   # the first element
print(primes[:3])  # slicing the first 3 elements

2
(2, 3, 5)


## `tuple` 與 `list` 最大的不同點，在於 `tuple`「不能夠更新」的特性

- 以更新 `list` 的語法更新 `tuple` 會產生錯誤。
- `try…except…` 是例外處理的語法，之後在「使用流程控制管理程式區塊的執行」章節會說明。

In [51]:
try:
    primes[-1] = 13
except TypeError as error_message:
    print(error_message)

'tuple' object does not support item assignment


## 在 Python 中有眾多的應用場景會遭遇到 `tuple`

- 自行定義函數預設「多個輸出」的資料結構。
- `dict.items()` 輸出。
- 函數的彈性參數 `*args`
- ...等。

## 以「鍵」查找「值」的 `dict` 類別

## `dict`

- `dict` 是一種使用「鍵值對應」關係的資料結構。
- `dict` 可以透過「逗號」`,`、「鍵值對應」`key: value` 與「大括號」`{}` 形成。

In [52]:
the_shawshank_redemption = {
    "title": "The Shawshank Redemption",
    "year": 1995,
    "rating": 9.3,
    "director": "Frank Darabont"
}
type(the_shawshank_redemption)

dict

## 使用內建函數 `len()`  得知一個 `dict` 中有幾組鍵值對應

In [53]:
len(the_shawshank_redemption)

4

## `dict` 採用以「鍵」取「值」的索引機制

```python
dict["key"]
```

In [54]:
print(the_shawshank_redemption["title"])
print(the_shawshank_redemption["year"])
print(the_shawshank_redemption["rating"])
print(the_shawshank_redemption["director"])

The Shawshank Redemption
1995
9.3
Frank Darabont


## 用來檢視 `dict` 的三個方法

1. `dict.keys()` 檢視鍵。
2. `dict.values()` 檢視值。
3. `dict.items()` 檢視鍵值對應。

In [55]:
print(the_shawshank_redemption.keys())
print(the_shawshank_redemption.values())
print(the_shawshank_redemption.items())  # (key, value) as a tuple

dict_keys(['title', 'year', 'rating', 'director'])
dict_values(['The Shawshank Redemption', 1995, 9.3, 'Frank Darabont'])
dict_items([('title', 'The Shawshank Redemption'), ('year', 1995), ('rating', 9.3), ('director', 'Frank Darabont')])


## 新增 `dict` 中的鍵值對應

In [56]:
the_shawshank_redemption['lead_actors'] = ['Tim Robbins', 'Morgan Freeman']
the_shawshank_redemption

{'title': 'The Shawshank Redemption',
 'year': 1995,
 'rating': 9.3,
 'director': 'Frank Darabont',
 'lead_actors': ['Tim Robbins', 'Morgan Freeman']}

## 使用 `del` 保留字刪除 `dict` 中的鍵值對應

In [57]:
del the_shawshank_redemption['lead_actors']
the_shawshank_redemption

{'title': 'The Shawshank Redemption',
 'year': 1995,
 'rating': 9.3,
 'director': 'Frank Darabont'}

## 使用 `dict.pop(key)` 方法指定「鍵」將「值」拋出

In [58]:
the_shawshank_redemption.pop("director")

'Frank Darabont'

## 指定 `dict` 的「鍵」更新「值」

In [59]:
the_shawshank_redemption["year"] = 1994
the_shawshank_redemption

{'title': 'The Shawshank Redemption', 'year': 1994, 'rating': 9.3}

## 能做集合運算的 `set` 類別

## `set`

- `set` 是一種「無序」、儲存「獨一值」並且能夠進行「集合運算」的資料結構。
- `set` 可以透過「逗號」`,` 分隔值與「大括號」`{}` 形成。

In [60]:
primes = {2, 3, 5, 7, 7}  # 7 is duplicated
odds = {1, 3, 5, 7, 9, 9} # 9 is duplicated
print(type(primes))
print(type(odds))

<class 'set'>
<class 'set'>


## 使用內建函數 `len()`  得知一個 `set` 中有幾個獨一值

In [61]:
print(len(primes))
print(primes)
print(len(odds))
print(odds)

4
{2, 3, 5, 7}
5
{1, 3, 5, 7, 9}


## `set` 重要的兩個特性

1. 不支援 indexing
2. 支援集合運算（Set operations）。

## `set` 不支援 indexing

In [62]:
try:
    primes[0]
except TypeError as error_message:
    print(error_message)

'set' object is not subscriptable


## `set` 支援集合運算

- 使用集合運算符（Set operators）。
- 使用 `set` 類別的方法。

## 常用的集合運算

- 交集。
- 聯集。
- 差集。
- 對稱差集。

## 使用 `&` 交集運算符或者 `set.intersection()` 方法

In [63]:
print(primes & odds)             # with an operator
print(primes.intersection(odds)) # equivalently with a method

{3, 5, 7}
{3, 5, 7}


## 使用 `|` 聯集運算符或者 `set.union()` 方法

In [64]:
print(primes | odds)      # with an operator
print(primes.union(odds)) # equivalently with a method

{1, 2, 3, 5, 7, 9}
{1, 2, 3, 5, 7, 9}


## 使用 `-` 差集運算符或者 `set.difference()` 方法

In [65]:
print(primes - odds)           # with an operator
print(primes.difference(odds)) # equivalently with a method
print(odds - primes)           # with an operator
print(odds.difference(primes)) # equivalently with a method

{2}
{2}
{1, 9}
{1, 9}


## 使用 `^` 對稱差集運算符或者 `set.symmetric_difference()` 方法

In [66]:
print(primes ^ odds)                      # with an operator
print(primes.symmetric_difference(odds))  # equivalently with a method

{1, 2, 9}
{1, 2, 9}


## 總結三種括號的應用場景

## 截至目前為止，我們已經看過了三種括號的應用場景

1. 小括號 `()`
2. 中括號 `[]`
3. 大括號 `{}`

## 小括號 `()` 的應用場景

- 對物件應用函數：`function(object)`
- 運算的優先順序。
- 使用物件的方法：`object.method()`
- 形成 `tuple` 資料結構類別。

## 中括號 `[]` 的應用場景

- 形成 `list` 資料結構類別。
- 從不同資料結構類別 indexing/slicing 資料。

## 大括號 `{}` 的應用場景

- 與 `str.format()` 以及 f-string 語法搭配。
- 形成 `dict` 資料結構類別。
- 形成 `set` 資料結構類別。

## Python 資料結構類別具備有威力的「複合性」

複合性指的是資料結構類別中能夠包含異質的資料類別以及不同的資料結構類別，在資料處理上相當有優勢。

- 資料類別：`int`/`float`/`str`/`bool`/`NoneType`
- 資料結構類別：`list`/`tuple`/`dict`/`set` 

## 關於流程控制

## 什麼是流程控制

多數程式語言都會從程式碼的第一列開始按照列（Row-wise）的順序往下讀取並且執行，但是在某些情況下，我們會希望依據特定的條件來決定程式的執行與否、重複次數以及錯誤發生時該如何應對，這時就可以透過流程控制的結構機制來滿足這些情況。

## 我們將要學習的流程控制

- 條件敘述。
- 迴圈。
- 例外處理。

## 認識程式區塊

## 什麼是程式區塊

> 程式區塊（Code block）有時也被稱為複合語句，是將程式組合並產生依附關係的結構，由一個或多個敘述所組成。

來源：<https://en.wikipedia.org/wiki/Block_(programming)>

## Python 使用四個空白作為縮排（Indentation）標註程式區塊

- 多數程式語言使用大括號 `{}` 來標註程式碼所依附的特定保留字。
- 一段程式碼的依附關係從縮排開始直到第一個未縮排的結束。
- 縮排必須隨著依附保留字的數量而增加。

## 什麼時候需要用到程式區塊

- 流程控制。
- 定義函數與類別。

## 決定程式區塊是否被執行的條件敘述

## 什麼是條件敘述

> 條件敘述是依指定運算的結果為 `False` 或 `True`，來決定是否執行一段程式區塊。

來源：https://en.wikipedia.org/wiki/Conditional_(computer_programming)

## 使用「條件」與「縮排」建立條件敘述

- 條件指的是一段能夠被解讀為 `bool` 的敘述。
- 縮排是 Python 用來辨識程式碼依附區塊的結構，要特別留意。

## 使用 `if` 依據條件決定是否執行程式區塊

```python
if 條件:
    # 依附 if 敘述的程式區塊。
    # 當條件為 True 的時候程式區塊才會被執行。
```

## 使用關係運算符或者邏輯運算符描述條件

- 關係運算符：`==`, `!=`, `>`, `<`, `>=`, `<=`, `in`, `not in`
- 邏輯運算符：`and`, `or`, `not`

In [67]:
def return_message_if_positive(x):
    if x > 0:
        return f"{x} is positive."

print(return_message_if_positive(56))
print(return_message_if_positive(-56))
print(return_message_if_positive(0))

56 is positive.
None
None


## 使用 `if...else...` 依據條件決定執行兩個程式區塊其中的一個

```python
if 條件:
    # 依附 if 敘述的程式區塊。
    # 當條件為 True 的時候會被執行。
else:
    # 依附 else 敘述的程式區塊。
    # 當條件為 False 的時候會被執行。
```

In [68]:
def return_message_whether_positive_or_not(x):
    if x > 0:
        return f"{x} is positive."
    else:
        return f"{x} is not positive."

print(return_message_whether_positive_or_not(56))
print(return_message_whether_positive_or_not(0))
print(return_message_whether_positive_or_not(-56))

56 is positive.
0 is not positive.
-56 is not positive.


## 使用 `if...elif...else...` 依據條件決定執行多個程式區塊其中的一個

```python
if 條件一:
    # 依附 if 敘述的程式區塊。
    # 當條件一為 True 的時候會被執行。
elif 條件二:
    # 依附 elif 敘述的程式區塊。
    # 當條件一為 False 、條件二為 True 的時候會被執行。
else:
    # 依附 else 敘述的程式區塊。
    # 當條件一、條件二均為 False 的時候會被執行。
```

In [69]:
def return_message_whether_positive_negative_or_neutral(x):
    if x > 0:
        return f"{x} is positive."
    elif x < 0:
        return f"{x} is negative."
    else:
        return f"{x} is neutral."

print(return_message_whether_positive_negative_or_neutral(56))
print(return_message_whether_positive_negative_or_neutral(-56))
print(return_message_whether_positive_negative_or_neutral(0))

56 is positive.
-56 is negative.
0 is neutral.


## 使用 `if...elif...` 把所有的條件都寫清楚

不一定非要加入 `else`

In [70]:
def return_message_whether_positive_negative_or_neutral(x):
    if x > 0:
        return f"{x} is positive."
    elif x < 0:
        return f"{x} is negative."
    elif x == 0:
        return f"{x} is neutral."

print(return_message_whether_positive_negative_or_neutral(56))
print(return_message_whether_positive_negative_or_neutral(-56))
print(return_message_whether_positive_negative_or_neutral(0))

56 is positive.
-56 is negative.
0 is neutral.


## 一組條件敘述的結構僅會執行「其中一個」程式區塊

- 如果條件彼此之間**互斥**，寫作條件的先後順序**沒有**影響。
- 如果條件彼此之間**非互斥**，寫作條件的先後順序**有**影響。

## 以自行定義的 `return_message_whether_positive_negative_or_neutral()` 函數為例

- 我們將條件一 `x > 0` 更改為 `x >= 0` 讓條件一與條件三**非互斥**
- 我們將條件二 `x < 0` 更改為 `x <= 0` 讓條件二與條件三**非互斥**

## 維持原本寫作條件的先後順序

輸入零使得條件一為 `True`，因為一組條件敘述的結構僅會執行「其中一個」程式區塊的特性，條件三以及它的程式區塊將永遠沒有派上用場的機會。

In [71]:
def return_message_whether_positive_negative_or_neutral(x):
    if x >= 0:
        return f"{x} is positive."
    elif x <= 0:
        return f"{x} is negative."
    elif x == 0:
        return f"{x} is neutral."

print(return_message_whether_positive_negative_or_neutral(0))

0 is positive.


## 調整寫作條件的先後順序

將條件三與條件一的順序互換，這時函數的運作才會跟原本條件彼此之間**互斥**時相同。

In [72]:
def return_message_whether_positive_negative_or_neutral(x):
    if x == 0:   
        return f"{x} is neutral."
    elif x <= 0:
        return f"{x} is negative."
    elif x >= 0:
        return f"{x} is positive."

print(return_message_whether_positive_negative_or_neutral(0))

0 is neutral.


## 讓程式區塊被重複執行的迴圈

## 什麼是迴圈

> 迴圈是流程控制的其中一種技巧，可以讓寫作一次的程式區塊被重複執行，常見的應用是重複執行直到條件不成立時或走訪可迭代類別中的所有元素。

來源：<https://en.wikipedia.org/wiki/Control_flow#Loops>

## 迴圈的三個要素

1. 起始。
2. 終止。
3. 如何從起始到終止。

## 兩種常見的迴圈

1. `while` 迴圈：重複執行程式區塊直到條件為 `False` 的時候。
2. `for` 迴圈：走訪可迭代類別中的所有元素。

## 使用 `while` 依據條件決定是否重複執行程式區塊

```python
while 條件:
    # 依附 while 敘述的程式區塊。
    # 當條件為 True 的時候程式區塊會被重複執行。
    # 當條件為 False 的時候停止執行程式區塊。
```

## 使用關係運算符或者邏輯運算符描述條件

- 關係運算符：`==`, `!=`, `>`, `<`, `>=`, `<=`, `in`, `not in`
- 邏輯運算符：`and`, `or`, `not`

## 如何寫作一個 `while` 迴圈

- 在迴圈程式區塊之前定義一個物件設定起始值。
- 設計條件讓程式區塊重複執行的次數符合我們的需求。
- 記得在程式區塊中更新物件的值。

## 如何寫作一個 `while` 迴圈：印出 5 次 `"Hello, world!"`

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=number_of_prints%20%3D%200%0Awhile%20number_of_prints%20%3C%205%3A%0A%20%20%20%20print%28%22Hello,%20world!%22%29%0A%20%20%20%20number_of_prints%20%3D%20number_of_prints%20%2B%201&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [73]:
number_of_prints = 0
while number_of_prints < 5:
    print("Hello, world!")
    number_of_prints = number_of_prints + 1

Hello, world!
Hello, world!
Hello, world!
Hello, world!
Hello, world!


## 在程式區塊中更新物件的值更常會使用複合運算符（Compound operators）

- `integer += 1` 等同於 `integer = integer + 1` 
- `integer -= 1` 等同於 `integer = integer - 1` 
- `integer *= 1` 等同於 `integer = integer * 1` 
- `integer /= 1` 等同於 `integer = integer / 1` 
- ...等。

## 如何寫作一個 `while` 迴圈：印出小於 10 的奇數

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=odd%20%3D%201%0Awhile%20odd%20%3C%2010%3A%0A%20%20%20%20print%28odd%29%0A%20%20%20%20odd%20%2B%3D%202%20%23%20odd%20%3D%20odd%20%2B%202&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [74]:
odd = 1
while odd < 10:
    print(odd)
    odd += 2 # odd = odd + 2

1
3
5
7
9


## 如何寫作一個 `while` 迴圈：從週一印到週五

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=weekdays%20%3D%20%5B%22Monday%22,%20%22Tuesday%22,%20%22Wednesday%22,%20%22Thursday%22,%20%22Friday%22%5D%0Aindex%20%3D%200%0Awhile%20index%20%3C%20len%28weekdays%29%3A%0A%20%20%20%20print%28weekdays%5Bindex%5D%29%0A%20%20%20%20index%20%2B%3D%201&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [75]:
weekdays = ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday"]
index = 0
while index < len(weekdays):
    print(weekdays[index])
    index += 1

Monday
Tuesday
Wednesday
Thursday
Friday


## 使用 `for` 走訪可迭代類別（Iterables）中的所有元素

```python
for 元素 in 可迭代類別:
    # 依附 for 敘述的程式區塊。
    # 當可迭代類別還沒有走訪完的時候程式區塊會被重複執行。
    # 當可迭代類別走訪完的時候停止執行程式區塊。
```

## 什麼是可迭代類別

具有一次回傳其中一個資料值特性的類別、輸入到內建函數 `iter()` 不會產生錯誤的類別，都屬於可迭代類別（Iterables），常見的有 `str` 與資料結構。

- 資料類別：`str`
- 資料結構類別：`list`、`tuple`、`dict`、`set`

In [76]:
luke = "Luke Skywalker"
primes = [2, 3, 5, 7, 11]
iter(luke)
iter(primes)

<list_iterator at 0x7fc65ecdcca0>

## 什麼是不可迭代的類別

任何輸入到內建函數 `iter()` 會產生錯誤的類別都是不可迭代類別，像是 `int`、`float` 與 `bool` 等。

In [77]:
i_am_int = 5566
try:
    iter(i_am_int)
except TypeError as error_message:
    print(error_message)

'int' object is not iterable


In [78]:
i_am_float = 5566.0
try:
    iter(i_am_float)
except TypeError as error_message:
    print(error_message)

'float' object is not iterable


In [79]:
i_am_bool = False
try:
    iter(i_am_bool)
except TypeError as error_message:
    print(error_message)

'bool' object is not iterable


## 如何寫作一個 `for` 迴圈

- 建立一個可迭代類別。
- 可迭代類別如果是數列，可透過內建函數 `range()` 建立。

## `range()` 函數有三個參數可以設定數列內容

1. `start` 數列的起始整數，即第 0 個整數（包含），預設值為 0。
2. `stop` 數列的終止整數，即第 -1 個整數（排除）。
3. `step` 數列的公差，預設值為 1。

In [80]:
help(range)

Help on class range in module builtins:

class range(object)
 |  range(stop) -> range object
 |  range(start, stop[, step]) -> range object
 |  
 |  Return an object that produces a sequence of integers from start (inclusive)
 |  to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
 |  start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
 |  These are exactly the valid indices for a list of 4 elements.
 |  When step is given, it specifies the increment (or decrement).
 |  
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      True if self else False
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash

## 如何寫作一個 `for` 迴圈：印出 5 次 `"Hello, world!"`

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=for%20element%20in%20range%280,%205,%201%29%3A%0A%20%20%20%20print%28%22Hello,%20world!%22%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [81]:
for element in range(0, 5, 1):
    print("Hello, world!")

Hello, world!
Hello, world!
Hello, world!
Hello, world!
Hello, world!


## 如何寫作一個 `for` 迴圈：印出小於 10 的奇數

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=for%20odd%20in%20range%281,%2010,%202%29%3A%0A%20%20%20%20print%28odd%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [82]:
for odd in range(1, 10, 2):
    print(odd)

1
3
5
7
9


## 如何寫作一個 `for` 迴圈：從週一印到週五

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=weekdays%20%3D%20%5B%22Monday%22,%20%22Tuesday%22,%20%22Wednesday%22,%20%22Thursday%22,%20%22Friday%22%5D%0Afor%20weekday%20in%20weekdays%3A%0A%20%20%20%20print%28weekday%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [83]:
weekdays = ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday"]
for weekday in weekdays:
    print(weekday)

Monday
Tuesday
Wednesday
Thursday
Friday


## 如何抉擇使用哪種迴圈，`for` 迴圈或 `while` 迴圈

- 先思考問題是否能夠建立可迭代類別？
- 如果可以，代表程式區塊被重複執行的次數**已知**，選擇 `for` 迴圈。
- 如果不可以，代表程式區塊被重複執行的次數**未知**，選擇 `while` 迴圈。

## 常見的迴圈應用

- 走訪 `str` 或資料結構。
- 可迭代類別的加總、乘積與計數。
- 合併資料成為 `str`、`list` 或者 `dict`。

## 走訪 `str` 或資料結構

1. 走訪 `str`、`list`、`tuple`、`set`
2. 走訪 `dict`

## 如何走訪 `str`、`list`、`tuple`、`set`

In [84]:
def iterate_str_list_tuple_set(an_iterable):
    for element in an_iterable:
        print(element)
        
luke = "Luke Skywalker"
weekdays_list = ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday"]
weekdays_tuple = tuple(weekdays_list)
weekdays_set = set(weekdays_list)

In [85]:
iterate_str_list_tuple_set(luke) # iterate over a str

L
u
k
e
 
S
k
y
w
a
l
k
e
r


In [86]:
iterate_str_list_tuple_set(weekdays_list)  # iterate over a list

Monday
Tuesday
Wednesday
Thursday
Friday


In [87]:
iterate_str_list_tuple_set(weekdays_tuple) # iterate over a tuple

Monday
Tuesday
Wednesday
Thursday
Friday


In [88]:
iterate_str_list_tuple_set(weekdays_set)   # iterate over a set

Monday
Friday
Thursday
Tuesday
Wednesday


## 如何走訪 `dict`

善用三個 `dict` 方法：

1. `dict.keys()`
2. `dict.values()`
3. `dict.items()`

In [89]:
the_shawshank_redemption = {
    'title': 'The Shawshank Redemption',
    'year': 1994,
    'rating': 9.3,
    'director': 'Frank Darabont'
}
type(the_shawshank_redemption)

dict

## 預設走訪 `dict` 的「鍵」

In [90]:
for key in the_shawshank_redemption:
    print(key)

title
year
rating
director


In [91]:
for k in the_shawshank_redemption.keys():
    print(k)

title
year
rating
director


## 指定走訪 `dict` 的「值」

In [92]:
for value in the_shawshank_redemption.values():
    print(value)

The Shawshank Redemption
1994
9.3
Frank Darabont


## 同時走訪 `dict` 的「鍵」與「值」

In [93]:
dict_items = the_shawshank_redemption.items()
print(dict_items)
for key, value in dict_items:
    print(f"{key}: {value}")

dict_items([('title', 'The Shawshank Redemption'), ('year', 1994), ('rating', 9.3), ('director', 'Frank Darabont')])
title: The Shawshank Redemption
year: 1994
rating: 9.3
director: Frank Darabont


## 可迭代類別的加總、乘積與計數

- 在迴圈程式區塊之前定義一個物件設定起始值。
- 在程式區塊中更新物件的值。

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=summation%20%3D%200%0Aproduct%20%3D%201%0Acount%20%3D%200%0Aprimes%20%3D%20%5B2,%203,%205,%207,%2011%5D%0Afor%20prime%20in%20primes%3A%0A%20%20%20%20summation%20%2B%3D%20prime%0A%20%20%20%20product%20*%3D%20prime%0A%20%20%20%20count%20%2B%3D%201%0Aprint%28summation%29%0Aprint%28product%29%0Aprint%28count%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [94]:
summation = 0
product = 1
count = 0
primes = [2, 3, 5, 7, 11]
for prime in primes:
    summation += prime
    product *= prime
    count += 1
print(summation)
print(product)
print(count)

28
2310
5


## 可迭代類別的加總與計數

善用內建函數 `sum()` 以及 `len()` 就可以得知加總與計數。

In [95]:
print(sum(primes))
print(len(primes))

28
5


## 合併資料成為 `str`、`list` 或者 `dict`

- 運用 `+` 運算符連接元素成為 `str`
- 運用 `+` 運算符連接 lists
- 運用 `list.append()` 方法合併元素成為 `list`
- 運用 `dict[key]=value` 合併元素成為 `dict`

## 運用 `+` 運算符連接元素成為 `str`

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=vowels%20%3D%20%5B%22a%22,%20%22e%22,%20%22i%22,%20%22o%22,%20%22u%22,%20%22A%22,%20%22E%22,%20%22I%22,%20%22O%22,%20%22U%22%5D%0Avowels_str%20%3D%20str%28%29%20%23%20an%20empty%20str%0Afor%20vowel%20in%20vowels%3A%0A%20%20%20%20vowels_str%20%2B%3D%20vowel%0Aprint%28vowels_str%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [96]:
vowels = ["a", "e", "i", "o", "u", "A", "E", "I", "O", "U"]
vowels_str = str() # an empty str
for vowel in vowels:
    vowels_str += vowel
print(vowels_str)

aeiouAEIOU


## 運用 `+` 運算符連接 lists

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=vowels%20%3D%20%5B%5B%22a%22,%20%22e%22,%20%22i%22,%20%22o%22,%20%22u%22%5D,%20%5B%22A%22,%20%22E%22,%20%22I%22,%20%22O%22,%20%22U%22%5D%5D%0Aflat_vowels%20%3D%20list%28%29%0Afor%20vowel%20in%20vowels%3A%0A%20%20%20%20flat_vowels%20%2B%3D%20vowel%0Aflat_vowels&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [97]:
vowels = [["a", "e", "i", "o", "u"], ["A", "E", "I", "O", "U"]]
flat_vowels = list()
for vowel in vowels:
    flat_vowels += vowel
flat_vowels

['a', 'e', 'i', 'o', 'u', 'A', 'E', 'I', 'O', 'U']

## 運用 `list.append()` 方法合併元素成為 `list`

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=vowels%20%3D%20%5B%5B%22a%22,%20%22e%22,%20%22i%22,%20%22o%22,%20%22u%22%5D,%20%5B%22A%22,%20%22E%22,%20%22I%22,%20%22O%22,%20%22U%22%5D%5D%0Aflat_vowels%20%3D%20list%28%29%0Afor%20v_list%20in%20vowels%3A%0A%20%20%20%20for%20v%20in%20v_list%3A%0A%20%20%20%20%20%20%20%20flat_vowels.append%28v%29%0Aflat_vowels&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [98]:
vowels = [["a", "e", "i", "o", "u"], ["A", "E", "I", "O", "U"]]
flat_vowels = list()
for v_list in vowels:
    for v in v_list:
        flat_vowels.append(v)
flat_vowels

['a', 'e', 'i', 'o', 'u', 'A', 'E', 'I', 'O', 'U']

## 運用 `dict[key]=value` 合併元素成為 `dict`

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=days_of_week%20%3D%20%5B%22Sunday%22,%20%22Monday%22,%20%22Tuesday%22,%20%22Wednesday%22,%20%22Thursday%22,%20%22Friday%22,%20%22Saturday%22%5D%0Adays_of_week_dict%20%3D%20dict%28%29%0Afor%20day%20in%20days_of_week%3A%0A%20%20%20%20day_upper%20%3D%20day.upper%28%29%20%23%20upper-case%0A%20%20%20%20day_abbreviation%20%3D%20day_upper%5B%3A3%5D%20%23%20abbreviation%0A%20%20%20%20days_of_week_dict%5Bday_abbreviation%5D%20%3D%20day%0Adays_of_week_dict&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [99]:
days_of_week = ["Sunday", "Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday"]
days_of_week_dict = dict()
for day in days_of_week:
    day_upper = day.upper() # upper-case
    day_abbreviation = day_upper[:3] # abbreviation
    days_of_week_dict[day_abbreviation] = day
days_of_week_dict

{'SUN': 'Sunday',
 'MON': 'Monday',
 'TUE': 'Tuesday',
 'WED': 'Wednesday',
 'THU': 'Thursday',
 'FRI': 'Friday',
 'SAT': 'Saturday'}

## 以兩個保留字調整迴圈的重複執行次數

1. `break` 保留字可以提早結束。
2. `continue` 保留字可以略過某些執行次數。

## 遇到星期四提早結束

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=days_of_week%20%3D%20%5B%22Sunday%22,%20%22Monday%22,%20%22Tuesday%22,%20%22Wednesday%22,%20%22Thursday%22,%20%22Friday%22,%20%22Saturday%22%5D%0Afor%20day%20in%20days_of_week%3A%0A%20%20%20%20if%20day%20%3D%3D%20%22Thursday%22%3A%0A%20%20%20%20%20%20%20%20break%0A%20%20%20%20print%28day%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [100]:
days_of_week = ["Sunday", "Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday"]
for day in days_of_week:
    if day == "Thursday":
        break
    print(day)

Sunday
Monday
Tuesday
Wednesday


## 略過週末

透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=days_of_week%20%3D%20%5B%22Sunday%22,%20%22Monday%22,%20%22Tuesday%22,%20%22Wednesday%22,%20%22Thursday%22,%20%22Friday%22,%20%22Saturday%22%5D%0Afor%20day%20in%20days_of_week%3A%0A%20%20%20%20if%20day%20in%20%7B%22Sunday%22,%20%22Saturday%22%7D%3A%0A%20%20%20%20%20%20%20%20continue%0A%20%20%20%20print%28day%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 拆解程式執行的每個步驟。

In [101]:
days_of_week = ["Sunday", "Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday"]
for day in days_of_week:
    if day in {"Sunday", "Saturday"}:
        continue
    print(day)

Monday
Tuesday
Wednesday
Thursday
Friday


## 組織程式碼的機制

## 什麼是組織程式碼

面對不同目的以及應用場景，我們會有組織程式碼的需求，簡單來說，是希望程式碼可以簡潔且有效率地完成任務。

## 組織程式碼希望達到的目標最主要有兩個：

1. 提高程式碼的「可利用性」。
2. 減少程式碼的「重複性」。

## Python 提供三種機制供使用者組織程式碼

視應用範疇由小到大依序為：

1. 函數（Function）。
2. 類別（Class）。
3. 模組（Module）。

## 如何理解程式碼組織機制的層次

- 數行程式碼可以組織為一個函數。
- 數個函數可以組織為一個類別。
- 數個函數或類別可以組織為一個模組。
- 數個模組可以組織為一個功能更多的模組。

## 自行定義函數

## 什麼是函數

一段被賦予名稱的程式碼，能夠完成某一個文字處理或者數值計算任務，在使用函數之前，必須先確定這個函數在執行的環境中已經被定義妥善。

## 函數有四個來源

1. 來自內建函數。
2. 來自標準模組。
3. 來自第三方模組。
4. **來自使用者的定義**。

## 如何自行定義函數

- `def` 保留字用來定義函數的名稱。
- 縮排部分稱為程式區塊（Code block），是函數的主體，也是練習題要學員運用預期輸入與參數來完成的部分。
- 不要忘記把函數的預期輸出寫在 `return` 保留字後。
- 函數的類別提示（Typing）並不是必要的，但它能幫助學員更快理解練習題。

## 自行定義函數的結構

```python
def function_name(INPUTS: TYPE, ARGUMENTS: TYPE) -> TYPE:
    ### BEGIN SOLUTION
    OUTPUTS = INPUTS (+-*/...) ARGUMENTS
    return OUTPUTS
    ### END SOLUTION
```

## 利用練習題大量地自行定義函數，學會程序化程式設計（Procedural programming）

把即將要執行的程式碼組織為函數，並依序使用這些函數來完成任務。

```python
def function_one():
    ...
    return ...
    
def function_two():
    ...
    return ...

function_one()
function_two()
```

## 定義與使用函數的差別

- 完成定義函數以後，還需要使用函數才會將引數傳入運算。
- 定義函數的當下只有與語法錯誤相似的錯誤（例如縮排錯誤）會發起例外。
- 如果是執行錯誤，在使用函數時才會發起。

## 透過 [pythontutor.com](https://pythontutor.com/visualize.html#code=def%20power%28x,%20n%29%3A%0A%20%20%20%20out%20%3D%20x**n%0A%20%20%20%20return%20out%0A%0Apower%285,%203%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false) 觀察

In [102]:
def power(x, n):
    out = x**n
    return out

power(5, 3)
#power("5", 3)

125

## 區隔物件有效性的作用域

## 什麼是作用域

> 作用域是物件名稱與物件實例參照保持有效的程式碼。

來源：<https://en.wikipedia.org/wiki/Scope_(computer_science)>

## 當自行定義函數出現在程式中，物件的作用域就會一分為二

1. 區域物件（Local objects）。
2. 全域物件（Global objects）。

## 區域物件僅在附屬於該函數的程式區塊中才有效

- 函數的輸入與參數物件。
- 在函數的程式區塊中建立的物件。

In [103]:
def power(local_x, local_n):
    local_out = local_x**local_n
    print(local_x)   # effective
    print(local_n)   # effective
    print(local_out) # effective

power(-5, 3)

-5
3
-125


In [104]:
try:
    #print(local_x)   # non-effective
    #print(local_n)   # non-effective
    print(local_out) # non-effective
except NameError as error_message:
    print(error_message)

name 'local_out' is not defined


## 其他函數的區域物件也無效

In [105]:
def absolute():
    if local_x < 0: # non-effective
        return -local_x
    else:
        return local_x

try:
    absolute()
except NameError as error_message:
    print(error_message)

name 'local_x' is not defined


## 不是在函數的程式區塊中建立的是全域物件，在任何地方都有效

- 不附屬於函數的物件。
- 定義妥善的函數。

In [106]:
def power():
    return global_out
def absolute():
    if global_x < 0:
        return -global_x
    else:
        return global_x

global_x = -5
global_n = 3
global_out = global_x**global_n
print(power())
print(absolute())

-125
5


## 物件命名的參照區域物件優先於全域物件

- 乍看之下在函數的程式區塊中使用全域物件很方便，但這樣的做法並不被推薦。
- 好的做法是透過函數所設計的參數將全域物件傳入。

## 不推薦直接使用全域物件的原因

- 如果區域以及全域存在相同的物件命名，函數會優先參照區域物件。
- 避免物件命名的混淆。

In [107]:
def power(x, n):
    out = x**n
    print(x)
    print(n)
    print(out)

x = 2
n = 4
out = x**n
print(x)     # global x
print(n)     # global n
print(out)   # global out

2
4
16


In [108]:
power(-5, 3) # local x, n, out

-5
3
-125


## 輸入與輸出的對應關係

## 自行定義函數很重要的任務是釐清「預期輸入」與「預期輸出」的對應關係

1. 一個輸入 vs. 一個輸出。
2. 一個輸入 vs. 多個輸出。
3. 多個輸入 vs. 一個輸出。
4. 多個輸入 vs. 多個輸出。

## 「一個輸入」或者「一個輸出」的對應關係單純且容易理解

- 多個輸出。
- 多個輸入。

## 以資料結構類別處理函數的「多個輸出」

- 預設以 `tuple` 資料結構類別應對多個輸出。
- 可以自行調整偏好的資料結構類別。

In [109]:
def get_first_and_last_characters(x):
    first_character = x[0]
    last_character = x[-1]
    return first_character, last_character # did not specify a tuple with ()

print(get_first_and_last_characters("Python"))
print(type(get_first_and_last_characters("Python")))

('P', 'n')
<class 'tuple'>


## 指定用 `list` 輸出

In [110]:
def get_first_and_last_characters(x):
    first_character = x[0]
    last_character = x[-1]
    return [first_character, last_character] # specify a list with []

print(get_first_and_last_characters("Python"))
print(type(get_first_and_last_characters("Python")))

['P', 'n']
<class 'list'>


## 指定用 `dict` 輸出

In [111]:
def get_first_and_last_characters(x):
    first_character = x[0]
    last_character = x[-1]
    output = {
        "first": first_character,
        "last": last_character
    }
    return output # specify a dict

print(get_first_and_last_characters("Python"))
print(type(get_first_and_last_characters("Python")))

{'first': 'P', 'last': 'n'}
<class 'dict'>


## 以資料結構類別或彈性參數處理函數的「多個輸入」

- 運用資料結構類別作為一個輸入物件名稱。
- 運用彈性參數。

## 運用資料結構類別作為一個輸入物件名稱

In [112]:
def sum_and_square(x):
    summation = sum(x)
    output = summation**2
    return output

print(sum_and_square([2, 3, 5]))    # [2, 3, 5] as input
print(sum_and_square((2, 3, 5, 7))) # (2, 3, 5, 7) as input

100
289


## 利用 `*` 標註彈性參數

- `args` 可以在函數程式區塊中作為一個 `tuple` 供運用。
- `args` 可以任意使用偏愛的命名。

In [113]:
def sum_and_square(*args):
    print(type(args))
    summation = sum(args)
    output = pow(summation, 2)
    return output

print(sum_and_square(2, 3, 5))    # 2, 3, 5 as input
print(sum_and_square(2, 3, 5, 7)) # 2, 3, 5, 7 as input

<class 'tuple'>
100
<class 'tuple'>
289


In [114]:
def sum_and_square(*arguments):
    summation = sum(arguments)
    output = pow(summation, 2)
    return output

print(sum_and_square(2, 3, 5))
print(sum_and_square(2, 3, 5, 7))

100
289


## 利用 `**` 標註具有「鍵」與「值」的彈性參數

- `kwargs` 可以在函數程式區塊中作為一個 `dict` 供運用。
- `kwargs` 可以任意使用偏愛的命名。

In [115]:
def print_country_capital(**kwargs):
    print(type(kwargs)) # dict
    for key, value in kwargs.items():
        print(f"Country: {key} Capital: {value}")

print_country_capital(JPN="Tokyo", USA="Washington D.C.", TWN="Taipei")

<class 'dict'>
Country: JPN Capital: Tokyo
Country: USA Capital: Washington D.C.
Country: TWN Capital: Taipei


In [116]:
def print_country_capital(**dictionary):
    for key, value in dictionary.items():
        print(f"Country: {key} Capital: {value}")

print_country_capital(JPN="Tokyo", USA="Washington D.C.", TWN="Taipei")

Country: JPN Capital: Tokyo
Country: USA Capital: Washington D.C.
Country: TWN Capital: Taipei


## `return` 保留字的作用

## `return` 保留字的兩個作用

1. 回傳函數的預期輸出。
2. 為函數的程式區塊畫下終止符。

## 回傳函數的預期輸出

- 沒有 `return` 的函數事實上的輸出是 `None`
- 這也是練習題如果沒有將預期輸出寫在 `return` 保留字後，無法通過批改測試的原因。

In [117]:
def power(x, n):
    """
    Equivalent to x raised to the power of n.
    """
    output = x**n

type(power(5, 3))

NoneType

## 為函數的程式區塊畫下終止符

即便寫在縮排的函數程式區塊之中，`return` 後所寫的程式並沒有作用。

In [118]:
def power(x, n):
    """
    Equivalent to x raised to the power of n.
    """
    out = x**n
    return out
    print(x)
    print(n)

power(5, 3)

125

## 類別提示

## Python 屬於動態類別程式語言

- 簡單來說，動態類別程式語言指的是物件「不」帶類別的資訊。
- 因此程式碼中相同命名的物件參照可以彈性地更動。
- 例如，相同的物件命名在一段程式碼中的某個段落參照資料類別 `int`，在其他段落參照資料結構類別 `list`

In [119]:
my_favorite = 5566
print(type(my_favorite))
my_favorite = [5, 5, 6, 6]
print(type(my_favorite))

<class 'int'>
<class 'list'>


## 帶有類別提示的自行定義函數

In [120]:
def power(x: int, n: int) -> int:
    out: int = x**n
    return out

## 類別提示並不具有強制性

- 函數的使用者仍可以輸入與類別提示相異的資料。
- 函數也會如預期產生錯誤。

In [121]:
try: 
    power("Luke Skywalker", 2)
except TypeError as error_message:
    print(error_message)

unsupported operand type(s) for ** or pow(): 'str' and 'int'


## 加入類別提示有什麼作用

- 增加程式碼的可讀性。
- 迫使設計者開發更簡潔易用的函數。
- 讓外部工具（例如 `mypy`、整合開發環境）能夠有更明確的提示、警告或自動完成功能。

## 單純的情境運用類別名稱標註即可

In [122]:
def power(x: int, n: int) -> int:
    out: int = x**n
    return out

## 關於類別

## 什麼是類別

自行設計資料或者資料結構的機制，能夠將多個函數與資料組織起來使用，定義「類別」也是入門物件導向程式設計的第一步。

## 兩種不同的程式設計

1. 程序型程式設計（Procedural programming）。
2. 物件導向程式設計（Object-oriented programming, OOP）。

## 程序型程式設計

以函數為主體的撰寫程式型態稱為「程序型程式設計（Procedural programming）」，把即將要執行的程式碼組織為函數，並依序使用這些函數來完成任務。

```python
def function_one():
    ...
    return ...
    
def function_two():
    ...
    return ...

function_one()
function_two()
```

## 物件導向程式設計

除了程序型程式設計，另外一種在軟體開發中被採用的撰寫程式型態稱為「物件導向程式設計（Object-oriented programming, OOP）」。

```python
class class_one:
    def method_one(self):
        ...
        return ...

object_one = class_one()
object_one.method_one()
```

## 程序型程式設計 vs. 物件導向程式設計

- 線狀 vs. 放射狀。
- 點餐式 vs. 自助餐式。

## 類別、實例與物件

## 定義類別是一種讓使用者自行設計資料或資料結構的機制。

- `type()` 內建函數所顯示的 `class` 就是「類別」。
- 物件（Object）是類別（Class）的實例（Instance），因此建立物件的程式碼常被稱為實例化（Instantiation）。

## `luke` 物件是 `str` 類別的實例

In [123]:
luke = "Luke Skywalker" # instantiation
type(luke)

str

## `skywalkers` 物件是 `list` 類別的實例

In [124]:
skywalkers = ["Luke Skywalker", "Anakin Skywalker", "Darth Vadar"] # instantiation
type(skywalkers)

list

## 類別之於物件的關係

- 類別如同藍圖一般的存在。
- 物件如同依照藍圖所創造的產品。

## 為什麼需要定義類別

- 當內建類別或模組所提供的類別無法滿足需求時，我們定義類別。
- 定義「類別」是物件導向程式設計的第一步。

## 常用的內建類別

- 資料
    - `int`
    - `float`
    - `str`
    - `bool`
    - `NoneType`

## 常用的內建類別（續）

- 資料結構
    - `list`
    - `tuple`
    - `dict`
    - `set`

## 資料科學模組主要提供的類別

- 資料結構：
    - `ndarray`
    - `Index`
    - `Series`
    - `DataFrame`

## 資料科學模組主要提供的類別（續）

- 視覺化類別：
    - `Figure`
    - `AxesSubplot`
- 機器學習估計器類別：
    - 轉換器
    - 預測器

## 設計類別時可以定義函數與資料

- 在類別程式區塊中定義的函數，實例化後稱為物件的方法（Methods）。
- 在類別程式區塊中定義的資料，實例化後稱為物件的屬性（Attributes）。

## 使用內建函數 `dir()` 檢視物件的方法與屬性

- 前後有兩個底線 `__` 命名的方法或屬性是所謂的特殊方法、特殊屬性。
- 特殊方法或屬性具有 Python 指定好的功能，例如接下來會用到的 `__doc__`、`__init__()` 方法與 `__repr__()` 方法。

In [125]:
# object luke is an instance of str class
luke = "Luke Skywalker"
print(dir(luke))

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isascii', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'removeprefix', 'removesuffix', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']


In [126]:
# object skywalkers is an instance of list class
skywalkers = ["Luke Skywalker", "Anakin Skywalker", "Darth Vadar"]
print(dir(skywalkers))

['__add__', '__class__', '__class_getitem__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


## 函數與方法

## 使用 `class` 保留字定義類別

> 類別的命名習慣與物件、函數不同，非採用蛇形命名法，而是採用首字大寫的 CapWords 命名法。

來源：<https://www.python.org/dev/peps/pep-0008/#class-names>

## `pass` 保留字的作用

類似在「使用流程控制管理程式區塊的執行」章節介紹過的 `continue`，完成程式區塊但沒有作用。

In [127]:
class SimpleCalculator:
    pass

simple_calculator = SimpleCalculator() # instantiation
print(type(simple_calculator))
print(dir(simple_calculator))

<class '__main__.SimpleCalculator'>
['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__']


## 關於 `<class '__main__.SimpleCalculator'>` 中的 `__main__`

- Python 組織程式碼的機制有一個層次是「數個函數或類別可以組織為一個模組」。
- 如果沒有指定，自行定義的函數或類別會預設組織到 `__main__` 特殊模組。

In [128]:
def power(x, n):
    """
    Equivalent to x**n.
    """
    return x**n

help(power)
type(simple_calculator)

Help on function power in module __main__:

power(x, n)
    Equivalent to x**n.



__main__.SimpleCalculator

## 在類別程式區塊中使用 `def` 保留字定義函數

在類別程式區塊中定義的函數，實例化後稱為物件的**方法**。

```python
class ClassName:
    def method_name(self):
        ...
        return ...

object_name = ClassName()
object_name.method_name()
```

## 如何理解 `self`

- 使用物件的方法必須要指定物件名稱：`object.method()`
- 可是設計類別的人不會知道物件名稱為何，因為實例化的物件名稱是由使用者所決定的。
- 若是要在定義類別的階段描述方法，就必須先給物件一個代名詞：`self` 作為第一個參數名稱。

In [129]:
class SimpleCalculator:
    def add(self, a, b):
        return a + b

simple_calculator = SimpleCalculator()
simple_calculator.add(5, 6)

11

## 如何理解 `self`（續）

- 事實上，也不一定要用 `self` 作為第一個參數的名稱，可以用偏好的命名。
- 但是 Python 的使用者都習慣 `self`

來源：<https://www.python.org/dev/peps/pep-0008/#function-and-method-arguments>

In [130]:
class SimpleCalculator:
    def add(this, a, b): # use this instead of self
        return a + b

simple_calculator = SimpleCalculator()
simple_calculator.add(55, 66)

121

## 資料與屬性

## 在類別程式區塊加入 `str` 字面值作為說明

- 我們可以加入 `str` 字面值描述自行定義的類別，與函數的說明（docstring）相似。
- 實例化後使用 `object.__doc__` 屬性閱讀說明。

In [131]:
class SimpleCalculator:
    """
    This class creates an instance with default attributes.
    """
    pass

simple_calculator = SimpleCalculator()
print(simple_calculator.__doc__)


    This class creates an instance with default attributes.
    


## 在類別程式區塊中定義函數 `__init__()` 定義資料

- 在類別程式區塊中定義的資料，實例化後稱為物件的屬性。
- `__init__()` 函數顧名思義就是在實例化當下就會起作用的函數。

In [132]:
class SimpleCalculator:
    """
    This class creates an instance with 2 custom attributes.
    """
    def __init__(self, a, b):
        self.a = a
        self.b = b

simple_calculator = SimpleCalculator(55, 66)
print(simple_calculator.a)
print(simple_calculator.b)

55
66


## 如何理解 `self`（續）

- 在使用物件的屬性時必須要指定物件名稱：`object.attribute`
- 可是設計類別的人不會知道物件名稱為何，因為實例化的物件名稱是由使用者所決定的。
- 若是要在定義類別的時候描述屬性，就必須先給物件一個代名詞：`self` 作為第一個參數名稱。

## 以 `self.attribute` 在類別程式區塊中使用屬性

In [133]:
class SimpleCalculator:
    """
    This class creates an instance with 2 custom attributes and 1 custom method.
    """
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def add(self):
        return self.a + self.b # retrieve via self.a, self.b

simple_calculator = SimpleCalculator(55, 66) # self proxies object simple_calculator
simple_calculator.add()

121

## 以 `self.method()` 在類別程式區塊中使用方法

In [134]:
class SimpleCalculator:
    """
    This class creates an instance with 2 custom attributes and 2 custom methods.
    """
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def add(self):
        return self.a + self.b # retrieve via self.a, self.b
    def add_then_square(self):
        return (self.add())**2 # use via self.add()

simple_calculator = SimpleCalculator(55, 66)
print(simple_calculator.add_then_square())

14641


## 自行定義的類別實例化後沒有顯示外觀

In [135]:
simple_calculator

<__main__.SimpleCalculator at 0x7fc65ec877f0>

## 在類別程式區塊中定義函數 `__repr__()` 描述顯示外觀

In [136]:
class SimpleCalculator:
    """
    This class creates an instance with 2 custom attributes and 2 custom methods.
    """
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def add(self):
        return self.a + self.b # retrieve via self.a, self.b
    def add_then_square(self):
        return (self.add())**2 # use via self.add()
    def __repr__(self):
        return f"a: {self.a}, b: {self.b}" # retrieve via self.a, self.b

simple_calculator = SimpleCalculator(55, 66)
print(simple_calculator)

a: 55, b: 66


## 物件導向程式設計的四個特性

1. **封裝**。
2. 繼承。
3. 抽象。
4. 多型。

## 資料分析師「必須」暸解的物件導向程式設計特性

- **封裝**：將函數與資料整合為物件的方法與屬性。
- 類別程式區塊中定義的函數實例化後稱為物件的「方法」。
- 類別程式區塊中定義的資料實例化後稱為物件的「屬性」。