# Python 的 50+ 練習：資料科學學習手冊

> 使用流程控制管理程式區塊的執行

[數據交點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 練習題指引

- 練習題閒置超過 10 分鐘會自動斷線，只要重新點選練習題連結即可重新啟動。
- 第一個程式碼儲存格會將可能用得到的模組載入。
- 如果練習題需要載入檔案，檔案存放絕對路徑為 `/home/jovyan/data`，相對路徑為 `../data`
- 練習題已經給定函數、類別、預期輸入或參數名稱，我們只需要寫作程式區塊。同時也給定函數的類別提示，說明預期輸入以及預期輸出的類別。
- 說明（Docstring）會描述測試如何進行，閱讀說明能夠暸解預期輸入以及預期輸出之間的關係，幫助我們更快解題。
- 請在 `### BEGIN SOLUTION` 與 `### END SOLUTION` 這兩個註解之間寫作函數或者類別的程式區塊。
- 將預期輸出放置在 `return` 保留字之後，若只是用 `print()` 函數將預期輸出印出無法通過測試。
- 語法錯誤（`SyntaxError`）或縮排錯誤（`IndentationError`）等將會導致測試失效，測試之前應該先在筆記本使用函數觀察是否與說明（Docstring）描述的功能相符。
- 如果卡關，可以先看練習題詳解或者複習課程單元影片之後再繼續寫作。
- 執行測試的步驟：
    1. 點選上方選單的 File -> Save Notebook 儲存 exercises.ipynb。
    2. 點選上方選單的 File -> New -> Terminal 開啟終端機。
    3. 在 Terminal 輸入 `python 04-control-flows/test_runner.py` 後按下 Enter 執行測試。

## 026. 判斷 BMI 分類

定義函數 `find_bmi_category()` 能夠將輸入 BMI 值所對應的分類以文字輸出。

|BMI|Category|
|---|--------|
|BMI < 18.5|Underweight|
|18.5 <= BMI < 25|Normal weight|
|25 <= BMI  < 30|Overweight|
|BMI >= 30|Obese|

來源：<https://en.wikipedia.org/wiki/Body_mass_index>

- 運用條件敘述。
- 將預期輸出寫在 `return` 之後。

In [4]:
def find_bmi_category(bmi: float) -> str:
    """
    >>> find_bmi_category(32.90) # Zion Williamson, professional basketball player
    'Obese'
    >>> find_bmi_category(26.63) # LeBron James, professional basketball player
    'Overweight'
    >>> find_bmi_category(24.83) # Roger Federer, professional tennis player
    'Normal weight'
    >>> find_bmi_category(17.58) # Suguru Osako, professional marathon runner 
    'Underweight'
    """
    ### BEGIN SOLUTION
    if bmi < 18.5:
        return "Underweight"
    elif 18.5 <= bmi < 25:
        return "Normal weight"
    elif 25 <= bmi < 30:
        return "Overweight"
    elif bmi >= 30:
        return "Obese"
    ### END SOLUTION

In [6]:
find_bmi_category(32.90)

'Obese'

In [7]:
find_bmi_category(26.63)

'Overweight'

In [8]:
find_bmi_category(24.83)

'Normal weight'

In [9]:
find_bmi_category(17.58)

'Underweight'

## 027. 判斷資料類別

定義函數 `check_data_type()` 能夠將輸入的資料類別以 `str` 輸出。

- 運用 `type()` 函數判斷資料類別。
- 運用條件敘述。
- 將預期輸出寫在 `return` 之後。

In [11]:
def check_data_type(x) -> str:
    """
    >>> check_data_type(0)
    'int'
    >>> check_data_type(1.0)
    'float'
    >>> check_data_type(False)
    'bool'
    >>> check_data_type(True)
    'bool'
    >>> check_data_type('5566')
    'str'
    >>> check_data_type(None)
    'NoneType'
    """
    ### BEGIN SOLUTION
    if type(x) == int:
        return "int"
    elif type(x) == float:
        return "float"
    elif type(x) == bool:
        return "bool"
    elif type(x) == str:
        return "str"
    else:
        return "NoneType"
    ### END SOLUTION

In [12]:
check_data_type(0)

'int'

In [13]:
check_data_type(1.0)

'float'

In [14]:
check_data_type(False)

'bool'

In [15]:
check_data_type(True)

'bool'

In [16]:
check_data_type('5566')

'str'

In [17]:
check_data_type(None)

'NoneType'

## 028. 判斷資料結構類別

定義函數 `check_data_structure_type()` 能夠將輸入的資料類別以 `str` 輸出。

- 運用 `type()` 函數判斷資料結構類別。
- 運用條件敘述。
- 將預期輸出寫在 `return` 之後。

In [19]:
def check_data_structure_type(x) -> str:
    """
    >>> check_data_structure_type([5, 5, 6, 6])
    'list'
    >>> check_data_structure_type((5, 5, 6, 6))
    'tuple'
    >>> check_data_structure_type({5, 6})
    'set'
    >>> check_data_structure_type({'title': 'The Shawshank Redemption', 'year': 1994})
    'dict'
    """
    ### BEGIN SOLUTION
    if type(x) == list:
        return "list"
    elif type(x) == tuple:
        return "tuple"
    elif type(x) == set:
        return "set"
    elif type(x) == dict:
        return "dict"
    ### END SOLUTION

In [21]:
check_data_structure_type([5, 5, 6, 6])

'list'

In [22]:
check_data_structure_type((5, 5, 6, 6))

'tuple'

In [23]:
check_data_structure_type({5, 6})

'set'

In [24]:
check_data_structure_type({'title': 'The Shawshank Redemption', 'year': 1994})

'dict'

## 029. 取出中位元素

定義函數 `retrieve_middle_elements()` 能夠將輸入 `list` 的中位元素取出（奇數長度取出中間元素、偶數長度取出中間的兩個元素）。

- 使用 `len()` 函數得知 `list` 長度。
- 運用條件敘述判斷長度為奇數或者偶數。
- 運用 Indexing/Slicing
- 將預期輸出寫在 `return` 之後。

In [36]:
from typing import Union

def retrieve_middle_elements(x: list) -> Union[int, tuple]:
    """
    >>> retrieve_middle_elements([2, 3, 5])
    3
    >>> retrieve_middle_elements([2, 3, 5, 7])
    (3, 5)
    >>> retrieve_middle_elements([2, 3, 5, 7, 11])
    5
    >>> retrieve_middle_elements([2, 3, 5, 7, 11, 13])
    (5, 7)
    """
    ### BEGIN SOLUTION
    if len(x) % 2 == 0:
        return (x[(len(x) // 2) -1] , x[len(x) // 2])
    else:
        return x[len(x)  // 2]
    ### END SOLUTION

In [37]:
retrieve_middle_elements([2, 3, 5])

3

In [39]:
retrieve_middle_elements([2, 3, 5, 7])

(3, 5)

In [40]:
retrieve_middle_elements([2, 3, 5, 7, 11])

5

In [41]:
retrieve_middle_elements([2, 3, 5, 7, 11, 13])

(5, 7)

## 030. 計算中位數

定義函數 `calculate_median()` 能夠計算輸入 `list` 的中位數。

\begin{equation}
Median(x) =
  \begin{cases}
    x[\frac{n-1}{2}]       & \quad \text{if } n \text{ is odd}\\
    \frac{x[\frac{n-2}{2}] + x[\frac{n}{2}]}{2}  & \quad \text{if } n \text{ is even}
  \end{cases} \\
\text{where} \, x= \, \text{ordered list of values in data set} \\
\text{where} \, n= \, \text{number of values in data set}
\end{equation}

來源：<https://en.wikipedia.org/wiki/Median>

- 遞增排序 `list`
- 使用 `len()` 函數得知 `list` 長度。
- 運用條件敘述判斷長度為奇數或者偶數。
- 運用 Indexing/Slicing 計算中位數。
- 將預期輸出寫在 `return` 之後。

In [68]:
from typing import Union

def calculate_median(x: list) -> Union[int, float]:
    """
    >>> calculate_median([9, 8, 3, 6, 7, 3, 1])
    6
    >>> calculate_median([1, 3, 2, 5, 4, 9, 8, 6])
    4.5
    """
    ### BEGIN SOLUTION
    if len(x) % 2 == 0:
        return ( x[(len(x) // 2) -1] + x[len(x) // 2] ) / 2
    else:
        return x[(len(x) // 2)]
    ### END SOLUTION

In [69]:
calculate_median([9, 8, 3, 6, 7, 3, 1])

6

In [70]:
calculate_median([1, 3, 2, 5, 4, 9, 8, 6])

4.5

## 031. 計算平均數

定義函數 `calculate_mean()` 能夠計算輸入 `list` 的算數平均數。

\begin{equation}
Mean(x) = \frac{\sum_{i=0}^{n - 1} x_i}{n} \\
\text{where} \, x= \, \text{list of values in data set} \\
\text{where} \, n= \, \text{number of values in data set}
\end{equation}

來源：<https://en.wikipedia.org/wiki/Mean>

- 取得 `list` 中的元素個數。
- 取得 `list` 中的元素加總。
- 將預期輸出寫在 `return` 之後。

In [83]:
def calculate_mean(x: list) -> float:
    """
    >>> calculate_mean([5, 5, 6, 6])
    5.5
    >>> calculate_mean([5, 3, 4])
    4.0
    >>> calculate_mean([4, 3])
    3.5
    """
    ### BEGIN SOLUTION
    sum = 0
    for i in x: 
        sum += i
    return sum / len(x)
    ### END SOLUTION

In [85]:
calculate_mean([5, 5, 6, 6])

5.5

In [86]:
calculate_mean([5, 3, 4])

4.0

In [87]:
calculate_mean([4, 3])

3.5

## 032. 前 100 個 Fizz buzz

定義函數 `create_first_100_fizz_buzz()` 能夠回傳一個 `list` 包含前 100 個符合 Fizz buzz 規則的元素。

來源：<https://en.wikipedia.org/wiki/Fizz_buzz>

- 運用迴圈讓物件的值能從 1 走到 100
- 運用條件敘述依據 Fizz Buzz 規則合併建立一個 `list`。
- 將預期輸出寫在 `return` 之後。

In [150]:
def create_first_100_fizz_buzz() -> list:
    """
    >>> len(create_first_100_fizz_buzz())
    100
    >>> create_first_100_fizz_buzz()[0]
    1
    >>> create_first_100_fizz_buzz()[1]
    2
    >>> create_first_100_fizz_buzz()[2]
    'Fizz'
    >>> create_first_100_fizz_buzz()[3]
    4
    >>> create_first_100_fizz_buzz()[4]
    'Buzz'
    >>> create_first_100_fizz_buzz()[13]
    14
    >>> create_first_100_fizz_buzz()[14]
    'Fizz Buzz'
    """
    ### BEGIN SOLUTION
    fizz_buzz_list = list()
    for integer in range(1,101):
        if integer % 15 == 0:
            fizz_buzz_list.append("Fizz Buzz")
        elif integer % 3 == 0:
            fizz_buzz_list.append("Fizz")
        elif integer % 5 == 0:
            fizz_buzz_list.append("Buzz")
        else:
            fizz_buzz_list.append(integer)
    return fizz_buzz_list
    ### END SOLUTION

In [151]:
len(create_first_100_fizz_buzz())

100

In [152]:
create_first_100_fizz_buzz()[0]

1

In [153]:
create_first_100_fizz_buzz()[1]

2

In [154]:
create_first_100_fizz_buzz()[2]

'Fizz'

In [155]:
create_first_100_fizz_buzz()[3]

4

In [156]:
create_first_100_fizz_buzz()[4]

'Buzz'

In [157]:
create_first_100_fizz_buzz()[13]

14

In [158]:
create_first_100_fizz_buzz()[14]

'Fizz Buzz'

## 033. Fizz buzz 片段

定義函數 `create_fizz_buzz_slice()` 能夠回傳一個 `list` 包含符合 Fizz buzz 規則元素的片段。

來源：<https://en.wikipedia.org/wiki/Fizz_buzz>

- 運用迴圈讓物件的值能從 `start` 走到 `stop`
- 運用條件敘述依據 Fizz Buzz 規則添加元素到 `list` 之中。
- 將預期輸出寫在 `return` 之後。

In [162]:
def create_fizz_buzz_slice(start: int, stop: int) -> list:
    """
    >>> create_fizz_buzz_slice(1, 5)
    [1, 2, 'Fizz', 4, 'Buzz']
    >>> create_fizz_buzz_slice(11, 15)
    [11, 'Fizz', 13, 14, 'Fizz Buzz']
    >>> create_fizz_buzz_slice(25, 30)
    ['Buzz', 26, 'Fizz', 28, 29, 'Fizz Buzz']
    """
    ### BEGIN SOLUTION
    fizz_buzz_slice = list()
    for integer in range(start,stop+1):
        if integer % 15 == 0:
            fizz_buzz_slice.append("Fizz Buzz")
        elif integer % 3 == 0:
            fizz_buzz_slice.append("Fizz")
        elif integer % 5 == 0:
            fizz_buzz_slice.append("Buzz")
        else:
            fizz_buzz_slice.append(integer)
    return fizz_buzz_slice
    ### END SOLUTION

In [164]:
create_fizz_buzz_slice(1, 5)

[1, 2, 'Fizz', 4, 'Buzz']

In [165]:
create_fizz_buzz_slice(11, 15)

[11, 'Fizz', 13, 14, 'Fizz Buzz']

In [166]:
create_fizz_buzz_slice(25, 30)

['Buzz', 26, 'Fizz', 28, 29, 'Fizz Buzz']

## 034. 因數分解

定義函數 `collect_divisors()` 能夠將輸入整數的所有因數回傳為一個 `list`。

- 運用迴圈從 1 走到 `x`
- 運用條件敘述是否為因數添加元素到 `list` 之中。
- 將預期輸出寫在 `return` 之後。

In [180]:
def collect_divisors(x: int) -> list:
    """
    >>> collect_divisors(2)
    [1, 2]
    >>> collect_divisors(3)
    [1, 3]
    >>> collect_divisors(4)
    [1, 2, 4]
    >>> collect_divisors(8)
    [1, 2, 4, 8]
    """
    ### BEGIN SOLUTION
    divisors = list()
    for integer in range(1,x+1):
        if  x % integer == 0:
            divisors.append(integer)
    return divisors
    ### END SOLUTION

In [182]:
collect_divisors(2)

[1, 2]

In [183]:
collect_divisors(3)

[1, 3]

In [184]:
collect_divisors(4)

[1, 2, 4]

In [185]:
collect_divisors(8)

[1, 2, 4, 8]

## 035. 安全的兩數相除

定義函數 `safe_divide()` 能夠對執行錯誤中的分母為零錯誤（`ZeroDivisionError`）進行例外處理，不要發起例外，而是將錯誤訊息以 `str` 回傳。

- 運用 `try...except...`
- 將預期輸出寫在 `return` 之後。

In [197]:
from typing import Union

def safe_divide(x: int, y: int) -> Union[float, str]:
    """
    >>> safe_divide(10, 2)
    5.0
    >>> safe_divide(0, 2)
    0.0
    >>> safe_divide(10, 0)
    'division by zero'
    """
    ### BEGIN SOLUTION
    divide = list()
    if y == 0 :
        return "division by zero"
    elif x % y == 0 :
        return (x // y) * 1.0
    ### END SOLUTION

In [198]:
safe_divide(10, 2)

5.0

In [199]:
safe_divide(0, 2)

0.0

In [200]:
safe_divide(10, 0)

'division by zero'