# Python 的 50+ 練習：資料科學學習手冊

> 使用資料結構類別管理資料

[數據交點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 練習題指引

- 練習題閒置超過 10 分鐘會自動斷線，只要重新點選練習題連結即可重新啟動。
- 第一個程式碼儲存格會將可能用得到的模組載入。
- 如果練習題需要載入檔案，檔案會存放在 `data` 資料夾中。
- 練習題已經給定函數、類別、預期輸入或參數名稱，我們只需要寫作程式區塊。同時也給定函數的類別提示，說明預期輸入以及預期輸出的類別。
- 說明（Docstring）會描述測試如何進行，閱讀說明能夠暸解預期輸入以及預期輸出之間的關係，幫助我們更快解題。
- 請在 `### BEGIN SOLUTION` 與 `### END SOLUTION` 這兩個註解之間寫作函數或者類別的程式區塊。
- 將預期輸出放置在 `return` 保留字之後，若只是用 `print()` 函數將預期輸出印出無法通過測試。
- 語法錯誤（`SyntaxError`）或縮排錯誤（`IndentationError`）等將會導致測試失效，測試之前應該先在筆記本使用函數觀察是否與說明（Docstring）描述的功能相符。
- 如果卡關，可以先看練習題詳解或者複習課程單元影片之後再繼續寫作。
- 執行測試的步驟：
    1. 點選上方選單的 File -> Save Notebook 儲存 exercises.ipynb。
    2. 點選上方選單的 File -> New -> Terminal 開啟終端機。
    3. 在 Terminal 輸入 `python 03-data-structures/test_runner.py` 後按下 Enter 執行測試。

## 016. 取出第一個與最後一個元素

定義函數 `retrieve_the_first_and_last_element()` 能夠將輸入 `list` 的第一個資料與最後一個資料取出，並且用 `dict` 的 keys 標註。

- 運用 Indexing
- 建立 `dict`
- 將預期輸出寫在 `return` 之後。

In [None]:
def retrieve_the_first_and_last_element(x: list) -> dict:
    """
    >>> retrieve_the_first_and_last_element([2, 3, 5, 7, 11])
    {'first': 2, 'last': 11}
    >>> retrieve_the_first_and_last_element(["Python", "Reticulate", "Anaconda"])
    {'first': 'Python', 'last': 'Anaconda'}
    """
    ### BEGIN SOLUTION
    return {"first": x[0],
            "last": x[-1]}
    ### END SOLUTION

## 017. 取出前三個字元

定義函數 `retrieve_the_first_three_characters()` 能夠將輸入 `str` 的前三個字元取出。

- 運用 Slicing
- 將預期輸出寫在 `return` 之後。

In [None]:
def retrieve_the_first_three_characters(x: str) -> str:
    """
    >>> retrieve_the_first_three_characters("Python")
    "Pyt"
    >>> retrieve_the_first_three_characters("Reticulate")
    "Ret"
    >>> retrieve_the_first_three_characters("Anaconda")
    "Ana"
    """
    ### BEGIN SOLUTION
    return x[:3]
    ### END SOLUTION

## 018. 移除第一個與最後一個元素

定義函數 `remove_the_first_and_last_element()` 能夠將輸入 `list` 的第一個資料與最後一個資料移除後再回傳。

- 運用 Slicing
- 將預期輸出寫在 `return` 之後。

In [None]:
def remove_the_first_and_last_element(x: list) -> list:
    """
    >>> remove_the_first_and_last_element([2, 3, 5, 7, 11])
    [3, 5, 7]
    >>> remove_the_first_and_last_element(["Python", "Reticulate", "Anaconda"])
    ["Reticulate"]
    """
    ### BEGIN SOLUTION
    return x[1:-1]
    ### END SOLUTION

## 019. 取出中間的元素

定義函數 `retrieve_the_middle_element()` 能夠將長度為奇數 `list` 的「中位」整數取出。

- 使用 `len()` 函數得知 `list` 長度。
- 對長度求其除以 2 的商數（floor divide）。
- 運用 Indexing
- 將預期輸出寫在 `return` 之後。

In [None]:
def retrieve_the_middle_element(x: list) -> int:
    """
    >>> retrieve_the_middle_element([2, 3, 5])
    3
    >>> retrieve_the_middle_element([2, 3, 5, 7, 11])
    5
    >>> retrieve_the_middle_element([2, 3, 5, 7, 11, 13, 17])
    7
    """
    ### BEGIN SOLUTION
    middle_index = len(x) // 2
    return x[middle_index]
    ### END SOLUTION

## 020. 取出中間的三個字元

定義函數 `retrieve_the_middle_three_characters()` 能夠將字元個數為奇數 `str` 的中間三個字元取出。

- 使用 `len()` 函數得知 `str` 長度。
- 對長度求其除以 2 的商數（floor divide）。
- 運用 Slicing
- 將預期輸出寫在 `return` 之後。

In [None]:
def retrieve_the_middle_three_characters(x: str) -> str:
    """
    >>> retrieve_the_middle_three_characters("Steve")
    "tev"
    >>> retrieve_the_middle_three_characters("Stark")
    "tar"
    >>> retrieve_the_middle_three_characters("Natasha")
    "tas"
    """
    ### BEGIN SOLUTION
    middle_index = len(x) // 2
    return x[(middle_index - 1):(middle_index + 2)]
    ### END SOLUTION

## 021. 台北市行政區郵遞區號

定義函數 `find_taipei_citys_zip_code()` 能輸入台北市的行政區名稱，回傳三碼的郵遞區號。

來源：[臺北市行政區劃](https://zh.wikipedia.org/wiki/%E8%87%BA%E5%8C%97%E5%B8%82%E8%A1%8C%E6%94%BF%E5%8D%80%E5%8A%83)

- 建立 `dict`
- 將預期輸出寫在 `return` 之後。

In [None]:
def find_taipei_citys_zip_code(area_name: str) -> int:
    """
    >>> find_taipei_citys_zip_code("中正區")
    100
    >>> find_taipei_citys_zip_code("大同區")
    103
    >>> find_taipei_citys_zip_code("中山區")
    104
    """
    ### BEGIN SOLUTION
    zip_code = {
        "中正區": 100,
        "大同區": 103,
        "中山區": 104,
        "松山區": 105,
        "大安區": 106,
        "萬華區": 108,
        "信義區": 110,
        "士林區": 111,
        "北投區": 112,
        "內湖區": 114,
        "南港區": 115,
        "文山區": 116
    }
    return zip_code[area_name]
    ### END SOLUTION

## 022. 國家 ISO 代碼

定義函數 `find_country_iso_codes()` 能輸入國家名稱，回傳 ISO 國家二位字母代碼、三位字母代碼。

備註：本題**不需要**完成所有國家的名稱與 ISO 國家字母代碼之對應關係，只需要能完成測試範例即可。

- 建立 `dict`
- 將預期輸出寫在 `return` 之後。

In [None]:
def find_country_iso_codes(country_name: str) -> dict:
    """
    >>> find_country_iso_codes("Taiwan")
    {'alpha2': 'TW', 'alpha3': 'TWN'}
    >>> find_country_iso_codes("Japan")
    {'alpha2': 'JP', 'alpha3': 'JPN'}
    >>> find_country_iso_codes("United States")
    {'alpha2': 'US', 'alpha3': 'USA'}
    >>> find_country_iso_codes("Czech Republic")
    {'alpha2': 'CZ', 'alpha3': 'CZE'}
    >>> find_country_iso_codes("Lithuania")
    {'alpha2': 'LT', 'alpha3': 'LTU'}
    >>> find_country_iso_codes("Slovakia")
    {'alpha2': 'SK', 'alpha3': 'SVK'}
    >>> find_country_iso_codes("Poland")
    {'alpha2': 'PL', 'alpha3': 'POL'}
    """
    ### BEGIN SOLUTION
    country_code = {
        "Taiwan": {"alpha2": "TW", "alpha3": "TWN"},
        "Japan": {"alpha2": "JP", "alpha3": "JPN"},
        "United States": {"alpha2": "US", "alpha3": "USA"},
        "Czech Republic": {"alpha2": "CZ", "alpha3": "CZE"},
        "Lithuania": {"alpha2": "LT", "alpha3": "LTU"},
        "Slovakia": {"alpha2": "SK", "alpha3": "SVK"},
        "Poland": {"alpha2": "PL", "alpha3": "POL"}
    }
    return country_code[country_name]
    ### END SOLUTION

## 023. 剔除重複值

定義函數 `remove_duplicates()` 能夠將輸入 `list` 中重複的元素剔除後遞增排序回傳。

- 運用 `set` 的特性。
- 使用 `set()`、`list()` 函數轉換資料結構類別。
- 使用 `sorted()` 函數或 `list.sort()`
- 留意物件更新的兩種方式。
- 將預期輸出寫在 `return` 之後。

In [None]:
def remove_duplicates(x: list) -> list:
    """
    >>> remove_duplicates([5, 5, 6, 6])
    [5, 6]
    >>> remove_duplicates([2, 2, 6, 6])
    [2, 6]
    >>> remove_duplicates([9, 9, 8, 1])
    [1, 8, 9]
    """
    ### BEGIN SOLUTION
    set_x = set(x)
    list_set_x = list(set_x)
    return sorted(list_set_x)
    ### END SOLUTION

## 024. 相同個數

定義函數 `find_number_of_intersections()` 能夠回傳兩份資料之間的相同個數。

- 運用 `set` 的集合運算方法。
- 使用 `len()` 函數得知長度。
- 將預期輸出寫在 `return` 之後。

In [None]:
def find_number_of_intersections(x: set, y: set) -> int:
    """
    >>> find_number_of_intersections({5, 5, 6, 6}, {5, 6, 7, 8})
    2
    >>> find_number_of_intersections({1, 3, 5, 7, 9}, {2, 3, 5, 7})
    3
    >>> find_number_of_intersections({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9})
    5
    >>> find_number_of_intersections({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10})
    0
    """
    ### BEGIN SOLUTION
    return len(x.intersection(y))
    ### END SOLUTION

## 025. 相異個數

定義函數 `find_number_of_differences()` 能夠回傳兩份資料之間的相異個數。

- 運用 `set` 的集合運算方法。
- 使用 `len()` 函數得知長度。
- 將預期輸出寫在 `return` 之後。

In [None]:
def find_number_of_differences(x: set, y: set) -> int:
    """
    >>> find_number_of_differences({5, 5, 6, 6}, {5, 6, 7, 8})
    2
    >>> find_number_of_differences({1, 3, 5, 7, 9}, {2, 3, 5, 7})
    3
    >>> find_number_of_differences({1, 3, 5, 7, 9}, {1, 3, 5, 7, 9})
    0
    >>> find_number_of_differences({1, 3, 5, 7, 9}, {2, 4, 6, 8, 10})
    10
    """
    ### BEGIN SOLUTION
    return len(x.symmetric_difference(y))
    ### END SOLUTION