# Python 的 50+ 練習：資料科學學習手冊

> 資料科學模組 Pandas 入門

[數據交點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 練習題指引

- 練習題閒置超過 10 分鐘會自動斷線，只要重新點選練習題連結即可重新啟動。
- 第一個程式碼儲存格會將可能用得到的模組載入。
- 如果練習題需要載入檔案，檔案存放絕對路徑為 `/home/jovyan/data`，相對路徑為 `../data`
- 練習題已經給定函數、類別、預期輸入或參數名稱，我們只需要寫作程式區塊。同時也給定函數的類別提示，說明預期輸入以及預期輸出的類別。
- 說明（Docstring）會描述測試如何進行，閱讀說明能夠暸解預期輸入以及預期輸出之間的關係，幫助我們更快解題。
- 請在 `### BEGIN SOLUTION` 與 `### END SOLUTION` 這兩個註解之間寫作函數或者類別的程式區塊。
- 將預期輸出放置在 `return` 保留字之後，若只是用 `print()` 函數將預期輸出印出無法通過測試。
- 語法錯誤（`SyntaxError`）或縮排錯誤（`IndentationError`）等將會導致測試失效，測試之前應該先在筆記本使用函數觀察是否與說明（Docstring）描述的功能相符。
- 如果卡關，可以先看練習題詳解或者複習課程單元影片之後再繼續寫作。
- 執行測試的步驟：
    1. 點選上方選單的 File -> Save Notebook 儲存 exercises.ipynb。
    2. 點選上方選單的 File -> New -> Terminal 開啟終端機。
    3. 在終端機輸入 `python 11-pandas/test_runner.py` 後按下 Enter 執行測試。

In [None]:
import numpy as np
import pandas as pd

## 081. 建立前 5 個偶數的 `Index`

定義函數 `create_first_five_evens_index()` 能夠回傳指定的 `Index`

- 使用 `np.arange()` 函數。
- 使用 `pd.Index()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_first_five_evens_index() -> pd.core.indexes.numeric.Int64Index:
    """
    >>> first_five_evens_index = create_first_five_evens_index()
    >>> first_five_evens_index
    Int64Index([0, 2, 4, 6, 8], dtype='int64')
    >>> type(first_five_evens_index)
    pandas.core.indexes.numeric.Int64Index
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 082. 建立包含指定文字的 `Index`

定義函數 `create_a_str_index()` 能夠回傳指定的 `Index`

- 使用 `pd.Index()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_a_str_index() -> pd.core.indexes.base.Index:
    """
    >>> a_str_index = create_a_str_index()
    >>> a_str_index
    Index(['1st', '2nd', '3rd', '4th', '5th'], dtype='object')
    >>> type(a_str_index)
    pandas.core.indexes.base.Index
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 083. 建立前 5 個偶數的 `Series`

定義函數 `create_first_five_evens_series()` 能夠回傳指定的 `Series`

- 使用 `np.arange()` 函數。
- 使用 `pd.Series()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_first_five_evens_series() -> pd.core.series.Series:
    """
    >>> first_five_evens_series = create_first_five_evens_series()
    >>> first_five_evens_series
    0    0
    1    2
    2    4
    3    6
    4    8
    dtype: int64
    >>> type(first_five_evens_series)
    pandas.core.series.Series
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 084. 調整前 5 個偶數 `Series` 的 `Index`

定義函數 `update_first_five_evens_series_index()` 能夠調整前 5 個偶數 `Series` 的 `Index`

- 使用 `create_first_five_evens_series()` 函數。
- 運用 `Series.index`
- 將預期輸出寫在 `return` 之後。

In [None]:
def update_first_five_evens_series_index() -> pd.core.series.Series:
    """
    >>> updated_first_five_evens_series_index = update_first_five_evens_series_index()
    >>> updated_first_five_evens_series_index
    1st    0
    2nd    2
    3rd    4
    4th    6
    5th    8
    dtype: int64
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 085. 建立前 5 個奇數的 `Series`

定義函數 `create_first_five_odds_series()` 能夠回傳指定的 `Series`

- 使用 `np.arange()` 函數。
- 使用 `pd.Series()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_first_five_odds_series() -> pd.core.series.Series:
    """
    >>> first_five_odds_series = create_first_five_odds_series()
    >>> first_five_odds_series
    1st    1
    2nd    3
    3rd    5
    4th    7
    5th    9
    dtype: int64
    >>> type(first_five_odds_series)
    pandas.core.series.Series
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 086. 建立前 5 個質數的 `Series`

定義函數 `create_first_five_primes_series()` 能夠回傳指定的 `Series`

- 使用 `np.array()` 函數。
- 使用 `pd.Series()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_first_five_primes_series() -> pd.core.series.Series:
    """
    >>> first_five_primes_series = create_first_five_primes_series()
    >>> first_five_primes_series
    1st     2
    2nd     3
    3rd     5
    4th     7
    5th    11
    dtype: int64
    >>> type(first_five_primes_series)
    pandas.core.series.Series
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 087. 建立前 5 個整數的 `DataFrame`

定義函數 `create_first_five_integer_dataframe()` 能夠回傳指定的 `DataFrame`

- 使用 `update_first_five_evens_series_index()` 函數。
- 使用 `create_first_five_odds_series()` 函數。
- 使用 `create_first_five_primes_series()` 函數。
- 使用 `pd.DataFrame()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_first_five_integer_dataframe() -> pd.core.frame.DataFrame:
    """
    >>> first_five_integer_dataframe = create_first_five_integer_dataframe()
    >>> first_five_integer_dataframe
         even  odd  prime
    1st     0    1      2
    2nd     2    3      3
    3rd     4    5      5
    4th     6    7      7
    5th     8    9     11
    >>> type(first_five_integer_dataframe)
    pandas.core.frame.DataFrame
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 088. 建立魔戒三部曲電影資訊的 `DataFrame`

定義函數 `create_lord_of_the_rings_dataframe()` 能夠回傳指定的 `DataFrame`

- 使用 `pd.DataFrame()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_lord_of_the_rings_dataframe() -> pd.core.frame.DataFrame:
    """
    >>> lord_of_the_rings_dataframe = create_lord_of_the_rings_dataframe()
    >>> lord_of_the_rings_dataframe
                            title       director  imdb_rating  release_year
    0  The Fellowship of the Ring  Peter Jackson          8.8          2001
    1              The Two Towers  Peter Jackson          8.7          2002
    2      The Return of the King  Peter Jackson          8.9          2003
    >>> type(lord_of_the_rings_dataframe)
    pandas.core.frame.DataFrame
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 089. 建立黑暗騎士三部曲電影資訊的 `DataFrame`

定義函數 `create_dark_knight_dataframe()` 能夠回傳指定的 `DataFrame`

- 使用 `pd.DataFrame()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_dark_knight_dataframe() -> pd.core.frame.DataFrame:
    """
    >>> dark_knight_dataframe = create_dark_knight_dataframe()
    >>> dark_knight_dataframe
                       title           director  imdb_rating  release_year
    0          Batman Begins  Christopher Nolan          8.2          2005
    1        The Dark Knight  Christopher Nolan          9.0          2008
    2  The Dark Knight Rises  Christopher Nolan          8.3          2012
    >>> type(dark_knight_dataframe)
    pandas.core.frame.DataFrame
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 090. 用 `dict` 摘要 `DataFrame`

定義函數 `summarize_dataframe_with_dict` 回傳有四組鍵值對應的 `dict` 摘要輸入的 `DataFrame`

- 運用 `DataFrame.shape`
- 運用 `DataFrame.index`
- 運用 `DataFrame.columns`
- 將預期輸出寫在 `return` 之後。

In [None]:
def summarize_dataframe_with_dict(x: pd.core.frame.DataFrame) -> dict:
    """
    >>> lord_of_the_rings_dataframe = create_lord_of_the_rings_dataframe()
    >>> dark_knight_dataframe = create_dark_knight_dataframe()
    >>> summarize_dataframe_with_dict(lord_of_the_rings_dataframe)
    {'shape': (3, 4),
     'index': RangeIndex(start=0, stop=3, step=1),
     'columns': Index(['title', 'director', 'imdb_rating', 'release_year'], dtype='object')}
    >>> summarize_dataframe_with_dict(dark_knight_dataframe)
    {'shape': (3, 4),
     'index': RangeIndex(start=0, stop=3, step=1),
     'columns': Index(['title', 'director', 'imdb_rating', 'release_year'], dtype='object')}
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION