# Python 的 50+ 練習：資料科學學習手冊

> 日期時間資料操作

[數據交點](https://www.datainpoint.com) | 郭耀仁 <yaojenkuo@datainpoint.com>

## 練習題指引

- 由於近期 mybinder.org 的服務不穩定，新增 Google Colab 作為另一個寫作練習題的平台。
- 開始寫作之前，可以先按上方「Copy to Drive」按鈕將筆記本複製到自己的 Google 雲端硬碟。
- 練習題閒置超過 10 分鐘會自動斷線，只要重新點選練習題連結即可重新啟動。
- 第一個程式碼儲存格會將可能用得到的模組載入。
- 如果練習題需要載入檔案，檔案存放絕對路徑為 `/content`
- 練習題已經給定函數、類別、預期輸入或參數名稱，我們只需要寫作程式區塊。同時也給定函數的類別提示，說明預期輸入以及預期輸出的類別。
- 說明（Docstring）會描述測試如何進行，閱讀說明能夠暸解預期輸入以及預期輸出之間的關係，幫助我們更快解題。
- 請在 `### BEGIN SOLUTION` 與 `### END SOLUTION` 這兩個註解之間寫作函數或者類別的程式區塊。
- 將預期輸出放置在 `return` 保留字之後，若只是用 `print()` 函數將預期輸出印出無法通過測試。
- 語法錯誤（`SyntaxError`）或縮排錯誤（`IndentationError`）等將會導致測試失效，測試之前應該先在筆記本使用函數觀察是否與說明（Docstring）描述的功能相符。
- 如果卡關，可以先看練習題詳解或者複習課程單元影片之後再繼續寫作。
- 執行測試的步驟：
    1. 點選右上角 Connect
    2. 點選上方選單的 Runtime -> Restart and run all -> Yes -> Run anyway
    3. 移動到 Google Colab 的最後一個儲存格看批改測試結果。
- 先執行下列兩個程式碼儲存格載入需要的模組與下載檔案至 `/content`

In [None]:
from datetime import date
from datetime import time
from datetime import datetime
from datetime import timedelta
import pandas as pd

In [None]:
!wget -N https://raw.githubusercontent.com/datainpoint/classroom-hahow-pythonfiftyplus/main/exercise_index.json
!wget -N https://raw.githubusercontent.com/datainpoint/classroom-hahow-pythonfiftyplus/main/data/covid19/time_series_covid19_confirmed_global.csv

## 141. 建立日期物件

定義函數 `create_date_object()` 將輸入的整數轉換為 `date` 類別的實例。

- 運用 `date` 類別。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_date_object(year: int, month: int, day: int) -> date:
    """
    >>> create_date_object(2021, 12, 31)
    datetime.date(2021, 12, 31)
    >>> type(create_date_object(2021, 12, 31))
    datetime.date
    >>> print(create_date_object(2021, 12, 31))
    2021-12-31
    >>> create_date_object(2022, 1, 1)
    datetime.date(2022, 1, 1)
    >>> type(create_date_object(2022, 1, 1))
    datetime.date
    >>> print(create_date_object(2022, 1, 1))
    2022-01-01
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 142. 建立時間物件

定義函數 `create_time_object()` 將輸入的整數轉換為 `time` 類別的實例。

- 運用 `time` 類別。
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_time_object(hour: int, minute: int, second: int) -> time:
    """
    >>> create_time_object(23, 59, 59)
    datetime.time(23, 59, 59)
    >>> type(create_time_object(23, 59, 59))
    datetime.time
    >>> print(create_time_object(23, 59, 59))
    23:59:59
    >>> create_time_object(0, 0, 1)
    datetime.time(0, 0, 1)
    >>> type(create_time_object(0, 0, 1))
    datetime.time
    >>> print(create_time_object(0, 0, 1))
    00:00:01
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 143. 建立日期時間物件

定義函數 `create_datetime_object()` 將輸入的 `date` 與 `time` 轉換為 `datetime` 類別的實例。

- 使用 `create_date_object()` 函數。
- 使用 `create_time_object()` 函數。
- 使用 `datetime.combine()`
- 將預期輸出寫在 `return` 之後。

In [None]:
def create_datetime_object(d: date, t: time) -> datetime:
    """
    >>> d = create_date_object(2021, 12, 31)
    >>> t = create_time_object(23, 59, 59)
    >>> create_datetime_object(d, t)
    datetime.datetime(2021, 12, 31, 23, 59, 59)
    >>> type(create_datetime_object(d, t))
    datetime.datetime
    >>> print(create_datetime_object(d, t))
    2021-12-31 23:59:59
    >>> d = create_date_object(2022, 1, 1)
    >>> t = create_time_object(0, 0, 1)
    >>> create_datetime_object(d, t)
    datetime.datetime(2022, 1, 1, 0, 0, 1)
    >>> type(create_datetime_object(d, t))
    datetime.datetime
    >>> print(create_datetime_object(d, t))
    2022-01-01 00:00:01
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 144. 昨天的日期 

定義函數 `get_yesterdays_date()` 將輸入日期文字（ISO 8601 格式）的前一天回傳。

- 使用 `date.fromisoformat()`
- 運用 `timedelta` 類別。
- 將預期輸出寫在 `return` 之後。

In [None]:
def get_yesterdays_date(x: str) -> date:
    """
    >>> print(get_yesterdays_date("2022-01-02"))
    2022-01-01
    >>> print(get_yesterdays_date("2022-01-01"))
    2021-12-31
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 145. 前一秒的日期時間  

定義函數 `get_a_second_before_datetime()` 將輸入日期時間文字（ISO 8601 格式）的前一秒回傳。

- 使用 `datetime.fromisoformat()`
- 運用 `timedelta` 類別。
- 將預期輸出寫在 `return` 之後。

In [None]:
def get_a_second_before_datetime(x: str) -> datetime:
    """
    >>> print(get_a_second_before_datetime("2022-01-01 00:00:01"))
    2022-01-01 00:00:00
    >>> print(get_a_second_before_datetime("2022-01-01 00:00:00"))
    2021-12-31 23:59:59
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 146. 顯示非 ISO 8601 的日期格式 

定義函數 `show_a_non_iso8601_date()` 將輸入的整數顯示為 `%a %b %d` 的日期格式。

來源：<https://docs.python.org/3/library/datetime.html#strftime-and-strptime-format-codes>

- 運用 `date` 類別。
- 使用 `date.strftime()`
- 將預期輸出寫在 `return` 之後。

In [None]:
def show_a_non_iso8601_date(year: int, month: int, day: int) -> str:
    """
    >>> show_a_non_iso8601_date(2021, 12, 31)
    'Fri Dec 31'
    >>> show_a_non_iso8601_date(2022, 1, 1)
    'Sat Jan 01'
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 147. 解析非 ISO 8601 的日期時間格式 

定義函數 `parse_a_non_iso8601_datetime()` 將輸入的日期時間文字（`%a %b %d %y %H:%M:%S` 格式）轉換為 ISO 8601 日期時間文字（`%Y-%m-%d %H:%M:%S` 格式）。

來源：<https://docs.python.org/3/library/datetime.html#strftime-and-strptime-format-codes>

- 使用 `datetime.strptime()`
- 使用 `datetime.strftime()`
- 將預期輸出寫在 `return` 之後。

In [None]:
def parse_a_non_iso8601_datetime(x: str) -> str:
    """
    >>> parse_a_non_iso8601_datetime("Fri Dec 31 21 23:59:59")
    '2021-12-31 23:59:59'
    >>> parse_a_non_iso8601_datetime("Sat Jan 01 22 00:00:01")
    '2022-01-01 00:00:01'
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 148. 載入 `time_series_covid19_confirmed_global.csv`

定義函數 `import_covid19_time_series_confirmed()` 將位於 `/content` 路徑的 `time_series_covid19_confirmed_global.csv` 載入。

- 運用絕對路徑。
- 使用 `pd.read_csv()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def import_covid19_time_series_confirmed() -> pd.core.frame.DataFrame:
    """
    >>> covid19_time_series_confirmed = import_covid19_time_series_confirmed()
    >>> type(covid19_time_series_confirmed)
    pandas.core.frame.DataFrame
    >>> covid19_time_series_confirmed.shape
    (280, 735)
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 149. 擷取日期的欄位名稱

定義函數 `extract_date_columns()` 將 `time_series_covid19_confirmed_global.csv` 中 `Province/State`、`Country/Region`、`Lat`、`Long` 以外日期的欄位名稱擷取出來。

- 使用 `import_covid19_time_series_confirmed()` 函數。
- 運用 `DataFrame.columns`
- 運用 slicing 技巧。
- 將預期輸出寫在 `return` 之後。

In [None]:
def extract_date_columns() -> pd.core.indexes.base.Index:
    """
    >>> date_columns = extract_date_columns()
    >>> type(date_columns)
    pandas.core.indexes.base.Index
    >>> date_columns.size
    731
    >>> date_columns
    Index(['1/22/20', '1/23/20', '1/24/20', '1/25/20', '1/26/20', '1/27/20',
           '1/28/20', '1/29/20', '1/30/20', '1/31/20',
           ...
           '1/12/22', '1/13/22', '1/14/22', '1/15/22', '1/16/22', '1/17/22',
           '1/18/22', '1/19/22', '1/20/22', '1/21/22'],
          dtype='object', length=731)
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 150. 解析日期的欄位名稱

定義函數 `parse_date_columns()` 將 `time_series_covid19_confirmed_global.csv` 中日期的欄位名稱擷取出來轉換為 `DatetimeIndex`

- 使用 `extract_date_columns()` 函數。
- 使用 `pd.to_datetime()` 函數。
- 將預期輸出寫在 `return` 之後。

In [None]:
def parse_date_columns() -> pd.core.indexes.datetimes.DatetimeIndex:
    """
    >>> date_columns = parse_date_columns()
    >>> type(date_columns)
    pandas.core.indexes.datetimes.DatetimeIndex
    >>> date_columns.size
    731
    >>> date_columns
    DatetimeIndex(['2020-01-22', '2020-01-23', '2020-01-24', '2020-01-25',
                   '2020-01-26', '2020-01-27', '2020-01-28', '2020-01-29',
                   '2020-01-30', '2020-01-31',
                   ...
                   '2022-01-12', '2022-01-13', '2022-01-14', '2022-01-15',
                   '2022-01-16', '2022-01-17', '2022-01-18', '2022-01-19',
                   '2022-01-20', '2022-01-21'],
                  dtype='datetime64[ns]', length=731, freq=None)
    """
    ### BEGIN SOLUTION
    
    ### END SOLUTION

## 練習題到此結束，以下的儲存格可以忽略

In [None]:
import unittest
import json

def run_suite(test_class, chapter_index):
    suite = unittest.TestLoader().loadTestsFromTestCase(test_class)
    runner = unittest.TextTestRunner(verbosity=2)
    test_results = runner.run(suite)
    number_of_failures = len(test_results.failures)
    number_of_errors = len(test_results.errors)
    number_of_test_runs = test_results.testsRun
    number_of_successes = number_of_test_runs - (number_of_failures + number_of_errors)
    with open("exercise_index.json", "r") as f:
        exercise_index = json.load(f)
    chapter_name = exercise_index[chapter_index]["chapter_name"]
    number_of_total_questions = 0
    number_of_completed_questions = 0
    for i in range(len(exercise_index)):
        number_of_total_questions += exercise_index[i]["number_of_exercises"]
        if i < chapter_index:
            number_of_completed_questions += exercise_index[i]["number_of_exercises"]
    number_of_completed_questions += number_of_successes
    chapter_percentage = number_of_successes * 100 / number_of_test_runs
    overall_percentage = number_of_completed_questions * 100 / number_of_total_questions
    print("你在「{}」章節的練習題完成率為 ... {:.2f}% ({}/{})".format(chapter_name, chapter_percentage, number_of_successes, number_of_test_runs))
    print("整體課程練習題的累計完成率為 ... {:.2f}% ({}/{})".format(overall_percentage, number_of_completed_questions, number_of_total_questions))
    if chapter_percentage == 100 and chapter_index < 19:
        print("表現得很好，你已經完成「{}」所有習題，我們繼續往下個章節：「{}」前進！".format(exercise_index[chapter_index]["chapter_name"], exercise_index[chapter_index + 1]["chapter_name"]))
        if chapter_index == 4:
            print("太棒了，你已經完成「Python 的 50+ 練習」的第一部分：Python 程式設計的基礎觀念，接下來還有三個部分等你來挑戰！")
        elif chapter_index == 8:
            print("表現得非常好，你已經完成「Python 的 50+ 練習」的第二部分：Python 程式設計的進階觀念，接著讓我們邁向資料科學！")
        elif chapter_index == 12:
            print("太令人佩服，你已經完成「Python 的 50+ 練習」的第三部分：Python 資料科學的基礎，距離完課只剩下最後一哩路！")
    elif chapter_percentage == 100 and chapter_index == 19:
        print("恭喜完課，你已經完成「Python 的 50+ 練習」所有習題，能夠堅持到底完成所有的教學影片與練習題真是非常了不起！後面已經沒有練習題了，你現在是一位擅長寫程式處理資料的分析師！")
    elif chapter_percentage >= 50:
        print("你已經完成「{}」章節一半以上的練習，繼續加油！".format(chapter_name))

class TestWorkingWithDateTime(unittest.TestCase):
    def test_141_create_date_object(self):
        self.assertEqual(create_date_object(2021, 12, 31), date(2021, 12, 31))
        self.assertEqual(create_date_object(2022, 1, 1), date(2022, 1, 1))
    def test_142_create_time_object(self):
        self.assertEqual(create_time_object(23, 59, 59), time(23, 59, 59))
        self.assertEqual(create_time_object(0, 0, 1), time(0, 0, 1))
    def test_143_create_datetime_object(self):
        d = create_date_object(2021, 12, 31)
        t = create_time_object(23, 59, 59)
        self.assertEqual(create_datetime_object(d, t), datetime(2021, 12, 31, 23, 59, 59))
        d = create_date_object(2022, 1, 1)
        t = create_time_object(0, 0, 1)
        self.assertEqual(create_datetime_object(d, t), datetime(2022, 1, 1, 0, 0, 1))
    def test_144_get_yesterdays_date(self):
        self.assertEqual(get_yesterdays_date("2022-01-02"), date(2022, 1, 1))
        self.assertEqual(get_yesterdays_date("2022-01-01"), date(2021, 12, 31))
    def test_145_get_a_second_before_datetime(self):
        self.assertEqual(get_a_second_before_datetime("2022-01-01 00:00:01"), datetime(2022, 1, 1, 0, 0, 0))
        self.assertEqual(get_a_second_before_datetime("2022-01-01 00:00:00"), datetime(2021, 12, 31, 23, 59, 59))
    def test_146_show_a_non_iso8601_date(self):
        self.assertEqual(show_a_non_iso8601_date(2021, 12, 31), 'Fri Dec 31')
        self.assertEqual(show_a_non_iso8601_date(2022, 1, 1), 'Sat Jan 01')
    def test_147_parse_a_non_iso8601_datetime(self):
        self.assertEqual(parse_a_non_iso8601_datetime("Fri Dec 31 21 23:59:59"), '2021-12-31 23:59:59')
        self.assertEqual(parse_a_non_iso8601_datetime("Sat Jan 01 22 00:00:01"), '2022-01-01 00:00:01')
    def test_148_import_covid19_time_series_confirmed(self):
        covid19_time_series_confirmed = import_covid19_time_series_confirmed()
        self.assertIsInstance(covid19_time_series_confirmed, pd.core.frame.DataFrame)
        self.assertEqual(covid19_time_series_confirmed.shape, (280, 735))
    def test_149_extract_date_columns(self):
        date_columns = extract_date_columns()
        self.assertIsInstance(date_columns, pd.core.indexes.base.Index)
        self.assertEqual(date_columns.size, 731)
    def test_150_parse_date_columns(self):
        date_columns = parse_date_columns()
        self.assertIsInstance(date_columns, pd.core.indexes.datetimes.DatetimeIndex)
        self.assertEqual(date_columns.size, 731)

run_suite(TestWorkingWithDateTime, 16)