<a href="https://colab.research.google.com/github/AI-FREE-Team/Machine-Learning-Basic/blob/master/Materials/%E6%97%A5%E6%9C%9F%E6%99%82%E9%96%93_Dates_and_Times.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

![Logo](https://raw.githubusercontent.com/AI-FREE-Team/Machine-Learning-Basic/main/README_imgs/aifreeteam.png) 
<center>Welcome to the course《Python: from business analytics to Artificial Intelligence》by AI . FREE Team.</center>
<center>歡迎大家來到 AI . FREE Team 《Python 從商業分析到人工智慧》的第二堂課 - 機器學習(ML)基礎教學。 </center>
<br/>

<center>作者: Tom Wu (<a href="https://github.com/YenLinWu">Github</a>) &nbsp&nbsp&nbsp 日期: July 2, 2021 </center>

# 前言 
本篇文章將介紹如何處理有關日期時間的資料，因時間具有週期性的重要特徵，例如：一月到十二月、星期一到星期日、24小時等週期地循環，故擷取一個日期或時間中的特定資訊，是一個不可或缺的資料處理技巧。 Python 內建的 time 、 calendar 及 datetime 模組提供我們許多實用的函數，來處理或計算日期時間的資料，讀者們在閱讀本篇文章後，將具備下列能力：
  1. 取得指定日期時間中的特定資訊； 
  2. 特定的字串日期格式轉換成 datetime 格式；  
  3. datetime 格式轉換成指定的字串日期格式；  
  4. 日期時間的加減計算；
  5. 計算兩日期相差的天數。  

此外，本篇文的最後部分，將簡介日期時間轉變成週期循環特徵的方法。

# 匯入模組

In [None]:
import sys
import time
import calendar 
import datetime

print( 'Python Version:', sys.version[0:7] ) 

Python Version: 3.7.10 


# [time](https://docs.python.org/3/library/time.html) 模組

使用 [`time.localtime()`](https://docs.python.org/3.9/library/time.html#time.strftime) 函數可獲得本地的當下時間，其回傳值的資料格式為 [time.struct_time](https://docs.python.org/3.9/library/time.html#time.struct_time) ，我們除可獲得當下的年、月、日、時、分、秒之外，同時也可得知當下的星期( weekday；0 為星期一、6 為星期日，依此類推 )、為一年當中的第幾天、是否為[日光節約時間](https://zh.wikipedia.org/wiki/夏时制)( 1 為是、0 為否 )的資訊。   
在取得台灣當地時間時，因台灣所屬時區較[世界協調時間( Coordinated Universal Time )](https://zh.wikipedia.org/wiki/%E5%8D%8F%E8%B0%83%E4%B8%96%E7%95%8C%E6%97%B6)快八小時， `time.localtime()` 所回傳的時間值將會比當下的台灣時間晚八個小時，故我們須將函數中調整成 `time.time()+8*3600` 參數來得到台灣的當下時間：


In [None]:
# 台灣的當下時間
current = time.localtime( time.time()+8*3600 )

# 當下時間的西元年份
current_year = time.localtime( time.time()+8*3600 ).tm_year

# 當下時間的月份
current_month = time.localtime( time.time()+8*3600 ).tm_mon

# 當下時間的日期
current_day = time.localtime( time.time()+8*3600 ).tm_mday

print( f'本地的當下時間：{current}' )
print( f'回傳值型態 {type(current)} \n' )
print( f'當下時間的西元年份：{current_year}' )
print( f'當下時間的月份：{current_month}' )
print( f'當下時間的日期：{current_day}' )

本地的當下時間：time.struct_time(tm_year=2021, tm_mon=4, tm_mday=15, tm_hour=0, tm_min=15, tm_sec=17, tm_wday=3, tm_yday=105, tm_isdst=0)
回傳值型態 <class 'time.struct_time'> 

當下時間的西元年份：2021
當下時間的月份：4
當下時間的日期：15


使用 [`time.strftime( string_format, struct_time )`](https://docs.python.org/3.9/library/time.html#time.strftime) 可將當下時間資訊轉換成以指定的字串( String )格式呈現，其中 `string_format` 為指定的字串日期編排格式、 `struct_time` 為一個 [time.struct_time](https://docs.python.org/3.9/library/time.html#time.struct_time) 格式的日期時間變數：

In [None]:
print( f'{current} \n' )

# 指定的字串日期時間格式
current_str = time.strftime( "%Y年 %m月 %d日 %H時 %M分 %S秒 (星期：%A)", current )   # 格式化符號 %A 表示完整的星期名稱

print( f'當下的時間：{current_str}' )
print( f'資料型態：{type(current_str)}' )

time.struct_time(tm_year=2021, tm_mon=4, tm_mday=15, tm_hour=0, tm_min=15, tm_sec=17, tm_wday=3, tm_yday=105, tm_isdst=0) 

當下的時間：2021年 04月 15日 00時 15分 17秒 (星期：Thursday)
資料型態：<class 'str'>


# [calendar](https://docs.python.org/3/library/calendar.html) 模組

使用 [`calendar.isleap()`](https://docs.python.org/3/library/calendar.html#calendar.isleap) 來判斷指定的年份是否為[閏年( Leap Year )](https://zh.wikipedia.org/wiki/闰年)：

In [None]:
IsLeap_2020 = calendar.isleap( 2020 )   # 2020 年是閏年 
IsLeap_2021 = calendar.isleap( 2021 )   # 2021 年不是閏年 

print( f'2020年是否為閏年：{IsLeap_2020}' )
print( f'2021年是否為閏年：{IsLeap_2021}' )

2020年是否為閏年：True
2021年是否為閏年：False


使用 [`calendar.weekday()`](https://docs.python.org/3/library/calendar.html#calendar.weekday) 來查詢指定的日期是星期幾，回傳值 0 表示星期一， 6 表示星期日，依此類推其他星期：

In [None]:
calendar.weekday( 2021, 4, 1 )   # 2020.4.1 是星期四 

3

透過 [`calendar.month( theyear, themonth )`](https://docs.python.org/3/library/calendar.html#calendar.month) 可得到指定年月份的日曆：

In [None]:
# 2021年4月份的日曆
print( calendar.month( 2021, 4 ) )

     April 2021
Mo Tu We Th Fr Sa Su
          1  2  3  4
 5  6  7  8  9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30



# [datetime](https://docs.python.org/3/library/datetime.html) 模組

datetime 模組除可擷取日期時間的特定資訊之外，它還提供日期加減天數的工具，例如：計算昨天、前天或明天等，下列將介紹 datetime 模組中幾個實用的函數：  
  (i) 如何取得當下的[世界協調時間( Coordinated Universal Time )](https://zh.wikipedia.org/wiki/%E5%8D%8F%E8%B0%83%E4%B8%96%E7%95%8C%E6%97%B6)中的日期   
  (ii) 如何取得當下的世界協調時間  
  (iii) 如何將字串格式的日期轉換成 datetime 格式   
  (iv) 如何將 datetime 格式的日期轉換成字串格式  

(i) 取得當下的世界協調時間中的日期 : [`datetime.date.today()`](https://docs.python.org/3/library/datetime.html#datetime.date.today) 

In [None]:
# 取得當下的世界協調時間中的日期
today = datetime.date.today() 

print( f'Today : {today} \n' )
print( f'Year : {today.year}' )
print( f'Month : {today.month}' )
print( f'Day : {today.day}' )

Today : 2021-04-14 

Year : 2021
Month : 4
Day : 14


(ii) 取得當下的世界協調時間 : [`datetime.date.now()`](https://docs.python.org/3/library/datetime.html#datetime.datetime.now) 

In [None]:
# 當下的世界協調時間
now = datetime.datetime.now( ) 

print( f'Now : {now} \n' )

Now : 2021-04-14 16:15:18.017937 



`datetime.datetime.now()` 可取得當下的[世界協調時間( Coordinated Universal Time )](https://zh.wikipedia.org/wiki/%E5%8D%8F%E8%B0%83%E4%B8%96%E7%95%8C%E6%97%B6)，然而，若我們想取得台灣當下的日期時間，則須先透過 [pytz](https://pypi.org/project/pytz/) 套件更改系統環境的所屬時區：

In [None]:
# 變更所屬時區
import pytz
tw = pytz.timezone( 'Asia/Taipei' )

# 取得台灣當下的日期時間
now = datetime.datetime.now( tw ) 

print( f'Now : {now} \n' )
print( f'Year : {now.year}' )
print( f'Month : {now.month}' )
print( f'Day : {now.day}' )
print( f'Hour : {now.hour}' )
print( f'Minute : {now.minute}' )
print( f'Second : {now.second}' )

Now : 2021-04-15 00:15:18.048111+08:00 

Year : 2021
Month : 4
Day : 15
Hour : 0
Minute : 15
Second : 18


(iii) 字串格式的日期轉換成 datetime 格式 : strptime( )    

[`datetime.datetime.strptime( date_string, string_format )`](https://docs.python.org/3/library/datetime.html#datetime.datetime.strptime) 函數可將一字串( String )格式的日期轉成 datetime 格式(年月日時分秒)，其中 `date_string` 為字串型態的日期， `string_format` 為該字串型態日期的編排格式，例如：'2021-04-15' 為 '%Y-%m-%d' 、'20210415' 為 '%Y%m%d' 等。





In [None]:
# 字串型態的日期
date_str = '20210401'
print( f'字串型態的日期格式：{date_str}, 格式為 { type(date_str) } \n' )

# 特定的字串型態轉換成 datetime 格式
date_datetime = datetime.datetime.strptime( date_str, '%Y%m%d' )
# datetime 格式僅取日期的資訊
date_datetime = date_datetime.date()

print( f'轉換後： {date_datetime}' )
print( f'轉換後的型態：{ type(date_datetime) }' )

字串型態的日期格式：20210401, 格式為 <class 'str'> 

轉換後： 2021-04-01
轉換後的型態：<class 'datetime.date'>


In [None]:
# 字串型態的日期
date_str = 'January 31, 2021'
print( f'字串型態的日期格式：{date_str}, 格式為 { type(date_str) } \n' )

# 特定的字串型態轉換成 datetime 格式
date_datetime = datetime.datetime.strptime( date_str, '%B %d, %Y' )   # 格式化符號 %B 表示完整的月份名稱
# datetime 格式僅取日期
date_datetime = date_datetime.date()

print( f'轉換後： {date_datetime}' )
print( f'轉換後的型態：{ type(date_datetime) }' )

字串型態的日期格式：January 31, 2021, 格式為 <class 'str'> 

轉換後： 2021-01-31
轉換後的型態：<class 'datetime.date'>


(iv) datetime 格式的日期轉換成字串格式 : strftime( )   

`strftime( string_format )` 函數可將 datetime 格式的日期轉換成指定的字串格式，其中 `string_format` 為指定的字串編排格式：

In [None]:
# 取得當下的世界協調時間中的日期
today_datetime = datetime.datetime.today().date()
print( f'datetime 格式的當下世界協調時間中的日期：{today_datetime} \n' )

# 日期轉成指定的字串格式
today_str = today_datetime.strftime( '%Y/%m/%d' )
print( f'轉換成字串型態的日期：{today_str}' )

datetime 格式的當下世界協調時間中的日期：2021-04-14 

轉換成字串型態的日期：2021/04/14


另外，我們也可使用 `.format( datetime )` 將 datetime 格式的日期時間轉換成指定的字串格式，其中 `datetime` 為要轉換的 datetime 格式日期：

In [None]:
# 取得當下的世界協調時間
now_datetime = datetime.datetime.today()
print( f'datetime 格式的當下世界協調時間：{now_datetime} \n' )

# 當下的世界協調日期時間轉成字串格式
now_str = '{:%Y/%b/%d %H:%M}'.format( now_datetime )   # 格式化符號 %b 表示簡寫的月份名稱

print( f'轉換成字串型態的當下時間：{now_str}' )

datetime 格式的當下世界協調時間：2021-04-14 16:15:18.116059 

轉換成字串型態的當下時間：2021/Apr/14 16:15


# 日期時間的加減計算   
timedelta 類別提供我們對一特定的日期時間加減天數、小時、分鐘等，來取得另一個特定的日期時間。    

In [None]:
from datetime import timedelta

使用 [`datetime.timedelta()`](https://docs.python.org/3/library/datetime.html#datetime.timedelta) 函數取得昨天與明天的日期：

In [None]:
today = datetime.date.today( ) 
yesterday = today + timedelta( days=-1 )
tomorrow = today + timedelta( days=1 )

print( f'Today : {today}\n' ) 
print( f'Yesterday : {yesterday}' ) 
print( f'Tomorrow : {tomorrow}' ) 

Today : 2021-04-14

Yesterday : 2021-04-13
Tomorrow : 2021-04-15


運用 `timedelta( )` 函數取得上個月最後一天的日期：

In [None]:
# 取得上個月最後一天的日期
end_of_last_month = datetime.date( datetime.date.today().year, datetime.date.today().month, 1 ) + datetime.timedelta(-1)

# datetime 格式轉換成指定的字串日期格式
end_of_last_month = '{:%Y/%m/%d}'.format( end_of_last_month )

print( f'當下的世界協調時間中的日期：{datetime.date.today()}' )
print( f'上個月的最後一天：{end_of_last_month}' )

當下的世界協調時間中的日期：2021-04-14
上個月的最後一天：2021/03/31


其他的日期加減計算例子，讀者們可參閱下列文章 : [How to Use datetime.timedelta in Python With Examples](https://miguendes.me/how-to-use-datetimetimedelta-in-python-with-examples)

# 計算兩個日期相差的天數  

計算任意兩日期的相差天數時，需先特別留意日期的格式是否皆已為 datetime 格式。



In [None]:
# 特定的字串日期格式
start_date = '2020/02/01'
end_date = '2020 2 29'

# 特定的字串日期格式轉換成 datetime 格式
start_date = datetime.datetime.strptime( start_date, '%Y/%m/%d' )
end_date = datetime.datetime.strptime( end_date, '%Y %m %d' )

# 兩日期相差天數
diff_day = ( end_date - start_date ).days

print( f'起日：{start_date}' ) 
print( f'迄日：{end_date}' )
print( f'相差天數：{diff_day}' )

起日：2020-02-01 00:00:00
迄日：2020-02-29 00:00:00
相差天數：28


# 日期時間的週期循環特徵  
透過上述 time 及 datetime 套件所提供的工具，我們能從日期時間中擷取特定的資訊，例如：年、月、日、星期等，若進一步將這些資訊加以結合三角函數 $\sin$ 或 $\cos$ ，則便能詮釋出日期時間的週期循環特徵。  
在機器學習的特徵工程( Feature Engineering )中，若我們想基於現有的日期時間資料，額外新增日期時間的循環特徵，例如：年週期、周週期或日週期等，可參考下列公式的想法；在實際運用之前，我們是須先對資料做觀察，而才決定使用 $\sin$ 或 $\cos$ 函數進行轉換：  
 * 年週期  $\displaystyle \cos \big( \frac{\text{月份}}{12} + \frac{\text{日期}}{360} \big)\times 2\pi$ ；   
 *   周週期  $\displaystyle \sin \big( \frac{\text{星期}}{7} + \frac{\text{小時}}{168} \big)\times 2\pi$ 。



# 結語 
本文介紹了日期時間的基本處理技巧：擷取日期時間中的資訊、特定的字串日期格式與 datetime 格式間的轉換、日期時間的週期循環特徵，其中，週期循環特徵的產生方法，取決於我們對資料觀察後所得知的現象，例如：每到週末才有消費、每個月初會領薪水等，需先注意最常發生或罕見發生所對應的日期時間點，再決定我們該採用哪類函數來詮釋這些現象。    
針對本文的內容，若讀者們有發現任何的錯誤或疑問，非常歡迎您[來信( yenlinwu1112@gmail.com )]( mailto:yenlinwu1112@gmail.com )給予建議及討論，讓我們一同來學習成長！

# 返回 [課程大綱](https://github.com/AI-FREE-Team/Machine-Learning-Basic)