## **使用POST方法來爬取台鐵的時刻表**
### [列車時刻/車次查詢](https://www.railway.gov.tw/tra-tip-web/tip/tip001/tip112/gobytime)

In [1]:
# 可以去掉 python 輸出時，因為軟體版本所引起的警告的警告。
import warnings
warnings.filterwarnings('ignore')

In [2]:
import requests

# 注意：所選的日期 (rideDate) 一定要今天或之後才會有資料
#
payload = {    
    '_csrf':'e7666daa-56a6-41b9-aba1-34141ed8e04b',
    'startStation':'3300-臺中',
    'endStation':'1080-桃園',
    'transfer':'ONE',
    'rideDate':'2022/06/03',
    'startOrEndTime':'true',
    'startTime':'00:00',
    'endTime':'23:59',
    'trainTypeList':'ALL',
    'query':'查詢'
}

url_address = 'https://www.railway.gov.tw/tra-tip-web/tip/tip001/tip112/querybytime'
    
res_post = requests.post(url_address, data = payload) 

res_post.encoding = 'utf-8'  # 為了能夠順利讓網頁中的中文字正確的呈現出來

#print (res_post.text) # 看一下網頁的內容

### **剖析網頁內容，瞭解要抓的表格在哪裡**

In [3]:
from bs4 import BeautifulSoup

soup = BeautifulSoup(res_post.text, 'html.parser')

# 表格標籤特徵為 <table class="itinerary-controls">
tables = soup.select('table[class="itinerary-controls"]')

print('共掃出 %d 個表格！\n' % len(tables))

共掃出 1 個表格！



### **用 Pandas 資料科學套件來讀取爬出的表格**

In [4]:
import pandas as pd

tables = pd.read_html(str(tables))

print('共掃出 %d 個表格！\n' % len(tables))
   
#print(table_columns)

共掃出 40 個表格！



### **看一下每一個表格**

In [5]:
tables[0]

Unnamed: 0,車種車次 (始發站 → 終點站),出發時間,抵達時間,行駛時間,經由,詳細資訊,全票,孩童票,敬老票,訂票,Unnamed: 10
0,區間 2114 ( 彰化 → 基隆 ),05:24,08:01,2 小時 37 分,山線,詳細,$ 198,$ 99,$ 99,,
1,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...
2,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,,,,
3,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,,,,,
4,區間 2114 ( 彰化 → 基隆 ),05:24 臺中,到,08:01 桃園,山線,每日行駛。,,,,,
...,...,...,...,...,...,...,...,...,...,...,...
190,自強 152 ( 屏東 → 七堵 ),21:43,23:25,1 小時 42 分,山線,詳細,$ 308,$ 154,$ 154,訂票,
191,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 152 ( 屏...
192,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,,,,
193,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,,,,,


In [6]:
tables[1]

Unnamed: 0_level_0,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊
Unnamed: 0_level_1,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,Unnamed: 6_level_1
0,區間 2114 ( 彰化 → 基隆 ),05:24 臺中,到,08:01 桃園,山線,每日行駛。,


In [7]:
tables[2]

Unnamed: 0_level_0,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊
Unnamed: 0_level_1,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,Unnamed: 6_level_1
0,自強 102 ( 斗六 → 七堵 ),05:56 臺中,到,07:42 桃園,山線,每日行駛。,


In [8]:
tables[3]

Unnamed: 0_level_0,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊
Unnamed: 0_level_1,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,Unnamed: 6_level_1
0,區間 2120 ( 二水 → 基隆 ),06:20 臺中,到,08:54 桃園,山線,每日行駛。,


In [9]:
tables[4]

Unnamed: 0_level_0,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊
Unnamed: 0_level_1,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,Unnamed: 6_level_1
0,區間 2124 ( 嘉義 → 基隆 ),06:48 臺中,到,09:29 桃園,山線,每日行駛。,


In [10]:
tables[5]

Unnamed: 0_level_0,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊
Unnamed: 0_level_1,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,Unnamed: 6_level_1
0,自強 170 ( 嘉義 → 花蓮 ),07:24 臺中,到,09:17 桃園,山線,每日行駛。,


### **看一下表格上有哪一些欄位**

In [11]:
for name in tables[0].columns:
    
    print(name)

車種車次 (始發站 → 終點站)
出發時間
抵達時間
行駛時間
經由
詳細資訊
全票
孩童票
敬老票
訂票
Unnamed: 10


### **選擇特定欄位內的資料寫入最後結果的表格內**

In [12]:
# 修改 pandas 顯示設定
pd.set_option('display.max.columns', 20)

pd.set_option('display.max.rows', None) # 顯示全部

In [13]:
#column_fields = ['車種車次 (始發站 → 終點站)', '出發時間', '抵達時間', '行駛時間', '經由', '全票', '孩童票']

column_fields = tables[0].columns[:9]

df = pd.DataFrame( 
                   tables[0], 
                   columns = column_fields
                  ) 

df.index += 1

df  # 顯示 df 表格

Unnamed: 0,車種車次 (始發站 → 終點站),出發時間,抵達時間,行駛時間,經由,詳細資訊,全票,孩童票,敬老票
1,區間 2114 ( 彰化 → 基隆 ),05:24,08:01,2 小時 37 分,山線,詳細,$ 198,$ 99,$ 99
2,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 區間 2114 ( ...
3,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,,
4,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,,,
5,區間 2114 ( 彰化 → 基隆 ),05:24 臺中,到,08:01 桃園,山線,每日行駛。,,,
6,自強 102 ( 斗六 → 七堵 ),05:56,07:42,1 小時 46 分,山線,詳細,$ 308,$ 154,$ 154
7,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...,詳細資訊 車種車次 (始發站 → 終點站) 出發 往 抵達 經由 備註 自強 102 ( 斗...
8,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,詳細資訊,,
9,車種車次 (始發站 → 終點站),出發,往,抵達,經由,備註,,,
10,自強 102 ( 斗六 → 七堵 ),05:56 臺中,到,07:42 桃園,山線,每日行駛。,,,


### **抽出所要的表格內容**

In [14]:
df2 = pd.DataFrame(columns = column_fields) 

for i in range(1, df.index.stop, 5):
    
    #append row to the dataframe
    df2 = df2.append(df.loc[i,:], ignore_index = True)
    
df2.index += 1 # 調整最後表格的索引值由 1 開始，而不是依預設值從 0 開始

df2  # 顯示 df2 表格

Unnamed: 0,車種車次 (始發站 → 終點站),出發時間,抵達時間,行駛時間,經由,詳細資訊,全票,孩童票,敬老票
1,區間 2114 ( 彰化 → 基隆 ),05:24,08:01,2 小時 37 分,山線,詳細,$ 198,$ 99,$ 99
2,自強 102 ( 斗六 → 七堵 ),05:56,07:42,1 小時 46 分,山線,詳細,$ 308,$ 154,$ 154
3,區間 2120 ( 二水 → 基隆 ),06:20,08:54,2 小時 34 分,山線,詳細,$ 198,$ 99,$ 99
4,區間 2124 ( 嘉義 → 基隆 ),06:48,09:29,2 小時 41 分,山線,詳細,$ 198,$ 99,$ 99
5,自強 170 ( 嘉義 → 花蓮 ),07:24,09:17,1 小時 53 分,山線,詳細,$ 308,$ 154,$ 154
6,區間 2134 ( 嘉義 → 基隆 ),07:33,10:10,2 小時 37 分,山線,詳細,$ 198,$ 99,$ 99
7,自強 106 ( 彰化 → 七堵 ),08:23,10:04,1 小時 41 分,山線,詳細,$ 308,$ 154,$ 154
8,自強 108 ( 潮州 → 七堵 ),08:42,10:27,1 小時 45 分,山線,詳細,$ 308,$ 154,$ 154
9,區間 2144 ( 嘉義 → 基隆 ),08:45,11:15,2 小時 30 分,山線,詳細,$ 198,$ 99,$ 99
10,區間 2154 ( 嘉義 → 基隆 ),09:41,12:12,2 小時 31 分,山線,詳細,$ 198,$ 99,$ 99
