## **台灣證劵交易所 (個股日成交公開資訊)**

[Plotly教學](https://blog.csdn.net/u012897374/article/details/77857980), [在Anaconda中裝Plotly](https://plotly.com/python/getting-started/)

In [None]:
# %load stockyear_plotly.py

# 可以去掉 python 輸出時，因為軟體版本所引起的警告的警告。
import warnings
warnings.filterwarnings('ignore')

import requests
import json, csv
import pandas as pd
import os
import time
import plotly
from plotly.graph_objs import Scatter, Layout

def twodigit(n):  #將數值轉為二位數字串
    
    if(n < 10):
        
        retstr = '0' + str(n)
        
    else:
        
        retstr = str(n)
        
    return retstr


def convertDate(date):  #轉換民國日期為西元:108/03/02->20190302

    str1 = str(date)
    
    yearstr = str1[:3]  #取出民國年
    
    realyear = str(int(yearstr) + 1911)  #轉為西元年
    
    realdate = realyear + str1[4:6] + str1[7:9]  #組合日期
    
    return realdate



plotly.offline.init_notebook_mode(connected = True) #當使用 plotly.offline.iplot 在 Jupyter筆記本中離線繪圖時，
                                                    #所需處理一個額外的初始化步驟。請參考 https://plot.ly/python/offline/

    
pd.options.mode.chained_assignment = None  #取消顯示 pandas 資料重設警告，這個設置會關閉掉 copywarning，
                                           #也有人提到關閉這個 warning後，速度更快，有待驗證。

### 本範例欲爬的目標網站：[台灣證劵交易所>>首頁>>交易資訊>>盤後資訊>>個股日成交資訊](https://www.twse.com.tw/zh/page/trading/exchange/STOCK_DAY.html)

In [None]:
# 以下區域變數內容可以自行設定

year = 2020      # 欲擷取資料的年份

stockNo = 2317   # 鴻海精密

startMonth = 1   # 欲擷取資料的起始月份

endMonth = 12    # 欲擷取資料的結束月份

#=====================================

#urlbase = 'http://www.tse.com.tw/exchangeReport/STOCK_DAY?response=html&date=' + str(year)  #網址前半
urlbase = 'http://www.tse.com.tw/exchangeReport/STOCK_DAY?response=json&date=' + str(year)  #網址前半

urltail = '01&stockNo=' + str(stockNo)  #網址後半

filename = 'stockyear' + str(year) + '.csv'   # 擷取資料後的存檔檔案名稱 (預設在相同路徑下)


#=====================================

# 如果之前的資料檔案存在就自動刪除，以方便建立檔案
os.remove(filename) if os.path.exists(filename) else None  
 

for i in range(startMonth, endMonth + 1):  # 取 1 到 12 數字
            
    url_twse = urlbase + twodigit(i) + urltail  # 組合網址
        
    res = requests.get(url_twse)    # 回傳為 json 資料
        
    jdata = json.loads(res.text)    # json 解析
                       
    outputfile = open(filename, 'a', newline = '', encoding = 'utf-8')  # 開啟資料儲存檔案
        
    outputwriter = csv.writer(outputfile)  # 以 csv 格式寫入檔案
        
    if i == 1:  # 若是 1 月 就寫入欄位名稱
        
        outputwriter.writerow(jdata['fields'])
        
    for dataline in (jdata['data']):  # 逐月寫入資料
            
        outputwriter.writerow(dataline)
        
        
    time.sleep(1)  # 延遲 0.5 秒以上，否則有時會有錯誤
    
outputfile.close()  # 關閉檔案

In [None]:
pdstock = pd.read_csv(filename, encoding = 'utf-8')  # 以 pandas 讀取檔案

for i in range(len(pdstock['日期'])):  # 轉換日期式為西元年格式

    pdstock['日期'][i] = convertDate(pdstock['日期'][i])


pdstock['日期'] = pd.to_datetime(pdstock['日期'])  # 轉換日期欄位為日期格式

data = [
    Scatter(x = pdstock['日期'], y = pdstock['收盤價'], name = '收盤價'),
    Scatter(x = pdstock['日期'], y = pdstock['最低價'], name = '最低價'),
    Scatter(x = pdstock['日期'], y = pdstock['最高價'], name = '最高價')
]

plotly.offline.iplot({  # 以 plotly 繪圖
    "data": data,
    "layout": Layout(title = str(year) + '年個股統計圖')
}) 