# 上一堂課我們實作了一支台股爬蟲

---
# 但是我們不滿足...

因爲撰寫網頁爬蟲會有以下缺點：

1. 在開發上，**解析目標網頁十分費時**，容易導致花費過多時間在截取資料而非分析資料上
2. 由於爬蟲的程式碼與目標網頁的**相依性（Coupling）十分高**，意味著**一旦網頁改版，就需要花費大量成本維護**
3. 效能問題：若我們需要截取的網頁數量變多，爬蟲的執行速度也會變慢

---
# 是否有其他從網路截取資料的方法？

假設我們今天不是透過手動，而是透過電腦程式去擷取資料時

一般的作法有以下兩種：

- 透過**網頁爬蟲**
- 透過**廠商客制化的 API**

今天我們來體驗一下 API

---
# 先説一下 API 是什麽？

**Application Programming Interface (API)** 應用程式界面

可以想象成程式 / 系統的界面，不過這個界面並非是給人使用，而是讓其它程式使用的
其目的就是希望不同語言/架構/廠商寫的程式，若能夠有一些共同的界面，
彼此之間就可以互相串連起來，達成共享資料或是擴充功能的目的

---
# API 在今天...
普偏會被直接理解成 "網頁程式的 API"，

這個網路世界其實就是由**許多 API 透過 HTTP 這個網路的溝通協定串起來的**

---
# 來看一下我們這堂課會使用的 fugle API

![](https://drive.google.com/uc?export=download&id=1P9SpIYlKNL2Uro1UVeXyADUIOnShXW_k)

網址：https://www.fugle.tw/

致力於幫助用心的投資人能享有更好的投資體驗的科技公司

這家公司為想做程式交易的使用者開發了一組 **Fugle Real Time API**

可以幫助我們截取到與股票相關的資訊

API 文件網址：https://developer.fugle.tw/realtime/document#/

---
# 如何使用 Web API?

要成功使用 Web API，通常需要以下：

1. 網址
2. 參數
3. HTTP 動詞

---
# 請將以下連結直接輸入瀏覽器

```python
https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo
```

接下來 fugle API 會回傳一個裝滿了玉山銀行資料的 JSON 物件 

這邊爲了能夠幫助各位查看 JSON 的資料，請安裝：[JSONView Chrome 插件](https://chrome.google.com/webstore/detail/jsonview/chklaanhfefbnpoihckbnefhakgolnmc?hl=en)

![](https://drive.google.com/uc?export=download&id=1-fS7u344w_foqXpnbN3tox-I2eF6592u)

# What is JSON?

- JSON（JavaScript Object Notation，JavaScript 物件表示法）
- 以純文字為基礎，來儲存和交換簡單結構的輕量級「資料交換格式」

可以把 JSON 想象成是貨櫃：

**任何貨物只要能被放入貨櫃，就可以被海運**；

同理，任何資料**只要能被封裝成 JSON 格式，就能夠方便的被網路傳輸，也能夠方便的被程式解析**

眼尖的同學也注意到，在 JSON 格式内，資料都是以 **key(鍵)** 對應 **Value(值)** 的形式呈現

它和 Python 的字典 (Dictionary) 這個資料結構是一樣的。

*詳細請參考：[Mozilla 官網文件](https://developer.mozilla.org/zh-TW/docs/Web/JavaScript/Reference/Global_Objects/JSON)

---

# 最後我們希望能讀取到玉山銀行的個股資料，並且呈現在 Excel 上


![](https://drive.google.com/uc?export=download&id=1bmXQgdMhj3L7NYvonKjyLSdsUmZPlqGf)

# 我們用瀏覽器來檢查一下這個 JSON 的結構

![](https://drive.google.com/uc?export=download&id=193i8Pzu746Y1ZdmoGrwzEnZ4_-tONsON)

接下來我們透過 Python 發送請求給 fugle API，來截取玉山銀行的資料：


```python
import requests

result = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo")

print(res.text)
```


In [None]:
import requests

res = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo")

res.text

In [None]:
# 若我們輸入 res.json() 方法，可以注意到 Python 會自動解析該字串，將結果封裝進一個巢狀的 Dictionary 内
res.json()

## 什麼是 JSON?
- JSON（JavaScript Object Notation，JavaScript 物件表示法）
- 以純文字為基礎，來儲存和交換簡單結構的輕量級「資料交換格式」
- 獨立於語言

```javascript
{
    "foo": "bar"
}
```
和 Python 的 dict (字典) 可以說是一樣的東西

---
## 從這個 JSON 内找出我們想要的資料
```python
import requests

result = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo")

json_data = result.json()
# .json() 會幫你把 JSON 資料格式轉成 python 的 dict，所以接下來我們就可透過 python 到 dict 取值的方法得到我們需要的資料：

high_price = json_data["data"]["quote"]["priceHigh"]["price"]
high_price
```

---
## 隨堂練習
請解析我們剛才的 json 資料，並且使用 Python 讀出玉山銀行在上個交易日的：

- 開盤價
- 最高價
- 最低價
- 收盤價


In [None]:
import requests

result = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo")

json_data = result.json()
# .json() 會幫你把 JSON 資料格式轉成 python 的 dict，所以接下來我們就可透過 python 到 dict 取值的方法得到我們需要的資料：
high_price = json_data["data"]["quote"]["priceHigh"]["price"]
low_price = __________________________________
open_price = __________________________________
close_price = __________________________________

## 如何截取昨日收盤價？

我們可以透過另一支叫做 `/intraday/meta` 内的`今日參考價`來搜尋

```python
import requests

result = requests.get("https://api.fugle.tw/realtime/v0/intraday/meta?symbolId=2884&apiToken=demo")

json_data = result.json()
close_price = json_data["data"]["meta"]["priceReference"]
```

## 最後來把資料寫入 Excel...

用 `xlwings` 來將 `TW2330.xlsx` 開啓：

```python
import xlwings as xw

wb = xw.Book("TW2330.xlsx")
tsmc_sheet = wb.sheets["TW2330"]
```

In [None]:
import xlwings as xw

wb = xw.Book("TW2330.xlsx")

tsmc_sheet = wb.sheets["TW2330"]
tsmc_sheet

In [None]:
import requests

result = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo")

json_data = result.json()
# 截取當日開高低收價
high_price = json_data["data"]["quote"]["priceHigh"]["price"]
low_price = json_data["data"]["quote"]["priceLow"]["price"]
open_price = json_data["data"]["quote"]["priceOpen"]["price"]
close_price = json_data["data"]["quote"]["trade"]["price"]
# 截取今日開盤參考價，也就是昨日收盤價
result1 = requests.get("https://api.fugle.tw/realtime/v0/intraday/meta?symbolId=2884&apiToken=demo")
json_data1 = result1.json()
last_close = json_data1["data"]["meta"]["priceReference"]

In [None]:
import time

# 偵測最後一行行數
last_row = tsmc_sheet.range("A1").end("down").row
# 將資料寫入 A 到 F 欄
tsmc_sheet.range(f"A{last_row+1}").value = time.strftime("%Y/%m/%d")
tsmc_sheet.range(f"B{last_row+1}").value = open_price
tsmc_sheet.range(f"C{last_row+1}").value = high_price
tsmc_sheet.range(f"D{last_row+1}").value = low_price
tsmc_sheet.range(f"E{last_row+1}").value = close_price
tsmc_sheet.range(f"F{last_row+1}").value = last_close

## 完整版程式碼

In [None]:
import xlwings as xw
import requests
import time

tsmc_sheet = wb.sheets["TW2330"]
result = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote?symbolId=2884&apiToken=demo")
json_data = result.json()
# 截取當日開高低收價
high_price = json_data["data"]["quote"]["priceHigh"]["price"]
low_price = json_data["data"]["quote"]["priceLow"]["price"]
open_price = json_data["data"]["quote"]["priceOpen"]["price"]
close_price = json_data["data"]["quote"]["trade"]["price"]
# 截取今日開盤參考價，也就是昨日收盤價
result1 = requests.get("https://api.fugle.tw/realtime/v0/intraday/meta?symbolId=2884&apiToken=demo")
json_data1 = result1.json()
last_close = json_data1["data"]["meta"]["priceReference"]

wb = xw.Book("TW2330.xlsx")
# 偵測最後一行行數
last_row = tsmc_sheet.range("A1").end("down").row
# 將資料寫入 A 到 F 欄
tsmc_sheet.range(f"A{last_row+1}").value = time.strftime("%Y/%m/%d")
tsmc_sheet.range(f"B{last_row+1}").value = open_price
tsmc_sheet.range(f"C{last_row+1}").value = high_price
tsmc_sheet.range(f"D{last_row+1}").value = low_price
tsmc_sheet.range(f"E{last_row+1}").value = close_price
tsmc_sheet.range(f"F{last_row+1}").value = last_close

## 原來用 Python 截取資料是那麽簡單的事啊！

沒錯！

不過前提是**有人很佛心的提供 API** 給你使用...

---
## 網頁爬蟲看似高大上，但是...

對於網頁的擁有者 / 維護者來説，開發 API：

- 網頁爬蟲需要花費大量的時間去開發 👎
- 網頁爬蟲需要花費大量的時間去維護 👎
- 網頁爬蟲門檻高，需要熟悉 html, css, javascript 等前端技術 👎
- 現在多數熱門網站都有做出防爬蟲的機制，大幅提升了實作爬蟲的難度 👎

---
## 網頁爬蟲 vs API

- 網頁爬蟲需要花費大量的時間去開發、分析、和維護，從時間報酬率的角度來看，**不一定值得**

- 今天我們寫程式**只是手段，而非目的**，若花費太多時間在寫程式，而沒有從投資中賺到錢，那反而得不償失

---

# 這節課的福利：增送 Fugle API 優惠序號

想要體驗 fugle realtime api 的全部功能，也就是能夠截取 2884 (玉山銀行) 以外的資料，需要開設玉山證券的賬戶才行，但是，這節課會提供

請各位同學看一下在課堂上講師公佈的 Google SpreadSheet:



1. 請找到 Goole Spreadsheet 内與你的 email 相對應的字串，這是你的優惠序號


2. 請到 [fugle 官網](https://www.fugle.tw/) 注冊並且登入 Fugle，需要 Email 與手機號碼：
![](https://drive.google.com/uc?export=download&id=1klFf2jxCpD1p3C9Mjna9-du-N6mJJF1x)

3. 請在 Fugle 網站中選擇 **設定 > 我的優惠**，輸入你的優惠序號：

![](https://drive.google.com/uc?export=download&id=1S3Kgn6RFKDzPMaSkkiNEuu3svuqaX07l)

4. 請在新增優惠序號輸入你從 Goole Spreadsheet 内的優惠序號：

![](https://drive.google.com/uc?export=download&id=13IgD67Xyos-MBwwBY3P4lV1qTyLgNfUC)
5. 接下來請回到 https://developer.fugle.tw/realtime/document#/ 

6. 切換到 API Token 分頁，點擊 Apply for new token 按鈕便會產生 api_token

![](https://drive.google.com/uc?export=download&id=17iqa7653zeHJns-dMnTJa2q6mPckCus5)

爲了方便查詢資料，我們來修改一下程式碼，把發送 Request 的部分參數化：

```python
import requests

# 參數：股票代號 + 通行碼
payload = {
    "symbolId": "2884",
    "apiToken": "demo"
}

print(payload)

res = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote", params=payload)
res.json()
```

這樣未來若要截取 `2884` 以外的資料時，只需要修改 `symbolId` 對應的資料即可

## 修改我們上一堂課實作的網頁爬蟲，改成從 api 截取交易資料

```python
import requests

def fugle_stock_crawler(stock_id):
    payload = {
        "symbolId": "2884",
        "apiToken": "把這邊改成你申請到的 api token"
    }

    res = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote", params=payload)
    json_data = res.json()
    
    res1 = requests.get("https://api.fugle.tw/realtime/v0/intraday/meta", params=payload)
    json_data1 = res1.json()

    return {
        "open": json_data["data"]["quote"]["priceOpen"]["price"],
        "high": json_data["data"]["quote"]["priceHigh"]["price"],
        "low": json_data["data"]["quote"]["priceLow"]["price"],
        "close": json_data["data"]["quote"]["trade"]["price"],
        "lastClose": json_data1["data"]["meta"]["priceReference"]
    }
# 呼叫函數來測試    
fugle_stock_crawler(2330)
```

## 完成版程式碼

透過 fugle api 截取多個不同股票的交易價格，並且寫入 Excel

In [None]:
from bs4 import BeautifulSoup
import requests
import time
import xlwings as xw

# 輸入股票代號，回傳該股票的收盤價
def fugle_stock_crawler(stock_id):
    payload = {
        "symbolId": "2884",
        "apiToken": "把這邊改成你申請到的 api token"
    }

    res = requests.get("https://api.fugle.tw/realtime/v0/intraday/quote", params=payload)
    json_data = res.json()
    
    res1 = requests.get("https://api.fugle.tw/realtime/v0/intraday/meta", params=payload)
    json_data1 = res1.json()

    return {
        "open": json_data["data"]["quote"]["priceOpen"]["price"],
        "high": json_data["data"]["quote"]["priceHigh"]["price"],
        "low": json_data["data"]["quote"]["priceLow"]["price"],
        "close": json_data["data"]["quote"]["trade"]["price"],
        "lastClose": json_data1["data"]["meta"]["priceReference"]
    }

wb = xw.Book(r"tw_stock_portfolio.xlsx")
date = time.strftime("%Y/%m/%d")
# 定義所有投資組合的股票代號
stocks = [2884, 2330, 2317]

for stock in stocks:
    # 截取到該股票代號的收盤價
    data = fugle_stock_crawler(stock)
    # 截取相對應的工作表
    sheet = wb.sheets[f"TW{stock}"]
    # 偵測該工作表的最後一行行數
    last_row = sheet.range("B1").end("down").row
    # 將日期寫入 A 欄
    sheet.range(f"A{last_row+1}").value = date
    sheet.range(f"B{last_row+1}").value = data["open"]
    sheet.range(f"C{last_row+1}").value = data["high"]
    sheet.range(f"D{last_row+1}").value = data["low"]
    sheet.range(f"E{last_row+1}").value = data["close"]
    sheet.range(f"F{last_row+1}").value = data["lastClose"]