# 利用 Python 存取 API


* 了解 Server Client 的架構與溝通方法
* 知道 HTTP Request & Response 的內容
* 什麼是 API？如何用 Python 程式存取 API 資料


## 作業目標

* 比較一下範例檔案中的「r.text」與「json.loads(r.text)」讀出來的內容有什麼差異
* 自行尋找一個合適的 API 接口做練習，並且查看其回傳內容
    * https://cat-fact.herokuapp.com/facts (來源：https://alexwohlbruck.github.io/cat-facts/)
    * http://odata.wra.gov.tw/v4/RealtimeWaterLevel (來源：https://data.gov.tw/dataset/25768)



### 比較一下範例檔案中的「r.text」與「json.loads(r.text)」讀出來的內容有什麼差異

### 對 API 的承載是由 documents 清單所組成，其為包含 id 和 text 屬性的元組。 text 屬性會儲存要分析的文字，而 id 可以是任何值。

#### r.text
* 以r來儲存想要爬資料的目標網址
* r.text是發送請求的動作
* 將所有的資料以混合的一組str呈現，資料不容易識別

#### json.loads(r.text)
* json以清楚的方式呈現資料，以list的方式將一組組資料分別呈現。
* 將字串轉換為字典

In [1]:
import requests

r = requests.get('https://api.github.com/events')
r.text



In [2]:
type(r.text)

str

In [3]:
import json

json.loads(r.text)

[{'id': '12751628788',
  'type': 'PushEvent',
  'actor': {'id': 31752426,
   'login': 'Habist',
   'display_login': 'Habist',
   'gravatar_id': '',
   'url': 'https://api.github.com/users/Habist',
   'avatar_url': 'https://avatars.githubusercontent.com/u/31752426?'},
  'repo': {'id': 247237616,
   'name': 'Habist/TwitterFilterAPI-Java',
   'url': 'https://api.github.com/repos/Habist/TwitterFilterAPI-Java'},
  'payload': {'push_id': 5292949379,
   'size': 1,
   'distinct_size': 1,
   'ref': 'refs/heads/master',
   'head': '62b4bbe5d87baccec150c8e5a01737afcee87dd8',
   'before': '5c6562832bc33093bab7c1f2bf300fa883d486ac',
   'commits': [{'sha': '62b4bbe5d87baccec150c8e5a01737afcee87dd8',
     'author': {'email': 'liasn@naver.com', 'name': 'Habist'},
     'message': 'parameters properties 추가',
     'distinct': True,
     'url': 'https://api.github.com/repos/Habist/TwitterFilterAPI-Java/commits/62b4bbe5d87baccec150c8e5a01737afcee87dd8'}]},
  'public': True,
  'created_at': '2020-06-27T12:0

In [4]:
type(json.loads(r.text))

list

### 自行尋找一個合適的 API 接口做練習，並且查看其回傳內容

* https://cat-fact.herokuapp.com/facts (來源：https://alexwohlbruck.github.io/cat-facts/)
* http://odata.wra.gov.tw/v4/RealtimeWaterLevel (來源：https://data.gov.tw/dataset/25768)


In [5]:
#API接口練習 - 即時水位資料
import requests

r = requests.get('http://odata.wra.gov.tw/v4/RealtimeWaterLevel')
json.loads(r.text) #資料透過 json.loads 將 json 字串轉換為 dict 

{'@odata.context': 'http://odata.wra.gov.tw/v4/$metadata#RealtimeWaterLevel',
 '@odata.count': 100,
 'value': [{'StationIdentifier': '2200H029',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 145.15},
  {'StationIdentifier': '1730H070',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 226.25},
  {'StationIdentifier': '1580H021',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 1.28},
  {'StationIdentifier': '1580H017',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 25.73},
  {'StationIdentifier': '2560H019',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 4.48},
  {'StationIdentifier': '1580H001',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 224.21},
  {'StationIdentifier': '1730H075',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 92.83},
  {'StationIdentifier': '2420H036',
   'RecordTime': 'Dec 11, 2019 2:50:00 PM',
   'WaterLevel': 164.37},
  {'StationIdentifier': '2500H003',
   'RecordTim

In [6]:
#觀察資料
j = json.loads(r.text)
print(len(j)) #此list含有四組內容，包括@odata.context、@odata.count, value, @odata.nextLink。其中大多數資料儲存於value中
print(len(j['value'])) #此list含有100組資料，每一組資料都含有RecordTime, StationIdentifier, WaterLevel的資訊

4
100


In [7]:
# 用迴圈存取每一個測站所記錄的時間水位高度
j = json.loads(r.text)
for i in range(len(j['value'])): 
    print (j['value'][i]['RecordTime'], #記錄的時間
           j['value'][i]['StationIdentifier'], #測站序號
           j['value'][i]['WaterLevel']) #水位高度

Dec 11, 2019 2:50:00 PM 2200H029 145.15
Dec 11, 2019 2:50:00 PM 1730H070 226.25
Dec 11, 2019 2:50:00 PM 1580H021 1.28
Dec 11, 2019 2:50:00 PM 1580H017 25.73
Dec 11, 2019 2:50:00 PM 2560H019 4.48
Dec 11, 2019 2:50:00 PM 1580H001 224.21
Dec 11, 2019 2:50:00 PM 1730H075 92.83
Dec 11, 2019 2:50:00 PM 2420H036 164.37
Dec 11, 2019 2:50:00 PM 2500H003 32.2
Dec 11, 2019 2:50:00 PM 1730H066 138.73
Dec 11, 2019 2:50:00 PM 1730H077 740.49
Dec 11, 2019 2:50:00 PM 1550H014 26.75
Dec 11, 2019 2:50:00 PM 1670H004 2.98
Dec 11, 2019 2:50:00 PM 2420H019 109.97
Dec 11, 2019 2:50:00 PM 1650H012 0.7
Dec 11, 2019 2:50:00 PM 1730H061 266.23
Dec 11, 2019 2:50:00 PM 1730H072 248.86
Dec 11, 2019 2:50:00 PM 1540H039 38.99
Dec 11, 2019 2:50:00 PM 1660H012 0.14
Dec 11, 2019 2:50:00 PM 2370H025 261.61
Dec 11, 2019 2:50:00 PM 1650H009 0.1
Dec 11, 2019 2:50:00 PM 1730H057 43.48
Dec 11, 2019 2:50:00 PM 1730H068 10.14
Dec 11, 2019 2:50:00 PM 1540H037 32.01
Dec 11, 2019 2:50:00 PM 1650H015 0.05
Dec 11, 2019 2:50:00 PM 2

## 備註 - json概念
* 參考資料: https://dotblogs.com.tw/kevinya/2018/09/09/

In [8]:
#剖析json
import json
j = json.loads(
    '{"one" : "1", "two" : "2", "three" : "3","twoDimension" : {"lv2id":"777", "lv2name":"superman"}}')
print(j['two'])
print(j['twoDimension']["lv2id"])

2
777
