## Python Library Tutorial: `requests` 

### Open API Resource List

- [jsonplaceholder](https://jsonplaceholder.typicode.com/)
- [Data USA](https://datausa.io/about/api/)
- [Cat Facts](https://catfact.ninja/)
- [The Bored API](https://www.boredapi.com/)
- [Agify](https://agify.io/)

reference: [Python 使用 requests 模組產生 HTTP 請求，下載網頁資料](https://blog.gtwang.org/programming/python-requests-module-tutorial/)

### 生資料方式 (從簡易到困難)

- 自己生假資料
- 使用公開資料集 API
- 使用瀏覽器開發人員工具，觀察網頁，打他的 API
- request 網頁 link，直接 parse html

### request format 與開發人員工具

開啟瀏覽器的開發人員工具，選擇 Network，重新整理頁面，點選 request 並觀察 Header / Content

### 安裝 requests 模組
`pip3 install requests`

In [1]:
import requests

### GET 請求

普通單純的網頁，只需要用最簡單的 `GET` 請求即可直接下載

In [2]:

r = requests.get('https://jsonplaceholder.typicode.com/todos/1')
r.status_code


200

In [3]:
# r.text
r.json()

{'userId': 1, 'id': 1, 'title': 'delectus aut autem', 'completed': False}

### 增加 URL 查詢參數

雖然我們也可以自己產生這段 URL，然後直接指定給 `requests`，不過自己處理的話，還必須注意編碼問題（尤其是有中文字的情況），所以建議還是交給 `requests` 統一處理比較省事。

In [4]:
my_params = {'postId': 1}
r = requests.get('https://jsonplaceholder.typicode.com/comments', params = my_params)
print(r.url)
r.status_code

https://jsonplaceholder.typicode.com/comments?postId=1


200

In [5]:
# r.text
r.json()

[{'postId': 1,
  'id': 1,
  'name': 'id labore ex et quam laborum',
  'email': 'Eliseo@gardner.biz',
  'body': 'laudantium enim quasi est quidem magnam voluptate ipsam eos\ntempora quo necessitatibus\ndolor quam autem quasi\nreiciendis et nam sapiente accusantium'},
 {'postId': 1,
  'id': 2,
  'name': 'quo vero reiciendis velit similique earum',
  'email': 'Jayne_Kuhic@sydney.com',
  'body': 'est natus enim nihil est dolore omnis voluptatem numquam\net omnis occaecati quod ullam at\nvoluptatem error expedita pariatur\nnihil sint nostrum voluptatem reiciendis et'},
 {'postId': 1,
  'id': 3,
  'name': 'odio adipisci rerum aut animi',
  'email': 'Nikita@garfield.biz',
  'body': 'quia molestiae reprehenderit quasi aspernatur\naut expedita occaecati aliquam eveniet laudantium\nomnis quibusdam delectus saepe quia accusamus maiores nam est\ncum et ducimus et vero voluptates excepturi deleniti ratione'},
 {'postId': 1,
  'id': 4,
  'name': 'alias odio sit',
  'email': 'Lew@alysha.tv',
  'body'

## 自訂 Header


In [6]:
my_headers = {'user-agent': 'my-app/0.0.1'}

r = requests.get('http://httpbin.org/get', headers = my_headers)
r.status_code

200

In [7]:
# r.text
r.json()

{'args': {},
 'headers': {'Accept': '*/*',
  'Accept-Encoding': 'gzip, deflate',
  'Host': 'httpbin.org',
  'User-Agent': 'my-app/0.0.1',
  'X-Amzn-Trace-Id': 'Root=1-616a8d0f-788952c36f1a593b1298e02c'},
 'origin': '1.160.120.158',
 'url': 'http://httpbin.org/get'}

### POST 請求

只要是網頁中有讓使用者填入資料的表單，大部分都會需要用 `POST` 請求來處理

In [8]:
post_data = {
    'title': 'DB TA tutorial',
    'body': 'requests library is so convenient',
    'userId': 1
}
r = requests.post('https://jsonplaceholder.typicode.com/posts', data = post_data)
r.status_code

201

In [9]:
# r.text
r.json()

{'title': 'DB TA tutorial',
 'body': 'requests library is so convenient',
 'userId': '1',
 'id': 101}

### 補充 - BeatifulSoup4

`pip3 install beautifulsoup4`

更詳細的教學：[Python 使用 Beautiful Soup 抓取與解析網頁資料，開發網路爬蟲教學](https://blog.gtwang.org/programming/python-beautiful-soup-module-scrape-web-pages-tutorial/)

In [25]:
from bs4 import BeautifulSoup
result = requests.get('https://jsonplaceholder.typicode.com/')
result.status_code

200

In [26]:
# result.text
output = BeautifulSoup(result.text, 'html.parser')
print(output.title)
print(output.title.string)

<title>JSONPlaceholder - Free Fake REST API</title>
JSONPlaceholder - Free Fake REST API
