<a href="https://colab.research.google.com/github/lendy0/mcu111_python/blob/main/%E7%88%AC%E8%9F%B20517.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Requests 函式庫

requests 函式庫具備了 GET、POST...等各種 request 用法，透過 requests 能夠輕鬆抓取網頁的資料。

## 安裝 requests 模組 

如果是使用 Colab 或 Anaconda，預設已經安裝了 requests 函式庫，不用額外安裝。

```python
import requests 
```

# requests 的 HTTP 方法
requests 可以使用下列 HTTP 六個方法，使用後會傳回一個 Response 物件，六個方法裡，*GET 和 POST 是最常用的兩個方法*。

Response 物件裡包含伺服器回應的訊息資訊，可以透過下列的屬性與方法，查詢相關內容。

*text*回應訊息的內容字串 ( str )。

*json()*將回應訊息進行 JSON 解碼後回傳 ( dict )。

# 靜態網頁內容

台灣水庫即時水情：https://water.taiwanstat.com/

```python
web = requests.get('https://water.taiwanstat.com/')  # 使用 get 方法
print(web.text)    # 讀取並印出 text 屬性
```

# 透過 API 爬取第一個開放資料 
- 高雄輕軌月均運量統計：https://data.gov.tw/dataset/106199
- JSON 檔案連結：https://data.kcg.gov.tw/dataset/6f29f6f4-2549-4473-aa90-bf60d10895dc/resource/30dfc2cf-17b5-4a40-8bb7-c511ea166bd3/download/lightrailtraffic.json

```python
web = requests.get('https://data.kcg.gov.tw/dataset/6f29f6f4-2549-4473-aa90-bf60d10895dc/resource/30dfc2cf-17b5-4a40-8bb7-c511ea166bd3/download/lightrailtraffic.json')
print(web.json())
```

# 傳遞參數 
requests 在使用方法時，也可加入指定的參數，最常用的是 *params ( GET 使用 )、data ( POST 使用 )、headers 和 cookies*。

get 範例網址：https://script.google.com/macros/s/AKfycbw5PnzwybI_VoZaHz65TpA5DYuLkxIF-HUGjJ6jRTOje0E6bVo/exec

```python
# 設定參數
params = {
    'name':'oxxo',
    'age':'18'
}
# 加入參數
web = requests.get('https://script.google.com/macros/s/AKfycbw5PnzwybI_VoZaHz65TpA5DYuLkxIF-HUGjJ6jRTOje0E6bVo/exec', params=params)
print(web.text)
```

# 網頁解析器
Beautiful Soup 函式庫，可以分析網頁的 HTML 與 XML 文件，並將分析的結果轉換成「網頁標籤樹」( tag ) 的型態，讓資料讀取方式更接近網頁的操作語法，處理起來也更為便利。

## 安裝 Beautiful Soup 模組 
如果是使用 Colab 或 Anaconda，預設已經安裝了 Beautiful Soup 函式庫，不用額外安裝。
```python
pip install beautifulsoup4
```

## import Beautiful Soup

```python
from bs4 import BeautifulSoup
```

# 使用 Beautiful Soup

將 HTML 的原始碼 ( 純文字 ) 提供給 Beautiful Soup，就能轉換成可讀取的標籤樹 ( tag )。

```python
url = 'https://water.taiwanstat.com/'
web = requests.get(url)                        # 取得網頁內容
soup = BeautifulSoup(web.text, "html.parser")  # 轉換成標籤樹
print(soup) 
title = soup.title                             # 取得 title
print(title) 
```