#  Introduction to Python

### part 12  Beautifulsoup & Requests & Selenium

- Beautifulsoup:
  借助網頁的結構特性來解析網頁的工具，只需要簡單的幾條指令就可以提取HTML標籤裡的元素。

- requests:
  對網路發動請求的套件取得html，可實作對網頁做get、post等HTTP協定的行為，爬取網路資料

- selenium:
  利用指令在網頁上進行自動化操作

#### 2021/5/14

In [None]:
第 10 章 爬取網路資料：使用 requests
10-0 用 requests 存取網路資源
10-1 以 requests 取得網路服務
10-2 解析網路服務的資料內容
10-3 網路服務實用範例：中央氣象局 36 小時天氣預報
10-4 網路資料圖形化：以地震震度統計為例

#### 參考資料

- https://www.crummy.com/software/BeautifulSoup/bs4/doc/

- https://blog.gtwang.org/programming/python-beautiful-soup-module-scrape-web-pages-tutorial/

- https://medium.com/seaniap/python%E7%88%AC%E8%9F%B2-2-beautiful-soup%E7%9A%84%E7%B6%B2%E9%A0%81%E7%88%AC%E5%8F%96%E6%8A%80%E5%B7%A7-dbb8eb625897

- https://ithelp.ithome.com.tw/articles/10204390    

- https://www.learncodewithmike.com/2020/02/python-beautifulsoup-web-scraper.html

- https://ithelp.ithome.com.tw/articles/10202121

- https://www.slideshare.net/tw_dsconf/python-78691041

- https://ithelp.ithome.com.tw/articles/10244761

在實務上開發專案時，很多時候會利用其他網站的資料來進行分析或運用，而取得的方式除了透過網站所提供的API(Application Programming Interface)外，也可以利用Python來開發爬蟲程式，將網頁的HTML內容下載下來，接著利用BeautifulSoup套件(Package)，擷取所需的資訊。

Beautiful Soup 的運作方式就是讀取 HTML 原始碼，自動進行解析並產生一個 BeautifulSoup 物件，此物件中包含了整個 HTML 文件的結構樹，有了這個結構樹之後，就可以輕鬆找出任何有興趣的資料了。



### 引入套件

首先匯入requests與BeautifulSoup模組，可以直接呼叫使用

`import requests`

`from bs4 import BeautifulSoup`

- requests:

  利用requests裡面的get()方法來抓取指定要爬的網址，設定適當的編碼後，用text()取得原始碼
  例如
  
  `url ='https://tw.news.yahoo.com/'`
  
  `html = requests.get(url)`
  
  指定網頁的編碼 `html.encoding = 'UTF-8'`


- BeautifulSoup：

  `sp = BeautifulSoup(原始碼, 解析器)`
  
  其中，在解析器（Parser）的部分可以使用lxml、html5lib等套件，或者是使用Python內建的html.parser來解析原始碼
  
  `sp.<tag>` = 傳回<tag>的內容。例如 `sp.title` 傳回title內容
  
  `find()` = 傳回第一個符合條件的tag，例如`sp.title("a")`
  
  `find_all()` = 傳回所有符合條件的tag，例如`sp.title("a")`
  
  `select()` = 傳回指定CSS選擇器的內容，例如以id讀取 `sp.select("#id")`、以class讀取 `sp.select(".classname")`

In [None]:
import requests

url = 'https://tw.news.yahoo.com/'
html = requests.get(url)
html.encoding = 'UTF-8'

print(html.text)

### 自訂HTTP Headers
模擬瀏覽器的操作

In [None]:
import requests
from bs4 import BeautifulSoup

url = 'https://tw.news.yahoo.com/'

#自訂表頭
headers = {
    'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
}

#加入get內

r = requests.get(url, headers=headers)

print(r.text)

In [15]:
import requests
from bs4 import BeautifulSoup

url ='https://tw.news.yahoo.com/'
html = requests.get(url)
html.encoding = 'UTF-8'

#使用html5lib的解析器，解讀抓到的內容
sp = BeautifulSoup(html.text, 'html5lib')


print(sp.title) #印出網頁的標題（title）
print(sp.h1.text) #印出內文中的標題（h1）
print(sp.find('h2')) #讀取h2標籤內容
print(sp.select("title"))  #以CSS選擇器讀取title標籤

<title>Yahoo奇摩新聞</title>
Yahoo奇摩新聞
None
[<title>Yahoo奇摩新聞</title>]


![](./images/html_structure.jpg)

操作步驟:
1.了解HTML網頁語法基本編寫概念
在網頁上按F12可以瀏覽網頁原始碼，html架構由以下的基本元素組成。 
²  網頁的所有內容會包含在< html> 和< /html> 標籤之間
²  網頁中重要元素或定義會放在< head>和< /head> 標簽之間，例如: 放置網頁標題的< title>標籤，就會放置在head裡面。
²  網頁中所呈現的內容(可視化的部份)，會放於< body> 和< /body> 標籤之間。其中標示文章標題的標

In [None]:
import requests
from bs4 import BeautifulSoup 

r = requests.get("https://www.ptt.cc/bbs/MobileComm/index.html") #將此頁面的HTML GET下來
#print(r.text) #印出HTML

#將抓下來的資料用Beautifulsoup4轉為HTML的parser
sp = BeautifulSoup(r.text,"html.parser") #將網頁資料以html.parser解析
sel = sp.select("div.title a") #取HTML標中的 <div class="title"></div> 中的<a>標籤存入sel
for s in sel:
    print(s["href"], s.text)

練習對靜態網頁爬蟲，用Requests的get取得PTT的頁面內容，並用python BeautifulSoup4將PTT NBA版的文章標題和發文時間擷取出來

https://medium.com/li-ting-liao-tiffany/%E6%AF%8F%E5%A4%A9%E4%BA%94%E5%88%86%E9%90%98-learn-new-things-eb8ad8e913be

In [None]:
import requests
from bs4 import BeautifulSoup as bs

#NBA網址
res = requests.get('https://www.ptt.cc/bbs/NBA/index.html')

#用lxml’s HTML parser直接解析html的tag
soup = bs(res.text,'lxml')

#建議看完就把它comment掉省記憶體
#res.text

#抓這個頁面所有符合這個條件也就是的內容
#find_all回傳是一個list
raw_titles = soup.find_all('div','title')

#可以抓出第一個標籤
raw_titles[0]

#每ㄧ個內容物是在developer tool 的 element頁面下的標籤
type(raw_titles[0])

#抓出標籤中的文字
raw_titles[0].text

#在tag裡面再找'a'tag, 再get（'href')
raw_titles[0].find('a').get('href')

#也可以寫成：
raw_titles[0].find('a')['href']

#用for迴圈把所有文章的tag印出來
for i in raw_titles:
    print(i)
    
#第一種解法, 每個i都是div標籤, 然後div裡面有a, a裡面有href, 建議每次都先print(i)並用print('===')隔開：
# results = []
# for i in raw_titles:
#     result = {}
#     result['topic'] = i.text.strip() #字串前後空白都會去掉
#     result['url'] = i.find('a').get('href')
#     results.append(result)
# print(results)
#就完成囉！

#也可以練習selector定位, 也是回傳list
soup.select('#main-container > div.r-list-container.action-bar-margin.bbs-screen > div:nth-child(2) > div.title > a')

#如果把指定位置的div:nth-child(2)改成div, 就會取到所有文章的'a'
soup.select('#main-container > div.r-list-container.action-bar-margin.bbs-screen > div > div.title > a')

#也可以把所有位置縮減成div.title > a, 也會取到所有文章的'a'
#建議在selector位置的一整串定位中，從最後面開始看, 有沒有帶有數字等等, 試著縮減一整串定位看看
#這個做法是可以在有被刪除的文章時,就不會報錯
soup.select('div.title > a')

#拿到a標籤中的超連結
for a in soup.select('div.title > a'):
    print(a.get('href'))
    
#第二種解法, 每個i都是a標籤
#可以省略div.title變成.title
raw_titles = soup.select('.title > a')
results = []
for i in raw_titles:
    result = {}
    result['topic'] = i.text
    result['url'] = 'https://www.ptt.cc'+i.get('href') #可以在抓下來的網址前面加上ptt的url標頭
    results.append(result)
print(results)

'''
#匯出成json檔
import json
with open('nba.json','a',encoding='utf8') as file:
    for i in results:
        file.write(json.dumps(i, ensure_ascii=False))
        file.write('\n')
'''

## session 與 cookie

瀏覽器訪問伺服器端，伺服器會發一個憑證以供識別，儲存在用戶端的為cookie，在伺服器端的為session。只要所屬的憑證未過期，伺服器可以辨識，儲存的資料可以是登入者的訊息等，多種訊息。所以可以用session()方式紀錄cookie訊息，保持Cookie登入狀態

#### 例：  ptt八卦板，進入時需要確認是否滿18歲

https://www.stevenhi.xyz/2020/11/29/python-ptt-web-crawler/

In [16]:
import requests
from bs4 import BeautifulSoup

payload = {
   'from': 'https://www.ptt.cc/bbs/Gossiping/index.html',
    'yes': 'yes'
}
headers = {
    'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
}
rs = requests.Session()
rs.post('https://www.ptt.cc/ask/over18', data=payload, headers=headers)
res = rs.get('https://www.ptt.cc/bbs/Gossiping/index.html', headers=headers)

soup = BeautifulSoup(res.text, 'html.parser')

items = soup.select('.r-ent')
for item in items:
    print(item.select('.date')[0].text, item.select('.author')[0].text, item.select('.title')[0].text)



 5/07 mark32928 
[問卦] 有沒有簽名要怎麼練才寫的好看的八卦

 5/07 iou861007 
[問卦] "中"文是中國文嗎?

 5/07 Lailungsheng 
Re: [問卦] 什麼人會覺得機組人員順位>醫護 ?

 5/07 sweat992001 
[新聞] 男闖台南五分局探毒友嗆聲影片曝光 囂張喊：叫局長來扛

 5/07 devidevi 
Re: [問卦] 什麼人會覺得機組人員順位>醫護 ?

 5/07 moonchaser 
[問卦] 現在公司聚餐表演PPAP還能炒熱氣氛嗎？

 5/07 aure0914 
[問卦] 翁立友現在在想什麼？

 5/07 ejeanstone 
[新聞] 印度日增41萬人染疫 第2波疫情從都市擴

 5/07 KillerMoDo 
Re: [新聞] 雞排妹「御用律師」與賣淫集團合作 仙人

 5/07 mos3491948 
[問卦] 極致的速度能扭曲空間嗎?

 5/07 a1234a123499 
Re: [新聞] 5人聚餐2500！他持7折券「不付錢」遭批

 5/07 yoyodiy 
[問卦] 等等去台北辦事 台北車站公車亭在哪?

 5/07 Qorqios 
Re: [問卦] 一億的鈔票從天而降，怎樣才能撿到最多?

 5/07 makinoyui 
[問卦] 一天一檢舉 交通好規矩？

 5/07 RLAPH 
Re: [新聞] 5人聚餐2500！他持7折券「不付錢」遭批

 5/07 h0103661 
Re: [新聞] 5人聚餐2500！他持7折券「不付錢」遭批

 5/07 Manny2020 
Re: [新聞] 雞排妹「御用律師」與賣淫集團合作 仙人

 5/07 RW2010 
[新聞] 「頻繁酒駕長久惡夢」　隋棠怒留言柯文

 5/07 wwwson1256 
[問卦] 歐洲也少子化 怎沒整天哭腰？

 5/07 haiduc 
[問卦] 吃蛇膽真的會視力變好？

11/21 arsonlolita 
[公告] 八卦板板規(2020.11.21)

 5/01 arsonlolita 
[公告] 部份板規修正草案5/4部份調整

 5/02 s1301806 
[協尋] 4/28行車紀錄器(6:50～7:30)安定交流道

 5/05 ubcs 
Fw: [活

"\nimport requests\nfrom bs4 import BeautifulSoup\n\npayload = {\n'from': '/bbs/Gossiping/index.html',\n'yes': 'yes'\n}\n\nrs = requests.session()\nres = rs.post('https://www.ptt.cc/ask/over18',data=payload)\nres = rs.get('https://www.ptt.cc/bbs/Gossiping/index.html')\nsoup = BeautifulSoup(res.text)\n\nfor entry in soup.select('.r-ent'):\n    print(entry.select('.title')[0].text,entry.select('.date')[0].text)\n    "

# 中央氣象局

1. 先到中央氣象局的[開放資料庫平台](https://opendata.cwb.gov.tw/index)註冊一免費帳號，需要有email即可註冊。

2. 登入該網站，點選取得授權碼，即可獲得一組如下的授權碼 CWB-xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx

3. 由提供的API擷取資料：

   說明文件：https://opendata.cwb.gov.tw/devManual/insrtuction

   一般天氣預報 今明36小時天預報：
   https://opendata.cwb.gov.tw/dist/opendata-swagger.html#/%E9%A0%90%E5%A0%B1/get_v1_rest_datastore_F_C0032_001


### 方法與簡易說明：

- URL： https://opendata.cwb.gov.tw/api/v1/opendataapi/{dataid}?Authorization={apikey}&format={data_format}&locationName={city}
                
  `dataid` 為各資料代碼。例如 F_C0032_001 為一般天氣預報 今明36小時天預報
                
  `apikey` 為授權碼。例如 CWB-1234ABCD-78EF-GH90-12XY-IJKL12345678
                
  `data_format` 為資料格式，可下載之檔案格式。有 JSON、XML
  
  `city` 為縣市名稱，有宜蘭縣、花蓮縣、臺東縣、澎湖縣、金門縣、連江縣、臺北市、新北市、桃園市、臺中市、臺南市、高雄市、基隆市、新竹縣、新竹市、苗栗縣、彰化縣、南投縣、雲林縣、嘉義縣、嘉義市、屏東縣
              
   
※ 範例：
url = 'https://opendata.cwb.gov.tw/api/v1/opendataapi/F-A0012-001?Authorization=CWB-1234ABCD-78EF-GH90-12XY-IJKL12345678&format=JSON&locationName=新北市'

下載後為JSON檔，可轉成dict，在弄成pandas DataFrame
                


## JSON檔

### 讀取
- `import json`

  `json.load()` 
   轉換json至dict，經由loads方法轉出，會產生一個dictionary型態資料


- 利用pandas讀取json檔案

  `df = pd.read_json('filename')`

### 轉為JSON

- 使用dumps，轉換dict至JSON

  `data_json = json.dumps(data)`
  

- 由pandas的dataFrame轉成json檔案

  `df.to_json("data.json")`
  
https://www.datainpoint.com/data-science-in-action/02-importing-files.html#%E6%AA%94%E6%A1%88%EF%BC%9Ajson

#### 看JSON結構 

https://jsoneditoronline.org/

In [6]:
#json的練習

import json

#讀取

# json 的資料形式字串
x =  '{ "name":"jim", "age":25, "city":"Taiwan"}'

# 轉換json至dict
person = json.loads(x)

print(type(person)) #<class 'dict'>
print(person) #{'name': 'jim', 'age': 25, 'city': 'Taiwan'}
print(person['age']) #25


#輸出

#轉換dict至JSON
person = {'name': 'jim', 'age': 25, 'city': 'Taiwan'}
data = json.dumps(person)

print(type(data)) #<class 'str'>
print(data) #{"name": "jim", "age": 25, "city": "Taiwan"}

<class 'dict'>
{'name': 'jim', 'age': 25, 'city': 'Taiwan'}
25
<class 'str'>
{"name": "jim", "age": 25, "city": "Taiwan"}


In [1]:
#抓取一般天氣預報-今明36小時天預報所有資料

import requests
import numpy as np
import pandas as pd


data_id = 'F-C0032-001'
apikey = 'CWB-BAE79F47-D9E2-4810-BABD-E1F1AB2B3E09' #金鑰
data_format = 'JSON' 
#city = '臺北市'
    
#url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/' + data_id + '?Authorization=' + apikey + '&format=' + data_format '&locationName=' + str(city)
url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/' + data_id + '?Authorization=' + apikey + '&format=' + data_format


Data = requests.get(url)

print(Data.text)


{"success":"true","result":{"resource_id":"F-C0032-001","fields":[{"id":"datasetDescription","type":"String"},{"id":"locationName","type":"String"},{"id":"parameterName","type":"String"},{"id":"parameterValue","type":"String"},{"id":"parameterUnit","type":"String"},{"id":"startTime","type":"Timestamp"},{"id":"endTime","type":"Timestamp"}]},"records":{"datasetDescription":"三十六小時天氣預報","location":[{"locationName":"嘉義縣","weatherElement":[{"elementName":"Wx","time":[{"startTime":"2021-05-10 06:00:00","endTime":"2021-05-10 18:00:00","parameter":{"parameterName":"多雲時晴","parameterValue":"3"}},{"startTime":"2021-05-10 18:00:00","endTime":"2021-05-11 06:00:00","parameter":{"parameterName":"多雲時晴","parameterValue":"3"}},{"startTime":"2021-05-11 06:00:00","endTime":"2021-05-11 18:00:00","parameter":{"parameterName":"晴時多雲","parameterValue":"2"}}]},{"elementName":"PoP","time":[{"startTime":"2021-05-10 06:00:00","endTime":"2021-05-10 18:00:00","parameter":{"parameterName":"0","parameterUnit":"百分比"}},{

In [50]:
#輸入地區，取得一般天氣預報-今明36小時天預報資料

import requests
def get(city):
    data_id = 'F-C0032-001'
    apikey = 'CWB-BAE79F47-D9E2-4810-BABD-E1F1AB2B3E09' #金鑰
    data_format = 'JSON'
    
    url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/' + data_id + '?Authorization=' + apikey + '&format=JSON&locationName=' + str(city)
    #url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/' + data_id + '?Authorization=' + apikey + '&format=JSON'
    Data = requests.get(url)

    #print(Data.text)
    
    return Data.text


#print(get('新北市'))


轉為dict
Data_dict = json.loads(get('新北市'))
data = json.loads(get(''))


#如下結構取出需要的內容
#print(Data_dict["records"]["location"][0]["locationName"])







In [None]:
#### 擷取的JSON結構
{
  "success": "true",
  "result": {
    "resource_id": "F-C0032-001",
    "fields": [
      {
        "id": "datasetDescription",
        "type": "String"
      },
      {
        "id": "locationName",
        "type": "String"
      },
      {
        "id": "parameterName",
        "type": "String"
      },
      {
        "id": "parameterValue",
        "type": "String"
      },
      {
        "id": "parameterUnit",
        "type": "String"
      },
      {
        "id": "startTime",
        "type": "Timestamp"
      },
      {
        "id": "endTime",
        "type": "Timestamp"
      }
    ]
  },
  "records": {
    "datasetDescription": "三十六小時天氣預報",
    "location": [
      {
        "locationName": "新北市",
        "weatherElement": [
          {
            "elementName": "Wx",
            "time": [
              {
                "startTime": "2021-05-10 12:00:00",
                "endTime": "2021-05-10 18:00:00",
                "parameter": {
                  "parameterName": "晴時多雲",
                  "parameterValue": "2"
                }
              },
              {
                "startTime": "2021-05-10 18:00:00",
                "endTime": "2021-05-11 06:00:00",
                "parameter": {
                  "parameterName": "晴時多雲",
                  "parameterValue": "2"
                }
              },
              {
                "startTime": "2021-05-11 06:00:00",
                "endTime": "2021-05-11 18:00:00",
                "parameter": {
                  "parameterName": "多雲時晴",
                  "parameterValue": "3"
                }
              }
            ]
          },
          {
            "elementName": "PoP",
            "time": [
              {
                "startTime": "2021-05-10 12:00:00",
                "endTime": "2021-05-10 18:00:00",
                "parameter": {
                  "parameterName": "20",
                  "parameterUnit": "百分比"
                }
              },
              {
                "startTime": "2021-05-10 18:00:00",
                "endTime": "2021-05-11 06:00:00",
                "parameter": {
                  "parameterName": "10",
                  "parameterUnit": "百分比"
                }
              },
              {
                "startTime": "2021-05-11 06:00:00",
                "endTime": "2021-05-11 18:00:00",
                "parameter": {
                  "parameterName": "10",
                  "parameterUnit": "百分比"
                }
              }
            ]
          },
          {
            "elementName": "MinT",
            "time": [
              {
                "startTime": "2021-05-10 12:00:00",
                "endTime": "2021-05-10 18:00:00",
                "parameter": {
                  "parameterName": "30",
                  "parameterUnit": "C"
                }
              },
              {
                "startTime": "2021-05-10 18:00:00",
                "endTime": "2021-05-11 06:00:00",
                "parameter": {
                  "parameterName": "26",
                  "parameterUnit": "C"
                }
              },
              {
                "startTime": "2021-05-11 06:00:00",
                "endTime": "2021-05-11 18:00:00",
                "parameter": {
                  "parameterName": "26",
                  "parameterUnit": "C"
                }
              }
            ]
          },
          {
            "elementName": "CI",
            "time": [
              {
                "startTime": "2021-05-10 12:00:00",
                "endTime": "2021-05-10 18:00:00",
                "parameter": {
                  "parameterName": "悶熱"
                }
              },
              {
                "startTime": "2021-05-10 18:00:00",
                "endTime": "2021-05-11 06:00:00",
                "parameter": {
                  "parameterName": "舒適至悶熱"
                }
              },
              {
                "startTime": "2021-05-11 06:00:00",
                "endTime": "2021-05-11 18:00:00",
                "parameter": {
                  "parameterName": "舒適至悶熱"
                }
              }
            ]
          },
          {
            "elementName": "MaxT",
            "time": [
              {
                "startTime": "2021-05-10 12:00:00",
                "endTime": "2021-05-10 18:00:00",
                "parameter": {
                  "parameterName": "34",
                  "parameterUnit": "C"
                }
              },
              {
                "startTime": "2021-05-10 18:00:00",
                "endTime": "2021-05-11 06:00:00",
                "parameter": {
                  "parameterName": "30",
                  "parameterUnit": "C"
                }
              },
              {
                "startTime": "2021-05-11 06:00:00",
                "endTime": "2021-05-11 18:00:00",
                "parameter": {
                  "parameterName": "34",
                  "parameterUnit": "C"
                }
              }
            ]
          }
        ]
      }
    ]
  }
}

In [42]:
#轉成dataframe

import requests
import numpy as np
import pandas as pd
import json

data_id = 'F-C0032-001'
apikey = 'CWB-BAE79F47-D9E2-4810-BABD-E1F1AB2B3E09' #金鑰
data_format = 'JSON' 
#city = '臺北市'
    
#url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/' + data_id + '?Authorization=' + apikey + '&format=' + data_format '&locationName=' + str(city)
url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/' + data_id + '?Authorization=' + apikey + '&format=' + data_format

Data = requests.get(url)


#method 1
Data_dict = json.loads(Data.text)
df = pd.DataFrame.from_dict(Data_dict)

#method 2
#df = pd.read_json(url)


#method 3
#df = pd.DataFrame.from_dict(Data.json())

#method 4??
#a = json.loads(Data.text)
#res = pd.json_normalize(a)
#df = pd.DataFrame(res)

print(df)

#df.iloc['locationName']


                   success                                             result  \
resource_id           true                                        F-C0032-001   
fields                true  [{'id': 'datasetDescription', 'type': 'String'...   
datasetDescription    true                                                NaN   
location              true                                                NaN   

                                                              records  
resource_id                                                       NaN  
fields                                                            NaN  
datasetDescription                                          三十六小時天氣預報  
location            [{'locationName': '嘉義縣', 'weatherElement': [{'...  


https://aronhack.com/retrieve-weekly-weather-forecast-with-python/

氣象局在政府資料開放平台上提供了鄉鎮天氣預報-台灣未來1週天氣預報，並提供了json的API。雖然容易使用，但資料中總共包含15項天氣資訊，在結構上又是一層包一層，必須要有耐心的抽絲剝繭，才能轉成容易使用的表格型式。

In [14]:
def get_weather_weekly_forecast(path):
    '''
    https://data.gov.tw/dataset/9308
    '''
    import pandas 
    import requests

    url = 'https://opendata.cwb.gov.tw/api/v1/rest/datastore/F-D0047-091?Authorization=rdec-key-123-45678-011121314'
    r = requests.get(url)

    # Parse
    data = pd.read_json(r.text)
    data = data.loc['locations', 'records']
    data = data[0]['location']

    # Fetch Data ......
    results = pd.DataFrame()

    # 共22個地區，每個地區約30秒，資料筆數約60368
    for i in range(len(data)):
        loc_data = data[i]
        
        loc_name = loc_data['locationName']
        geocode = loc_data['geocode']
        lat = loc_data['lat']
        lon = loc_data['lon']
        weather_data = loc_data['weatherElement']

        # 資料類型，有15個
        # 0              PoP12h 12小時降雨機率
        # 1                   T 平均溫度
        # 2                  RH 平均相對濕度
        # 3               MinCI 最小舒適度指數
        # 4                  WS 最大風速
        # 5               MaxAT 最高體感溫度
        # 6                  Wx 天氣現象
        # 7               MaxCI 最大舒適度指數
        # 8                MinT 最低溫度
        # 9                UVI 紫外獻指數
        # 10 WeatherDescription 天氣預報綜合描述
        # 11              MinAT 最低體感溫度
        # 12               MaxT 最高溫度
        # 13                 WD 風向
        # 14                 Td 平均露點溫度
        
        
        for j in range(len((weather_data))):
            ele_data_dict = weather_data[j]
            
            for k in range(len(ele_data_dict)):
                ele_name = ele_data_dict['elementName']
                ele_desc = ele_data_dict['description']
                ele_data = ele_data_dict['time']

                # 此欄位為質性資料，如「'陰短暫雨。降雨機率 90%。溫度攝氏18至22度。
                # 舒適。東北風 風速5級(每秒8公尺)。相對濕度92%。'」，因此不保留
                if ele_name == 'WeatherDescription':
                    continue
                
                for l in range(len(ele_data)):
                    start_time = ele_data[l]['startTime']
                    end_time = ele_data[l]['endTime']
                    value = ele_data[l]['elementValue'][0]['value']
                    
                    # 先保留全部的資料，最後再決定要保留哪些欄位
                    new_data = \
                        pd.DataFrame({'location':[loc_name],
                                      'geocode':[geocode],
                                      'lat':[lat],
                                      'lon':[lon],
                                      'element':[ele_name],
                                      'description':[ele_desc],
                                      'start_time':[start_time],
                                      'end_time':[end_time],
                                      'value':[value]})
                    
                    results = results.append(new_data)
        print('update_weekly_forecast' + str(i) + '/' + str(len(data)))
            
    results = results.reset_index(drop=True)
    results.to_csv(path + '/r.csv', index=False)
    return results

`from selenium import webdriver`
driver = webdriver.Chrome()

要先安裝chrome的驅動：https://sites.google.com/a/chromium.org/chromedriver/downloads
將ChromeDriver.exe 複製到Anaconda3資料夾內