# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異


In [None]:
'''
File I/O讀出內容為原始xml格式內容，而xmltodict讀出是經過解析後轉化為dict型別的資料內容，因此可以很方便取得特定欄位值。
'''

### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [22]:
# 1. 請問高雄市有多少地區有溫度資料？

# 引入Library
from urllib.request import urlretrieve
import zipfile
import os
import xmltodict as xtd

# 下載檔案同時解壓縮另存於/data
rawDataUrl = "http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314"
dirName = "/Users/s./Downloads/data/"
dataFileName = "exapmle.zip"
kaohsiungFile = "64_72hr_CH.xml"

urlretrieve(rawDataUrl, dirName + dataFileName)
data = zipfile.ZipFile(dirName + dataFileName)
data.extractall(dirName)

# 檢視/data內所有檔案
# fileList = os.listdir(dirName)

# for file in fileList:
#     print(file)

# 讀取高雄市資料存放檔案
try:
    with open(dirName + kaohsiungFile, "r") as kf:
        kfXml = kf.read()
#         print(kfXml)
except Exception as e:
    print(e.args)

# 解析檔案內容為dict
content = dict(xtd.parse(kfXml))

# 取出所有location欄位值並取得地區總數
locations = content["cwbopendata"]["dataset"]["locations"]["location"]
print(f"高雄市有 {len(locations)} 個地區有溫度資料")

高雄市有 38 個地區有溫度資料


In [30]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度

# 引入Library
from urllib.request import urlretrieve
import zipfile
import os
import xmltodict as xtd

# 下載檔案同時解壓縮另存於/data
rawDataUrl = "http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314"
dirName = "/Users/s./Downloads/data/"
dataFileName = "exapmle.zip"
kaohsiungFile = "64_72hr_CH.xml"

urlretrieve(rawDataUrl, dirName + dataFileName)
data = zipfile.ZipFile(dirName + dataFileName)
data.extractall(dirName)

# 讀取高雄市資料存放檔案
try:
    with open(dirName + kaohsiungFile, "r") as kf:
        kfXml = kf.read()
except Exception as e:
    print(e.args)

# 解析檔案內容為dict
content = dict(xtd.parse(kfXml))

# 取出各location第一個weatherElement的第一個time的時間跟溫度值
locations = content["cwbopendata"]["dataset"]["locations"]["location"]

for location in locations:
    locationName = location["locationName"]
    dataTime = location["weatherElement"][0]["time"][0]["dataTime"]
    measures = location["weatherElement"][0]["time"][0]["elementValue"]\
                ["measures"]
    value = location["weatherElement"][0]["time"][0]["elementValue"]\
                ["value"]
    print(f"高雄市 {locationName} 地區，第一個時間 {dataTime} 之溫度為 {measures}{value}")
    

高雄市 鹽埕區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 鼓山區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 左營區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 楠梓區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 三民區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 新興區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度23
高雄市 前金區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 苓雅區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度23
高雄市 前鎮區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度23
高雄市 旗津區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 小港區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度23
高雄市 鳳山區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 林園區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度23
高雄市 大寮區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 大樹區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度21
高雄市 大社區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度21
高雄市 仁武區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 鳥松區 地區，第一個時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 岡山區 地區，第一個時間 2020-04-25T

In [31]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度

# 引入Library
from urllib.request import urlretrieve
import zipfile
import os
import xmltodict as xtd

# 下載檔案同時解壓縮另存於/data
rawDataUrl = "http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314"
dirName = "/Users/s./Downloads/data/"
dataFileName = "exapmle.zip"
kaohsiungFile = "64_72hr_CH.xml"

urlretrieve(rawDataUrl, dirName + dataFileName)
data = zipfile.ZipFile(dirName + dataFileName)
data.extractall(dirName)

# 讀取高雄市資料存放檔案
try:
    with open(dirName + kaohsiungFile, "r") as kf:
        kfXml = kf.read()
except Exception as e:
    print(e.args)

# 解析檔案內容為dict
content = dict(xtd.parse(kfXml))

# 取出第一個location的第一個weatherElement的所有時間跟溫度值
location = content["cwbopendata"]["dataset"]["locations"]["location"][0]
locationName = location["locationName"]
timeList = location["weatherElement"][0]["time"]

for time in timeList:
    dataTime = time["dataTime"]
    measures = time["elementValue"]["measures"]
    value = time["elementValue"]["value"]
    print(f"高雄市 {locationName} 地區，時間 {dataTime} 之溫度為 {measures}{value}")
    

高雄市 鹽埕區 地區，時間 2020-04-25T00:00:00+08:00 之溫度為 攝氏度22
高雄市 鹽埕區 地區，時間 2020-04-25T03:00:00+08:00 之溫度為 攝氏度22
高雄市 鹽埕區 地區，時間 2020-04-25T06:00:00+08:00 之溫度為 攝氏度22
高雄市 鹽埕區 地區，時間 2020-04-25T09:00:00+08:00 之溫度為 攝氏度25
高雄市 鹽埕區 地區，時間 2020-04-25T12:00:00+08:00 之溫度為 攝氏度27
高雄市 鹽埕區 地區，時間 2020-04-25T15:00:00+08:00 之溫度為 攝氏度27
高雄市 鹽埕區 地區，時間 2020-04-25T18:00:00+08:00 之溫度為 攝氏度26
高雄市 鹽埕區 地區，時間 2020-04-25T21:00:00+08:00 之溫度為 攝氏度25
高雄市 鹽埕區 地區，時間 2020-04-26T00:00:00+08:00 之溫度為 攝氏度24
高雄市 鹽埕區 地區，時間 2020-04-26T03:00:00+08:00 之溫度為 攝氏度24
高雄市 鹽埕區 地區，時間 2020-04-26T06:00:00+08:00 之溫度為 攝氏度23
高雄市 鹽埕區 地區，時間 2020-04-26T09:00:00+08:00 之溫度為 攝氏度26
高雄市 鹽埕區 地區，時間 2020-04-26T12:00:00+08:00 之溫度為 攝氏度29
高雄市 鹽埕區 地區，時間 2020-04-26T15:00:00+08:00 之溫度為 攝氏度29
高雄市 鹽埕區 地區，時間 2020-04-26T18:00:00+08:00 之溫度為 攝氏度27
高雄市 鹽埕區 地區，時間 2020-04-26T21:00:00+08:00 之溫度為 攝氏度26
高雄市 鹽埕區 地區，時間 2020-04-27T00:00:00+08:00 之溫度為 攝氏度25
高雄市 鹽埕區 地區，時間 2020-04-27T03:00:00+08:00 之溫度為 攝氏度24
高雄市 鹽埕區 地區，時間 2020-04-27T06:00:00+08:00 之溫度為 攝氏度23
高雄市 鹽埕區 地區，時間 2020-04-27T09:00: