# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異


In [126]:
import urllib.request
import os, sys

res = "http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314"
# download the file 
try:
    os.makedirs( './data', exist_ok=True )
    urllib.request.urlretrieve(res, "./data/example.zip")
except:
    print('發生錯誤！')

#unzip the file
import zipfile

with zipfile.ZipFile('./data/example.zip') as f:
    f.extractall('./data')

## File I/O

In [None]:
# 讀檔案
fh = open("./data/64_72hr_CH.xml", "r", encoding="utf-8")
xml = fh.read()
fh.close()

print(xml)

## xmltodict

In [128]:
# 解析檔案內容
import xmltodict
d = dict(xmltodict.parse(xml))

In [None]:
# 取出 datasetDescription
datasetDescription = d['cwbopendata']['dataset']['locations']['location']
print(datasetDescription)


### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [130]:
# 1. 請問高雄市有多少地區有溫度資料？

print("{}個".format(len(datasetDescription)))

38個


In [131]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度

datasetDescription = d['cwbopendata']['dataset']['locations']['location']

list_1 = []

for location in datasetDescription:
    #print(location['locationName'])
    for weatherElement in location['weatherElement']:
        if (weatherElement['description']=='溫度'):
            dataTime = weatherElement['time'][0]['dataTime']
            #print("時間：{}".format(dataTime))
            
            value = weatherElement['time'][0]['elementValue']['value']
            measures = weatherElement['time'][0]['elementValue']['measures']
            dic = {location['locationName']:{'時間': dataTime, '溫度':value}}
            #print("{}:{}".format(measures,value))
            
            list_1.append(dic)

print(list_1)

[{'鹽埕區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'鼓山區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'左營區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '17'}}, {'楠梓區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '17'}}, {'三民區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '17'}}, {'新興區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'前金區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'苓雅區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'前鎮區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'旗津區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'小港區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'鳳山區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '17'}}, {'林園區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'大寮區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}}, {'大樹區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '16'}}, {'大社區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '16'}}, {'仁武區': {'時間': '2020-02-20T00:00:00+08:00', '溫度': '16'}}, {'鳥松區': {'時間'

In [132]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度
list_2 = []

location = datasetDescription[0]
#print(location['locationName'])
for weatherElement in location['weatherElement']:
    if (weatherElement['description']=='溫度'):
        for time in weatherElement['time']:
            dataTime = time['dataTime']
            #print("時間：{}".format(dataTime))
            
            value = time['elementValue']['value']
            dic = {'時間': dataTime, '溫度':value}
    
            list_2.append(dic)

print(list_2)

[{'時間': '2020-02-20T00:00:00+08:00', '溫度': '18'}, {'時間': '2020-02-20T03:00:00+08:00', '溫度': '17'}, {'時間': '2020-02-20T06:00:00+08:00', '溫度': '16'}, {'時間': '2020-02-20T09:00:00+08:00', '溫度': '18'}, {'時間': '2020-02-20T12:00:00+08:00', '溫度': '23'}, {'時間': '2020-02-20T15:00:00+08:00', '溫度': '24'}, {'時間': '2020-02-20T18:00:00+08:00', '溫度': '22'}, {'時間': '2020-02-20T21:00:00+08:00', '溫度': '20'}, {'時間': '2020-02-21T00:00:00+08:00', '溫度': '19'}, {'時間': '2020-02-21T03:00:00+08:00', '溫度': '18'}, {'時間': '2020-02-21T06:00:00+08:00', '溫度': '18'}, {'時間': '2020-02-21T09:00:00+08:00', '溫度': '19'}, {'時間': '2020-02-21T12:00:00+08:00', '溫度': '24'}, {'時間': '2020-02-21T15:00:00+08:00', '溫度': '24'}, {'時間': '2020-02-21T18:00:00+08:00', '溫度': '23'}, {'時間': '2020-02-21T21:00:00+08:00', '溫度': '21'}, {'時間': '2020-02-22T00:00:00+08:00', '溫度': '20'}, {'時間': '2020-02-22T03:00:00+08:00', '溫度': '19'}, {'時間': '2020-02-22T06:00:00+08:00', '溫度': '18'}, {'時間': '2020-02-22T09:00:00+08:00', '溫度': '20'}, {'時間': '2020-02-22T