# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異


#### File I/O
* 讀取出來的資料型態為純字串
* 若要取得有效資訊，需要額外花費工夫處理複雜字串

#### xmltodict
* 讀取出來的資料型態為巢狀字典
* 可以透過觀察想取得資訊的Tag並利用字典特性來取值

### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [1]:
# 下載檔案
import urllib.request
import zipfile
import os

res = 'http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314'
download_path = './data/example.zip'
extract_path = './data'

# create download directory
try:
    os.makedirs(extract_path)
except:
    pass

# Download the file into specified path
urllib.request.urlretrieve(res, download_path)

# Unzip the file 
f = zipfile.ZipFile(download_path)
f.extractall(extract_path)

In [2]:
# 1. 請問高雄市有多少地區有溫度資料？

import xmltodict

with open("./data/64_72hr_CH.xml", "r", encoding='UTF-8') as file:
    xml = file.read()
    d = dict(xmltodict.parse(xml))
    print('共', len(d['cwbopendata']['dataset']['locations']['location']), '個地區')

共 38 個地區


In [3]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度
import xmltodict

with open("./data/64_72hr_CH.xml", "r", encoding='UTF-8') as file:
    xml = file.read()
    d = dict(xmltodict.parse(xml))
    for location in d['cwbopendata']['dataset']['locations']['location']:
        locationName = location['locationName']
        timing = location['weatherElement'][0]['time'][0]['dataTime']
        value = location['weatherElement'][0]['time'][0]['elementValue']['value']
        print(locationName, '時間點:', timing, '溫度:', value)

鹽埕區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
鼓山區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
左營區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
楠梓區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
三民區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
新興區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
前金區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
苓雅區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
前鎮區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
旗津區 時間點: 2019-11-27T18:00:00+08:00 溫度: 24
小港區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
鳳山區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
林園區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
大寮區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
大樹區 時間點: 2019-11-27T18:00:00+08:00 溫度: 26
大社區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
仁武區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
鳥松區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
岡山區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
橋頭區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
燕巢區 時間點: 2019-11-27T18:00:00+08:00 溫度: 25
田寮區 時間點: 2019-11-27T18:00:00+08:00 溫度: 23
阿蓮區 時間點: 2019-11-27T18:00:00+08:00 溫度: 23
路竹區 時間點: 2019-11-27T18:00:00+08:00

In [4]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度
import xmltodict

with open("./data/64_72hr_CH.xml", "r", encoding='UTF-8') as file:
    xml = file.read()
    d = dict(xmltodict.parse(xml))
    first_location = d['cwbopendata']['dataset']['locations']['location'][0]
    for element in first_location['weatherElement']:
        for record in element['time']:
            if 'dataTime' in record and 'elementValue' in record:
                if 'measures' in record['elementValue'] and record['elementValue']['measures'] == '攝氏度':
                    timing = record['dataTime']
                    value = record['elementValue']['value']
                    print('時間點:', timing, '溫度:', value)

時間點: 2019-11-27T18:00:00+08:00 溫度: 25
時間點: 2019-11-27T21:00:00+08:00 溫度: 23
時間點: 2019-11-28T00:00:00+08:00 溫度: 22
時間點: 2019-11-28T03:00:00+08:00 溫度: 21
時間點: 2019-11-28T06:00:00+08:00 溫度: 20
時間點: 2019-11-28T09:00:00+08:00 溫度: 23
時間點: 2019-11-28T12:00:00+08:00 溫度: 27
時間點: 2019-11-28T15:00:00+08:00 溫度: 27
時間點: 2019-11-28T18:00:00+08:00 溫度: 24
時間點: 2019-11-28T21:00:00+08:00 溫度: 23
時間點: 2019-11-29T00:00:00+08:00 溫度: 21
時間點: 2019-11-29T03:00:00+08:00 溫度: 20
時間點: 2019-11-29T06:00:00+08:00 溫度: 19
時間點: 2019-11-29T09:00:00+08:00 溫度: 21
時間點: 2019-11-29T12:00:00+08:00 溫度: 24
時間點: 2019-11-29T15:00:00+08:00 溫度: 25
時間點: 2019-11-29T18:00:00+08:00 溫度: 23
時間點: 2019-11-29T21:00:00+08:00 溫度: 22
時間點: 2019-11-30T00:00:00+08:00 溫度: 21
時間點: 2019-11-30T03:00:00+08:00 溫度: 21
時間點: 2019-11-30T06:00:00+08:00 溫度: 20
時間點: 2019-11-30T09:00:00+08:00 溫度: 22
時間點: 2019-11-30T12:00:00+08:00 溫度: 26
時間點: 2019-11-30T15:00:00+08:00 溫度: 26
時間點: 2019-11-27T18:00:00+08:00 溫度: 21
時間點: 2019-11-27T21:00:00+08:00 溫度: 20
時間點: 2019-11