# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異


In [7]:
import xmltodict

print(
'File I/O 讀取出來是以 String 的型態；\n'
'xmltodict 會轉換成 Dict 的型態，後續方便操作。\n'
)

# File I/O
print('============== File I/O ==============')
with open('./data/sample.xml', encoding='UTF-8') as fh:
    text = fh.read()
    print(text)
    print(f'格式：{type(text)}\n')

# xmltodict
print('============== xmltodict ==============')
# 存取檔案
with open('./data/sample.xml', encoding='UTF-8') as fd:
    doc = dict(xmltodict.parse(fd.read()))
    print(doc)
    print(f'格式：{type(doc)}')

File I/O 讀取出來是以 String 的型態；
xmltodict 會轉換成 Dict 的型態，後續方便操作。

<?xml version="1.0" encoding="UTF-8"?>
<CUPOY>
    <Title>爬蟲馬拉松</Title>
    <Author>Wei</Author>
    <Chapters>
        <Chapter name="01">資料來源與存取</Chapter>
        <Chapter name="02">靜態網頁爬蟲</Chapter>
        <Chapter name="03">動態網頁爬蟲</Chapter>
    </Chapters>
</CUPOY>
格式：<class 'str'>

{'CUPOY': OrderedDict([('Title', '爬蟲馬拉松'), ('Author', 'Wei'), ('Chapters', OrderedDict([('Chapter', [OrderedDict([('@name', '01'), ('#text', '資料來源與存取')]), OrderedDict([('@name', '02'), ('#text', '靜態網頁爬蟲')]), OrderedDict([('@name', '03'), ('#text', '動態網頁爬蟲')])])]))])}
格式：<class 'dict'>


### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [8]:
# 1. 請問高雄市有多少地區有溫度資料？

import xmltodict

weather_dict = {}

# 存取檔案
with open('./data/64_72hr_CH.xml', encoding='UTF-8') as fd:
    doc = dict(xmltodict.parse(fd.read()))
    
weathers = doc['cwbopendata']['dataset']['locations']['location']
print(f'此檔案共有 {len(weathers)} 筆高雄市的地區有溫度資料')

此檔案共有 38 筆高雄市的地區有溫度資料


In [9]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度

for weather in weathers:
    location_name = weather['locationName']
    for category in weather['weatherElement']:
        if category['description'] == '溫度':
            predict_time = category['time'][0]['dataTime']
            predict_value = category['time'][0]['elementValue']['value']
            predict_measures = category['time'][0]['elementValue']['measures']
            break
    print(f'{location_name} | 溫度：{predict_value} {predict_measures} | 時間點：{predict_time}')
    

鹽埕區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
鼓山區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
左營區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
楠梓區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
三民區 | 溫度：32 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
新興區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
前金區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
苓雅區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
前鎮區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
旗津區 | 溫度：32 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
小港區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
鳳山區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
林園區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
大寮區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
大樹區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
大社區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
仁武區 | 溫度：33 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
鳥松區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
岡山區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
橋頭區 | 溫度：35 攝氏度 | 時間點：2019-06-28T12:00:00+08:00
燕巢區 | 溫度：34 攝氏度 | 時間點：2019-06-28T12:00:0

In [4]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度

location_weather = weathers[0]

print(f"[{location_weather['locationName']}]")
for category in location_weather['weatherElement']:
    if category['description'] == '溫度':
        temperatures = category['time']
        for temperature in temperatures:
            predict_time = temperature['dataTime']
            predict_value = temperature['elementValue']['value']
            predict_measures = temperature['elementValue']['measures']
            print(f'溫度: {predict_value} {predict_measures} | 時間點: {predict_time}')
    
        break

[鹽埕區]
溫度: 33 攝氏度 | 時間點: 2019-06-28T12:00:00+08:00
溫度: 33 攝氏度 | 時間點: 2019-06-28T15:00:00+08:00
溫度: 32 攝氏度 | 時間點: 2019-06-28T18:00:00+08:00
溫度: 30 攝氏度 | 時間點: 2019-06-28T21:00:00+08:00
溫度: 30 攝氏度 | 時間點: 2019-06-29T00:00:00+08:00
溫度: 29 攝氏度 | 時間點: 2019-06-29T03:00:00+08:00
溫度: 28 攝氏度 | 時間點: 2019-06-29T06:00:00+08:00
溫度: 31 攝氏度 | 時間點: 2019-06-29T09:00:00+08:00
溫度: 32 攝氏度 | 時間點: 2019-06-29T12:00:00+08:00
溫度: 32 攝氏度 | 時間點: 2019-06-29T15:00:00+08:00
溫度: 31 攝氏度 | 時間點: 2019-06-29T18:00:00+08:00
溫度: 30 攝氏度 | 時間點: 2019-06-29T21:00:00+08:00
溫度: 29 攝氏度 | 時間點: 2019-06-30T00:00:00+08:00
溫度: 28 攝氏度 | 時間點: 2019-06-30T03:00:00+08:00
溫度: 28 攝氏度 | 時間點: 2019-06-30T06:00:00+08:00
溫度: 31 攝氏度 | 時間點: 2019-06-30T09:00:00+08:00
溫度: 32 攝氏度 | 時間點: 2019-06-30T12:00:00+08:00
溫度: 32 攝氏度 | 時間點: 2019-06-30T15:00:00+08:00
溫度: 31 攝氏度 | 時間點: 2019-06-30T18:00:00+08:00
溫度: 30 攝氏度 | 時間點: 2019-06-30T21:00:00+08:00
溫度: 29 攝氏度 | 時間點: 2019-07-01T00:00:00+08:00
溫度: 29 攝氏度 | 時間點: 2019-07-01T03:00:00+08:00
溫度: 28 攝氏度 | 時間點: 2019-07-