# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異


In [None]:
'''
xmltodict將資料存於記憶體解析在樹狀結構，通過對樹狀結構資料的解析取得所需要的資料。

File I/O以範例為例，讀出dict格式
{'CUPOY': OrderedDict([('Title', '爬蟲馬拉松'), ('Author', 'Wei'), ('Chapters', OrderedDict([('Chapter', [OrderedDict([('@name', '01'), ('#text', '資料來源與存取')]), OrderedDict([('@name', '02'), ('#text', '靜態網頁爬蟲')]), OrderedDict([('@name', '03'), ('#text', '動態網頁爬蟲')])])]))])}
再依照Dict操作方式進行一層層的讀取。
'''

### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [None]:
#下載檔案
import urllib.request
import zipfile

res="http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314"
urllib.request.urlretrieve(res,"./data/example.zip")
f=zipfile.ZipFile('./data/example.zip')
f.extractall('./data')

In [3]:
#觀察資料
fh=open('./data/64_72hr_CH.xml', "r", encoding='utf8')
xml=fh.read()
fh.close()
# print(xml)

In [56]:
# 1. 請問高雄市有多少地區有溫度資料？
# 解析檔案內容
import xmltodict
with open('./data/64_72hr_CH.xml',encoding='utf8') as fd:
    doc=dict(xmltodict.parse(fd.read()))
# print(doc)

#建立樹狀路徑中資料位置參數
KSlocations=doc['cwbopendata']['dataset']['locations']['location']
# print(KSlocations)

#印出路徑中，location list中的資料筆數
print('高雄的地方資料數為:',len(KSlocations))


高雄的地方資料數為: 38


In [106]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度

# 解析檔案內容
import xmltodict
with open('./data/64_72hr_CH.xml',encoding='utf8') as fd:
    doc=dict(xmltodict.parse(fd.read()))
# print(doc)

#建立樹狀路徑中資料位置參數
KSlocations=doc['cwbopendata']['dataset']['locations']['location']
# print(KSlocations)

#印出每一筆location的locationName及溫度
for i in KSlocations:
    print(i['locationName'],'溫度為',i['weatherElement'][0]['time'][0]['elementValue']['value'],'度')

鹽埕區 溫度為 33 度
鼓山區 溫度為 33 度
左營區 溫度為 33 度
楠梓區 溫度為 34 度
三民區 溫度為 32 度
新興區 溫度為 33 度
前金區 溫度為 33 度
苓雅區 溫度為 33 度
前鎮區 溫度為 33 度
旗津區 溫度為 32 度
小港區 溫度為 33 度
鳳山區 溫度為 34 度
林園區 溫度為 33 度
大寮區 溫度為 34 度
大樹區 溫度為 34 度
大社區 溫度為 34 度
仁武區 溫度為 33 度
鳥松區 溫度為 34 度
岡山區 溫度為 34 度
橋頭區 溫度為 35 度
燕巢區 溫度為 34 度
田寮區 溫度為 34 度
阿蓮區 溫度為 34 度
路竹區 溫度為 33 度
湖內區 溫度為 33 度
茄萣區 溫度為 33 度
永安區 溫度為 32 度
彌陀區 溫度為 32 度
梓官區 溫度為 32 度
旗山區 溫度為 34 度
美濃區 溫度為 34 度
六龜區 溫度為 34 度
甲仙區 溫度為 33 度
杉林區 溫度為 36 度
內門區 溫度為 34 度
茂林區 溫度為 34 度
桃源區 溫度為 31 度
那瑪夏區 溫度為 29 度


In [107]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度


# 解析檔案內容
import xmltodict
with open('./data/64_72hr_CH.xml',encoding='utf8') as fd:
    doc=dict(xmltodict.parse(fd.read()))
# print(doc)


#建立樹狀路徑中資料位置參數
KSlocations=doc['cwbopendata']['dataset']['locations']['location']
# print(KSlocations)

#取得第一個地區的資料位置
FirstLocation=KSlocations[0]
print(FirstLocation['locationName'])

#取得第一個地區的天氣資訊及時間
weatherelement=FirstLocation['weatherElement'][0]['time']
# print(weatherelement)

#印出每個time項目下的 dataTime及溫度(value)
for j in weatherelement:
    print('時間:',j['dataTime'],'溫度為:', j['elementValue']['value'],'度')

鹽埕區
時間: 2019-06-28T12:00:00+08:00 溫度為: 33 度
時間: 2019-06-28T15:00:00+08:00 溫度為: 33 度
時間: 2019-06-28T18:00:00+08:00 溫度為: 32 度
時間: 2019-06-28T21:00:00+08:00 溫度為: 30 度
時間: 2019-06-29T00:00:00+08:00 溫度為: 30 度
時間: 2019-06-29T03:00:00+08:00 溫度為: 29 度
時間: 2019-06-29T06:00:00+08:00 溫度為: 28 度
時間: 2019-06-29T09:00:00+08:00 溫度為: 31 度
時間: 2019-06-29T12:00:00+08:00 溫度為: 32 度
時間: 2019-06-29T15:00:00+08:00 溫度為: 32 度
時間: 2019-06-29T18:00:00+08:00 溫度為: 31 度
時間: 2019-06-29T21:00:00+08:00 溫度為: 30 度
時間: 2019-06-30T00:00:00+08:00 溫度為: 29 度
時間: 2019-06-30T03:00:00+08:00 溫度為: 28 度
時間: 2019-06-30T06:00:00+08:00 溫度為: 28 度
時間: 2019-06-30T09:00:00+08:00 溫度為: 31 度
時間: 2019-06-30T12:00:00+08:00 溫度為: 32 度
時間: 2019-06-30T15:00:00+08:00 溫度為: 32 度
時間: 2019-06-30T18:00:00+08:00 溫度為: 31 度
時間: 2019-06-30T21:00:00+08:00 溫度為: 30 度
時間: 2019-07-01T00:00:00+08:00 溫度為: 29 度
時間: 2019-07-01T03:00:00+08:00 溫度為: 29 度
時間: 2019-07-01T06:00:00+08:00 溫度為: 28 度
時間: 2019-07-01T09:00:00+08:00 溫度為: 31 度
