# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異
#### ANS: 
*   File I/O: 將整個xml讀進來，印出來有助了解資料的概觀與結構
*   xmltodict: 將xml讀成有序字典變數，不容易閱讀，但適用用程式操作



In [0]:
# 下載檔案
import os
import urllib.request
import zipfile

datafolder = './data'
os.makedirs(datafolder, exist_ok=True )

res = "http://opendata.cwb.gov.tw/govdownload?dataid=F-D0047-093&authorizationkey=rdec-key-123-45678-011121314"
urllib.request.urlretrieve(res, "./data/example.zip")
f = zipfile.ZipFile('./data/example.zip')
f.extractall('./data')

In [0]:
# File I/O
fh = open("./data/64_72hr_CH.xml", "r")
xml = fh.read()
fh.close()

print(xml)

Output hidden; open in https://colab.research.google.com to view.

In [0]:
!pip install xmltodict

Collecting xmltodict
  Downloading https://files.pythonhosted.org/packages/28/fd/30d5c1d3ac29ce229f6bdc40bbc20b28f716e8b363140c26eff19122d8a5/xmltodict-0.12.0-py2.py3-none-any.whl
Installing collected packages: xmltodict
Successfully installed xmltodict-0.12.0


In [0]:
# xmltodict
import xmltodict
d = dict(xmltodict.parse(xml))
print(d)

{'cwbopendata': OrderedDict([('@xmlns', 'urn:cwb:gov:tw:cwbcommon:0.1'), ('identifier', 'f4739c9b-f879-4eb8-bee2-d7a02b3635c9'), ('sender', 'weather@cwb.gov.tw'), ('sent', '2019-12-06T06:20:04+08:00'), ('status', 'Actual'), ('scope', 'Public'), ('msgType', 'Issue'), ('dataid', 'D0047-065'), ('source', 'MFC'), ('dataset', OrderedDict([('datasetInfo', OrderedDict([('datasetDescription', '臺灣各縣市鄉鎮未來3天(72小時)逐3小時天氣預報'), ('datasetLanguage', 'zh-TW'), ('issueTime', '2019-12-06T05:00:00+08:00'), ('validTime', OrderedDict([('startTime', '2019-12-06T06:00:00+08:00'), ('endTime', '2019-12-09T05:00:00+08:00')])), ('update', '2019-12-06T06:20:04+08:00')])), ('locations', OrderedDict([('locationsName', '高雄市'), ('location', [OrderedDict([('locationName', '鹽埕區'), ('geocode', '6400100'), ('lat', '22.626497'), ('lon', '120.278707'), ('weatherElement', [OrderedDict([('elementName', 'T'), ('description', '溫度'), ('time', [OrderedDict([('dataTime', '2019-12-06T06:00:00+08:00'), ('elementValue', OrderedDict([

### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [11]:
# 1. 請問高雄市有多少地區有溫度資料？
countTempInKao = 0
for location in d['cwbopendata']['dataset']['locations']['location']:
    for weatherEl in location['weatherElement']:
        if weatherEl['description'] == '溫度':
            countTempInKao += 1
            print('地區：{:s}：有溫度'.format(location['locationName']))
            break

print('高雄市有溫度資料的地區數量：'+str(countTempInKao))

地區：鹽埕區：有溫度
地區：鼓山區：有溫度
地區：左營區：有溫度
地區：楠梓區：有溫度
地區：三民區：有溫度
地區：新興區：有溫度
地區：前金區：有溫度
地區：苓雅區：有溫度
地區：前鎮區：有溫度
地區：旗津區：有溫度
地區：小港區：有溫度
地區：鳳山區：有溫度
地區：林園區：有溫度
地區：大寮區：有溫度
地區：大樹區：有溫度
地區：大社區：有溫度
地區：仁武區：有溫度
地區：鳥松區：有溫度
地區：岡山區：有溫度
地區：橋頭區：有溫度
地區：燕巢區：有溫度
地區：田寮區：有溫度
地區：阿蓮區：有溫度
地區：路竹區：有溫度
地區：湖內區：有溫度
地區：茄萣區：有溫度
地區：永安區：有溫度
地區：彌陀區：有溫度
地區：梓官區：有溫度
地區：旗山區：有溫度
地區：美濃區：有溫度
地區：六龜區：有溫度
地區：甲仙區：有溫度
地區：杉林區：有溫度
地區：內門區：有溫度
地區：茂林區：有溫度
地區：桃源區：有溫度
地區：那瑪夏區：有溫度
高雄市有溫度資料的地區數量：38


In [17]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度
locationTemps = {}
for location in d['cwbopendata']['dataset']['locations']['location']:
    for weatherEl in location['weatherElement']:
        if weatherEl['description'] == '溫度':
            print('地區：{:s}：{:s}  {:s}'.format(location['locationName'], weatherEl['time'][0]['dataTime'], weatherEl['time'][0]['elementValue']['value']))
            locationTemps[location['locationName']] = {'資料時間': weatherEl['time'][0]['dataTime'], '溫度': weatherEl['time'][0]['elementValue']['value']}
            break

print('每一個地區所記錄的第一個時間點跟溫度')
print(locationTemps)

地區：鹽埕區：2019-12-06T06:00:00+08:00  16
地區：鼓山區：2019-12-06T06:00:00+08:00  16
地區：左營區：2019-12-06T06:00:00+08:00  15
地區：楠梓區：2019-12-06T06:00:00+08:00  15
地區：三民區：2019-12-06T06:00:00+08:00  15
地區：新興區：2019-12-06T06:00:00+08:00  16
地區：前金區：2019-12-06T06:00:00+08:00  16
地區：苓雅區：2019-12-06T06:00:00+08:00  16
地區：前鎮區：2019-12-06T06:00:00+08:00  16
地區：旗津區：2019-12-06T06:00:00+08:00  16
地區：小港區：2019-12-06T06:00:00+08:00  16
地區：鳳山區：2019-12-06T06:00:00+08:00  15
地區：林園區：2019-12-06T06:00:00+08:00  16
地區：大寮區：2019-12-06T06:00:00+08:00  15
地區：大樹區：2019-12-06T06:00:00+08:00  15
地區：大社區：2019-12-06T06:00:00+08:00  15
地區：仁武區：2019-12-06T06:00:00+08:00  14
地區：鳥松區：2019-12-06T06:00:00+08:00  15
地區：岡山區：2019-12-06T06:00:00+08:00  15
地區：橋頭區：2019-12-06T06:00:00+08:00  15
地區：燕巢區：2019-12-06T06:00:00+08:00  16
地區：田寮區：2019-12-06T06:00:00+08:00  15
地區：阿蓮區：2019-12-06T06:00:00+08:00  14
地區：路竹區：2019-12-06T06:00:00+08:00  15
地區：湖內區：2019-12-06T06:00:00+08:00  15
地區：茄萣區：2019-12-06T06:00:00+08:00  14
地區：永安區：2019-12-06T06:00:00+08:00  15
地

In [18]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度

first_loc = d['cwbopendata']['dataset']['locations']['location'][0]
print('第一個地區：{:s}'.format(first_loc['locationName']))
first_loc_temp = []
for weatherEl in first_loc['weatherElement']:
    if weatherEl['description'] == '溫度':
        for time in weatherEl['time']:
            print('{:s}：{:s}'.format(time['dataTime'], time['elementValue']['value']))
            first_loc_temp.append({'資料時間': time['dataTime'], '溫度': time['elementValue']['value']})

print('每一時間點與記錄的溫度')
print(first_loc_temp)

第一個地區：鹽埕區
2019-12-06T06:00:00+08:00：16
2019-12-06T09:00:00+08:00：17
2019-12-06T12:00:00+08:00：19
2019-12-06T15:00:00+08:00：19
2019-12-06T18:00:00+08:00：18
2019-12-06T21:00:00+08:00：17
2019-12-07T00:00:00+08:00：16
2019-12-07T03:00:00+08:00：16
2019-12-07T06:00:00+08:00：16
2019-12-07T09:00:00+08:00：17
2019-12-07T12:00:00+08:00：22
2019-12-07T15:00:00+08:00：22
2019-12-07T18:00:00+08:00：20
2019-12-07T21:00:00+08:00：18
2019-12-08T00:00:00+08:00：17
2019-12-08T03:00:00+08:00：16
2019-12-08T06:00:00+08:00：16
2019-12-08T09:00:00+08:00：18
2019-12-08T12:00:00+08:00：23
2019-12-08T15:00:00+08:00：23
2019-12-08T18:00:00+08:00：21
2019-12-08T21:00:00+08:00：19
2019-12-09T00:00:00+08:00：18
2019-12-09T03:00:00+08:00：17
每一時間點與記錄的溫度
[{'資料時間': '2019-12-06T06:00:00+08:00', '溫度': '16'}, {'資料時間': '2019-12-06T09:00:00+08:00', '溫度': '17'}, {'資料時間': '2019-12-06T12:00:00+08:00', '溫度': '19'}, {'資料時間': '2019-12-06T15:00:00+08:00', '溫度': '19'}, {'資料時間': '2019-12-06T18:00:00+08:00', '溫度': '18'}, {'資料時間': '2019-12-06T21:00