# Python 下載XML檔案與解析


* 了解 xml 檔案格式與內容
* 能夠利用套件存取 xml 格式的檔案


## 作業目標

* 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異

* 根據範例檔案的結果：
    1. 請問高雄市有多少地區有溫度資料？
    2. 請取出每一個地區所記錄的第一個時間點跟溫度
    3. 請取出第一個地區所記錄的每一個時間點跟溫度

### 比較一下範例檔案中的「File I/O」與「xmltodict」讀出來的內容有什麼差異


In [1]:
# File I/O

import os, sys

with open('./data/64_72hr_CH.xml') as fh:
    xml = fh.read()
print(xml)

<?xml version="1.0" encoding="utf-8"?>
<cwbopendata xmlns="urn:cwb:gov:tw:cwbcommon:0.1">
  <identifier>ee2e9d7d-647c-4634-9027-7c822bde7bc0</identifier>
  <sender>weather@cwb.gov.tw</sender>
  <sent>2019-06-28T12:20:35+08:00</sent>
  <status>Actual</status>
  <scope>Public</scope>
  <msgType>Issue</msgType>
  <dataid>D0047-065</dataid>
  <source>MFC</source>
  <dataset>
    <datasetInfo>
      <datasetDescription>臺灣各縣市鄉鎮未來3天(72小時)逐3小時天氣預報</datasetDescription>
      <datasetLanguage>zh-TW</datasetLanguage>
      <issueTime>2019-06-28T11:00:00+08:00</issueTime>
      <validTime>
        <startTime>2019-06-28T12:00:00+08:00</startTime>
        <endTime>2019-07-01T11:00:00+08:00</endTime>
      </validTime>
      <update>2019-06-28T12:20:35+08:00</update>
    </datasetInfo>
    <locations>
      <locationsName>高雄市</locationsName>
      <location>
        <locationName>鹽埕區</locationName>
        <geocode>6400100</geocode>
        <lat>22.626497</lat>
        <lon>120.278707</lon>
        <

In [2]:
# xmltodict

# !pip install xmltodict

import xmltodict

with open('./data/64_72hr_CH.xml') as fd:
    xml = dict(xmltodict.parse(fd.read()))
print(xml)


{'cwbopendata': OrderedDict([('@xmlns', 'urn:cwb:gov:tw:cwbcommon:0.1'), ('identifier', 'ee2e9d7d-647c-4634-9027-7c822bde7bc0'), ('sender', 'weather@cwb.gov.tw'), ('sent', '2019-06-28T12:20:35+08:00'), ('status', 'Actual'), ('scope', 'Public'), ('msgType', 'Issue'), ('dataid', 'D0047-065'), ('source', 'MFC'), ('dataset', OrderedDict([('datasetInfo', OrderedDict([('datasetDescription', '臺灣各縣市鄉鎮未來3天(72小時)逐3小時天氣預報'), ('datasetLanguage', 'zh-TW'), ('issueTime', '2019-06-28T11:00:00+08:00'), ('validTime', OrderedDict([('startTime', '2019-06-28T12:00:00+08:00'), ('endTime', '2019-07-01T11:00:00+08:00')])), ('update', '2019-06-28T12:20:35+08:00')])), ('locations', OrderedDict([('locationsName', '高雄市'), ('location', [OrderedDict([('locationName', '鹽埕區'), ('geocode', '6400100'), ('lat', '22.626497'), ('lon', '120.278707'), ('weatherElement', [OrderedDict([('elementName', 'T'), ('description', '溫度'), ('time', [OrderedDict([('dataTime', '2019-06-28T12:00:00+08:00'), ('elementValue', OrderedDict([

### 根據範例檔案的結果：

1. 請問高雄市有多少地區有溫度資料？
2. 請取出每一個地區所記錄的第一個時間點跟溫度
3. 請取出第一個地區所記錄的每一個時間點跟溫度

In [3]:
# 1. 請問高雄市有多少地區有溫度資料？

# 解析檔案內容
import xmltodict

with open("./data/64_72hr_CH.xml", "r") as fh:
  xml = fh.read()
  doc = dict(xmltodict.parse(xml))

locations = doc['cwbopendata']['dataset']['locations']['location']
print(len(locations))

for i in locations:
  print(i['locationName'],end=',')


38
鹽埕區,鼓山區,左營區,楠梓區,三民區,新興區,前金區,苓雅區,前鎮區,旗津區,小港區,鳳山區,林園區,大寮區,大樹區,大社區,仁武區,鳥松區,岡山區,橋頭區,燕巢區,田寮區,阿蓮區,路竹區,湖內區,茄萣區,永安區,彌陀區,梓官區,旗山區,美濃區,六龜區,甲仙區,杉林區,內門區,茂林區,桃源區,那瑪夏區,

In [4]:
# 2. 請取出每一個地區所記錄的第一個時間點跟溫度

for i in locations:
    print(i['locationName'],end=' / ')
    print(i['weatherElement'][0]['time'][0]['dataTime'],end=' / ')
    print(i['weatherElement'][0]['time'][0]['elementValue']['value'],'°C')

鹽埕區 / 2019-06-28T12:00:00+08:00 / 33 °C
鼓山區 / 2019-06-28T12:00:00+08:00 / 33 °C
左營區 / 2019-06-28T12:00:00+08:00 / 33 °C
楠梓區 / 2019-06-28T12:00:00+08:00 / 34 °C
三民區 / 2019-06-28T12:00:00+08:00 / 32 °C
新興區 / 2019-06-28T12:00:00+08:00 / 33 °C
前金區 / 2019-06-28T12:00:00+08:00 / 33 °C
苓雅區 / 2019-06-28T12:00:00+08:00 / 33 °C
前鎮區 / 2019-06-28T12:00:00+08:00 / 33 °C
旗津區 / 2019-06-28T12:00:00+08:00 / 32 °C
小港區 / 2019-06-28T12:00:00+08:00 / 33 °C
鳳山區 / 2019-06-28T12:00:00+08:00 / 34 °C
林園區 / 2019-06-28T12:00:00+08:00 / 33 °C
大寮區 / 2019-06-28T12:00:00+08:00 / 34 °C
大樹區 / 2019-06-28T12:00:00+08:00 / 34 °C
大社區 / 2019-06-28T12:00:00+08:00 / 34 °C
仁武區 / 2019-06-28T12:00:00+08:00 / 33 °C
鳥松區 / 2019-06-28T12:00:00+08:00 / 34 °C
岡山區 / 2019-06-28T12:00:00+08:00 / 34 °C
橋頭區 / 2019-06-28T12:00:00+08:00 / 35 °C
燕巢區 / 2019-06-28T12:00:00+08:00 / 34 °C
田寮區 / 2019-06-28T12:00:00+08:00 / 34 °C
阿蓮區 / 2019-06-28T12:00:00+08:00 / 34 °C
路竹區 / 2019-06-28T12:00:00+08:00 / 33 °C
湖內區 / 2019-06-28T12:00:00+08:00 / 33 °C


In [5]:
# 3. 請取出第一個地區所記錄的每一個時間點跟溫度

print(locations[0]['locationName'])

for i in locations[0]['weatherElement'][0]['time']:
        print(i['dataTime'],end=' / ')
        print(i['elementValue']['value'],'°C')      

鹽埕區
2019-06-28T12:00:00+08:00 / 33 °C
2019-06-28T15:00:00+08:00 / 33 °C
2019-06-28T18:00:00+08:00 / 32 °C
2019-06-28T21:00:00+08:00 / 30 °C
2019-06-29T00:00:00+08:00 / 30 °C
2019-06-29T03:00:00+08:00 / 29 °C
2019-06-29T06:00:00+08:00 / 28 °C
2019-06-29T09:00:00+08:00 / 31 °C
2019-06-29T12:00:00+08:00 / 32 °C
2019-06-29T15:00:00+08:00 / 32 °C
2019-06-29T18:00:00+08:00 / 31 °C
2019-06-29T21:00:00+08:00 / 30 °C
2019-06-30T00:00:00+08:00 / 29 °C
2019-06-30T03:00:00+08:00 / 28 °C
2019-06-30T06:00:00+08:00 / 28 °C
2019-06-30T09:00:00+08:00 / 31 °C
2019-06-30T12:00:00+08:00 / 32 °C
2019-06-30T15:00:00+08:00 / 32 °C
2019-06-30T18:00:00+08:00 / 31 °C
2019-06-30T21:00:00+08:00 / 30 °C
2019-07-01T00:00:00+08:00 / 29 °C
2019-07-01T03:00:00+08:00 / 29 °C
2019-07-01T06:00:00+08:00 / 28 °C
2019-07-01T09:00:00+08:00 / 31 °C
