# 기상청 날씨 구하기
### 기상청 날씨 정보를 xml파일로 다운로드 받아서 처리

In [1]:
from bs4 import BeautifulSoup
import urllib.request as req
import os.path

In [2]:
url='http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp?stnid=108'
savename = 'forecast.xml'

In [3]:
# if not os.path.exists(savename):    # 현재 디렉토리에 forecast.xml이 없으면
req.urlretrieve(url, savename)        # forecast.xml 파일 다운로드

('forecast.xml', <http.client.HTTPMessage at 0x1cbf71b23d0>)

In [4]:
# BeautifulSoup로 분석하기
xml = open(savename, 'r', encoding='utf-8').read()
soup = BeautifulSoup(xml, 'html.parser')
print(soup)

<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0">
<channel>
<title>기상청 육상 중기예보</title>
<link/>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp
<description>기상청 날씨 웹서비스</description>
<language>ko</language>
<generator>기상청</generator>
<pubdate>2022년 09월 06일 (화)요일 06:00</pubdate>
<item>
<author>기상청</author>
<category>육상중기예보</category>
<title>전국 육상 중기예보 - 2022년 09월 06일 (화)요일 06:00 발표</title>
<link/>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp
<guid>http://www.kma.go.kr/weather/forecast/mid-term_01.jsp</guid>
<description>
<header>
<title>전국 육상중기예보</title>
<tm>202209060600</tm>
<wf><![CDATA[○ (하늘상태 및 강수) 9일(금)~11일(일) 가끔 구름많겠고, 12일(월)~16일(금)은 대체로 흐리겠습니다. 13일(화) 제주도에 비가 오는 곳이 있겠습니다.<br />○ (기온) 이번 예보기간 아침 기온은 15~22도로 어제(5일, 아침최저기온 19~26도)보다 낮겠고, 낮 기온은 24~29도로 어제(낮최고기온 19~28도)와 비슷하거나 조금 높겠습니다.<br />○ (주말전망) 10일(토)~11일(일) 전국이 구름많겠고, 아침 기온은 15~21도, 낮 기온은 24~29도가 되겠습니다.]]></wf>
</header>
<body>
<location wl_ver="3">
<province>서울ㆍ인천ㆍ경기도</province>
<city>서울</city>
<data>
<mo

In [5]:
# 전국 날씨정보를 info딕셔너리에 저장
info = {}                                       # info = { name : weather }
for location in soup.find_all('location'):
    name = location.find('city').text           # 도시명
    wf = location.find('wf').string             # 날씨
    tmx = location.find('tmx').string           # 최고기온
    tmn = location.find('tmn').string           # 최저기온

    weather = wf + ':' + tmn + '~' + tmx
    if name not in info:
        info[name] = []
    info[name].append(weather)

print(info)

{'서울': ['구름많음:19~29'], '인천': ['구름많음:20~27'], '수원': ['구름많음:18~29'], '파주': ['구름많음:15~29'], '이천': ['구름많음:15~29'], '평택': ['구름많음:17~28'], '춘천': ['구름많음:15~28'], '원주': ['구름많음:16~28'], '강릉': ['구름많음:18~26'], '대전': ['구름많음:17~28'], '세종': ['구름많음:16~28'], '홍성': ['구름많음:16~28'], '청주': ['구름많음:18~28'], '충주': ['구름많음:16~28'], '영동': ['구름많음:15~27'], '광주': ['구름많음:19~29'], '목포': ['구름많음:20~27'], '여수': ['구름많음:20~26'], '순천': ['구름많음:18~29'], '광양': ['구름많음:18~27'], '나주': ['구름많음:17~29'], '전주': ['구름많음:17~29'], '군산': ['구름많음:17~28'], '정읍': ['구름많음:17~28'], '남원': ['구름많음:16~28'], '고창': ['구름많음:17~28'], '무주': ['구름많음:15~27'], '부산': ['구름많음:20~27'], '울산': ['구름많음:19~26'], '창원': ['구름많음:18~28'], '진주': ['구름많음:16~28'], '거창': ['구름많음:14~26'], '통영': ['구름많음:19~28'], '대구': ['구름많음:17~27'], '안동': ['구름많음:15~27'], '포항': ['구름많음:20~25'], '경주': ['구름많음:17~26'], '울진': ['구름많음:17~24'], '울릉도': ['구름많음:19~24'], '제주': ['구름많음:22~27'], '서귀포': ['구름많음:21~28']}


In [6]:
# 각 지역의 날씨를 구분해서 출력
for name in info.keys():
    print('+', name)
    for weather in info[name]:
        print('|', weather)

+ 서울
| 구름많음:19~29
+ 인천
| 구름많음:20~27
+ 수원
| 구름많음:18~29
+ 파주
| 구름많음:15~29
+ 이천
| 구름많음:15~29
+ 평택
| 구름많음:17~28
+ 춘천
| 구름많음:15~28
+ 원주
| 구름많음:16~28
+ 강릉
| 구름많음:18~26
+ 대전
| 구름많음:17~28
+ 세종
| 구름많음:16~28
+ 홍성
| 구름많음:16~28
+ 청주
| 구름많음:18~28
+ 충주
| 구름많음:16~28
+ 영동
| 구름많음:15~27
+ 광주
| 구름많음:19~29
+ 목포
| 구름많음:20~27
+ 여수
| 구름많음:20~26
+ 순천
| 구름많음:18~29
+ 광양
| 구름많음:18~27
+ 나주
| 구름많음:17~29
+ 전주
| 구름많음:17~29
+ 군산
| 구름많음:17~28
+ 정읍
| 구름많음:17~28
+ 남원
| 구름많음:16~28
+ 고창
| 구름많음:17~28
+ 무주
| 구름많음:15~27
+ 부산
| 구름많음:20~27
+ 울산
| 구름많음:19~26
+ 창원
| 구름많음:18~28
+ 진주
| 구름많음:16~28
+ 거창
| 구름많음:14~26
+ 통영
| 구름많음:19~28
+ 대구
| 구름많음:17~27
+ 안동
| 구름많음:15~27
+ 포항
| 구름많음:20~25
+ 경주
| 구름많음:17~26
+ 울진
| 구름많음:17~24
+ 울릉도
| 구름많음:19~24
+ 제주
| 구름많음:22~27
+ 서귀포
| 구름많음:21~28
