### 기상청 날씨 데이터 
* BeautifulSoup 객체의 find(), find_all(), select(), select_one() 함수 비교 사용
* 파싱한 데이터를 자료구조 (dict, list)에 저장하기
* json file 로 저장하기

In [9]:
import requests
from bs4 import BeautifulSoup

url = 'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp'
res = requests.get(url)
print(res.status_code)

if res.ok:
    soup = BeautifulSoup(res.text, 'html.parser')
    
    title = soup.find('title')
    print(type(title), title)
    print(type(title.text), title.text)
    print(type(title.string), title.string)
    
    title_all = soup.find_all('title')
    print(type(title_all), title_all)
    for item in title_all:
        print(item.string)

200
<class 'bs4.element.Tag'> <title>기상청 육상 중기예보</title>
<class 'str'> 기상청 육상 중기예보
<class 'bs4.element.NavigableString'> 기상청 육상 중기예보
<class 'bs4.element.ResultSet'> [<title>기상청 육상 중기예보</title>, <title>전국 육상 중기예보 - 2021년 11월 11일 (목)요일 06:00 발표</title>, <title>전국 육상중기예보</title>]
기상청 육상 중기예보
전국 육상 중기예보 - 2021년 11월 11일 (목)요일 06:00 발표
전국 육상중기예보


In [13]:
location_all = soup.find_all('location', attrs={"wl_ver":"3"})
print(len(location_all))

location_all2 = soup.select("location[wl_ver='3']")
print(len(location_all2))

41
41


In [20]:
location_one = soup.find('location', attrs={"wl_ver":"3"})
province = location_one.find('province').string
print(province)
city = location_one.find('city').string
print(city)

print(len(location_one.find_all('data')))
for data in location_one.find_all('data'):
    print(data.find('mode').string, data.find('tmef').string)

서울ㆍ인천ㆍ경기도
서울
13
A02 2021-11-14 00:00
A02 2021-11-14 12:00
A02 2021-11-15 00:00
A02 2021-11-15 12:00
A02 2021-11-16 00:00
A02 2021-11-16 12:00
A02 2021-11-17 00:00
A02 2021-11-17 12:00
A02 2021-11-18 00:00
A02 2021-11-18 12:00
A01 2021-11-19 00:00
A01 2021-11-20 00:00
A01 2021-11-21 00:00


### 전국의 날씨 데이터를 dict와 list에 저장하기

In [36]:
import requests
from bs4 import BeautifulSoup

url = 'http://www.kma.go.kr/weather/forecast/mid-term-rss3.jsp'
res = requests.get(url)
print(res.status_code)

if res.ok:
    soup = BeautifulSoup(res.text, 'html.parser')
    
    #41개의 location정보를 저장할 list 선언
    location_list = [] #list()
    location_tags = soup.find_all('location', attrs={"wl_ver":"3"})
    print(len(location_tags))
    for location in location_tags:
        #1개의 location (city) 정보를 저장할 dict 선언
        location_dict = {} #dict()
        location_dict['province'] = location.find('province').text
        location_dict['city'] = location.find('city').text
        
        #location 하위에 있는 13개의 data 태그의 정보를 저장할 list 선언
        data_list = list()
        data_tags = location.find_all('data')
        for data in data_tags:
            '''
            <data>
                <mode>A02</mode>
                <tmef>2021-11-14 00:00</tmef>
                <wf>구름많고 비</wf>
                <tmn>6</tmn>
                <tmx>15</tmx>
            </data>
            '''
            #1개의 data 태그의 정보를 저장할 dict 선언
            data_dict = dict()
            data_dict['mode'] = data.find('mode').text
            data_dict['tmef'] = data.find('tmef').text
            data_dict['wf'] = data.find('wf').text
            data_dict['tmn'] = data.find('tmn').text
            data_dict['tmx'] = data.find('tmx').text
            data_list.append(data_dict)
        
        location_dict['datas'] = data_list
            
        location_list.append(location_dict)

print(len(location_list))
location_list[0:1]

200
41
41


[{'province': '서울ㆍ인천ㆍ경기도',
  'city': '서울',
  'datas': [{'mode': 'A02',
    'tmef': '2021-11-14 00:00',
    'wf': '구름많고 비',
    'tmn': '6',
    'tmx': '15'},
   {'mode': 'A02',
    'tmef': '2021-11-14 12:00',
    'wf': '맑음',
    'tmn': '6',
    'tmx': '15'},
   {'mode': 'A02',
    'tmef': '2021-11-15 00:00',
    'wf': '맑음',
    'tmn': '7',
    'tmx': '14'},
   {'mode': 'A02',
    'tmef': '2021-11-15 12:00',
    'wf': '맑음',
    'tmn': '7',
    'tmx': '14'},
   {'mode': 'A02',
    'tmef': '2021-11-16 00:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '12'},
   {'mode': 'A02',
    'tmef': '2021-11-16 12:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '12'},
   {'mode': 'A02',
    'tmef': '2021-11-17 00:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '13'},
   {'mode': 'A02',
    'tmef': '2021-11-17 12:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '13'},
   {'mode': 'A02',
    'tmef': '2021-11-18 00:00',
    'wf': '구름많음',
    'tmn': '5',
    'tmx': '13'},
   {'mode': 'A02',
    'tmef': '2

* json file로 저장하고, json file을 읽어오기

In [39]:
import json

with open('data/weather.json','w',encoding='utf-8') as file:
    json.dump(location_list, file)

In [41]:
with open('data/weather.json','r', encoding='utf-8') as file:
    content = file.read()
    json_content = json.loads(content)

In [42]:
#json_content

[{'province': '서울ㆍ인천ㆍ경기도',
  'city': '서울',
  'datas': [{'mode': 'A02',
    'tmef': '2021-11-14 00:00',
    'wf': '구름많고 비',
    'tmn': '6',
    'tmx': '15'},
   {'mode': 'A02',
    'tmef': '2021-11-14 12:00',
    'wf': '맑음',
    'tmn': '6',
    'tmx': '15'},
   {'mode': 'A02',
    'tmef': '2021-11-15 00:00',
    'wf': '맑음',
    'tmn': '7',
    'tmx': '14'},
   {'mode': 'A02',
    'tmef': '2021-11-15 12:00',
    'wf': '맑음',
    'tmn': '7',
    'tmx': '14'},
   {'mode': 'A02',
    'tmef': '2021-11-16 00:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '12'},
   {'mode': 'A02',
    'tmef': '2021-11-16 12:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '12'},
   {'mode': 'A02',
    'tmef': '2021-11-17 00:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '13'},
   {'mode': 'A02',
    'tmef': '2021-11-17 12:00',
    'wf': '맑음',
    'tmn': '4',
    'tmx': '13'},
   {'mode': 'A02',
    'tmef': '2021-11-18 00:00',
    'wf': '구름많음',
    'tmn': '5',
    'tmx': '13'},
   {'mode': 'A02',
    'tmef': '2