In [26]:
import numpy as np  # 수치 연산 및 배열 처리를 위한 라이브러리
import pandas as pd  # 데이터 분석 및 DataFrame 처리를 위한 라이브러리
import requests  # HTTP 요청을 보내고 API 데이터를 가져오는 라이브러리
import folium  # 지도 시각화를 위한 라이브러리
import time

from tqdm.notebook import tqdm  # 코드 실행 중 진행 상태를 표시하는 진행 바
from bs4 import BeautifulSoup  # HTML/XML 데이터를 파싱하여 웹 크롤링을 수행하는 라이브러리

from selenium import webdriver  # 웹 브라우저 자동화를 위한 Selenium WebDriver 모듈
from selenium.webdriver.chrome.service import Service  # Chrome WebDriver 실행을 위한 서비스 클래스
from selenium.webdriver.common.by import By  # 웹 요소를 찾을 때 사용 (id, class, xpath 등)
from selenium.webdriver.support.ui import WebDriverWait  # 특정 요소가 나타날 때까지 대기하는 기능 제공
from selenium.webdriver.support import expected_conditions as EC  # 요소의 상태(로딩 완료, 클릭 가능 등)를 정의하는 조건 클래스

In [27]:
chrome_options = webdriver.ChromeOptions()  # Chrome 브라우저 옵션 설정 객체 생성
drive_path = 'chromedriver.exe'  # Chrome 드라이버 실행 파일 경로 지정
myservice = Service(drive_path)  # Chrome 드라이버 서비스를 실행할 Service 객체 생성
driver = webdriver.Chrome(service=myservice, options=chrome_options)  # Chrome 웹드라이버 객체 생성
print(type(driver))  # 생성된 드라이버 객체의 타입 출력

wait_time = 10  # 암시적 대기 시간(초) 설정
driver.implicitly_wait(wait_time)  # 웹 요소가 로드될 때까지 최대 10초 동안 대기

<class 'selenium.webdriver.chrome.webdriver.WebDriver'>


In [28]:
driver.maximize_window()  # 브라우저 창을 최대화

In [55]:
# 기상청 홈페이지 찾기
weather_url = 'https://search.naver.com/search.naver?where=nexearch&sm=top_hty&fbm=0&ie=utf8&query=%EC%84%9C%EC%9A%B8+%EB%82%A0%EC%94%A8'
driver.get(weather_url) #해당 페이지로 이동하시오.

naver_input_selector = '#nx_query'
naver_search_button_css = '#nx_search_form > fieldset > button > i'
regions = ['서울','부산','강릉']
for region in regions:
    WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.CSS_SELECTOR, naver_input_selector))).clear()
    WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.CSS_SELECTOR, naver_input_selector))).click()
    WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.CSS_SELECTOR, naver_input_selector))).send_keys(f'{region} 날씨')
    WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.CSS_SELECTOR, naver_search_button_css))).click()
    
    # 주간 날씨 HTML 코드를 파싱하여 html 파일에 기록합니다.
    html = driver.page_source
    htmlFile = open(f'{region} 날씨 정보.html', mode='wt', encoding='UTF-8')
    print(html, file=htmlFile)
    print(f'"{region} 날씨 정보.html"' + ' 파일 생성됨')
    htmlFile.close()

    
    time.sleep(3) 

"서울 날씨 정보.html" 파일 생성됨
"부산 날씨 정보.html" 파일 생성됨
"강릉 날씨 정보.html" 파일 생성됨


In [56]:
for region in regions:
    soup = BeautifulSoup(f'{region} 날씨 정보.html', 'html.parser')
    print(soup)

서울 날씨 정보.html
부산 날씨 정보.html
강릉 날씨 정보.html



If you meant to use Beautiful Soup to parse the contents of a file on disk, then something has gone wrong. You should open the file first, using code like this:

    filehandle = open(your filename)

You can then feed the open filehandle into Beautiful Soup instead of using the filename.



    
  soup = BeautifulSoup(f'{region} 날씨 정보.html', 'html.parser')


In [57]:

week_weather_list = []
for region in regions:
    one_week_weather_list = []
    soup = BeautifulSoup(f'{region} 날씨 정보', 'html.parser')
    div_tag = soup.find(attrs={'class': 'weekly_forecast_area _toggle_panel'}) #한 주의 날씨 정보
    one_week_weather_list = div_tag.find_all('li') #날 별 날씨 정보
    
    
    
    for today_weather in one_week_weather_list:
    
        date = soup.find("span", class_="date").text #날짜 정보 (예: 3.11.)
        day_of_the_week = soup.find("strong", class_="day").text #요일 정보 (예: 오늘, 내일, 월)
        am_weather = soup.select(".weather_inner:nth-of-type(1) .blind")[0].text #오전 날씨 (맑음, 구름많음 등)
        pm_weather = soup.select(".weather_inner:nth-of-type(2) .blind")[0].text #오후 날씨
        am_chance_of_precipitation = soup.select(".weather_inner:nth-of-type(1) .rainfall")[0].text #오전 강수확률 (%)
        pm_chance_of_precipitation = soup.select(".weather_inner:nth-of-type(2) .rainfall")[0].text #오후 강수확률 (%)
        temperature = soup.find("span", class_="lowest").text #최저 기온
        highest_temperature = soup.find("span", class_="highest").text #최고 기온
        
        week_weather_list.append([date,day_of_the_week,am_weather,pm_weather,am_chance_of_precipitation,pm_chance_of_precipitation,temperature,highest_temperature])
    #end for
#end for
print(week_weather_list)



AttributeError: 'NoneType' object has no attribute 'find_all'

In [None]:
week_weather_frame = pd.DataFrame(week_weather_list)
week_weather_frame.columns = ['날짜 정보', '요일 정보', '오전 날씨', '오후 날씨', '오전 강수확률 (%)', '오후 강수확률 (%)']
week_weather_frame.head()