# 1. selenium을 이용하여 하나은행 환율정보 수집

In [None]:
######## 1. 환경 설정 및 라이브러리 불러오기 ########
import os
import sys
from io import StringIO
import requests
import pandas as pd
import time
from datetime import datetime, timedelta

# 외부 모듈 'dbio'의 경로 설정 및 임포트
target_dir = os.path.abspath('../../')
if target_dir not in sys.path:
    sys.path.append(target_dir)
from dbio import to_db


######## 2. 하나은행 환율 수집 (공휴일 대응 로직 추가) ########
def exrate_get(ymd_dash, ymd):
    url = "https://www.kebhana.com/cms/rate/wpfxd651_01i_01.do"
    
    # 데이터가 없을 경우 최대 5일 전까지 거슬러 올라가며 확인
    current_dt = datetime.strptime(ymd_dash, "%Y-%m-%d")
    
    for i in range(6): # 0(당일)부터 5일까지 시도
        target_dt = current_dt - timedelta(days=i)
        target_dash = target_dt.strftime("%Y-%m-%d")
        target_ymd = target_dt.strftime("%Y%m%d")
        
        payload = dict(ajax="true", tmpInqStrDt=target_dash, pbldDvCd="0", 
                       inqStrDt=target_ymd, inqKindCd="1", requestTarget="searchContentDiv")
        
        try:
            r = requests.get(url, params=payload, timeout=10)
            tables = pd.read_html(r.text)
            
            if tables and len(tables) > 0:
                df = tables[0]
                # 원래 요청했던 날짜를 기록 (데이터의 기점 명시)
                df.insert(0, '날짜', ymd_dash) 
                # 실제 데이터가 수집된 날짜도 기록 (PM 관점의 데이터 무결성 확보)
                df.insert(1, '실제고시날짜', target_dash)
                
                if i > 0:
                    print(f"  -> {ymd_dash}는 공휴일(주말)이므로 {target_dash} 데이터로 대체 수집합니다.")
                return df
        except:
            continue # 에러 발생 시 다음 날짜(전일)로 시도
            
    return None


######## 3. 날짜 생성 및 수집 ########
result = []
date_range = pd.date_range("2026-01-29", "2026-01-01", freq='-1B')

for date in date_range:
    ymd_dash, ymd = date.strftime("%Y-%m-%d"), date.strftime("%Y%m%d")
    print(f"조회 중: {ymd_dash}", end=" ")
    
    data = exrate_get(ymd_dash, ymd)
    
    if data is not None:
        result.append(data)
        print("✓ 완료")
    else:
        print("✗ 실패 (유효 데이터 없음)")
    
    time.sleep(1) # 서버 부하 방지

# 수집된 데이터가 있을 때만 합치기
if result:
    final_result = pd.concat(result, ignore_index=True)
    print(f"\n총 {len(result)}일치 데이터 통합 완료.")
else:
    final_result = pd.DataFrame()
    print("\n수집된 데이터가 없습니다.")


######## 4. 컬럼명 평탄화 ########
def flatten_cols(df):
    if df.empty: return {}
    new_cols = {}
    for col in df.columns:
        if isinstance(col, tuple):
            if col[0] != col[1] == col[2]:
                new_cols[col] = col[0] if col[1] == "" else f"{col[0]}_{col[1]}".replace(" ", "_")
            elif col[0] != col[1] != col[2]:
                new_cols[col] = "_".join(col).replace(" ", "_")
            else:
                new_cols[col] = col[0].replace(" ", "_")
        else:
            new_cols[col] = col.replace(" ", "_")
    return new_cols

if not final_result.empty:
    mapping = flatten_cols(final_result)
    final_result = final_result.rename(columns=mapping)


######## 5. DB에 저장 ########
if not final_result.empty:
    to_db("exchange_rate_data", "exchage_rate", final_result)
    print("DB 저장 완료.")

조회 중: 2026-01-29 

  tables = pd.read_html(r.text)


✓ 완료
조회 중: 2026-01-28 

  tables = pd.read_html(r.text)


✓ 완료
조회 중: 2026-01-27 

  tables = pd.read_html(r.text)


✓ 완료
조회 중: 2026-01-26 

  tables = pd.read_html(r.text)


✓ 완료
조회 중: 2026-01-23 