In [2]:
import pandas as pd
from sklearn.ensemble import RandomForestRegressor

# 📌 1. 데이터 불러오기
weather_df = pd.read_csv("weather_all_data_cleaned.csv", encoding="euc-kr")
forecast_df = pd.read_csv("2026_지점별_예측_통합.csv", encoding="ISO-8859-1")

# 📌 2. forecast_df 컬럼 복구 및 날짜 처리
forecast_df.columns = [
    "일시", "평균기온(°C)", "최저기온(°C)", "최고기온(°C)",
    "일강수량(mm)", "최대 순간 풍속(m/s)", "최대 풍속(m/s)",
    "평균 풍속(m/s)", "최소 상대습도(%)", "평균 증기압(hPa)",
    "평균 현지기압(hPa)", "최저 해면기압(hPa)", "일 최심신적설(cm)",
    "평균 지면온도(°C)", "지점명"
]
forecast_df["지점명"] = forecast_df["지점명"].str.encode('latin1').str.decode('utf-8')
forecast_df["일시"] = pd.to_datetime(forecast_df["일시"])

# 📌 3. weather_df 컬럼 정리
weather_df["일시"] = pd.to_datetime(weather_df["일시"])
weather_df = weather_df[[
    "지점", "지점명", "일시", "평균기온(°C)", "최저기온(°C)", "최고기온(°C)",
    "일강수량(mm)", "최대 순간 풍속(m/s)", "최대 풍속(m/s)", "평균 풍속(m/s)",
    "최소 상대습도(%)", "평균 증기압(hPa)", "평균 현지기압(hPa)", "평균 지면온도(°C)",
    "평균 이슬점온도(°C)"
]].dropna()

# 📌 4. 학습/예측 데이터 분리
X_train = weather_df.drop(columns=["지점", "지점명", "일시", "평균 이슬점온도(°C)"])
y_train = weather_df["평균 이슬점온도(°C)"]

X_test = forecast_df[[
    "평균기온(°C)", "최저기온(°C)", "최고기온(°C)", "일강수량(mm)",
    "최대 순간 풍속(m/s)", "최대 풍속(m/s)", "평균 풍속(m/s)", "최소 상대습도(%)",
    "평균 증기압(hPa)", "평균 현지기압(hPa)", "평균 지면온도(°C)"
]]

# 📌 5. 모델 학습 및 예측
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
forecast_df["예측 평균 이슬점온도(°C)"] = model.predict(X_test)

# 📌 6. 지점별 일자별 예측 결과 정리
result_df = forecast_df[["일시", "지점명", "예측 평균 이슬점온도(°C)"]].sort_values(by=["지점명", "일시"])

result_df.to_csv("2026_이슬점온도_예측.csv", index=False, encoding="utf-8-sig")

# 📌 출력 확인
print(result_df.head())


          일시 지점명  예측 평균 이슬점온도(°C)
0 2026-01-01  고산            3.321
1 2026-01-02  고산            3.717
2 2026-01-03  고산            2.525
3 2026-01-04  고산            1.614
4 2026-01-05  고산            3.730


In [3]:
import pandas as pd
from sklearn.ensemble import RandomForestRegressor

# 📌 1. 데이터 불러오기
weather_df = pd.read_csv("weather_all_data_cleaned.csv", encoding="euc-kr")
forecast_df = pd.read_csv("2026_지점별_예측_통합.csv", encoding="ISO-8859-1")

# 📌 2. forecast_df 컬럼 복구 및 날짜 처리
forecast_df.columns = [
    "일시", "평균기온(°C)", "최저기온(°C)", "최고기온(°C)",
    "일강수량(mm)", "최대 순간 풍속(m/s)", "최대 풍속(m/s)",
    "평균 풍속(m/s)", "최소 상대습도(%)", "평균 증기압(hPa)",
    "평균 현지기압(hPa)", "최저 해면기압(hPa)", "일 최심신적설(cm)",
    "평균 지면온도(°C)", "지점명"
]
forecast_df["지점명"] = forecast_df["지점명"].str.encode('latin1').str.decode('utf-8')
forecast_df["일시"] = pd.to_datetime(forecast_df["일시"])

# 📌 3. weather_df 컬럼 정리
weather_df["일시"] = pd.to_datetime(weather_df["일시"])
weather_df = weather_df[[
    "지점", "지점명", "일시", "평균기온(°C)", "최저기온(°C)", "최고기온(°C)",
    "일강수량(mm)", "최대 순간 풍속(m/s)", "최대 풍속(m/s)", "평균 풍속(m/s)",
    "최소 상대습도(%)", "평균 증기압(hPa)", "평균 현지기압(hPa)", "평균 지면온도(°C)",
    "평균 이슬점온도(°C)"
]].dropna()

# 📌 4. 학습/예측 데이터 분리
X_train = weather_df.drop(columns=["지점", "지점명", "일시", "평균 상대습도(%)"])
y_train = weather_df["평균 상대습도(%)"]

X_test = forecast_df[[
    "평균기온(°C)", "최저기온(°C)", "최고기온(°C)", "일강수량(mm)",
    "최대 순간 풍속(m/s)", "최대 풍속(m/s)", "평균 풍속(m/s)", "최소 상대습도(%)",
    "평균 증기압(hPa)", "평균 현지기압(hPa)", "평균 지면온도(°C)"
]]

# 📌 5. 모델 학습 및 예측
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
forecast_df["예측 평균 상대습도(%)"] = model.predict(X_test)

# 📌 6. 지점별 일자별 예측 결과 정리
result_df = forecast_df[["일시", "지점명", "예측 평균 이슬점온도(°C)"]].sort_values(by=["지점명", "일시"])

result_df.to_csv("2026_상대습도_예측.csv", index=False, encoding="utf-8-sig")

# 📌 출력 확인
print(result_df.head())


KeyError: "['평균 상대습도(%)'] not found in axis"