In [None]:
import pandas as pd
import joblib
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

# 1. (사전 작업) 2020, 2021, 2023년 데이터 전처리 완료 데이터프레임 준비
# final_df_2020, final_df_2021, final_df_2023는 각각 아래와 같은 전처리 과정을 거쳐야 함
# (각 연도별 기상/위험/산불 데이터 병합 및 결측치 처리, features 추출 등)
# features = ['TA_AVG', 'HM_AVG', 'WS_AVG', 'effective_humidity', 'wind_speed']

# 2. 세 연도 데이터 합치기
final_df_all = pd.concat([final_df_2020, final_df_2021, final_df_2023], ignore_index=True)

# 3. 특성과 타겟 추출
features = ['TA_AVG', 'HM_AVG', 'WS_AVG', 'effective_humidity', 'wind_speed']
X_all = final_df_all[features].astype(float)
y_all = final_df_all['fire_occurred']

# 4. 저장된 SMOTE 모델 불러오기
model = joblib.load('xgb_fire_model_smote.pkl')

# 5. 예측 및 평가
preds_all = model.predict(X_all)

print("전체(2020+2021+2023년) 데이터 정확도:", accuracy_score(y_all, preds_all))
print("분류 리포트:")
print(classification_report(y_all, preds_all))
print("혼동 행렬:")
print(confusion_matrix(y_all, preds_all))

# 6. 예측 결과 표로 확인 (샘플)
result_df_all = X_all.copy()
result_df_all['actual_fire_occurred'] = y_all
result_df_all['predicted_fire_occurred'] = preds_all
print(result_df_all.head())
