# 04. Visualization & Report Figures(최종발표/리포트용 그림만 깔끔하게 준비)
## 4-1. 준비
## 4-2. 핵심그래프 3~5개(그래프 저장 포함)
## 4-3. 요약

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

from src.data_loader import load_csv
from src.visualization import plot_time_series, plot_actual_vs_pred

sns.set_style("whitegrid")
plt.rcParams["figure.figsize"] = (10, 4)

In [None]:
# 1. 데이터 & 예측 결과 불러오기 (필요에 따라 포맷 맞추기)
df = load_csv("data/processed/bike_features.csv")
preds = pd.read_csv("reports/bike_predictions.csv")  # 예: y_test, y_pred 저장해둔 파일

df["datetime"] = pd.to_datetime(df["datetime"])
df = df.sort_values("datetime").reset_index(drop=True)

In [None]:
# 2-1. 전체 시계열 그래프
plot_time_series(df, "datetime", "demand", title="Bike demand over time")

plt.savefig("reports/figures/01.bike/bike_timeseries.png", dpi=200, bbox_inches="tight")
plt.close()

In [None]:
# 2-2. 요일-시간대 heatmap
tmp = df.copy()
tmp["dayofweek"] = tmp["datetime"].dt.dayofweek
tmp["hour"] = tmp["datetime"].dt.hour

pivot = tmp.pivot_table(
    index="dayofweek",
    columns="hour",
    values="demand",
    aggfunc="mean",
)

plt.figure(figsize=(12, 4))
sns.heatmap(pivot, cmap="viridis")
plt.title("Average demand by dayofweek & hour")
plt.savefig("reports/figures/01.bike/bike_heatmap_dow_hour.png", dpi=200, bbox_inches="tight")
plt.close()

In [None]:
# 2-3. 실제 vs 예측 (베스트 모델)
y_test = preds["y_test"].values
y_pred = preds["y_pred_rf"].values  # 예: random forest 결과

plot_actual_vs_pred(y_test, y_pred, title="Bike demand – RF (actual vs predicted)")
plt.savefig("reports/figures/01.bike/bike_actual_vs_pred.png", dpi=200, bbox_inches="tight")
plt.close()

## 그림별 한 줄 메시지 메모

1. **전체 시계열**  
   - 예: "출퇴근 시간대(08–09시, 18–20시)에 일관된 피크가 나타남"

2. **요일·시간대 heatmap**  
   - 예: "평일 아침/저녁 집중, 주말은 오후 시간대에 수요가 분산됨"

3. **실제 vs 예측**  
   - 예: "랜덤포레스트가 피크 구간까지 비교적 잘 따라가지만, 일부 극단값은 과소예측"