## 1. 환경 설정 및 데이터 로드
Optuna 튜닝 결과를 SQLite에서 불러오고, 정확도(accuracy) 컬럼을 추가합니다.

In [None]:
!pip install optuna

import optuna
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

# SQLite 경로 설정
storage = "sqlite:///optuna_lgbm.db"
study = optuna.load_study(study_name="lgbm_study", storage=storage)

# DataFrame 변환
df = study.trials_dataframe()
df["accuracy"] = 1.0 - df["value"]


## 2. 정확도 기준 상위 5개 Trial 보기
가장 성능이 좋았던 상위 5개의 실험을 보여줍니다.

In [None]:
df_sorted = df.sort_values("accuracy", ascending=False)
top5 = df_sorted.head(5)
top5[["number", "value", "accuracy", "params"]]


## 3. 정확도 변화 시각화
실험 순서에 따라 모델 성능(정확도)이 어떻게 변화했는지 확인합니다.

In [None]:
plt.figure(figsize=(10, 4))
sns.lineplot(x=df.index, y="accuracy", data=df)
plt.title("Accuracy Trend per Trial")
plt.xlabel("Trial Number")
plt.ylabel("Accuracy")
plt.grid(True)
plt.show()


## 4. 하이퍼파라미터 중요도 시각화
어떤 파라미터가 성능 향상에 영향을 많이 주었는지 시각화합니다.

In [None]:
from optuna.visualization.matplotlib import plot_param_importances

plot_param_importances(study)
plt.title("Parameter Importance")
plt.tight_layout()
plt.show()


## 5. 파라미터 vs 정확도 분포 보기
파라미터의 값이 정확도에 어떤 영향을 주었는지 확인할 수 있습니다.

In [None]:
param = "params_learning_rate"  # 예시
if param in df.columns:
    plt.figure(figsize=(8, 4))
    sns.scatterplot(x=df[param], y=df["accuracy"])
    plt.title(f"{param} vs Accuracy")
    plt.xlabel(param)
    plt.ylabel("Accuracy")
    plt.grid(True)
    plt.show()
else:
    print("해당 파라미터가 존재하지 않습니다.")
