In [None]:
import random
from autogluon.tabular import TabularPredictor

# 기본 단위: 초(sec)
setTime= 10 * 60

# 파이썬 및 넘파이 시드 고정
random.seed(42)
np.random.seed(42)

# AutoGluon 모델 학습
predictor = TabularPredictor(
    label='target',
    problem_type='binary',
    eval_metric='accuracy',
    path='./autogluon_models'
)

# 모델 학습 (다양한 모델 앙상블)
predictor.fit(
    train_data=train_df,
    time_limit=setTime,  # 10분
    presets='medium_quality',  # 최고 품질 설정
    num_bag_folds=5,
    num_stack_levels=1,
    verbosity=2,

)

In [None]:
# 학습된 모델 요약
print('=== 학습된 모델 리더보드 ===')
leaderboard = predictor.leaderboard(train_df, silent=True)
print(leaderboard)

In [None]:
# test_df를 이용한 최종 Accuracy 측정
# 가장 우수한 성능을 보인 베스트 모델로 자동 평가합니다.
performance = predictor.evaluate(test_df)
print(f"\n최종 Test Accuracy: {performance['accuracy']:.4f}")

In [None]:
# 특성 중요도
print('=== 특성 중요도 ===')
feature_importance = predictor.feature_importance(train_df)
display(feature_importance.head(20))

# 특성 중요도 시각화
plt.figure(figsize=(12, 8))
top_features = feature_importance.head(15)
plt.barh(range(len(top_features)), top_features['importance'].values)
plt.yticks(range(len(top_features)), top_features.index)
plt.xlabel('중요도')
plt.title('AutoGluon 특성 중요도 (상위 15개)')
plt.gca().invert_yaxis()
plt.tight_layout()
plt.show()