In [None]:
# ----------------------------------------------------------------------
# 하이퍼파라미터 튜닝 (Hyperparameter Tuning) 정의
# ----------------------------------------------------------------------

# 1. 정의:
# - 모델 학습 과정에서 데이터로부터 자동으로 학습되지 않고, 사용자가 직접 설정해야 하는 값(파라미터)을 최적으로 찾는 과정.
# - 예시: K-NN의 K값, 랜덤 포레스트의 트리 개수(n_estimators), 학습률(learning_rate), 규제 강도(alpha 등).

# 2. 목적:
# - 과적합/과소적합 방지 및 모델의 일반화 성능(Generalization Performance) 극대화.
# - 최적의 하이퍼파라미터 조합을 찾아 가장 높은 검증 점수(Validation Score)를 달성하는 것.

# ----------------------------------------------------------------------
# 주요 튜닝 기법
# ----------------------------------------------------------------------
# 1. Grid Search (그리드 탐색)
# - 원리: 사용자가 지정한 하이퍼파라미터들의 모든 조합을 격자(Grid) 형태로 탐색하여 가장 좋은 성능을 내는 조합을 찾는 방식.
# - 특징:
#   - 장점: 모든 조합을 시도하므로, 최적의 조합을 찾을 확률이 높음.
#   - 단점: 탐색 공간이 넓거나 하이퍼파라미터 개수가 많아지면 기하급수적으로 시간이 증가 (비효율적).

# 2. Random Search (랜덤 탐색, 참고)
# - 원리: 지정된 탐색 공간 내에서 하이퍼파라미터 조합을 무작위로 샘플링하여 성능을 비교.
# - 특징: Grid Search보다 적은 시간으로 최적에 가까운 조합을 찾을 가능성이 높아, Grid Search의 대안으로 많이 사용됨.

# 3. Optuna (베이지안 최적화 기반)
# - 원리: 이전 시도에서 얻은 정보를 바탕으로 다음 시도에 가장 좋은 성능을 낼 가능성이 높은 하이퍼파라미터 조합을 '지능적으로' 선택하여 탐색. (베이지안 최적화 원리 활용)
# - 특징:
#   - 장점: Grid/Random Search보다 훨씬 적은 반복만으로 최적의 조합을 찾을 수 있어 탐색 시간이 단축됨 (가장 효율적).
#   - 특징: 'Define-by-Run' 방식을 사용하여 탐색 공간을 동적으로 정의할 수 있음.