# 🧠 딥러닝 하이퍼파라미터 튜닝 실습

**목적:** '혼자 공부하는 머신러닝, 딥러닝' 방식을 딥러닝에 적용  
**데이터:** Mall Customer Segmentation 데이터  
**모델:** 분류 신경망 (Classification Neural Network)

In [3]:
import sys
!{sys.executable} -m pip install keras tensorflow

Collecting keras
  Downloading keras-2.11.0-py2.py3-none-any.whl.metadata (1.4 kB)
Downloading keras-2.11.0-py2.py3-none-any.whl (1.7 MB)
[2K   [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m4.2 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:01[0m
[?25hInstalling collected packages: keras
Successfully installed keras-2.11.0


In [5]:
# 필요한 라이브러리 import
# import sys
import os
from tensorflow import keras


# 프로젝트 루트 디렉토리를 Python path에 추가
project_root = os.path.dirname(os.getcwd())
if project_root not in sys.path:
    sys.path.append(project_root)

from core.hyperparameter_tuning import HyperparameterTuner, run_grid_search_experiment
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# TensorFlow 경고 줄이기
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

print("🎯 하이퍼파라미터 튜닝 환경 준비 완료!")
print("📊 사용할 데이터: Mall Customer Segmentation")
print("🧠 테스트할 모델: 분류 신경망")

ModuleNotFoundError: No module named 'tensorflow'

## 📊 실험 1: 데이터 확인

In [15]:
# 튜너 인스턴스 생성
tuner = HyperparameterTuner()

# 데이터 로드 및 전처리
X_train, X_test, y_train, y_test = tuner.prepare_data()

print(f"훈련 데이터 크기: {X_train.shape}")
print(f"테스트 데이터 크기: {X_test.shape}")
print(f"클러스터 수: {len(np.unique(y_train))}")
print(f"특성 수: {X_train.shape[1]}")



📊 데이터 로드 및 전처리 중...
데이터 크기: (200, 5)
훈련 세트: (160, 3), 테스트 세트: (40, 3)
클러스터 분포: [54 47 40 20 39]
훈련 데이터 크기: (160, 3)
테스트 데이터 크기: (40, 3)
클러스터 수: 5
특성 수: 3


## 🔧 실험 2: Learning Rate 튜닝

**가설:** 학습률이 너무 높으면 발산하고, 너무 낮으면 학습이 느려질 것이다.

In [16]:
# 학습률 튜닝 실행
best_lr, lr_results = tuner.tune_learning_rate(X_train, y_train, X_test, y_test)

# 결과 시각화
if lr_results:
    lr_df = pd.DataFrame(lr_results)
    
    plt.figure(figsize=(10, 6))
    plt.bar([str(lr) for lr in lr_df['learning_rate']], lr_df['val_accuracy'])
    plt.title('Learning Rate vs Validation Accuracy')
    plt.xlabel('Learning Rate')
    plt.ylabel('Validation Accuracy')
    plt.xticks(rotation=45)
    
    # 최고 성능 강조
    best_idx = lr_df['val_accuracy'].idxmax()
    plt.bar(str(lr_df.loc[best_idx, 'learning_rate']), lr_df.loc[best_idx, 'val_accuracy'], color='red', alpha=0.7)
    
    plt.tight_layout()
    plt.show()
    
    print(f"🎯 최적 학습률: {best_lr}")
    display(lr_df[['learning_rate', 'val_accuracy']].round(4))

\n=== 1단계: Learning Rate 튜닝 ===
학습률은 모델 성능에 가장 큰 영향을 미치는 하이퍼파라미터야!
\n🔧 학습률 0.1 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 학습률 0.01 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 학습률 0.001 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 학습률 0.0001 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
❌ 모든 학습률 테스트 실패


## 🧠 실험 3: Hidden Units 튜닝

**가설:** 뉴런이 너무 적으면 underfitting, 너무 많으면 overfitting이 발생할 것이다.

In [6]:
# 은닉층 크기 튜닝 실행 (최적 학습률 사용)
best_units, units_results = tuner.tune_hidden_units(X_train, y_train, X_test, y_test, best_lr)

# 결과 시각화
if units_results:
    units_df = pd.DataFrame(units_results)
    
    plt.figure(figsize=(10, 6))
    plt.plot(units_df['hidden_units'], units_df['val_accuracy'], 'bo-', linewidth=2, markersize=8)
    plt.title('Hidden Units vs Validation Accuracy')
    plt.xlabel('Number of Hidden Units')
    plt.ylabel('Validation Accuracy')
    plt.grid(True, alpha=0.3)
    
    # 최고 성능 포인트 강조
    best_idx = units_df['val_accuracy'].idxmax()
    plt.plot(units_df.loc[best_idx, 'hidden_units'], units_df.loc[best_idx, 'val_accuracy'], 'ro', markersize=12)
    
    plt.show()
    
    print(f"🎯 최적 은닉층 크기: {best_units}")
    display(units_df[['hidden_units', 'val_accuracy']].round(4))

\n=== 2단계: Hidden Units 튜닝 (최적 학습률 None 사용) ===
은닉층 크기는 모델의 표현력을 결정해!
\n🔧 은닉층 16개 뉴런 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 은닉층 32개 뉴런 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 은닉층 64개 뉴런 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 은닉층 128개 뉴런 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 은닉층 256개 뉴런 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
❌ 모든 은닉층 크기 테스트 실패


## 🎯 실험 4: Dropout Rate 튜닝

**가설:** 적절한 드롭아웃은 과적합을 방지하면서 성능을 유지할 것이다.

In [7]:
# 드롭아웃 비율 튜닝 실행
best_dropout, dropout_results = tuner.tune_dropout_rate(X_train, y_train, X_test, y_test, best_lr, best_units)

# 결과 시각화
if dropout_results:
    dropout_df = pd.DataFrame(dropout_results)
    
    plt.figure(figsize=(12, 8))
    
    # 검증 정확도 그래프
    plt.subplot(2, 2, 1)
    plt.plot(dropout_df['dropout_rate'], dropout_df['val_accuracy'], 'go-', linewidth=2, markersize=8)
    plt.title('Dropout Rate vs Validation Accuracy')
    plt.xlabel('Dropout Rate')
    plt.ylabel('Validation Accuracy')
    plt.grid(True, alpha=0.3)
    
    # 과적합 갭 그래프
    plt.subplot(2, 2, 2)
    plt.plot(dropout_df['dropout_rate'], dropout_df['overfitting_gap'], 'ro-', linewidth=2, markersize=8)
    plt.title('Dropout Rate vs Overfitting Gap')
    plt.xlabel('Dropout Rate')
    plt.ylabel('Overfitting Gap (Train - Val)')
    plt.grid(True, alpha=0.3)
    
    # 훈련 vs 검증 정확도 비교
    plt.subplot(2, 2, 3)
    plt.plot(dropout_df['dropout_rate'], dropout_df['train_accuracy'], 'b-', label='Train Accuracy', linewidth=2)
    plt.plot(dropout_df['dropout_rate'], dropout_df['val_accuracy'], 'r-', label='Validation Accuracy', linewidth=2)
    plt.title('Train vs Validation Accuracy')
    plt.xlabel('Dropout Rate')
    plt.ylabel('Accuracy')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    print(f"🎯 최적 드롭아웃 비율: {best_dropout}")
    display(dropout_df[['dropout_rate', 'val_accuracy', 'train_accuracy', 'overfitting_gap']].round(4))

\n=== 3단계: Dropout Rate 튜닝 (학습률 None, 은닉층 None 사용) ===
드롭아웃은 과적합을 방지하는 핵심 기법이야!
\n🔧 드롭아웃 0.0 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 드롭아웃 0.1 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 드롭아웃 0.2 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 드롭아웃 0.3 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 드롭아웃 0.4 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
\n🔧 드롭아웃 0.5 테스트 중...
❌ 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined
❌ 모든 드롭아웃 비율 테스트 실패


## 🏆 실험 5: 최종 모델 훈련

In [8]:
# 최적 하이퍼파라미터로 최종 모델 훈련
final_model, final_history = tuner.final_validation(
    X_train, y_train, X_test, y_test, 
    best_lr, best_units, best_dropout
)

if final_model and final_history:
    # 훈련 과정 시각화
    plt.figure(figsize=(12, 5))
    
    # 정확도 그래프
    plt.subplot(1, 2, 1)
    epochs = range(1, len(final_history.history['accuracy']) + 1)
    plt.plot(epochs, final_history.history['accuracy'], 'b-', label='Training Accuracy')
    plt.plot(epochs, final_history.history['val_accuracy'], 'r-', label='Validation Accuracy')
    plt.title('Training and Validation Accuracy')
    plt.xlabel('Epochs')
    plt.ylabel('Accuracy')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    # 손실 그래프
    plt.subplot(1, 2, 2)
    plt.plot(epochs, final_history.history['loss'], 'b-', label='Training Loss')
    plt.plot(epochs, final_history.history['val_loss'], 'r-', label='Validation Loss')
    plt.title('Training and Validation Loss')
    plt.xlabel('Epochs')
    plt.ylabel('Loss')
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # 최종 성능 평가
    test_loss, test_accuracy = final_model.evaluate(X_test, y_test, verbose=0)
    
    print("\n🏆 최종 결과 요약:")
    print(f"- 최적 Learning Rate: {best_lr}")
    print(f"- 최적 Hidden Units: {best_units}")
    print(f"- 최적 Dropout Rate: {best_dropout}")
    print(f"- 최종 테스트 정확도: {test_accuracy:.4f}")
    print(f"- 최종 테스트 손실: {test_loss:.4f}")

\n=== 🏆 최종 검증 ===
최적 하이퍼파라미터:
- Learning Rate: None
- Hidden Units: None
- Dropout Rate: None
❌ 최종 모델 생성 실패: 모델 생성 실패: name 'keras' is not defined


## 📝 학습 정리

### 배운 것들:
1. **Learning Rate의 중요성**: 가장 큰 영향을 미치는 하이퍼파라미터
2. **Network Size**: 적절한 크기가 중요 (너무 크면 overfitting, 너무 작으면 underfitting)
3. **Dropout의 효과**: 과적합 방지에 효과적
4. **단계별 접근법**: 체계적인 튜닝이 무작위 탐색보다 효율적

### 실무 적용:
- Early Stopping으로 시간 절약
- 검증 세트 기준으로 선택
- 과적합 갭 모니터링
- 재현 가능한 실험 설계