In [None]:
"""
Part 3: 라벨 스무딩 (Label Smoothing)
- 라벨 스무딩의 효과
- 과신(Overconfidence) 방지
- 일반화 성능 향상

독립적으로 실행 가능합니다.
"""

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, f1_score

# 재현성을 위한 시드 고정
torch.manual_seed(42)
np.random.seed(42)

print("=" * 70)
print("Part 3: 라벨 스무딩 (Label Smoothing)")
print("=" * 70)


# =====================================================================
# 실습 3-1: 라벨 스무딩 개념 이해
# =====================================================================
print("\n[실습 3-1] 라벨 스무딩 개념")

# 원래 레이블 (3개 클래스)
original_label = torch.tensor([1, 0, 0], dtype=torch.float)
print("원래 레이블 (One-hot):", original_label.numpy())
print("  의미: 클래스 0이 100% 정답")

# 라벨 스무딩 적용
smoothing = 0.1
n_classes = 3

# 스무딩 공식: y_smooth = y * (1 - alpha) + alpha / K(클래스 수)
smooth_value = smoothing / n_classes
smooth_label = original_label * (1 - smoothing) + smooth_value

print(f"\n라벨 스무딩 (alpha={smoothing}) 적용 후:")
print(smooth_label.numpy())
print(f"  의미: 클래스 0이 {smooth_label[0]*100:.1f}% 정답")
print(f"       나머지 클래스도 각각 {smooth_label[1]*100:.1f}% 가능성")

print("\n효과:")
print("  모델이 100% 확신하지 않도록 함")
print("  과신(Overconfidence) 방지")
print("  일반화 능력 향상")


# =====================================================================
# 실습 3-2: 라벨 스무딩 구현
# =====================================================================
print("\n" + "=" * 70)
print("[실습 3-2] 라벨 스무딩 구현")
print("=" * 70)

class LabelSmoothingCrossEntropy(nn.Module):
    """
    라벨 스무딩이 적용된 CrossEntropyLoss
    """
    def __init__(self, n_classes, smoothing=0.1):
        super(LabelSmoothingCrossEntropy, self).__init__()
        self.n_classes = n_classes
        self.smoothing = smoothing
        self.confidence = 1.0 - smoothing

    def forward(self, pred, target):
        """
        pred: (batch_size, n_classes) - 모델의 logits
        target: (batch_size,) - 클래스 인덱스
        """
        # Log Softmax
        log_probs = torch.log_softmax(pred, dim=1)

        # 타겟을 원-핫으로 변환
        with torch.no_grad():
            true_dist = torch.zeros_like(log_probs)
            true_dist.fill_(self.smoothing / (self.n_classes - 1))
            true_dist.scatter_(1, target.unsqueeze(1), self.confidence)

        # KL Divergence 계산
        # 확률분포 2개가 있어요. 이 두개가 얼마나 다르지? (차이)가 있는지 확인하는 계산
        # 즉, 진짜 존재하는 분포(P), 모델이 예측한 분포(Q)
        # 모델이 예측한 분포(Q)가 얼마나 실제 분포(P)와 유사한가
        # Q가 P 에서 얼마나 벗어났나? 확인
        # CrossEntropyLoss = NLLLoss + KL Divergence
        loss = torch.mean(torch.sum(-true_dist * log_probs, dim=1))

        return loss

# 테스트
print("\n라벨 스무딩 손실 함수 테스트:")

# 예시 데이터
batch_logits = torch.tensor([
    [2.0, 0.5, 0.1],  # 클래스 0 예측
    [0.3, 2.5, 0.2],  # 클래스 1 예측
])
batch_targets = torch.tensor([0, 1])

# 일반 CrossEntropy
ce_normal = nn.CrossEntropyLoss()
loss_normal = ce_normal(batch_logits, batch_targets)

# 라벨 스무딩 CrossEntropy
ce_smooth = LabelSmoothingCrossEntropy(n_classes=3, smoothing=0.1)
loss_smooth = ce_smooth(batch_logits, batch_targets)

print(f"일반 CrossEntropy: {loss_normal.item():.4f}")
print(f"라벨 스무딩 CrossEntropy: {loss_smooth.item():.4f}")
print(f"차이: {(loss_smooth - loss_normal).item():.4f}")


# =====================================================================
# 실습 3-3: 데이터 준비 및 모델 정의
# =====================================================================
print("\n" + "=" * 70)
print("[실습 3-3] 실험 데이터 준비")
print("=" * 70)

# 5개 클래스 분류 데이터
X, y = make_classification(
    n_samples=1000, n_features=20, n_informative=15,
    n_classes=5, n_clusters_per_class=1, random_state=42
)

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

# 정규화
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

X_train_t = torch.FloatTensor(X_train)
y_train_t = torch.LongTensor(y_train)
X_test_t = torch.FloatTensor(X_test)
y_test_t = torch.LongTensor(y_test)

print(f"훈련 데이터: {X_train.shape}")
print(f"테스트 데이터: {X_test.shape}")
print(f"클래스 수: 5")


# 분류 모델 정의
class Classifier(nn.Module):
    """5개 클래스 분류 모델"""
    def __init__(self, n_classes=5):
        super(Classifier, self).__init__()
        self.network = nn.Sequential(
            nn.Linear(20, 128),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(128, 64),
            nn.ReLU(),
            nn.Dropout(0.3),
            nn.Linear(64, n_classes)
        )

    def forward(self, x):
        return self.network(x)


# =====================================================================
# 실습 3-4: 일반 vs 라벨 스무딩 학습 비교
# =====================================================================
print("\n" + "=" * 70)
print("[실습 3-4] 일반 vs 라벨 스무딩 학습 비교")
print("=" * 70)

# 실험 설정
smoothing_values = [0.0, 0.05, 0.1, 0.2]
results = {}

for smoothing in smoothing_values:
    if smoothing == 0.0:
        print(f"\n라벨 스무딩 없음 학습 중...")
        criterion = nn.CrossEntropyLoss()
    else:
        print(f"\n라벨 스무딩 alpha={smoothing} 학습 중...")
        criterion = LabelSmoothingCrossEntropy(n_classes=5, smoothing=smoothing)

    # 모델 초기화
    model = Classifier(n_classes=5)
    optimizer = optim.Adam(model.parameters(), lr=0.001)

    # 학습
    train_losses = []
    train_accs = []

    num_epochs = 100
    for epoch in range(num_epochs):
        model.train()
        optimizer.zero_grad()

        output = model(X_train_t)
        loss = criterion(output, y_train_t)

        loss.backward()
        optimizer.step()

        train_losses.append(loss.item())

        # 훈련 정확도
        with torch.no_grad():
            train_pred = torch.argmax(output, dim=1)
            train_acc = accuracy_score(y_train, train_pred.numpy())
            train_accs.append(train_acc)

    # 테스트
    model.eval()
    with torch.no_grad():
        test_output = model(X_test_t)
        test_pred = torch.argmax(test_output, dim=1)
        test_probs = torch.softmax(test_output, dim=1)

        test_acc = accuracy_score(y_test, test_pred.numpy())

        # 예측 확신도 (최대 확률의 평균)
        max_probs = torch.max(test_probs, dim=1)[0]
        avg_confidence = max_probs.mean().item()

    results[smoothing] = {
        'train_losses': train_losses,
        'train_accs': train_accs,
        'test_acc': test_acc,
        'avg_confidence': avg_confidence,
        'test_probs': test_probs
    }

    print(f"  최종 훈련 손실: {train_losses[-1]:.4f}")
    print(f"  최종 훈련 정확도: {train_accs[-1]:.4f}")
    print(f"  테스트 정확도: {test_acc:.4f}")
    print(f"  평균 확신도: {avg_confidence:.4f}")


# =====================================================================
# 실습 3-5: 결과 분석 및 시각화
# =====================================================================
print("\n" + "=" * 70)
print("[실습 3-5] 결과 분석")
print("=" * 70)

print("\n성능 요약:")
print(f"{'Alpha':>10} {'Train Acc':>12} {'Test Acc':>12} {'Confidence':>12}")
print("-" * 50)
for smoothing in smoothing_values:
    result = results[smoothing]
    print(f"{smoothing:10.2f} {result['train_accs'][-1]:12.4f} "
          f"{result['test_acc']:12.4f} {result['avg_confidence']:12.4f}")

print("\n관찰:")
print("  1. 라벨 스무딩 사용 시 테스트 정확도 향상 가능")
print("  2. 평균 확신도는 감소 (과신 방지)")
print("  3. alpha가 너무 크면 (0.2) 성능 저하 가능")

# 시각화
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. 학습 곡선 비교
ax1 = axes[0, 0]
colors = ['#e74c3c', '#f39c12', '#3498db', '#2ecc71']
for smoothing, color in zip(smoothing_values, colors):
    losses = results[smoothing]['train_losses']
    ax1.plot(losses, label=f'alpha={smoothing}', linewidth=2, color=color)

ax1.set_xlabel('Epoch', fontsize=11)
ax1.set_ylabel('Training Loss', fontsize=11)
ax1.set_title('Training Loss with Different Smoothing',
              fontsize=12, weight='bold')
ax1.legend(fontsize=10)
ax1.grid(alpha=0.3)

# 2. 정확도 비교
ax2 = axes[0, 1]
train_accs_final = [results[s]['train_accs'][-1] for s in smoothing_values]
test_accs = [results[s]['test_acc'] for s in smoothing_values]

x_pos = np.arange(len(smoothing_values))
width = 0.35

bars1 = ax2.bar(x_pos - width/2, train_accs_final, width,
                label='Train', color='#3498db', edgecolor='black', alpha=0.7)
bars2 = ax2.bar(x_pos + width/2, test_accs, width,
                label='Test', color='#2ecc71', edgecolor='black', alpha=0.7)

ax2.set_ylabel('Accuracy', fontsize=11)
ax2.set_title('Accuracy Comparison', fontsize=12, weight='bold')
ax2.set_xticks(x_pos)
ax2.set_xticklabels([f'{s}' for s in smoothing_values])
ax2.set_xlabel('Smoothing Alpha', fontsize=11)
ax2.legend(fontsize=10)
ax2.grid(axis='y', alpha=0.3)
ax2.set_ylim(0.5, 1.0)

# 값 표시
for bars in [bars1, bars2]:
    for bar in bars:
        height = bar.get_height()
        ax2.text(bar.get_x() + bar.get_width()/2., height,
                 f'{height:.3f}', ha='center', va='bottom', fontsize=8)

# 3. 확신도 비교
ax3 = axes[1, 0]
confidences = [results[s]['avg_confidence'] for s in smoothing_values]

bars = ax3.bar([f'{s}' for s in smoothing_values], confidences,
               color=colors, edgecolor='black', alpha=0.7)
ax3.set_xlabel('Smoothing Alpha', fontsize=11)
ax3.set_ylabel('Average Confidence', fontsize=11)
ax3.set_title('Model Confidence', fontsize=12, weight='bold')
ax3.grid(axis='y', alpha=0.3)
ax3.set_ylim(0, 1.0)

# 값 표시
for bar, conf in zip(bars, confidences):
    height = bar.get_height()
    ax3.text(bar.get_x() + bar.get_width()/2., height,
             f'{conf:.3f}', ha='center', va='bottom', fontsize=9, weight='bold')

# 4. 확률 분포 비교 (첫 10개 샘플)
ax4 = axes[1, 1]

# alpha=0.0과 alpha=0.1 비교
probs_no_smooth = results[0.0]['test_probs'][:10].numpy()
probs_smooth = results[0.1]['test_probs'][:10].numpy()

sample_indices = range(10)
for i in sample_indices:
    max_prob_no = probs_no_smooth[i].max()
    max_prob_smooth = probs_smooth[i].max()

    ax4.plot([i-0.1, i+0.1], [max_prob_no, max_prob_smooth],
             'o-', linewidth=2, markersize=8)

ax4.axhline(y=1.0, color='red', linestyle='--', linewidth=1, alpha=0.5)
ax4.set_xlabel('Sample Index', fontsize=11)
ax4.set_ylabel('Max Probability', fontsize=11)
ax4.set_title('Confidence per Sample\n(Left: No Smooth, Right: Smooth)',
              fontsize=12, weight='bold')
ax4.set_xticks(sample_indices)
ax4.grid(alpha=0.3)
ax4.set_ylim(0.5, 1.05)

plt.tight_layout()
plt.savefig('part3_label_smoothing.png', dpi=150, bbox_inches='tight')
print("\n저장: part3_label_smoothing.png")
plt.close()


# =====================================================================
# 실습 3-6: PyTorch 내장 라벨 스무딩 사용
# =====================================================================
print("\n" + "=" * 70)
print("[실습 3-6] PyTorch 내장 라벨 스무딩 (PyTorch 1.10+)")
print("=" * 70)

# PyTorch 1.10 이상에서는 CrossEntropyLoss에 label_smoothing 파라미터 제공
try:
    criterion_builtin = nn.CrossEntropyLoss(label_smoothing=0.1)

    print("\nPyTorch 내장 라벨 스무딩 사용 가능")
    print("사용법:")
    print("  criterion = nn.CrossEntropyLoss(label_smoothing=0.1)")

    # 간단한 테스트
    test_logits = torch.randn(5, 3)
    test_targets = torch.tensor([0, 1, 2, 0, 1])
    loss = criterion_builtin(test_logits, test_targets)
    print(f"\n테스트 손실: {loss.item():.4f}")

except TypeError:
    print("\nPyTorch 버전이 1.10 미만입니다.")
    print("위에서 구현한 LabelSmoothingCrossEntropy 클래스를 사용하세요.")


# =====================================================================
# 최종 요약
# =====================================================================
print("\n" + "=" * 70)
print("Part 3 완료")
print("=" * 70)

print("\n핵심 개념:")
print("\n1. 라벨 스무딩")
print("   - 정답 레이블을 부드럽게 만듦")
print("   - [1, 0, 0] -> [0.93, 0.03, 0.03]")
print("   - 과신(Overconfidence) 방지")

print("\n2. 효과")
print("   - 일반화 성능 향상")
print("   - 과적합 방지")
print("   - 모델 캘리브레이션 개선")

print("\n3. 하이퍼파라미터")
print("   - alpha = 0.0: 스무딩 없음")
print("   - alpha = 0.1: 표준 설정 (권장)")
print("   - alpha = 0.2: 강한 스무딩 (주의)")

print("\n실전 가이드:")
print("  - 대규모 데이터셋: alpha=0.1")
print("  - 작은 데이터셋: 사용 안 함 또는 alpha=0.05")
print("  - 과적합 문제: alpha=0.1~0.15")
print("  - PyTorch 1.10+: label_smoothing 파라미터 사용")

print("\n생성된 파일:")
print("  part3_label_smoothing.png - 라벨 스무딩 효과")

print("\n다음: Part 4 - 클래스 불균형 대응")
print("=" * 70)