실습 정리 및 복습

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
import seaborn as sns
from scipy.special import kl_div
import warnings
warnings.filterwarnings('ignore')

# 한글 폰트 설정 (선택사항)
plt.rcParams['font.family'] = ['DejaVu Sans']
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 10

# 시드 설정
np.random.seed(42)

5.1 오늘 학습한 핵심 개념 정리

In [2]:
def summarize_concepts():
    """오늘 학습한 핵심 개념들을 정리"""
    
    print("=" * 60)
    print("📚 3일차 실습 핵심 개념 정리")
    print("=" * 60)
    
    concepts = {
        "1. 확률분포의 성질": [
            "• 정규분포: 68-95-99.7 규칙, 중심극한정리",
            "• 베르누이분포: 평균=p, 분산=p(1-p), 최대분산은 p=0.5",
            "• 이항분포: 베르누이 시행의 합, 정규분포로 근사 가능"
        ],
        
        "2. 정보 이론 핵심": [
            "• 정보량: I(x) = -log₂(P(x)), 확률이 낮을수록 정보량 많음",
            "• 엔트로피: H(X) = E[I(X)], 불확실성의 측정, 균등분포에서 최대",
            "• 크로스 엔트로피: H(P,Q) = -Σ P(x)log Q(x), 모델 평가에 사용"
        ],
        
        "3. KL Divergence": [
            "• 정의: D_KL(P||Q) = Σ P(x)log(P(x)/Q(x))",
            "• 의미: Q 모델로 P 데이터를 인코딩할 때의 추가 비용",
            "• 성질: 비음성, 비대칭, P=Q일 때만 0"
        ],
        
        "4. VAE와 정보 이론": [
            "• 사전분포: 항상 N(0,I), 모든 데이터에 대해 동일",
            "• 사후분포: q(z|x), 입력에 따라 다름, 학습을 통해 변화",
            "• ELBO = 재구성 품질 - KL 발산, 최대화가 목표"
        ],
        
        "5. 실용적 관점": [
            "• KL ≈ 0: Posterior collapse, 정보 손실",
            "• KL = 3~15: 건강한 범위, 좋은 표현 학습",
            "• VAE Loss = -ELBO, 음수일수록 좋음"
        ]
    }
    
    for topic, points in concepts.items():
        print(f"\n{topic}")
        print("-" * 40)
        for point in points:
            print(point)
    
    print("\n" + "=" * 60)
    print("🎯 내일 학습 예고: Jensen's Inequality와 ELBO 완전 유도")
    print("=" * 60)

# 실행
summarize_concepts()

📚 3일차 실습 핵심 개념 정리

1. 확률분포의 성질
----------------------------------------
• 정규분포: 68-95-99.7 규칙, 중심극한정리
• 베르누이분포: 평균=p, 분산=p(1-p), 최대분산은 p=0.5
• 이항분포: 베르누이 시행의 합, 정규분포로 근사 가능

2. 정보 이론 핵심
----------------------------------------
• 정보량: I(x) = -log₂(P(x)), 확률이 낮을수록 정보량 많음
• 엔트로피: H(X) = E[I(X)], 불확실성의 측정, 균등분포에서 최대
• 크로스 엔트로피: H(P,Q) = -Σ P(x)log Q(x), 모델 평가에 사용

3. KL Divergence
----------------------------------------
• 정의: D_KL(P||Q) = Σ P(x)log(P(x)/Q(x))
• 의미: Q 모델로 P 데이터를 인코딩할 때의 추가 비용
• 성질: 비음성, 비대칭, P=Q일 때만 0

4. VAE와 정보 이론
----------------------------------------
• 사전분포: 항상 N(0,I), 모든 데이터에 대해 동일
• 사후분포: q(z|x), 입력에 따라 다름, 학습을 통해 변화
• ELBO = 재구성 품질 - KL 발산, 최대화가 목표

5. 실용적 관점
----------------------------------------
• KL ≈ 0: Posterior collapse, 정보 손실
• KL = 3~15: 건강한 범위, 좋은 표현 학습
• VAE Loss = -ELBO, 음수일수록 좋음

🎯 내일 학습 예고: Jensen's Inequality와 ELBO 완전 유도


5.2 실습 숙제

In [3]:
def homework_problems():
    """3일차 숙제 문제들"""
    
    print("📝 3일차 숙제 문제")
    print("=" * 50)
    
    problems = [
        {
            "번호": "문제 1",
            "제목": "KL Divergence 직접 계산",
            "내용": [
                "두 정규분포 N(1, 2²)과 N(-1, 1²) 사이의 KL Divergence를",
                "해석적 공식과 수치적 방법으로 각각 계산하고 비교하세요.",
                "오차가 0.001 이하가 되도록 수치적 계산의 정확도를 높여보세요."
            ]
        },
        
        {
            "번호": "문제 2", 
            "제목": "정보량과 압축의 관계",
            "내용": [
                "다음 문자열들의 엔트로피를 계산하고,",
                "'MISSISSIPPI', 'ABCDEFGHIJK', 'AAAAABBBBB'",
                "각각에 대해 최적 압축률을 예측해보세요.",
                "실제 ZIP 압축과 비교해보세요."
            ]
        },
        
        {
            "번호": "문제 3",
            "제목": "VAE 사후분포 시뮬레이션", 
            "내용": [
                "5개 클래스를 가진 데이터셋에서 VAE 학습을 시뮬레이션하세요.",
                "각 epoch마다 사후분포의 평균과 분산을 기록하고,",
                "KL divergence와 재구성 품질의 변화를 그래프로 그려보세요."
            ]
        },
        
        {
            "번호": "문제 4",
            "제목": "Jensen's Inequality 실험",
            "내용": [
                "다양한 오목함수(log, sqrt, x^0.5)에 대해 Jensen's Inequality를 확인하세요.",
                "볼록함수(x², exp)에 대해서는 부등호 방향이 바뀌는지 확인하세요.",
                "ELBO 유도에서 Jensen's Inequality가 어떻게 사용되는지 설명하세요."
            ]
        }
    ]
    
    for problem in problems:
        print(f"\n{problem['번호']}: {problem['제목']}")
        print("-" * 30)
        for line in problem['내용']:
            print(f"  {line}")
    
    print(f"\n{'='*50}")
    print("💡 힌트: 오늘 실습 코드를 참고하여 문제를 해결해보세요!")
    print("📅 제출: 내일 오전 수업 전까지")

# 실행
homework_problems()

📝 3일차 숙제 문제

문제 1: KL Divergence 직접 계산
------------------------------
  두 정규분포 N(1, 2²)과 N(-1, 1²) 사이의 KL Divergence를
  해석적 공식과 수치적 방법으로 각각 계산하고 비교하세요.
  오차가 0.001 이하가 되도록 수치적 계산의 정확도를 높여보세요.

문제 2: 정보량과 압축의 관계
------------------------------
  다음 문자열들의 엔트로피를 계산하고,
  'MISSISSIPPI', 'ABCDEFGHIJK', 'AAAAABBBBB'
  각각에 대해 최적 압축률을 예측해보세요.
  실제 ZIP 압축과 비교해보세요.

문제 3: VAE 사후분포 시뮬레이션
------------------------------
  5개 클래스를 가진 데이터셋에서 VAE 학습을 시뮬레이션하세요.
  각 epoch마다 사후분포의 평균과 분산을 기록하고,
  KL divergence와 재구성 품질의 변화를 그래프로 그려보세요.

문제 4: Jensen's Inequality 실험
------------------------------
  다양한 오목함수(log, sqrt, x^0.5)에 대해 Jensen's Inequality를 확인하세요.
  볼록함수(x², exp)에 대해서는 부등호 방향이 바뀌는지 확인하세요.
  ELBO 유도에서 Jensen's Inequality가 어떻게 사용되는지 설명하세요.

💡 힌트: 오늘 실습 코드를 참고하여 문제를 해결해보세요!
📅 제출: 내일 오전 수업 전까지
