# 예제 4.03: 가중치 초기화 함수 (1) - 직접 초기화

## 학습목표
1. **가중치 초기화(Weight Initialization)** 의 중요성 이해하기
2. **nn.init 모듈** 사용법 익히기
3. **Xavier 초기화** 방법 학습하기
4. **_init_weights 메서드** 직접 구현하기

---

#### 가중치 직접 초기화

**가중치 초기화의 중요성**
- 초깃값에 따라 학습 수렴 속도와 최종 성능이 달라짐
- 너무 작은 값: 기울기 소실 (Vanishing Gradient)
- 너무 큰 값: 기울기 폭발 (Exploding Gradient)

**Xavier 초기화**
- Sigmoid, Tanh 활성화 함수에 적합
- 입력과 출력의 분산을 동일하게 유지
- `nn.init.xavier_uniform_()`: 균등 분포 사용

In [None]:
from torch import nn


class Net(nn.Module):
    """가중치를 직접 초기화하는 모델"""
    
    def __init__(self):
        super().__init__()
        # 은닉층: 입력 1 → 출력 2
        self.layer = nn.Sequential(
            nn.Linear(1, 2),
            nn.Sigmoid()
        )
        # 출력층: 입력 2 → 출력 1
        self.fc = nn.Linear(2, 1)
        
        # 가중치 초기화 메서드 호출
        self._init_weights()

    def _init_weights(self):
        """가중치 초기화 메서드"""
        # layer[0]은 nn.Linear (layer[1]은 Sigmoid)
        # Xavier 균등 분포로 가중치 초기화
        nn.init.xavier_uniform_(self.layer[0].weight)
        # 편향을 0.01로 초기화
        self.layer[0].bias.data.fill_(0.01)

        # 출력층도 동일하게 초기화
        nn.init.xavier_uniform_(self.fc.weight)
        self.fc.bias.data.fill_(0.01)


# 모델 생성 (생성 시 _init_weights 자동 호출)
model = Net()

print("모델 구조:")
print(model)
print("\n초기화된 가중치:")
for name, param in model.named_parameters():
    print(f"{name}: {param.data}")