# 예제 3.57: 모델 구조와 초깃값 설정

## 학습목표
1. **다층 신경망(Multi-Layer Network)** 구조 이해하기
2. **모델 파라미터 직접 초기화** 방법 익히기
3. **weight.data와 bias.data** 접근 방법 학습하기
4. **nn.Parameter** 를 사용한 가중치 설정 이해하기

---

#### 모델 정의 및 가중치 초기화

**가중치 초기화의 중요성**
- 학습 수렴 속도와 최종 성능에 영향
- 너무 작은 값: 기울기 소실(Vanishing Gradient)
- 너무 큰 값: 기울기 폭발(Exploding Gradient)

**가중치 접근 방법**
- `layer[0].weight.data`: 가중치 행렬
- `layer[0].bias.data`: 편향 벡터

In [None]:
import torch
from torch import nn
from torch import optim


class CustomModel(nn.Module):
    """2층 신경망 모델 (가중치 직접 초기화)"""
    
    def __init__(self):
        super().__init__()

        # 1층: 입력 2 → 출력 2
        self.layer1 = nn.Sequential(
            nn.Linear(2, 2),
            nn.Sigmoid()
        )
        # 2층: 입력 2 → 출력 1
        self.layer2 = nn.Sequential(
            nn.Linear(2, 1),
            nn.Sigmoid()
        )
        
        # 1층 가중치 직접 초기화
        # layer1[0]은 nn.Linear를 가리킴 (layer1[1]은 Sigmoid)
        self.layer1[0].weight.data = torch.nn.Parameter(
            torch.Tensor([[0.4352, 0.3545],
                         [0.1951, 0.4835]])
        )
        self.layer1[0].bias.data = torch.nn.Parameter(
            torch.Tensor([-0.1419,  0.0439])
        )

        # 2층 가중치 직접 초기화
        self.layer2[0].weight.data = torch.nn.Parameter(
            torch.Tensor([[-0.1725,  0.1129]])
        )
        self.layer2[0].bias.data = torch.nn.Parameter(
            torch.Tensor([-0.3043])
        )


# GPU 설정 및 모델 생성
device = "cuda" if torch.cuda.is_available() else "cpu"
model = CustomModel().to(device)

# 손실함수: BCELoss (이진 분류용)
criterion = nn.BCELoss().to(device)

# 옵티마이저 (학습률 1로 설정)
optimizer = optim.SGD(model.parameters(), lr=1)

# 모델 구조 확인
print("모델 구조:")
print(model)
print("\n초기화된 가중치:")
for name, param in model.named_parameters():
    print(f"{name}: {param.data}")