<a href="https://colab.research.google.com/github/poietes5150/SuperCoding/blob/main/PyTorch_nn_Module%2C_Loss_Function%2C_Optimizer.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# nn.Module이란?
`nn.Module`은 PyTorch에서 **모델의 기본단위**입니다. 모델의 계층(layer)과 연산을 정의하고, 학습 가능한 파라미터를 포함합니다.
사용자가 새로운 모델을 만들기 위해서는 `nn.Module`을 상속한 클래스를 정의하고, `__init__()`에서 계층을 선언하고, `forward()`에서 데이터를 어떻게 흐르게 할지 정의합니다.

# 예시 1: 간단한 선형 회귀 모델

In [1]:
import torch
import torch.nn as nn

# 선형 회귀 모델: 입력 1개 -> 출력 1개
class LinearRegressionModel(nn.Module):
    def __init__(self):
        super(LinearRegressionModel, self).__init__()
        self.linear = nn.Linear(1, 1) # 입력, 출력 차원

    def forward(self, x):
        return self.linear(x)

model = LinearRegressionModel()
print(model)

LinearRegressionModel(
  (linear): Linear(in_features=1, out_features=1, bias=True)
)


# 예시 2: 다층 퍼셉트론(MLP)

In [2]:
# 입력: 784차원 (28 x 28 이미지), 출력: 10개 클래스
class MLP(nn.Module):
  def __init__(self):
    super(MLP, self).__init__()
    self.layers = nn.Linear(784, 128)
    self.relu = nn.ReLU()
    self.output = nn.Linear(128, 10)

  def forward(self, x):
    x = self.layers(x)
    x = self.relu(x)
    x = self.output(x)
    return x

mlp_model = MLP()
print(mlp_model)

MLP(
  (layers): Linear(in_features=784, out_features=128, bias=True)
  (relu): ReLU()
  (output): Linear(in_features=128, out_features=10, bias=True)
)


# Optimizer란?
Optimizer는 신경망의 가중치를 학습하기 위한 알고리즘입니다. 주어진 손실 함수(loss function)를 줄이기 위해 가중치를 어떻게 조정할지 결정합니다.
PyTorch에서는 `torch.optim` 모듈을 통해 다양한 Oprimizer를 제공합니다. 가장 대표적인 Optimizer는 `SGD`, `Adam` 등이 있습니다.

# 예시 1: SGD와 Adam Optimizer 사용법

In [3]:
import torch.optim as optim
model = LinearRegressionModel()

# SGD Optimizer
optimizer_sgd = optim.SGD(model.parameters(), lr=0.01)

# Adam Optimizer
optimizer_adam = optim.Adam(model.parameters(), lr=0.001)

print(f"SGD Optimizer: {optimizer_sgd}")
print(f"Adam Optimizer: {optimizer_adam}")

SGD Optimizer: SGD (
Parameter Group 0
    dampening: 0
    differentiable: False
    foreach: None
    fused: None
    lr: 0.01
    maximize: False
    momentum: 0
    nesterov: False
    weight_decay: 0
)
Adam Optimizer: Adam (
Parameter Group 0
    amsgrad: False
    betas: (0.9, 0.999)
    capturable: False
    differentiable: False
    eps: 1e-08
    foreach: None
    fused: None
    lr: 0.001
    maximize: False
    weight_decay: 0
)


# 손실 함수(Loss Function)란?
모델의 출려과 실제 정답(label)의 차이를 수치화한 함수입니다. 이 값을 최소화하는 방향으로 Optimizer가 학습을 진행합니다.
PyTorch는 `torch.nn` 에서 다양한 손실 함수를 제공합니다.

# 예시: MSELoss(회귀), CrossEntropyLoss(분류)

In [5]:
# 회귀 문제용 손실 함수
mse_loss = nn.MSELoss()

# 분류 문제용 손실 함수
cross_entropy_loss = nn.CrossEntropyLoss()

# 사용예시
output = torch.tensor([[0.2],[0.8]], requires_grad=True)
target = torch.tensor([[0.0], [1.0]])
print(f"MSE Loss: {mse_loss(output, target)}")

logits = torch.tensor([[2.0, 0.5]], requires_grad=True)
target = torch.tensor([0])
print(f"Cross Entropy Loss: {cross_entropy_loss(logits, target)}")

MSE Loss: 0.03999999910593033
Cross Entropy Loss: 0.2014133334159851


# PyTorch DataLoader
PyTorch의 `DataLoader`를 사용하는 두가지 방식:
1. `TensorDataset`
2. 사용자정의 `Custom Dataset`



# 1. TensorDataset + DataLoader 예제

In [10]:
import torch
from torch.utils.data import TensorDataset, DataLoader

# 임의 데이터 생성
X = torch.randn(10, 3)          # 입력: 10개 샘플, 3 features
y = torch.randint(0, 2, (10,))  # 레이블: 0 또는 1

# TensorDataset으로 묶기
dataset = TensorDataset(X, y)

# DataLoader로 배치화
dataloader = DataLoader(dataset, batch_size=4, shuffle=True)

# 데이터 순회
print(f"x: {X}")
print(f"y: {y}")
print("="*30)
for batch_X, batch_y in dataloader:
    print(f"입력 배치: {batch_X}")
    print(f"레이블 배치: {batch_y}")
    print("-"*30)

x: tensor([[-0.4148,  0.6576, -0.7713],
        [ 0.5132, -0.2951, -0.7301],
        [ 0.4911,  0.5706,  1.4262],
        [-0.1623,  0.2304, -0.9744],
        [-1.6842,  1.5444,  1.2828],
        [ 0.5560, -1.0305,  0.4646],
        [ 0.0793, -0.8120, -0.1013],
        [-0.3016, -1.0444, -2.0392],
        [ 0.0228,  0.9327, -1.1461],
        [ 0.9835,  1.4618, -1.0320]])
y: tensor([1, 0, 0, 1, 1, 1, 0, 0, 0, 0])
입력 배치: tensor([[ 0.5132, -0.2951, -0.7301],
        [-1.6842,  1.5444,  1.2828],
        [ 0.0228,  0.9327, -1.1461],
        [-0.1623,  0.2304, -0.9744]])
레이블 배치: tensor([0, 1, 0, 1])
------------------------------
입력 배치: tensor([[ 0.5560, -1.0305,  0.4646],
        [-0.4148,  0.6576, -0.7713],
        [ 0.9835,  1.4618, -1.0320],
        [-0.3016, -1.0444, -2.0392]])
레이블 배치: tensor([1, 1, 0, 0])
------------------------------
입력 배치: tensor([[ 0.0793, -0.8120, -0.1013],
        [ 0.4911,  0.5706,  1.4262]])
레이블 배치: tensor([0, 0])
------------------------------


# 2. Custom Dataset 클래스 정의
더 복잡하거나 전처리가 필요한 데이터일 경우 `torch.utils.data.Dataset`을 상속하여 사용자 정의 클래스를 만듭니다.

In [12]:
from torch.utils.data import Dataset

# 예제: x는 [0, 1, ...1 99], y는 x * 2
class MyCustomDataset(Dataset):
    def __init__(self):
        self.x = torch.arange(100, dtype=torch.float32)
        self.y = self.x * 2

    def __len__(self):
        return len(self.x)

    def __getitem__(self, idx):
        return self.x[idx], self.y[idx]

# 인스턴스 생성 및 DataLoader 적용
custom_dataset = MyCustomDataset()
custom_loader = DataLoader(custom_dataset, batch_size=8, shuffle=True)

for x, y in custom_loader:
  print(f"x: {x}")
  print(f"y: {y}")
  print("-"*30)

x: tensor([11.,  9., 16., 65., 45., 61., 19., 90.])
y: tensor([ 22.,  18.,  32., 130.,  90., 122.,  38., 180.])
------------------------------
x: tensor([21., 38., 94., 50., 70., 74., 23., 40.])
y: tensor([ 42.,  76., 188., 100., 140., 148.,  46.,  80.])
------------------------------
x: tensor([22., 54., 51., 25.,  4., 34., 37., 93.])
y: tensor([ 44., 108., 102.,  50.,   8.,  68.,  74., 186.])
------------------------------
x: tensor([10., 55., 77., 99., 52., 95., 97., 86.])
y: tensor([ 20., 110., 154., 198., 104., 190., 194., 172.])
------------------------------
x: tensor([49., 39., 15., 62.,  7., 43.,  3., 36.])
y: tensor([ 98.,  78.,  30., 124.,  14.,  86.,   6.,  72.])
------------------------------
x: tensor([ 1., 24., 27., 66., 81., 47., 53., 26.])
y: tensor([  2.,  48.,  54., 132., 162.,  94., 106.,  52.])
------------------------------
x: tensor([60., 14., 76., 64., 56., 84., 28.,  6.])
y: tensor([120.,  28., 152., 128., 112., 168.,  56.,  12.])
------------------------------

DataLoader 요약
* `TensorDataset`은 간단한 텐서 데이터를 빠르게 묶는데 유용합니다.
* `Custom Dataset`은 파일 읽기, 전처리, 다양한 타입의 데이터를 처리할 때 강력합니다.

두 방법 모두 `DataLoader`와 함께 쓰여 **배치 처리, 셔플링, 멀티스레딩**이 가능합니다.

# 연습문제

**Q1.** 입력이 100차원이고 은닉층이 64, 출력이 10인 MLP 모델을 정의해보세요.

**Q2.** `SGD` Optimizer를 사용하여 위 모델의 파라미터를 학습하려고 합니다. Optimizer코드를 작성해 보세요.

**Q3.** 다중 클래스 분류 문제에 적합한 손실 함수를 선택하고, 예시 코드를 작성해보세요.

In [18]:
# Q1. 입력이 100차원이고 은닉층이 64, 출력이 10인 MLP 모델을 정의해보세요.
import torch
import torch.nn as nn

class model_MLP(nn.Module):
  def __init__(self):
    super(model_MLP, self).__init__()
    self.layers = nn.Linear(100, 64)
    self.relu = nn.ReLU()
    self.output = nn.Linear(64, 10)

  def forward(self, x):
    x = self.layers(x)
    x = self.relu(x)
    x = self.output(x)
    return x

mlp_model = MLP()
print(mlp_model)

MLP(
  (layers): Linear(in_features=100, out_features=64, bias=True)
  (relu): ReLU()
  (output): Linear(in_features=64, out_features=10, bias=True)
)


In [19]:
# Q2. SGD Optimizer를 사용하여 위 모델의 파라미터를 학습하려고 합니다. Optimizer코드를 작성해 보세요.
import torch
import torch.nn as nn
import torch.optim as optim

model = model_MLP()
optimizer_sgd = optim.SGD(model.parameters(), lr=0.01)
print(f"SGD Optimizer: {optimizer_sgd}")

SGD Optimizer: SGD (
Parameter Group 0
    dampening: 0
    differentiable: False
    foreach: None
    fused: None
    lr: 0.01
    maximize: False
    momentum: 0
    nesterov: False
    weight_decay: 0
)


In [50]:
# Q3. 다중 클래스 분류 문제에 적합한 손실 함수를 선택하고, 예시 코드를 작성해보세요.
import torch
import torch.nn as nn

cross_entropy_loss = nn.CrossEntropyLoss()
input = torch.tensor(torch.rand(1,100), requires_grad=True)
target = torch.tensor(torch.randint(0,2,(1,)))
output = model(input)
loss = cross_entropy_loss(output, target)
print(f"예측값: {output}")
print(f"손실값: {loss.item()}")

예측값: tensor([[-0.0804, -0.1832,  0.0663,  0.4076, -0.1773,  0.0203, -0.2480, -0.1736,
          0.3634, -0.1535]], grad_fn=<AddmmBackward0>)
손실값: 2.4959259033203125


  input = torch.tensor(torch.rand(1,100), requires_grad=True)
  target = torch.tensor(torch.randint(0,2,(1,)))
