# 모델 매개변수 최적화
- 모델을 학습하는 과정은 반복적인 과정을 거침
- 에폭(epoch)이라고 부르는 각 반복 단계에서 모델은 출력을 추측
- 추측과 정답 사이의 손실을 계산
- 매개변수에 대한 오류의 도함수(derivative)를 수집
- 경사하강법을 사용하여 이 파라매터들을 최적화(optimize)

In [3]:
import torch 
from torch import nn 
from torch.utils.data import DataLoader 
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

training_data = datasets.FashionMNIST(
    root = 'data',
    train = True, 
    download=True,
    transform=ToTensor() 
)

test_data = datasets.FashionMNIST(
    root='data',
    train=False,
    download=True,
    transform=ToTensor()
)

In [4]:
train_dataloader = DataLoader(training_data, batch_size=64)
test_dataloader = DataLoader(test_data, batch_size=64)

In [5]:
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512,512),
            nn.ReLU(),
            nn.Linear(512, 10)
        )
    
    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits 

model = NeuralNetwork()

# HyperParameter 
- 모델 최적화 과정을 제어할 수 있는 매개변수 
- 모델 학습과 convergence rate에 영향을 미침 

## 학습시 조정하는 하이퍼파라미터
- epoch 수 : 데이터셋을 반복하는 횟수
- batch size : 매개변수가 갱신되기 전 신경망을 통해 전파된 데이터 샘플 수 
- learning rate : 각 배치/에폭에서 모델의 매개변수를 조정하는 비율 

In [6]:
learning_rate = 1e-3
batch_size = 64
epochs = 5