## FashionMNIST DataSet & DataLoader

In [1]:
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor

In [2]:
train_data = datasets.FashionMNIST(
    root="../../data", train=True, download=True, transform=ToTensor()
)

test_data = datasets.FashionMNIST(
    root="../../data", train=False, download=True, transform=ToTensor()
)

In [3]:
train_dataloader = DataLoader(train_data, batch_size=64, shuffle=True)
test_dataloader = DataLoader(test_data, batch_size=64, shuffle=False)

## Modeling

In [4]:
from torch import nn


class NeuralNetwork(nn.Module):
    def __init__(self):
        # nn.Module 생성
        super(NeuralNetwork, self).__init__()

        # 레이어 정의
        self.flatten = nn.Flatten()

        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28 * 28, 128), nn.ReLU(), nn.Linear(128, 10)
        )

    def forward(self, x):
        x = self.flatten(x)
        y = self.linear_relu_stack(x)

        return y

## 모델 생성

In [5]:
import torch

if torch.backends.mps.is_available():
    device = "mps"
else:
    device = "cpu"

device = "cpu"

print(device)

cpu


In [6]:
model = NeuralNetwork().to(device)
print(model)

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=128, bias=True)
    (1): ReLU()
    (2): Linear(in_features=128, out_features=10, bias=True)
  )
)


## Train Model

In [7]:
loss_fn = nn.CrossEntropyLoss()  # 이미 여기에 소프트맥스 함수가 포함되어 있다.
optimizer = torch.optim.Adam(model.parameters(), lr=0.0001)

In [8]:
def train_loop(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)

    model.train()

    for batch, (X, y) in enumerate(dataloader):
        # DataLoader 에 들어있는 tensor 들을 모델과 같은 위치에 두기
        X, y = X.to(device), y.to(device)
        pred = model(X)
        loss = loss_fn(pred, y)

        optimizer.zero_grad()  # 이전 배치의 기울기 제거
        loss.backward()
        optimizer.step()

        # 배치가 100번 돌 때마다 화면에 출력
        if batch % 100 == 0:
            loss, current = loss.item(), batch * len(X)
            print(f"Train Loss : {loss:>7f} [ {current:>5d} / {size:>5d} ]")

In [9]:
def test_loop(dataloader, model, loss_fn):
    size = len(dataloader.dataset)

    # loss는 배치 별로 계산, correct는 전체 데이터 세트에 대한 평균 정확도
    test_loss, correct = 0, 0

    # 모델을 추론 모드로 바꿔준다.
    model.eval()

    # 추론 과정에서는 기울기를 구할 필요 없음
    with torch.no_grad():
        for X, y in dataloader:
            X, y = X.to(device), y.to(device)
            pred = model(X)

            test_loss += loss_fn(pred, y).item()

            # 10개의 예측값 중 가장 큰 곳의 인덱스를 argmax 로 찾고, target 과 일치하는지 확인
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()

    num_batches = len(dataloader)
    test_loss /= num_batches
    correct /= size

    print(
        f"Test Error : \n Accuracy : {(100*correct):>0.1f}%, Avg Loss : {test_loss:>8f}\n"
    )

In [10]:
epochs = 10

for i in range(epochs):
    print(f"Epoch {i+1}\n........................")
    train_loop(train_dataloader, model, loss_fn, optimizer)
    test_loop(test_dataloader, model, loss_fn)

print("Experiment Successful")

Epoch 1
........................
Train Loss : 2.257907 [     0 / 60000 ]
Train Loss : 1.466735 [  6400 / 60000 ]
Train Loss : 1.011678 [ 12800 / 60000 ]
Train Loss : 0.863554 [ 19200 / 60000 ]
Train Loss : 0.933581 [ 25600 / 60000 ]
Train Loss : 0.746833 [ 32000 / 60000 ]
Train Loss : 0.528999 [ 38400 / 60000 ]
Train Loss : 0.758681 [ 44800 / 60000 ]
Train Loss : 0.686812 [ 51200 / 60000 ]
Train Loss : 0.543049 [ 57600 / 60000 ]
Test Error : 
 Accuracy : 78.5%, Avg Loss : 0.632650

Epoch 2
........................
Train Loss : 0.638636 [     0 / 60000 ]
Train Loss : 0.600570 [  6400 / 60000 ]
Train Loss : 0.402481 [ 12800 / 60000 ]
Train Loss : 0.750936 [ 19200 / 60000 ]
Train Loss : 0.476849 [ 25600 / 60000 ]
Train Loss : 0.574864 [ 32000 / 60000 ]
Train Loss : 0.721517 [ 38400 / 60000 ]
Train Loss : 0.388411 [ 44800 / 60000 ]
Train Loss : 0.499579 [ 51200 / 60000 ]
Train Loss : 0.497415 [ 57600 / 60000 ]
Test Error : 
 Accuracy : 81.2%, Avg Loss : 0.545108

Epoch 3
..................

## 훈련된 모델의 가중치를 저장 / 불러오기

불러올 곳에서 모델의 구조를 알고 있는 경우 가중치만 저장하면 적은 용량으로 저장하고 불러오는 것이 가능하다
* 단점 : 모델 class 가 없으면 사용할 수 없다

In [11]:
# model.state_dict() : 모델 내에 있는 레이어 별 가중치를 들고 있는 딕셔너리
torch.save(model.state_dict(), "../../data/saved_models/model_weights.pth")

In [12]:
model.state_dict()

OrderedDict([('linear_relu_stack.0.weight',
              tensor([[-3.6391e-03,  7.6025e-03, -2.3236e-02,  ..., -4.1066e-02,
                       -5.4370e-03,  2.6251e-02],
                      [ 4.5918e-02,  1.8733e-02,  6.4198e-02,  ..., -3.1635e-02,
                        1.1356e-02,  2.5222e-03],
                      [-1.9674e-02, -2.3116e-02, -1.5752e-03,  ...,  9.0471e-03,
                       -4.9617e-05,  9.2110e-03],
                      ...,
                      [-2.5583e-02, -5.0421e-02,  3.3750e-02,  ...,  2.7883e-03,
                        1.5956e-02,  2.6494e-02],
                      [ 2.0904e-02,  5.5900e-02,  3.5611e-02,  ...,  1.2542e-02,
                       -2.2144e-03, -5.2213e-03],
                      [ 3.9552e-03, -3.5959e-02, -5.5057e-02,  ...,  6.2795e-02,
                        5.6173e-02,  5.1584e-02]])),
             ('linear_relu_stack.0.bias',
              tensor([-0.0919, -0.0604, -0.0392,  0.2245, -0.1185, -0.0476,  0.1126, -0.0785,
    

In [13]:
# 저장된 가중치 파일(pth) 불러오기
new_model = NeuralNetwork().to(device)
print(new_model)

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=128, bias=True)
    (1): ReLU()
    (2): Linear(in_features=128, out_features=10, bias=True)
  )
)


In [14]:
# 훈련되지 않은 모델로 예측
test_loop(test_dataloader, new_model, loss_fn)

Test Error : 
 Accuracy : 9.7%, Avg Loss : 2.296109



In [15]:
# 이전에 훈련된 가중치를 불러와 새로운 모델에 load
new_model.load_state_dict(torch.load("../../data/saved_models/model_weights.pth"))
test_loop(test_dataloader, new_model, loss_fn)

  new_model.load_state_dict(torch.load("../../data/saved_models/model_weights.pth"))


Test Error : 
 Accuracy : 85.4%, Avg Loss : 0.416799



## 훈련된 모델 자체를 저장 / 불러오기

* 모델의 구조를 몰라도 사용 가능
* 용량은 많이 필요하다

In [16]:
torch.save(model, "../../data/saved_models/model.pth")

In [18]:
new_model = torch.load("../../data/saved_models/model.pth")
test_loop(test_dataloader, new_model, loss_fn)

  new_model = torch.load("../../data/saved_models/model.pth")


Test Error : 
 Accuracy : 85.4%, Avg Loss : 0.416799

