In [None]:
import numpy as np
import torch
from torch.utils.data import Dataset
from torchvision import datasets, transforms

### 내장 데이터셋 로드

- `FashionMNIST` 데이터셋 로드하는 예제


- `root`: 데이터셋을 다운로드 받을 경로(폴더) 지정.
- `train`: `True`로 설정된 경우 `train` 데이터셋에서 로드하며, `False`인 경우 `test` 데이터셋에서 로드
- `download`: `True`로 설정된 경우, 인터넷으로부터 데이터셋을 다운로드 받아 지정된 `root` 디렉토리에 다운로드
- `transform`: 이미지 `transform` 적용


In [None]:
# Image Transform 정의
transform = transforms.Compose(
    [
        transforms.ToTensor(),
    ]
)

In [None]:
# train(학습용) 데이터셋 로드
train = datasets.FashionMNIST(
    root="data",
    train=True,  # set True
    download=True,  # 다운로드
    transform=transform,  # transform 적용. (0~1 로 정규화)
)

In [None]:
# test(학습용) 데이터셋 로드
test = datasets.FashionMNIST(
    root="data",
    train=False,  # set to False
    download=True,  # 다운로드
    transform=transform,  # transform 적용. (0~1 로 정규화)
)

`FashionMNIST` 데이터셋 시각화

- 총 10개의 카테고리로 구성되어 있으며, `Label`은 아래 코드에서 `labels_map`에 정의되어 있습니다.
- 출처: [zalandoresearch/fashion-mnist](https://github.com/zalandoresearch/fashion-mnist)


In [None]:
import matplotlib.pyplot as plt

labels_map = {
    0: "T-Shirt",
    1: "Trouser",
    2: "Pullover",
    3: "Dress",
    4: "Coat",
    5: "Sandal",
    6: "Shirt",
    7: "Sneaker",
    8: "Bag",
    9: "Ankle Boot",
}

figure = plt.figure(figsize=(12, 8))
cols, rows = 8, 5

for i in range(1, cols * rows + 1):
    sample_idx = torch.randint(len(train), size=(1,)).item()
    img, label = train[sample_idx]
    figure.add_subplot(rows, cols, i)
    plt.title(labels_map[label])
    plt.axis("off")
    plt.imshow(torch.permute(img, (1, 2, 0)), cmap="gray")
plt.show()

### torch.utils.data.DataLoader로 데이터셋 로더 구성


In [None]:
batch_size = 32  # batch_size 지정
num_workers = 8  # Thread 숫자 지정 (병렬 처리에 활용할 쓰레드 숫자 지정)

In [None]:
train_loader = torch.utils.data.DataLoader(
    train, batch_size=batch_size, shuffle=True, num_workers=num_workers
)

In [None]:
test_loader = torch.utils.data.DataLoader(
    test, batch_size=batch_size, shuffle=False, num_workers=num_workers
)

## 모델 생성


In [None]:
if torch.backends.mps.is_built():
    # mac os mps 지원 체크
    device = torch.device("mps" if torch.backends.mps.is_built() else "cpu")
else:
    # cuda 사용 가능한지 체크
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(device)

In [None]:
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F


class Net(nn.Module):
    def __init__(self, num_classes):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 256)
        self.fc2 = nn.Linear(256, 128)
        self.fc3 = nn.Linear(128, 32)
        # 마지막 출력층의 Neuron은 Class 개수로 설정
        self.output = nn.Linear(32, num_classes)

    def forward(self, x):
        # (B, 1, 28, 28) -> (B, 28*28)
        x = x.view(-1, 28 * 28)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = F.relu(self.fc3(x))
        x = self.output(x)
        return x

In [None]:
# 모델 생성
model = Net(num_classes=10)

# 모델을 device 에 올립니다. (cuda:0 혹은 cpu)
model.to(device)
model

## 손실함수 / 옵티마이저 정의


In [None]:
# Mean Squared Error(MSE) 오차 정의
loss_fn = nn.CrossEntropyLoss()

# 옵티마이저 설정: model.paramters()와 learning_rate 설정
optimizer = optim.Adam(model.parameters(), lr=0.005)

## 훈련


In [None]:
def train(model, train_loader, optimizer, loss_fn, device):
    model.train()
    final_loss = 0
    running_acc = 0
    for x, y in train_loader:
        x, y = x.to(device), y.to(device)
        # gradient 초기화
        optimizer.zero_grad()
        # forward pass
        y_hat = model(x)
        # loss 계산
        loss = loss_fn(y_hat, y)
        # backward pass
        loss.backward()
        # weight update
        optimizer.step()
        final_loss += loss.item()
        running_acc += y_hat.argmax(dim=1).eq(y).sum().item() / len(y)
    final_loss /= len(train_loader)
    running_acc /= len(train_loader)
    return final_loss, running_acc


def evaluate(model, test_loader, loss_fn, device):
    # 모델을 평가 모드로 설정
    model.eval()
    final_loss = 0
    running_acc = 0
    with torch.no_grad():

        for x, y in test_loader:
            # 데이터를 device에 올립니다.
            x, y = x.to(device), y.to(device)
            # forward pass
            y_hat = model(x)
            # loss 계산
            loss = loss_fn(y_hat, y)
            # loss 누적
            final_loss += loss.item()
            running_acc += y_hat.argmax(dim=1).eq(y).sum().item() / len(y)
    final_loss /= len(test_loader)
    running_acc /= len(test_loader)
    return final_loss, running_acc

In [None]:
# 최대 반복 횟수 정의
num_epoch = 2000

# loss 기록하기 위한 list 정의
losses = []
val_losses = []

MIN_LOSS = 9999999999.0

STATE_DICT_PATH = "mymodel.pth"

for epoch in range(num_epoch):
    loss, acc = train(model, train_loader, optimizer, loss_fn, device)
    val_loss, val_acc = evaluate(model, test_loader, loss_fn, device)
    losses.append(loss)
    val_losses.append(val_loss)
    if val_loss < MIN_LOSS:
        print(
            f"{epoch:05d} [INFO] Model saved... {MIN_LOSS:.5f} ===> {val_loss:.5f}")
        MIN_LOSS = val_loss
        torch.save(model.state_dict(), STATE_DICT_PATH)

    print(
        f"[{epoch:03d}] loss: {loss:.5f} acc: {acc:.5f} val_loss: {val_loss:.5f} val_acc: {val_acc:.5f}"
    )

In [None]:
model.load_state_dict(torch.load(STATE_DICT_PATH))

In [None]:
# 검증모드 진입
model.eval()
# loss 초기화
running_loss = 0
# 정확도 계산
running_acc = 0

with torch.no_grad():
    for (
        x,
        y,
    ) in test_loader:
        x, y = x.to(device), y.to(device)

        output = model(x)

        running_loss += loss
        running_acc += output.argmax(dim=1).eq(y).sum().item() / len(y)

    loss = running_loss / len(test_loader)
    acc = running_acc / len(test_loader)

# 최종 훈련 결과확인
print(f"Loss: {loss:.5f}, Accuracy: {acc:.5f}")