In [None]:
# For tips on running notebooks in Google Colab, see
# https://docs.pytorch.org/tutorials/beginner/colab
%matplotlib inline

**Learn the Basics** \|\| [Quickstart](quickstart_tutorial.html) \|\|
[Tensors](tensorqs_tutorial.html) \|\| [Datasets &
DataLoaders](data_tutorial.html) \|\|
[Transforms](transforms_tutorial.html) \|\| [Build
Model](buildmodel_tutorial.html) \|\|
[Autograd](autogradqs_tutorial.html) \|\|
[Optimization](optimization_tutorial.html) \|\| [Save & Load
Model](saveloadrun_tutorial.html)

Learn the Basics
================

Authors: [Suraj Subramanian](https://github.com/subramen), [Seth
Juarez](https://github.com/sethjuarez/), [Cassie
Breviu](https://github.com/cassiebreviu/), [Dmitry
Soshnikov](https://soshnikov.com/), [Ari
Bornstein](https://github.com/aribornstein/)

Most machine learning workflows involve working with data, creating
models, optimizing model parameters, and saving the trained models. This
tutorial introduces you to a complete ML workflow implemented in
PyTorch, with links to learn more about each of these concepts.

We\'ll use the FashionMNIST dataset to train a neural network that
predicts if an input image belongs to one of the following classes:
T-shirt/top, Trouser, Pullover, Dress, Coat, Sandal, Shirt, Sneaker,
Bag, or Ankle boot.

[This tutorial assumes a basic familiarity with Python and Deep Learning
concepts.]{.title-ref}

Running the Tutorial Code
-------------------------

You can run this tutorial in a couple of ways:

-   **In the cloud**: This is the easiest way to get started! Each
    section has a \"Run in Google Colab\" link at the top, which opens
    an integrated notebook in Google Colab with the code in a
    fully-hosted environment.
-   **Locally**: This option requires you to set up PyTorch and
    TorchVision first on your local machine ([installation
    instructions](https://pytorch.org/get-started/locally/)). Download
    the notebook or copy the code into your favorite IDE.

How to Use this Guide
---------------------

If you\'re familiar with other deep learning frameworks, check out the
[0. Quickstart](quickstart_tutorial.html) first to quickly familiarize
yourself with PyTorch\'s API.

If you\'re new to deep learning frameworks, head right into the first
section of our step-by-step guide: [1. Tensors](tensorqs_tutorial.html).

::: {.toctree maxdepth="2" hidden=""}
quickstart\_tutorial tensorqs\_tutorial data\_tutorial
transforms\_tutorial buildmodel\_tutorial autogradqs\_tutorial
optimization\_tutorial saveloadrun\_tutorial
:::


## 기초 개념

이 섹션에서는 머신 러닝에서 흔히 사용되는 API에 대해 설명합니다. 각 섹션의 링크를 참조하여 더 자세히 알아보세요.

### 데이터 관련 작업

PyTorch는 데이터 작업을 위한 두 가지 기본 요소인 `torch.utils.data.DataLoader`와 `torch.utils.data.Dataset`을 제공합니다. `Dataset`에는 샘플과 해당 레이블이 저장되고, `DataLoader`는 `Dataset`을 감싸는 반복 가능한 객체를 생성합니다.

- torch.utils.data
  - Dataset: 샘플, 레이블
  - DataLoader: 토치용 데이터 형식

In [2]:
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor

- PyTorch는 TorchText, TorchVision, TorchAudio와 같은 도메인별 라이브러리를 제공하며, 이 라이브러리들에는 모두 데이터셋이 포함되어 있습니다.
- 이 튜토리얼에서는 TorchVision 데이터셋을 사용하겠습니다. torchvision.datasets 모듈에는 CIFAR, COCO 등 다양한 실제 비전 데이터에 대한 Dataset 객체가 포함되어 있습니다(전체 목록은 [여기](https://pytorch.org/vision/stable/datasets.html) 참조).
- 이 튜토리얼에서는 FashionMNIST 데이터셋을 사용합니다. 모든 TorchVision Dataset에는 샘플과 레이블을 각각 수정하는 transform과 target_transform이라는 두 개의 인수가 있습니다.


In [4]:
# downloading training data from open dataset
training_data = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),

)

test_data = datasets.FashionMNIST(
    root='data',
    train=False,
    download=True,
    transform=ToTensor()
)

- 우리는 데이터셋을 DataLoader의 인수로 전달합니다. DataLoader는 데이터셋을 순회하는 반복 가능한 객체를 생성하며, 자동 배치 처리, 샘플링, 셔플링 및 멀티프로세스 데이터 로딩을 지원합니다.
- 여기서는 배치 크기를 64로 정의했습니다. 즉, DataLoader 반복 가능한 객체의 각 요소는 64개의 특성과 레이블로 구성된 배치를 반환합니다.

In [5]:
batch_size = 64

# create dataloaders
train_dataloader = DataLoader(training_data, batch_size=batch_size)
test_dataloader = DataLoader(test_data, batch_size=batch_size)

for X, y in test_dataloader:
  print(f"Shape of X [N, C, H, W]: {X.shape}")
  print(f"Shape of y [N, C, H, W]: {y.shape} {y.dtype}")

Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([64, 1, 28, 28])
Shape of y [N, C, H, W]: torch.Size([64]) torch.int64
Shape of X [N, C, H, W]: torch.Size([

## 모델 생성

- PyTorch에서 신경망을 정의하려면
  - **nn.Module**을 상속하는 클래스를 생성합니다.
  - **\_\_init\_\_** 함수에서 네트워크의 레이어를 정의하고,
  - **forward** 함수에서 데이터가 네트워크를 통과하는 방식을 지정합니다.
- 신경망 연산 속도를 높이기 위해 CUDA, MPS, MTIA, XPU와 같은 가속기를 사용합니다. 사용 가능한 가속기가 있으면 이를 사용하고, 그렇지 않으면 CPU를 사용합니다.


In [25]:
device = torch.accelerator.current_accelerator().type if torch.accelerator.is_available() else "cpu"
print(f"Using {device} device")

# Define model
class NeuralNetwork(nn.Module):
    def __init__(self):
        super().__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10)
        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

model = NeuralNetwork().to(device)
print(model)

Using cpu device
NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
  )
)


- 신경망 구성에 대한 좀더 자세한 내용은 [여기](https://docs.pytorch.org/tutorials/beginner/basics/buildmodel_tutorial.html)를 참조

## 모델 매개변수의 최적화
- 모델을 훈련시기키 위해서는 [손실함수](https://pytorch.org/docs/stable/nn.html#loss-functions)와 [최적화함수](https://pytorch.org/docs/stable/optim.html)가 필요하다.

In [26]:
loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)

- 단일 학습 루프에서 모델은 학습 데이터 세트(배치 단위로 입력됨)에 대한 예측을 수행하고 예측 오류를 역전파하여 모델의 매개변수를 조정합니다.


In [30]:
def train(dataloader, model, loss_fn, optimizer):
  size = len(dataloader.dataset)
  model.train()
  for batch, (X, y) in enumerate(dataloader):
    X, y = X.to(device), y.to(device)
    # compute prediction error
    pred = model(X)
    loss = loss_fn(pred, y)
    # backpropagation
    loss.backward()
    optimizer.step()
    optimizer.zero_grad()
    if batch % 100 == 0:
      loss, current = loss.item(), (batch+1) * len(X)
      print(f"loss: {loss:>7f} [{current:>5d}/size:5d]")

- 또한 모델이 얼마나 잘 학습하였는지 확인하기 위해 테스트 데이터셋을 이용하여 모델의 성능을 점검합니다.


In [39]:
def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    model.eval()
    test_loss, correct = 0, 0
    with torch.no_grad():
        for X, y in dataloader:
            X, y = X.to(device), y.to(device)
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()
    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")

- 학습 과정은 여러 번의 반복(에포크)을 통해 진행됩니다. 에포크가 진행될 때마다 예측의 정확성이 증가가하고 손실이 감소하는 것을 확인할 수 있습니다.

In [40]:
epochs = 5
for t in range(epochs):
    print(f"Epoch {t+1}\n-------------------------------")
    train(train_dataloader, model, loss_fn, optimizer)
    test(test_dataloader, model, loss_fn)
print("Done!")

Epoch 1
-------------------------------
loss: 0.661659 [   64/size:5d]
loss: 0.767574 [ 6464/size:5d]
loss: 0.535652 [12864/size:5d]
loss: 0.760985 [19264/size:5d]
loss: 0.656659 [25664/size:5d]
loss: 0.660791 [32064/size:5d]
loss: 0.729202 [38464/size:5d]
loss: 0.735599 [44864/size:5d]
loss: 0.718303 [51264/size:5d]
loss: 0.684152 [57664/size:5d]
Test Error: 
 Accuracy: 75.7%, Avg loss: 0.685555 

Epoch 2
-------------------------------
loss: 0.640311 [   64/size:5d]
loss: 0.746465 [ 6464/size:5d]
loss: 0.516677 [12864/size:5d]
loss: 0.745828 [19264/size:5d]
loss: 0.643515 [25664/size:5d]
loss: 0.647253 [32064/size:5d]
loss: 0.711458 [38464/size:5d]
loss: 0.723591 [44864/size:5d]
loss: 0.704232 [51264/size:5d]
loss: 0.670118 [57664/size:5d]
Test Error: 
 Accuracy: 76.4%, Avg loss: 0.670404 

Epoch 3
-------------------------------
loss: 0.619121 [   64/size:5d]
loss: 0.727407 [ 6464/size:5d]
loss: 0.499953 [12864/size:5d]
loss: 0.732324 [19264/size:5d]
loss: 0.631550 [25664/size:5d]
l

## 모델의 저장
- 모델을 저장하는 일반적인 방법은 내부 상태 사전(모델 매개변수를 포함)을 직렬화하는 것입니다.


In [45]:
torch.save(model.state_dict(), "model.pth")
print("Saved PyTorch Model State to model.pth")

Saved PyTorch Model State to model.pth


## 저장된 모델 불러오기

- 모델을 불러오는 과정에는 모델 구조를 다시 생성하고, 상태 사전을 그 안에 로드하는 작업이 포함됩니다.


In [46]:
model = NeuralNetwork().to(device)
model.load_state_dict(torch.load("model.pth", weights_only=True))

<All keys matched successfully>

In [50]:
classes = [
    "T-shirt/top",
    "Trouser",
    "Pullover",
    "Dress",
    "Coat",
    "Sandal",
    "Shirt",
    "Sneaker",
    "Bag",
    "Ankle boot",
]

model.eval()
x, y = test_data[5][0], test_data[5][1]
with torch.no_grad():
    x = x.to(device)
    pred = model(x)
    predicted, actual = classes[pred[0].argmax(0)], classes[y]
    print(f'Predicted: "{predicted}", Actual: "{actual}"')

Predicted: "Trouser", Actual: "Trouser"
