In [1]:
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor

train_data = datasets.FashionMNIST(
    root="data", # 데이터를 저장할 root 디렉토리
    train=True, # 훈련용 데이터 설정
    download=True, # 다운로드
    transform=ToTensor() # 이미지 변환. 여기서는 TorchTesnor로 변환시킵니다.
)

test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)

In [2]:
train_dataloader = DataLoader(train_data, batch_size=64, shuffle=True)
test_dataloader  = DataLoader(test_data, batch_size=64, shuffle=False)

# PyTorch Modeling

> PyTorch 모델링 - 클래스 기반 모델 설계

PyTorch에서 대부분의 모델은 클래스 기반으로 설계됩니다. 

이를 위해 torch.nn.Module 클래스를 상속받아 커스텀 모델을 만듭니다. 

이 클래스는 PyTorch에서 신경망 모델의 기본 구조를 정의하는데 사용됩니다.

파이토치는 대부분 클래스 기반 모델링을 수행합니다. `torch.nn.Module` 클래스를 상속 받아 만들게 됩니다. 필수적으로 오버라이딩 해야 하는 메소드는 생성자 `__init__`과 순전파를 담당하는 `forward` 입니다.

In [3]:
import torch
import torch.nn as nn

# 모델 클래스 정의
class SimpleModel(nn.Module):
    
    def __init__(self):
        super(SimpleModel, self).__init__()  # 부모 클래스(nn.Module)의 생성자 호출
        self.fc1 = nn.Linear(10, 20)  # 첫 번째 선형 레이어 (입력 10, 출력 20)
        self.fc2 = nn.Linear(20, 1)   # 두 번째 선형 레이어 (입력 20, 출력 1)
    
    def forward(self, x):
        x = self.fc1(x)  # 첫 번째 레이어를 통과
        x = torch.relu(x)  # ReLU 활성화 함수 적용
        x = self.fc2(x)  # 두 번째 레이어를 통과
        return x  # 결과 반환
    
# 모델 인스턴스 생성
model = SimpleModel()

# 가짜 데이터 생성
input_data = torch.randn(5, 10)  # 5개의 샘플, 각 샘플은 10차원 벡터

# 순전파 실행
output = model(input_data)

# 결과 출력
print(output)


# 1. torch.nn.Module 상속

    # 모든 PyTorch 모델은 torch.nn.Module 클래스를 상속받아야 합니다. 
    # 이 클래스는 PyTorch의 신경망 구조의 기본 요소를 제공하며, 사용자 정의 모델을 생성할 때는 이 클래스를 상속받아 레이어와 연산을 정의할 수 있습니다.

# 2. __init__() 메서드

    # __init__() 메서드는 생성자로서, 모델의 **구성 요소(레이어)**를 정의합니다. 
    # 예를 들어, 선형 레이어(fully connected layer), 컨볼루션 레이어, 활성화 함수 등을 여기에 정의합니다. 
    # 이 메서드는 모델을 생성할 때 호출되며, 보통 모델의 구조를 결정하는 파라미터들을 정의합니다.

# 3. forward() 메서드

    # forward() 메서드는 **순전파(forward pass)**를 정의합니다. 
    # 입력 데이터를 받아서, 모델이 각 레이어를 어떻게 통과할지를 나타냅니다. 
    # 즉, 이 메서드는 데이터가 모델을 통과하면서 일어나는 연산을 정의합니다.

# 4. 모델 학습 과정

    # 모델을 정의한 후, 데이터를 모델에 입력하고 학습할 수 있습니다. 
    # **순전파(Forward Pass)**를 실행하여 모델이 어떻게 예측하는지를 확인한 후, **역전파(Backward Pass)**를 통해 기울기를 계산하고 모델을 최적화하는 과정이 이어집니다.

# 5. 클래스 기반 모델 설계의 장점

    # > 구조화: 
        # 클래스 기반 모델은 각 레이어와 연산을 구조적으로 정의할 수 있어 코드의 가독성과 유지보수성이 높습니다.
    # > 확장성: 
        # torch.nn.Module을 상속받아 모델을 정의함으로써 복잡한 네트워크를 설계하거나, 커스텀 연산을 추가하는 것이 용이합니다.
    # > 재사용성: 
        # __init__()에서 정의한 레이어는 여러 번 사용할 수 있으며, 다양한 재사용 가능한 레이어와 연산을 쉽게 정의할 수 있습니다.


# 6. 종합 요약

# - torch.nn.Module 상속: 
    # 모든 모델은 torch.nn.Module을 상속받아야 합니다.
# - __init__(): 
    # 레이어와 연산을 정의하는 생성자입니다. 모델의 구조와 파라미터를 정의합니다.
# - forward(): 
    # 입력 데이터를 받아서 순전파를 정의하는 메서드입니다. 
    # 데이터가 어떻게 모델을 통과하고 예측되는지를 정의합니다.


tensor([[-0.0702],
        [ 0.2714],
        [ 0.0851],
        [ 0.4392],
        [-0.0590]], grad_fn=<AddmmBackward0>)


다시 한번 해보자

In [5]:
from torch import nn

class NeuralNetwork(nn.Module):

    def __init__(self):
        # Subclass인 NeuralNetwork의 생성자.
            # 여기에서 상위 클래스인 nn.Module의 생성에 대한 책임을 져야 한다. 
                # 책임이란? 부모클래스의 생성자에 필요한 파라미터를 지정하는 것 (nn.Module에 마우스 올리면 생성자 어떻게 생겼는지 볼 수 있음)

        # super를 이용하여 상위 클래스의 객체 생성 책임을 진다.
        super(NeuralNetwork, self).__init__()

        # 생성자에는 항상 레이어의 구성을 정의
        self.flatten = nn.Flatten() # 입력되는 데이터를 평탄화 시키는 레이어

        # nn.Sequential을 이용해 연속되는 레이어의 구조를 구성
        self.linear_relu_stack = nn.Sequential(
            # 1층 구성
            nn.Linear(28*28, 128),
            nn.ReLU(),
            # 2층 (출력층) 구성
            nn.Linear(128, 10)
            # 출력 활성화 함수(Softmax)는 실제 모델 순전파 시에 넣어도 상관 없기 때문!(훈련할 때)
            # 꼭 없어야 하는 건 아님!! 상황에 따라서 넣어 줄 수 도 있음
        )


    def forward(self, x):
        # forward에는 입력 데이터 x가 들어온다. 이 때 x의 shape은? (N, 28, 28)
        x = self.flatten(x) # 왜 그냥 넣지?: 이미 위에서 입력되는 데이터를 평탄화 시키는 레이어 구성을 정의해두었기 때문
        y = self.linear_relu_stack(x)
        return y

# 모델 생성
파이토치를 이용해 모델 객체를 만들고 나서 어떤 장치(device) 환경에서 훈련이나 추론을 수행할지 결정지어줘야 합니다.

In [None]:
# import torch

# device = 'cuda' if torch.cuda.is_available() else 'cpu'
# device

Apple Silicon 기반의 MacBook에서는 CUDA(NVIDIA GPU 기반 가속화) 대신 **MPS(Metal Performance Shaders)**를 사용해야 합니다. CUDA는 NVIDIA GPU에서만 작동하기 때문에, MacBook의 GPU 가속을 사용하려면 MPS를 활용해야 합니다.

따라서, torch.cuda.is_available()로 CUDA 지원 여부만 확인하는 대신, MPS 지원 여부도 확인할 수 있도록 코드를 수정해야 합니다. 그리고, MPS가 지원되지 않을 경우에는 CPU에서 실행할 수 있도록 하는 코드를 작성하는 것이 좋습니다.

In [7]:
import torch

# MPS 지원 여부 확인
if torch.backends.mps.is_available():
    device = 'mps'  # Apple Silicon에서 MPS 사용
elif torch.cuda.is_available():
    device = 'cuda'  # CUDA 사용 가능 시
else:
    device = 'cpu'  # 그 외에는 CPU 사용

print(f"Using device: {device}")


Using device: mps


In [8]:
# 모델을 설정한 환경(device)으로 옮긴다는 개념
model = NeuralNetwork().to(device)
print(model)

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=128, bias=True)
    (1): ReLU()
    (2): Linear(in_features=128, out_features=10, bias=True)
  )
)
