In [1]:
import os
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

In [2]:
device = (
    'cuda'
    if torch.cuda.is_available()
    else 'mps'
    if torch.cuda.is_available()
    else 'cpu'
    )
print(f"Using {device} device")

Using cpu device


In [3]:
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()  # 입력 텐서를 1차원으로 평탄화
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),  # 28*28 입력 특성과 512 출력 특성을 가지는 완전 연결층
            nn.ReLU(),  # ReLU 활성화 함수 적용
            nn.Linear(512, 512),  # 512 입력 특성과 512 출력 특성을 가지는 완전 연결층
            nn.ReLU(),  # ReLU 활성화 함수 적용
            nn.Linear(512, 10),  # 512 입력 특성과 10 출력 특성을 가지는 완전 연결층
            nn.ReLU()  # ReLU 활성화 함수 적용
        )

    def forward(self, x):
        x = self.flatten(x)  # 입력 텐서를 1차원 평탄화
        logits = self.linear_relu_stack(x)  # 평탄화된 입력을 linear_relu_stack에 통과시킴
        return logits

In [4]:
model = NeuralNetwork().to(device) # 내부적으로 forward 메서드를 호출
print(model)

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
    (5): ReLU()
  )
)


In [5]:
x = torch.rand(1, 28, 28, device=device)
logits = model(x)
pred_probab = nn.Softmax(dim=1)(logits)
y_pred = pred_probab.argmax(1)
print(f"Predicted class: {y_pred}")

Predicted class: tensor([3])


torch.Size([3, 28, 28])
