# 신경망 모델 구성
신경망의 경우 데이터에 대한 연산을 수행하는 layer, module로 구성.<br>
torch.nn 의 경우 신경망을 구성하는 데 필요한 모든 요소를 제공.
- PyTorch의 모든 모듈은 nn.Module의 하위 클래스, 신경망은 다른 모듈로 구성된 모듈.
    - 이런 중첩구조의 경우 복잡한 아키텍쳐를 쉽게 구축, 관리 가능

In [1]:
import os
import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

In [2]:
device = (
    "cuda"
    if torch.cuda.is_available()
    else "mps"
    if torch.backends.mps.is_available()
    else "cpu"
)
print(f"Using {device} device")

Using cpu device


## 클래스 정의
- 신경망 모델을 nn.Module의 하위클래스로 정의. __ init __에서 신경망 계층 초기화.
- nn.Module을 상속받은 forward 메소드에 입력데이터에 대한 연산을 구현

In [5]:
class NeuralNetwork(nn.Module):
    def __init__(self):
        super().__init__() # 부모클래스 nn.Module의 초기화 매서드 호출
        self.flatten = nn.Flatten() # 이미지 데이터 평탄화하는 nn.Flatten호출 self.flatten에 할당.

        # 신경망 주요부분 정의
        self.linear_relu_stack = nn.Sequential( # nn.Sequential을 사용, 여러 layer를 쌓음 
            nn.Linear(28*28, 512), # 입력크기 28*28(이미지 크기), 출력크기 512인 선형 layer
            nn.ReLU(), # 활성화 함수 정의
            nn.Linear(512, 512), # 입력크기 512, 출력크기 512인 layer
            nn.ReLU(),
            nn.Linear(512, 10), # 입력크기 512, 출력크기 10인 layer
                                # 이때 10은 출력 클래스의 수
        )

    def forward(self, x): # 순전파 정의 메서드
        x = self.flatten(x) # 입력데이터 x를 평탄화
        logits = self.linear_relu_stack(x) # 평탄화 된 데이터를 앞의 신경망 스택에 전달, 출력값(logits)을 얻음
        return logits # 출력값 반환
    

# 정의 된 신경망은 이미지를 입력받아 layer, 활성화 함수 통과 후 최종 10개 클래스에 대한 logit 출력

NeuralNetwork의 인스턴스 생성, 이를 device로 이동후 구조를 출력

In [6]:
model = NeuralNetwork().to(device)
print(model)

NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
  )
)
