In [1]:
# 결과 확인을 용이하게 하기 위한 코드
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

- 딥러닝은 인공신경망(models)을 사용하며 이것은 상호연결된 집단의 많은 계층으로 구성된 계산 시스템임
- 데이터가 이 상호연결된 집단을 통과하면서, 신경망은 입력을 출력으로 바꾸기 위해 요구된 계산 방법에 어떻게 접근하는지 배울 수 있음
- PyTorch에서 신경망은 `torch.nn` 패키지를 사용해 구성할 수 있음

# 소개
- PyTorch는 `torch.nn`을 포함하여 신경망을 만들고 훈련시키는 것을 도울 수 있도록 섬세하게 만들어진 모듈과 클래스들을 제공함
- `nn.Module`은 계층과 output을 반환하는 `forward(input)` 메소드를 포함하고 있음

- 이 레시피에서 MNIST dataset을 사용하여 신경망을 정의하기 위해 `torch.nn`을 사용할 예정임

# 단계
1. 데이터를 가져오기 위해 필요한 라이브러리들 불러오기
2. 신경망을 정의하고 초기화하기
3. 데이터가 모델을 어떻게 지나갈 지 구체화하기
4. [선택사항] 데이터를 모델에 적용해 테스트하기

## 데이터를 가져오기 위해 필요한 라이브러리들 불러오기
- `torch`와 이것의 하위 모듈인 `torch.nn`, `torch.nn.functional`을 사용할 것임

In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F

## 신경망을 정의하고 초기화하기
- 이미지를 인식하는 신경망을 만들 것임
- PyTorch에서 만들어진 합성곱(convolution)이라고 불리는 방법을 사용할 것임
- 합성곱은 커널이나 작은 행렬을 통해 가중치를 부여한 이미지의 각 요소를 주변 값과 더함
- 그리고 이것은 입력된 이미지의 특징(모서리 감지, 선명함, 흐릿함 등)을 추출하는 데 도움을 줌


- 모델의 `Net` 클래스를 정의하기 위해 2가지가 필요함
    - 1) `nn.Module`을 참고하는 `__init__` 함수를 작성하는 것
        - 이 함수는 신경망에서 fully connected layers를 만드는 것에 사용됨
    - 2) 합성곱을 사용해 1개의 입력 이미지 채널을 가지고 목표인 0~9까지 숫자를 대표하는 10개의 라벨과 대응하는 값을 출력하는 모델을 정의하기

In [4]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        # 첫 번째 2D 합성곱 계층
        # 1개의 입력 채널(이미지)을 받아들이고, 사각 커널 사이즈가 3인 32개의 합성곱 특징을 출력함
        self.conv1 = nn.Conv2d(1, 32, 3, 1) # in_채널, out_채널, kernel_size, stride
        
        #두 번째 2D 합성곱 계층
        # 32개의 입력 계층을 받아들이고, 사각 커널 사이즈가 3인 64개의 합성곱 특징을 출력함
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        
        # 인접한 픽셀들은 입력 확률에 따라 모두 0 값을 가지거나 혹은 모두 유효한 값이 되도록 만듦
        self.dropout1 = nn.Dropout2d(0.25)
        self.dropout2 = nn.Dropout2d(0.5)
        
        # 첫 번째 fully connected layer
        self.fc1 = nn.Linear(9216, 128) # in_features, out_features
        # 10개의 라벨을 출력하는 두 번째 fully connected layer
        self.fc2 = nn.Linear(128, 10)

my_nn = Net()
print(my_nn)

Net(
  (conv1): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1))
  (conv2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1))
  (dropout1): Dropout2d(p=0.25, inplace=False)
  (dropout2): Dropout2d(p=0.5, inplace=False)
  (fc1): Linear(in_features=9216, out_features=128, bias=True)
  (fc2): Linear(in_features=128, out_features=10, bias=True)
)


## 데이터가 모델을 어떻게 지나갈 지 구체화하기
- PyTorch를 사용해 모델을 생성할 때, 계산 그래프(즉, 신경망)에 데이터를 지나가게 하는 `forward` 함수를 정의해야 함
- 이것은 feed-forward 알고리즘을 나타냄
- `forward` 함수에서 어떠한 Tensor 연산자도 사용 가능함

In [5]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        self.dropout1 = nn.Dropout2d(0.25)
        self.dropout2 = nn.Dropout2d(0.5)
        self.fc1 = nn.Linear(9216, 128)
        self.fc2 = nn.Linear(128, 10)
    
    # x는 데이터를 나타냄
    def forward(self, x):
        
        # 데이터가 conv1을 지나감
        x = self.conv1(x)
        
        # x를 ReLU 활성함수에 대입함
        x = F.relu(x)
        
        x = self.conv2(x)
        x = F.relu(x)
        
        # x에 대해서 max pooling을 실행함
        x = F.max_pool2d(x, 2)
        
        # 데이터가 dropout1을 지나감
        x = self.dropout1(x)
        
        # start_dim = 1로 x를 압축함
        x = torch.flatten(x, 1)
        
        # 데이터가 fc1을 지나감
        x = self.fc1(x)
        x = F.relu(x)
        x = self.dropout2(x)
        x = self.fc2(x)
        
        # x에 softmax를 적용함
        output = F.log_softmax(x, dim=1)
        return output

## [선택사항] 데이터를 모델에 적용해 테스트하기
- 원하는 출력값을 받을 수 있는지 확인하기 위해 무작위의 데이터를 모델에 통과시켜 시험해보기

In [6]:
# 임의로 28x28 이미지로 맞춰줌
random_data = torch.rand((1, 1, 28, 28))

my_nn = Net()
result = my_nn(random_data)
print(result)

tensor([[-2.2580, -2.3187, -2.3196, -2.3442, -2.2462, -2.2624, -2.2871, -2.2367,
         -2.3775, -2.3886]], grad_fn=<LogSoftmaxBackward0>)


