# MNIST

## Reference

- https://tutorials.pytorch.kr/recipes/recipes/defining_a_neural_network.html

- https://tutorials.pytorch.kr/recipes/recipes/what_is_state_dict.html



In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [5]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()

        # 첫번째 2D 합성곱 계층
        # 1개의 입력 채널(이미지)을 받아들이고, 사각 커널 사이즈가 3인 32개의 합성곱 특징들을 출력합니다.
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        # 두번째 2D 합성곱 계층
        # 32개의 입력 계층을 받아들이고, 사각 커널 사이즈가 3인 64개의 합성곱 특징을 출력합니다.
        self.conv2 = nn.Conv2d(32, 64, 3, 1)

        # 인접한 픽셀들은 입력 확률에 따라 모두 0 값을 가지거나 혹은 모두 유효한 값이 되도록 만듭니다.
        self.dropout1 = nn.Dropout2d(0.25)
        self.dropout2 = nn.Dropout2d(0.5)

        # 첫번째 fully connected layer
        self.fc1 = nn.Linear(9216, 128)
        # 10개의 라벨을 출력하는 두번째 fully connected layer
        self.fc2 = nn.Linear(128, 10)

my_nn = Net()
print(my_nn)

Net(
  (conv1): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1))
  (conv2): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1))
  (dropout1): Dropout2d(p=0.25, inplace=False)
  (dropout2): Dropout2d(p=0.5, inplace=False)
  (fc1): Linear(in_features=9216, out_features=128, bias=True)
  (fc2): Linear(in_features=128, out_features=10, bias=True)
)


In [6]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        self.dropout1 = nn.Dropout2d(0.25)
        self.dropout2 = nn.Dropout2d(0.5)
        self.fc1 = nn.Linear(9216, 128)
        self.fc2 = nn.Linear(128, 10)

    # x는 데이터를 나타냅니다.
    def forward(self, x):
        # 데이터가 conv1을 지나갑니다.
        x = self.conv1(x)
        # x를 ReLU 활성함수(rectified-linear activation function)에 대입합니다.
        x = F.relu(x)

        x = self.conv2(x)
        x = F.relu(x)

        # x에 대해서 max pooling을 실행합니다.
        x = F.max_pool2d(x, 2)
        # 데이터가 dropout1을 지나갑니다.
        x = self.dropout1(x)
        # start_dim=1으로 x를 압축합니다.
        x = torch.flatten(x, 1)
        # 데이터가 fc1을 지나갑니다.
        x = self.fc1(x)
        x = F.relu(x)
        x = self.dropout2(x)
        x = self.fc2(x)

        # x에 softmax를 적용합니다.
        output = F.log_softmax(x, dim=1)
        return output

In [7]:
# 임의의 28x28 이미지로 맞춰줍니다.
random_data = torch.rand((1, 1, 28, 28))

my_nn = Net()
result = my_nn(random_data)
print (result)

tensor([[-2.3974, -2.2446, -2.3189, -2.3449, -2.2109, -2.2836, -2.3860, -2.3037,
         -2.2739, -2.2777]], grad_fn=<LogSoftmaxBackward0>)


