# Convolutional Neural Network



### Imports

In [None]:
import torch
import torchvision.datasets as dsets
import torchvision.transforms as transforms
import torch.nn.init

device = 'cuda' if torch.cuda.is_available() else 'cpu'
# GPU 사용

# for reproducibility
torch.manual_seed(777)
if device == 'cuda':
    torch.cuda.manual_seed_all(777)

<torch._C.Generator at 0x7fc3da535b90>

### 1 CNN model
* Input (입력의 형태)
  + Input type: torch.Tensor
  + Input shape: (N x C x H x W)
    - N: Batch size, C: # of channels, H: height, W: width
  + (?, 1, 28, 28)
    - 여러장의, 흑백, 28x28 size의 이미지라고 가정하자
* Layer 설계
  + Layer 1
    - Conv2d >> C: 32, Kernel size (필터 크기): 3, Stride: 1, Padding: 1
    - ReLU
    - MaxPool >> Kernel size: 2, Stride: 2
    - 입-출력 (?, 1, 28, 28) >> (?, 32, 14, 14)
  + Layer 2
    - Conv2d >> C: 64, Kernel size (필터 크기): 3, Stride: 1, Padding: 1
    - ReLU
    - MaxPool >> Kernel size: 2, Stride: 2
    - 입-출력 (?, 32, 14, 14) >> (?, 64, 7, 7)
  + Layer 3
    - Linear >> input: 7x7x64 output: 10
    - Softmax

In [None]:
class CNN(torch.nn.Module):

    def __init__(self):
        super(CNN, self).__init__()
        # L1 Input shape=(?, 1, 28, 28)
        #    Conv     -> (?, 32, 28, 28)
        #    Pool     -> (?, 32, 14, 14)
        self.layer1 = torch.nn.Sequential(
            torch.nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
            torch.nn.ReLU(),
            # 여기서 ReLU는 선형성, 계산효율, Vanishing Gradient 문제 감소등의 이유로 사용된다
            torch.nn.MaxPool2d(kernel_size=2, stride=2))
        # L2 Input shape=(?, 32, 14, 14)
        #    Conv      ->(?, 64, 14, 14)
        #    Pool      ->(?, 64, 7, 7)
        self.layer2 = torch.nn.Sequential(
            torch.nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
            torch.nn.ReLU(),
            torch.nn.MaxPool2d(kernel_size=2, stride=2))
            # maxpool은 size를 축소시키는 용도로 사용된다. (대표값을 뽑아줌)

        # L3 Linear 64x7x7 inputs -> 10 outputs
        self.fc = torch.nn.Linear(64*7*7, 10, bias=True)
        # 이전 레이어의 출력을 "평탄화"하여 다음 스테이지의 입력이 될 수 있는 단일 벡터로 변환
        torch.nn.init.xavier_uniform_(self.fc.weight)
        # 신경망 모델의 학습을 시작하기 전에 가중치를 적절한 값으로 설정하는 과정, 초기화를 잘 수행하면 모델의 학습이 빠르고 안정적으로 이루어질 수 있다.

    def forward(self, x):
        out = self.layer1(x)
        out = self.layer2(out)
        out = out.view(out.size(0), -1)
        # 이 부분은 컨볼루션 레이어들을 통과한 결과를 fully connected 레이어에 전달하기 전에 평탄화(flatten)하는 역할을 한다
        # -1은 나머지 차원을 자동으로 조정하라는 의미이며,
        # 이는 주로 배치 크기를 유지하면서 나머지 차원들을 평탄하게 펼치기 위해 사용된다
        out = self.fc(out)
        return out

### 2 Assignment
### 다음과 같은 CNN 모델을 작성해보자
* Input
  + Input type: torch.Tensor
  + Input shape: (?, 1, 28, 28)
    - 여러장의, 흑백, 28x28 size의 이미지라고 가정하자
* Layers
  + Layer 1
    - Conv2d >> C: 32, Kernel size (필터 크기): 3, Stride: 1, Padding: 1
    - ReLU
    - MaxPool >> Kernel size: 2, Stride: 2
    - 입-출력 (?, 1, 28, 28) >> (?, 32, 14, 14)
  + Layer 2
    - Conv2d >> C: 64, Kernel size (필터 크기): 3, Stride: 1, Padding: 1
    - ReLU
    - MaxPool >> Kernel size: 2, Stride: 2
    - 입-출력 (?, 32, 14, 14) >> (?, 64, 7, 7)
  + Layer 3
    - Conv2d >> C: 128, Kernel size (필터 크기): 3, Stride: 1, Padding: 1
    - ReLU
    - MaxPool >> Kernel size: 2, Stride: 2, Padding: 1
    - 입-출력 (?, 64, 7, 7) >> (?, 128, 4, 4)
  + Layer 4
    - Linear >> input: 4x4x128 output: 625
    - ReLU
    - Dropout
    - 입-출력 (4x4x128) >> (625)
  + Layer 5
    - Linear >> input: 625 output: 10
    - Softmax (pytorch의 Cross Entropy Loss 함수를 사용하는 것을 감안한다)
    


In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
def __init__(self):
  super(CNN, self).__init__()
  # L1 input shape = (?, 1, 28, 28)
  # Conv -> (?,32, 28, 28)
  # Pool -> (?, 32, 14, 14)
  self.layer1 = torch.nn.Sequential(
      torch.nn.Conv2d(1, 32, kernel_size=3, stride=1, padding=1),
      torch.nn.ReLU(),
      torch.nn.MaxPool2d(kernel_size=2, stride=2))

  # L2 input shape = (?, 32, 14, 14)
  # Conv -> (?, 64, 14, 14)
  # Pool -> (?, 64, 7, 7)
  self.layer2 = torch.nn.Sequential(
      torch.nn.Conv2d(32, 64, kernel_size=3, stride=1, padding=1),
      torch.nn.ReLU(),
      torch.nn.MaxPool2d(kernel_size=2, stride=2))

  # L3 input shape = (?, 64, 7, 7)
  # Conv -> (?, 128, 7, 7)
  # Pool -> (?, 128, 4, 4)
  self.layer3 = torch.nn.Sequential(
      torch.nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1),
      torch.nn.ReLU(),
      torch.nn.MaxPool2d(kernel_size=2, stride=2, padding=1))

  # L4 Linear 128x4x4 inputs -> 625 outputs
  self.layer4= torch.nn.Sequential(
      torch.nn.Linear(128*4*4, 625, bias=True),
      torch.nn.ReLU(),
      torch.nn.Dropout(0.2)
  # 여기서 Dropout은 과적합을 방지하기 위해서 따로 빼서 결과를 출력하기 위해 사용
  # 0.2를 설정했을 때, 20% 노드는 끄고 계산을 진행하는 것
  # 128*4*4*0.8만 학습 진행
  )

  # L5 Linear 625 inputs -> 10 outputs
  self.fc = torch.nn.Linear(625, 10, bias=True)
  torch.nn.init.xavier_uniform_(self.fc.weight)

def forward(self, x):
  out = self.layer1(x)
  out = self.layer2(out)
  out = self.layer3(out)
  out = out.view(out.size(0),-1)
  # 행렬을 백터로 펴주기 위해 사용, -1은 전체를 변환한다는 의미
  out = self.layer4(out)
  out = self.fc(out)
  return out


