In [None]:
# 02. CNN으로 MNIST 분류하기

# 이 챕터에서는 합성곱 + 활성화함수 + 맥스풀링을 하나의 합성곱으로 본다.

In [None]:
# 모델의 아키텍쳐 : 3개의 층으로 구성

# 1번 레이어 : 합성곱층(Convolutional layer)
# 합성곱(in_channel = 1, out_channel = 32, kernel_size = 3, stride = 1, padding = 1) + 활성화 함수 ReRU
# 맥스풀링(kernel_size = 2, stride = 2)

# 2번 레이어 : 합성곱층(Convolutional layer)
# 합성곱(in_channel = 32, out_channel = 64, kernel_size = 3, stride = 1, padding = 1) + 활성화 함수 ReRU
# 맥스풀링(kernel_size = 2, stride = 2)

# 3번 레이어 : 전결합층(Fully-Connected layer)
# 특성맵을 펼친다 : batch_size * 7 * 7 * 64 -> batch_size * 3136
# 전결합층(뉴런 10개) + 활성화 함수 softmax

In [None]:
# 모델 구현하기

# 위 아키텍쳐 구현

In [1]:
# 필요한 도구 임포트와 입력의 정의

import torch
import torch.nn as nn

# 임의의 텐서 생성, 텐서의 크기는 1 X 1 X 28 X 28
# 배치크기 X 채널 X 높이 X 너비 
inputs = torch.Tensor(1, 1, 28, 28)
print('텐서의 크기 : {}'.format(inputs.shape))

텐서의 크기 : torch.Size([1, 1, 28, 28])


In [2]:
# 합성곱층과 풀링 선언
# 첫번째 합성곱 층 구현 : 1채널 입력받아 32채널 출력, 커널 사이즈 3, 패딩 1

conv1 = nn.Conv2d(1, 32, 3, padding= 1)
print(conv1)

Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))


In [3]:
# 두 번째 합성곱 층 구현 : 3채널 입력받아 64채널 출력, 커널 사이즈 3, 패딩 1

conv2 = nn.Conv2d(32, 64, kernel_size= 3, padding= 1)
print(conv2)

Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))


In [4]:
# 맥스풀링 구현 : 정수 하나를 인자로 넣으면 커널 사이즈와 스트라이더가 둘 다 해당값으로 지정된다

pool = nn.MaxPool2d(2)
print(pool)

MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)


In [8]:
# 3. 구현체를 연결하여 모델 만들기

# 입력을 첫번째 합성곱층을 통과시키고 난 후 텐서의 크기
out = conv1(inputs)
print(out.shape) # 32채널 28너비 28높이 텐서가 된다. 32가 나온 이유는 conv1의 out_channel로 32를 지정해주었기 때문

# 이를 맥스풀링을 통과시키고 난 후 텐서의 크기
out = pool(out)
print(out.shape) # 32채널 14넓이 14높이 텐서가 된다

# 두 번째 합성곱층에 통과한 이후 텐서의 크기
out = conv2(out)
print(out.shape) # 64채널 14너비 14높이 텐서가 된다.

# 맥스풀링에 통과
out = pool(out)
print(out.shape)

torch.Size([1, 32, 28, 28])
torch.Size([1, 32, 14, 14])
torch.Size([1, 64, 14, 14])
torch.Size([1, 64, 7, 7])


In [10]:
# 텐서를 펼치는 작업
# .size(n) : 텐서의 n번째 차원에 접근하게 해준다
out.size(0) # out의 첫번째 차원은 1

7

In [11]:
out.size(1) 

64

In [12]:
out.size(2) 

7

In [13]:
out.size(3) 

7

In [14]:
# .view() 를 사용하여 텐서를 펼치는 작업
# 첫번째 차원인 배치 차원은 그대로 두고 나머지를 펼친다

out = out.view(out.size(0), -1)
print(out.shape) # 배치 차원을 제외하고 하나의 차원으로 통합되었다

torch.Size([1, 3136])


In [15]:
# 전결합층(Fully-Connteced layer) 통과 : 출력층으로 10개의 뉴런을 배치하여 10개 차원의 텐서로 변환
fc = nn.Linear(3136, 10) # Input_dim = 3136, Output_dim = 10
out = fc(out)
print(out.shape)

torch.Size([1, 10])
