<a href="https://colab.research.google.com/github/KevinTheRainmaker/ML_DL_Basics/blob/master/HonGong_ML_DL/20_CNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 합성곱 신경망의 구성 요소

### **키워드:** 합성곱, 필터, 특성 맵, 패딩, 스트라이드, 풀링

합성곱 신경망을 구성하는 기본 개념과 동작 원리를 알아보고, 간단한 합성곱, 풀링 계산 방법을 익혀보자.

In [1]:
# packages
from tensorflow import keras

## 합성곱

합성곱(convolution)은 입력 데이터에서 유용한 특성만 드러나게 하는 것으로 설명할 수 있다.

기본적인 밀집층에는 뉴런마다 입력 개수만큼의 가중치가 있어 모든 입력에 가중치가 곱해지고, 뉴런 개수만큼의 출력을 만든다.

반면 합성곱은 일부 입력만큼의 가중치를 가진다. 즉, 입력 전체 특성에 가중치가 곱해져 출력을 생성하는 것이 아니라, 일부 특성에만 가중치가 곱해져 하나의 출력을 만들게 되는 것이다. 일부 특성에 곱해진 가중치는 앞쪽부터 조금씩 내려오면서 다음 일부 특성에 곱해져 출력을 만들며, 이때 곱해지는 가중치는 이전과 동일하다. 이렇게 합성곱은 한 칸씩 아래로 이동하면서 출력을 만들게 되며, 최종 출력의 개수는 (뉴런 개수) - (가중치 개수 n개) + 1개가 된다. (1차원 기준)

## 필터

합성곱 층의 뉴런에 있는 가중치의 개수는 하이퍼파라미터로, 사용자가 정할 수 있다.

합성곱 신경망(Convolutional Neural Network, CNN)에서는 이러한 n개 크기의 뉴런을 필터(filter) 혹은 커널(kernel)이라고 한다.

둘은 종종 같은 의미로 사용되지만, 케라스 API를 기준으로 설명할 때는 입력에 곱하는 가중치를 커널, 뉴런 개수를 필터라고 부르곤 한다.

필터를 통해 계산된 합성곱의 출력은 특성 맵(feature map)이라고 부른다. 여기서의 특성 맵은 활성화 함수를 적용한 후의 출력이다.

## 케라스 합성곱 층

케라스 층은 모두 `keras.layers` 패키지 아래 클래스로 구현되어 있다.

In [2]:
keras.layers.Conv2D(10, kernel_size=(3,3), activation='relu')

<keras.layers.convolutional.Conv2D at 0x7f97d8533490>

### 패딩

합성곱 계산을 통해 특성 맵이 만들어지면 입력보다 작은 크기를 가지게 된다. 만약 커널 크기는 그대로 두고 출력의 크기(특성 맵의 크기)를 입력과 동일하게 만들고자 할 경우 입력에 여분 크기를 부여해야 한다. 이러한 여분을 패딩이라고 하며 이는 출력값에는 영향을 미치지 않는 비어있는 값(0)이다.

이렇게 입력과 특성 맵의 크기를 동일하게 만들기 위해 입력 주변을 0으로 패딩하는 것을 세임 패딩(same padding)이라고 하고, 패딩 없이 순수하게 합성곱을 하여 특성 맵을 만드느 것을 밸리드 패딩(valid padding)이라고 한다. 합성곱에서는 세임 패딩 방식을 주로 사용하는데, 그 이유는 입력의 가장자리 정보가 가운데 정보에 비해 비중이 작아지는 것을 방지하기 위해서이다.

패딩 방식은 Conv2D 클래스에서 지정할 수 있으며, 이는 padding 매개변수에 의해 이뤄진다.

(세임 패딩: same / 밸리드 패딩(default): valid)

In [3]:
keras.layers.Conv2D(10, kernel_size=(3,3), activation='relu', padding='same')

<keras.layers.convolutional.Conv2D at 0x7f97d851be10>

### 스트라이드

필터는 기본적으로 한 칸씩 이동하는데, 이때 이동의 크기를 지정할 수 있다. 이러한 크기를 스트라이드(stride)라고 하며, Conv2D 클래스의 strides 매개변수로 조절할 수 있다.

In [5]:
keras.layers.Conv2D(10, kernel_size=(3,3), activation='relu', padding='same', strides=1) # default: 1

<keras.layers.convolutional.Conv2D at 0x7f97d7b604d0>

보통 1보다 큰 스트라이드를 사용하는 경우는 드물다.