## 합성곱 신경망
역전파를 복습하자면, 순전파 과정에 따라 계산된 오차 정보가 신경망의 모든 노드(출력층 -> 은닉층 -> 입력층)로 전송됩니다. 이러한 계산 과정은 복잡하고 많은 자원(CPU 혹은 GPU, 메모리)을 요구합니다. 또한, 계산하는 데도 오래 걸립니다. 이 문제를 해결하고자 하는 것이 합성곱신경망입니다. 합성곱 신경망은 이미지 전체를 한 번에 계산하는 것이 아닌 `이미지의 국소적 부분을 계산`함으로써 `시간과 자원을 절약`하여 이미지의 `세밀한 부분까지 분석`할 수 있는 신경망입니다.

## 합성곱층의 필요성

합성곱 신경망은 이미지나 영상을 처리하는 데 유용합니다. 예를 들어 다음과 같이 3x3 흑백(그레이스케일) 이미지가 있다고 가정해 봅시다.

이미지 분석은 다음 그림의 왼쪽과 같은 3x3 배열을 오른쪽과 같이 펼쳐서(flattening) 각 픽셀에 가중치를 곱하여 은닉층으로 전달하게 됩니다. 하지만 그림에서 보이는 것처럼 이미지를 펼쳐서 분석하면 데이터의 공간적 구조를 무시하게 되는데, 이것을 방지하려고 도입된 것이 합성곱층입니다.

![](../Static/166.jpg)

합성곱층의 필요성을 알았으니, 합성곱 신경망을 자세히 살펴보겠습니다.

## 합성곱 신경망의 구조

합성곱 신경망(CNN 또는 ConvNet)은 음성 인식이나 이미지/영상 인식에서 주로 사용되는 신경망입니다. 다차원 배열 데이터를 처리하도록 구성되어 컬러 이미지같은 다차원 배열 처리에 특화되어 있으며, 다음과 같이 `계층 다섯 개`로 구성됩니다.

* 입력층
* 합성곱층
* 풀링층
* 완전연결층
* 출력층

![](../Static/167.jpg)

합성곱 신경망은 합성곱층과 풀링층을 거치면서 입력 이미지의 주요 `특성 벡터(feature vector)`를 추출합니다. 그 후 추출된 주요 특성 벡터들은 완전연결층을 거치면서 1차원 벡터로 변환되며, 마지막으로 출력층에서 활성화 함수인 `소프트맥스(softmax)` 함수를 사용하여 최종 결과가 출력됩니다. 그럼 입력층부터 하나씩 알아봅시다.

## 입력층

입력층(input layer)은 입력 이미지 데이터가 최초로 거치게 되는 계층입니다. 이미지는 단순 1차원의 데이터가 아닌 `높이(height)`, `너비(width)` , `채널(channel)`의 값을 갖는 3차원 데이터입니다. 이때 채널은 이미지가 그레이스케일(gray scale)이면 1 값을 가지며, 컬러(RGB)이면 3 값을 갖습니다. 예를 들어 다음 그림과 같은 형태는 높이4, 너비4, 채널은 RGB를 갖고있으므로, 이미지 형태(shape)는 `(4,4,3)`으로 표현할 수 있습니다.

![](../Static/168.jpg)



## 합성곱층

합성곱층(convolutional layer)은 입력 데이터에서 특성을 추출하는 역할을 수행합니다.

그럼 특성 추출은 어떻게 진행될까요? 입력 이미지가 들어왔을 때 이미지에 대한 특성을 감지하기 위해 `커널(kernel)` 또는 `필터`를 사용합니다. 커널/필터는 이미지의 모든 영역을 훑으면서 특성을 추출하게 되는데, 이렇게 추출된 결과물이 `특성 맵(feature map)`입니다.

이때 커널은 3x3, 5x5 크기로 적용되는 것이 일반적이며, `스트라이드(stdire)`라는 지정된 간격에 따라 순차적으로 이동합니다.

다음은 스트라이드가 1일 때 이동하는 과정입니다.

![](../Static/169_1.jpg)



## 풀링층

풀링층(pooling layer)는 합성곱층과 유사하게 특성 맵의 차원을 다운 샘플링하여 연산량을 감소시키고, 주요한 특성 벡터를 추출하여 학습을 효과적으로 할 수 있게됩니다.

풀링 연산에는 두 가지가 사용됩니다.

* 최대 풀링(max pooling) : 대상 영역에서 최댓값을 추출
* 평균 풀링(average pooling) : 대상 영역에서 평균을 반환

하지만 대부분의 합성곱 신경망에서는 최대 풀링이 사용되는데, 평균 풀링은 각 커널 값을 평균화시켜 중요한 가중치를 갖는 값의 특성이 희미해질 수 있기 때문입니다.

다음은 최대 풀링의 연산 과정입니다.

![](../Static/173_2.jpg)

![](../Static/174_1.jpg)

![](../Static/175.jpg)



## 완전연결층

합성곱층과 풀링층을 거치면서 차원이 축소된 특성 맵은 최종적으로 `완전연결층(fully connected layer)`로 전달됩니다. 이 과정에서 이미지는 3차원 벡터에서 1차원 벡터로 펼쳐지게(flatten)됩니다.

![](../Static/176.jpg)

## 출력층

출력층(output layer)에서는 소프트맥스 활성화 함수가 사용되는데, 입력받은 값을 0~1 사이의 값으로 출력합니다. 따라서 마지막 출력층의 `소프트맥스 함수`를 사용하여 이미지가 각 레이블(lable)에 속할 확률 값이 출력되며, 이때 가장 높은 확률 값을 갖는 레이블이 최종 값으로 선정됩니다.