<a href="https://colab.research.google.com/github/All4Nothing/hg-mldl/blob/main/8-1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 합성곱 신경망의 구성 요소 

## 합성곱

**합성곱 convolution**은 입력 데이터 전체에 가중치를 적용하는 것이 아니라 일부에 가중치를 곱한다.  

**합성곱 신경망 convolutional neural network, CNN**에서는 완전 연결 신경망과 달리 뉴런을 **필터 filter**라고 부른다. 혹은 **커널 kernel**이라고도 부른다

완전 연결 층(밀집층0만 사용하여 만든 신경망을 완전 연결 신경망(밀집 신경망)이라고 부른다

합성곱 계산을 통해 얻은 출력을 **특성 맵 feature map**이라고 부른다

![합성곱](https://wikidocs.net/images/page/64066/conv9.png)

여러 개의 필터를 사용하면 특성 맵은 순서대로 차곡 차곡 쌓인다.

입력보다 훨씬 작은 크기의 커널을 사용하고 입력 위를 이동하면서 2차원 특성 맵을 만든다.  
2차원 구조를 그대로 사용하기 때문에 합성곱 신경망이 이미지 처리 분야에서 뛰어난 성능을 발휘한다.  

## 케라스 합성곱 층

입력 위를 (왼쪽에서 오른쪽, 위에서 아래로) 이동하는 합성곱은 `Conv2D`클래스로 제공한다.

In [2]:
from tensorflow import keras
keras.layers.Conv2D(10, kernel_size=(3, 3), activation='relu')

<keras.layers.convolutional.Conv2D at 0x7f0145902f10>

`Conv2D` 클래스의 첫 번째 매개변수는 필터의 개수이다.  
`kernel_size` 매개변수는 필터에 사용할 커널의 크기를 지정한다.  
활성화 함수를 지정한다.  

일반적으로 특성 맵은 활성화 함수를 통과한 값을 나타낸다. 합성곱에서는 활성화 출력이란 표현을 잘 쓰지 않는다.

커널의 크기는 하이퍼파라미터이다. 보통 (3, 3)이나 (5, 5)크기가 권장된다.

1개 이상의 합성곱 층을 쓴 인공 신경망을 합성망 신경망이라고 부른다. 꼭 합성곱 층만 사용한 신경망을 합성곱 신경망이라고 부르는 것은 아니다.

### 패딩과 스트라이드

입력 배열의 주위를 가상의 원소로 채우는 것을 **패딩 padding**이라고 부른다

실제 입력값이 아니기 때문에 패딩은 0으로 채운다.  
패딩의 역할은 순전히 커널이 도장을 찍을 횟수를 늘려주는 것밖에는 없고, 실제 값은 0으로 채워져 있기 때문에 계산에 영향을 미치지 않는다

![패딩](https://wikidocs.net/images/page/64066/conv10.png)

입력과 특성 맵의 크기를 동일하게 만들기 위해 입력 주위에 0으로 패딩 하는 것을 **세임 패딩 same padding**이라고 부른다.  
합성곱 신경망에서는 세임 패딩이 많이 사용된다.  

패딩 없이 순수한 입력 배열에서만 합성곱을 하여 특성 맵을 만드는 경우를 **밸리드 패딩 valid padding**이라고 한다.   
밸리드 패딩은 특성 맵의 크기가 줄어들 수 밖에 없다.

패딩을 하지 않을 경우 중앙부와 모서리 픽셀이 합성곱에 참여하는 비율은 크게차이가 난다. 즉 모서리에 있는 중요한 정보가 특성맵으로 잘 전달되지 않을 가능성이 높고, 가운데에 있는 정보는 두드러지게 표현된다.

적절한 패딩은 이미지의 주변에 있는 정보를 잃어버리지 않도록 도와준다.  

`Conv2D` 클래스에서 `padding` 매개변수로 패딩을 지정할 수 있다. 기본값은 `valid`로 밸리드 패딩을 나타내고, 세임 패딩은 `same`으로 지정할 수 있다.

In [3]:
keras.layers.Conv2D(10, kernel_size=(3, 3), activation='relu', padding=('same'))

<keras.layers.convolutional.Conv2D at 0x7f0144db9310>

합성곱 연산시 이동하는 크기를 **스트라이드 stride**라고 한다. 기본으로 스트라이드는 1이다.  
대부분 기본값을 그대로 사용하기 때문에 `strides` 매개변수는 잘 사용하지 않는다.

In [5]:
keras.layers.Conv2D(10, kernel_size=(3,3), activation='relu', padding='same', strides=1)

<keras.layers.convolutional.Conv2D at 0x7f0144cc3090>

### 풀링

**풀링 pooling**은 합성곱 층에서 만든 특성 맵의 가로세로 크기를 줄이는 역할을 수행한다.  하지만 특성맵의 개수는 줄이지 않는다

풀링도 합성곱처럼 입력 위를 지나가면서 도장을 찍는다. 하지만 풀링에는 가중치가 없다. 도장을 찍은 영역에서 가장 큰 값을 고르거나 평균값을 계산한다.  
이를 각각 **최대 풀링 max pooling**과 **평균 풀링 average pooling**이라고 부른다 

풀링에서는 커널이 겹치지 않고 이동한다. 따라서 풀링의 크기가 (2, 2)이면 가로세로 두칸씩 이동한다. 즉 스트라이드가 2이다.

In [6]:
keras.layers.MaxPooling2D(2)

<keras.layers.pooling.MaxPooling2D at 0x7f0144c75550>

`MaxPooling2D`의 첫 번째 매개변수로 풀링의 크기를 지정한다.  
대부분 풀링의 크기는 2이다.

평균 풀링을 제공하는 클래스는 `AveragePooling2D`이다.  
많은 경우 평균 풀링보다 최대 풀링을 많이 사용한다. 평균 풀링은 특성 맵에 있는 중요한 정보를 (평균하여)희석시킬 수 있기 때문이다.

## 합성곱 신경망의 전체 구조 

입력  
1. 합성곱 층(세임 패딩)
2. 풀링층
3. 밀집층

풀링을 사용하는 이유는 합성곱에서 스트라이드를 크게 하여 특성 맵을 줄이는 것보다 풀링 층에서 크기를 줄이는 것이 경험적으로 더 나은 성능을 내기 때문이다.

풀링을 거친 특성 맵을 밀집층인 출력층에 전달하려면 3차원 배열을 1차원으로 펼쳐야 한다(`Flatten`)

출력층에서 계산된 값은 소프트맥스 활성화 함수를 거쳐 최종 예측 확률이 된다.

### 컬러 이미지를 사용한 합성곱

흑백 이미지는 2차원 배열로 표현할 수 있다.  
컬러 이미지는 RGB 채널로 구성되어 있기 때문에 컴퓨터는 이를 3차원 배열로 표시한다.  
하나의 컬러 이미지는 너비와 높이 차원 외에 깊이 차원(또는 채널 차원)이 있다.  

![채널](https://wikidocs.net/images/page/64066/conv15.png)

깊이가 있는 입력에서 합성곱을 수행하기 위해서는 도장도 깊이가 필요하다.

입력이나 필터의 차원이 몇 개인지 상관없이 항상 출력은 하나의 값이다.  
즉 특성 맵에 잇는 한 원소가 채워진다.

합성곱 신경망에서 필터는 이미지에 있는 어떤 특징을 찾는다고 생각할 수 있다. 처음에는 간단한 기본적인 특징 (직선, 곡선 등)을 찾고 층이 깊어질수록 다양하고 구체적인 특징을 감지할 수 있도록 필터의 개수를 늘린다.  
또 어떤 특징이 이미지의 어느 위치에 놓이더라도 쉽게 감지할 수 있도록 너비와 높이 차원을 점점 줄여간다.