# 이미지를 위한 인공 신경망

## 합성곱 신경망의 구성 요소

### 합성곱

합성곱(convolution)
- 두 함수(또는 신호, 배열)를 겹쳐가며 곱한 뒤 그 결과를 모두 더해 새 함수를 만드는 연산
- 하나의 작은 패턴을 큰 데이터 위에서 한 킨씩 이동시키면서 겹치는 값들끼리 곱해서 더함


- 입력 데이터 일부에 가중치를 곱함

힙성곱 신경망(convolutional neural network; CNN)
- 뉴런을 필터(filter) 혹은 커널(kernel)이라 부름

- 뉴런 = 필터 = 커널

- 완전 연결 신경망

- 완전 연결 층(밀집층)만 사용하여 만든 신경망

- 여기서는 입력에 곱하는 가중치를 커널, 뉴런 개수를 표현할 때는 필터라고 표현

- 합성곱은 마치 도장을 찍듯이 왼쪽 위에서 오른쪽 맨 아래까지 이동하면서 출력을 만든다

- 입력과 가중치의 행과 열을 맞추어 곱셈하고 모두 더함

특성 맵(feature map)
- 합성곱 계산을 통해 얻은 출력

- 합성곱 층에서도 여러 개의 필터를 사용
- 합성곱 층에 있는 가중치(커널)도 모두 다름

- 단순히 입력과 가중치를 곱하는 것이지만 2차원 형태를 유지함

- 입력보다 훨씬 작은 크기의 커널을 사용하고 입력 위를 이동하면서 2차원 특성 맵을 ㅁ나든다
- 2차원 구조를 그대로 사용하기 때문에 합성곱 신경망이 이미지 처리 분야에서 뛰어난 성능을 발휘함

### 케라스 합성곱 층

- 케라스의 층은 모두 keras.layers 패키지 아래 클래스로 구현되어 있음

- 입력 위를 이동하는 합성곱은 Conv2D 클래스로 제공

In [1]:
from tensorflow import keras
keras.layers.Conv2D(10, kernel_size = (3, 3), activation = 'relu')

<Conv2D name=conv2d, built=False>

- 첫 번째 매개변수 > 필터의 개수

- kernel_size > 필터에 사용할 커널의 크기

- 필터의 개수와 커널의 크기는 반드시 지정해야 하는 매개변수

- 마지막 > 활성화함수 지정

- 특성 맵은 활성화 함수를 적용하기 후
- 일반적으로 특성 맵은 활성화 함수를 통과한 값을 나타냄

- 합성곱에서는 활성화 출력이란 표현을 잘 쓰지 않음

- 커널의 크기는 하이퍼파라미터이다

- 따라서 여러 값을 시도해 봐야 함
- 보통 (3, 3)이나 (5, 5) 크기가 권장됨

합성곱 신경망
- 1개 이상의 합성곱을 쓴 인공 신경망

- 꼭 합성곱 층을 쓴 인공신경망을 합성곱 신경망이라 부르는 것은 아님
- 클래스에 대한 확률을 계산하려면 마지막 층에 클래스 개수만큼의 뉴런을 가진 밀집층을 두는 것이 일반적

#### 패딩과 스트라이드

패딩(padding)
- 입력 배열의 주위를 가상의 원소로 채우는 것

- 실제 입력값이 아니기 때문에 패딩을 0으로 채움
- 도장을 찍을 횟수를 늘려주는 역할
- 실제 값은 0으로 채워져 있기 떄문에 계산에 영향을 미치지 x

세임 패딩(same padding)
- 입력과 특성 맵의 크기를 동일하게 만들기 위해 입력 주위에 0으로 패딩 하는 것
- 합성곱 신경망에서는 세임 패딩이 많이 사용됨

- 입력과 특성 맵의 크기를 동일하게 만드는 경우가 많음

밸리드 패딩(valid padding)
- 패딩 없이 순수한 입력 배열에서만 합성곱을 하여 특성 맵을 만드는 경우

- 밸리드 패딩은 특성 맵의 크기가 줄어들 수밖에 없음

- 적절한 패딩은 이미지의 주변에 있는 정보를 잃어버리지 않도록 도와줌

- 일반적인 합성곱 신경망에서는 세임 패딩이 많이 사용됨

In [2]:
keras.layers.Conv2D(10, kernel_size = (3, 3), activation = 'relu', padding = 'same')

<Conv2D name=conv2d_1, built=False>

스트라이드(stride)
- 도장(필터)이 이동하는 칸의 개수
- 기본으로 스트라이드는 1 > 한 칸씩 이동한다

- 튜플로 이동 칸 수를 지정할 수 있음

In [3]:
keras.layers.Conv2D(10, kernel_size= (3, 3), activation='relu', padding = 'same', strides = 1)

<Conv2D name=conv2d_2, built=False>

- 커널의 이동 크기를 가로세로 방향으로 다르게 지정하는 경우는 거의 없음

- 1보다 큰 스트라이드를 사용하는 경우도 드물다
- 대부분 기본값을 그대로 사용하기 때문에 strides 매개변수는 잘 사용하지 않는다

#### 풀링

풀링(pooling)
- 합성곱 층에서 만든 특성 맵의 가로세로 크기를 줄이는 역할

- 특성맵의 개수는 줄이지 않는다
- 특성 맵에 커널 없는 필터를 적용하는 것과 비슷

- 마지막 차원인 개수는 유지하고, 너비와 높이만 줄어든다

- 풀링도 합성곱처럼 입력 위를 지나가면서 도장을 찍음

- 하지만 풀링에는 가중치가 없다
- 도장을 찍은 영역에서 가장 큰 값을 고르거나 평균값을 계산
- 이를 각각 최대 풀링(max pooling)과 최소 풀링(min pooling)이라고 부름


- 합성곱 신경망에서는 합성곱 층과 풀링 층에서 출력되는 값을 모두 특성 맵이라고 부름

- 풀링 영역은 두 칸씩 이동함

- 합성곱에서는 커널이 한 칸씩 이동해서 겹치는 부분이 있었음
- 풀링에서는 겹치지 않고 이동 > 가로세로 두 칸씩 이동 > 스트라이드가 2

- 풀링은 가중치가 없고 풀링 크기와 스트라이드 크기가 같음

- 패딩도 없음

In [4]:
keras.layers.MaxPooling2D(2)

<MaxPooling2D name=max_pooling2d, built=True>

In [5]:
keras.layers.MaxPooling2D(2, strides = 2, padding = 'valid')

<MaxPooling2D name=max_pooling2d_1, built=True>

- 평균 풀링을 제공하는 클래스 > AveragePooling2D

- 최댓값 대신 평균을 계산하는 것을 제외하면 MaxPooling2D와 동일하며 제공하는 매개변수도 같음
- 많은 경우 평균 풀링보다 최대 풀링을 많이 사용
- 평균 풀링은 특성 맵에 있는 중요한 정보를 (평균하여) 희성시킬 수 있음

- 풀링은 가로세로 방향으로만 진행

- 특성 맵의 개수는 변하지 않고 그대로

### 합성곱 신경망의 전체 구조

- 풀링을 사용하는 이유 > 합성곱에서 스트라이드를 크게 하여 특성 맵을 줄이는 것보다 풀링 층에서 크기를 줄이는 것이 경험적으로 더 나은 성능을 냅

- 합성곱 신경망은 합성곱 층에서 특성 맵을 생성하고 풀링에서 크기를 줄이는 구조가 쌍을 이룬다