# *합성곱 신경망*
 ## 2. 합성곱 계층

### 1) 완전연결 계층의 문제점

- 완전연결 계층의 문제점은 **'데이터의 형상이 무시'** 된다는 점임
- 입력데이터가 이미지인 경우 통상 세로/가로/색상으로 구성된 3차원 데이터를 1차원으로 평탄화 해 주어야만 함
- 실제로 MNIST에서 (1, 28, 28) 3차원 데이터를 평탄화 한 784개 데이터를 첫 Affine 계층에 입력함
- 이미지는 3차원 형상 정보이며 이 형상에는 소중한 공간적 정보가 담겨 있음 (공간적으로 가까운 픽셀은 유사하거나, RGB는 밀접하게 연관되어 있거나)
- 하지만 완결연결 계층은 모든 데이터를 한 차원의 동등한 뉴런으로 취급하여 형상 정보를 살릴 수 없음

- 반면 **Conv는 형상을 유지**
- 이미지도 3차원 데이터로 입력 받고, 다음 계층에도 3차원 데이터로 전달
- CNN의 합성곱 계층의 입출력 데이터를 **feature map(특징 맵)** 이라고 함

### 2) 합성곱 연산

- 합성곱 연산은 이미지 처리에서 말하는 **필터 연산**(또는 커널) 에 해당
![](image/fig 7-3.png)
- 위와 같이 입력 데이터에(4, 4) 필터를(3, 3) 적용하여  출력 데이터를(2, 2) 반환

- 연산 과정은 아래 그림과 같이 이루어짐
![](image/fig 7-4.png)
- 합성곱 연산은 필터의 **window(윈도우)**를 일정 간격으로 이동해가며 입력 데이터에 적용
- 연산은 각 필터에 대응하는 원소끼리 곱한 후 합을 더함 (이 과정을 **fused multiply-add, FMA (단일곱셈-누산)**이라 함)
- 위 그림의 첫번째 예를 보면 $1*2 + 2*0 + 3*1 + 0*0 + 1*1 + 2*2 + 3*1 + 0*0 + 1*2 = 15$ 계산을 수행
- 위 결과를 출력의 지정 위치에 저장하면 합성곱 연산이 완성

- CNN에서는 필터의 매개변수가 $w$(weight)에 해당
- 여기에 편향까지 더하면 아래와 같이 표현 가능
![](image/fig 7-5.png)

### 3) 패딩

- 패딩은 주로 출력 크기를 조정할 목적으로 사용
- 합성곱 연산의 출력은 (입력행수 - 필터행수 + 1) 을 사이즈로 갖는 행렬을 반환
- 결국 합성곱 연산을 거칠 때마다 크기가 작아지면서 어느 시점에는 출력 크기가 1이 될 수 밖에 없음
- 이를 방지하기 위해 주변을 특정 값(일반적으로 0)으로 채우는 과정을 **padding(패딩)**이라고 함

- 예를 들어 아래 그림은 (4,4) 크기의 입력 데이터에 폭이 1인 패딩을 적용한 모습임
![](image/fig 7-6.png)
- 위와 같이 (4,4)에 폭이 1인 패딩을 적용하여 (6,6)으로 사이즈를 변경하고, (3,3)필터를 적용하면 출력이 (4,4)크기의 행렬을 반환

### 4) 스트라이드

- 패딩이 입력데이터의 사이즈를 조정하여 출력데이터의 사이즈를 조정하는 반면, **stride(스트라이드)**는 필터를 적용하는 간격을 설정
- 그간 예제에서는 스트라이드를 1로만 적용해왔으니, 이를 2로 변경하면 아래와 같이 표현 가능
![](image/fig 7-7.png)
- 위 관계를 (입력크기 = H, 필터크기 = FH, 출력크기 = OH, 패딩 = P, 스트라이드 = S) 수식으로 표현하면 다음과 같음

$$
OH = \frac{H + 2P - FH}{S}+1
$$
- 패딩 예를 수식으로 표현하면 $OH = \frac{4 +(2*1)-3}{1}+1 = 4$로 표현 가능
- 위 스트라이드 예를 수식으로 표현하면 $OH = \frac{7 +(2*0)-3}{2} +1 = 3$로 표현 가능
- 주의할 점은 필터크기, 패딩, 스트라이드 값을 설정할 시에 **$OH = \frac{H + 2P -FH}{S}+1$로 정수를 출력**해야만 함 (오류 발생)
- 딥러닝 프레임워크 중에는 값이 딱 나누어 떨어지지 않을 때 가장 가까운 정수로 반올림하는 등 에러 발생을 방지하는 구현도 있음

### 5) 3차원 데이터의 합성곱 연산

- 이미지만 해도 세로, 가로, 색상(채널)까지 3차원 데이터임
- 3차원 데이터의 합성곱 연산은 아래 그림과 같이 수행
![](image/fig 7-9.png)
- 위의 예에서 볼 수 있듯이 입력데이터와 필터의 **채널수가 같아야 3차원 연산**이 가능
- 필터 자체의 크기는 원하는 값으로 설정 가능 위의 예에서는 (3,3)

### 6) 블록으로 생각하기

- 3차원 합성곱 연산은 데이터와 필터를 직육면체 블록으로 생각하면 편리
- 또한 3차원 데이터의 형상을 배열로 표현할 때는 **(Channel, Height, Width)** 순서로 표기
![](image/fig 7-10.png)
- 여기서 출력 데이터는 channel이 1인 형상으로 반환

- 합성곱 연산의 출력을 다수의 채널로 내보내기 위해서는 필터를 다수 사용하는 것으로 해결 가능
![](image/fig 7-11.png)
- 필터를 FN개 적용함에 따라 형상이 (FN, OH, OW)인 출력값 반환 가능
- 따라서 합성곱 연산에서는 필터의 수도 고려해야 함
- 여기에 편향까지 더한 모습은 아래와 같음
![](image/fig 7-12.png)


### 7) 배치 처리

- 합성곱 연산의 배치 처리는 아래와 같은 순서로 진행
![](image/fig 7-13.png)