# Convolutional Neural Network Backpropagation

## 0. 배경

### 1) CNN
Convolutional Neural Network (CNN)
1. parameter sharing : 하나의 파트에서 수직 성분 추출하는 필터라면, 다른 파트에서도 해당 필터가 잘 적용될 수 있음 
    - 이로 인해, 이동된 이미지도 같은 이미지로 잘 인식됨 (=traslation invariance)
    - 이로 인해, 모델이 단순화되어 overfitting을 줄일 수 있음
    
    
    
2. 의존성 완화(Sparsity of connections) : output의 한 픽셀마다 영향을 받는 input 픽셀 수가 적음

### 2) CNN Forward Pass

- **목적** : 필터(행렬)로 데이터를 찍어내어 어떠한 특징을 나타내는 행렬을 추출


- **방법**
    - Notation
        - $n_H$, $n_W$, $n_C$ : 특정 layer의 데이터 높이, 너비, 채널 수
        - $[l]$ : $l$ 번째 layer
        - exmaple : $n_C^{[l]}$ -> $l$번째 layer의 채널 수

<center>
<video width="620" height="440" src="conv_kiank.mp4" type="video/mp4" controls>
</video>
</center>

### 3) CNN Backpropagation

- **목적** : 네트워크의 예측값(A)과 실제값(Y)의 차이인 loss값을 최소화하기 위함 
- **방법** : loss(L)를 parameter(W)에 대해 미분한 gradient값(dW)을 가지고, parameter를 update(W=W-a*dW) -> dW 구하기가 중요!
- **특징** : 현재는 딥러닝 프레임워크를 이용하며, backpropagation을 직접 구현할 필요는 없음

## 1. 설명

**참고영상**

https://youtu.be/z9hJzduHToc?feature=shared


(직관적으로 이해하기 쉽습니다)

![image-7.png](attachment:image-7.png)
![image-3.png](attachment:image-3.png)
![image.png](attachment:image.png)
![image-6.png](attachment:image-6.png)
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)
![image-4.png](attachment:image-4.png)
![image-5.png](attachment:image-5.png)


![image-8.png](attachment:image-8.png)
![image-9.png](attachment:image-9.png)

## 2. 적용

**dW 계산하기**

$$dW_c  \mathrel{+}= \sum _{h=0} ^{n_H} \sum_{w=0} ^ {n_W} a_{slice} \times dZ_{hw}$$
- A : conv layer의 output (=Z)가 활성화함수(=activation function)을 거친 결과값 (즉, 예측값) & conv layer의 input 값
- a_{slice} : A의 하나의 채널의 하나의 slice
- $W_c$ : 필터의 c번째 채널 (=weight 행렬)
- $Z_{hw}$ : conv layer의 output의 h번째 행, w번째 열 값
- $dZ_{hw}$ : $Z_{hw}$ 의 cost에 대한 gradient 값

In [None]:
dW[:,:,:,c] += a_slice * dZ[i, h, w, c]
db[:,:,:,c] += dZ[i, h, w, c]

In [None]:
import numpy as np
import h5py
import matplotlib.pyplot as plt

np.random.seed(1)

conv_backward(dZ, cache):
    for i in range(m): 
        for h in range(n_H): 
            for w in range(n_W): 
                for c in range(n_C):
                    dW[:,:,:,c] +=
                    db[:,:,:,c] +=