[딥러닝 자연어처리 입문](https://wikidocs.net/37406) 에서 참조한 이미지, 아래 이미지의 간단한 뉴럴넷을 직접 구현해 보면서 역전파 관련 궁금한 점들을 해결하려 함.
![image](backpropagation_my.jpg)

빨간색 사다리꼴 기준으로 가중치의 gradient를 계산함.  
__E->w = E->h * h->z * z->w__

In [18]:
# 라이브러리 임포트 및 사용 함수 정의
import numpy as np

def sigmoid(x) -> np.ndarray:
    z = 1/(1+np.exp(-x))
    return z

def MSE(target, output) -> np.ndarray:
    res = np.sum((target-output)**2)
    return res

In [19]:
# 데이터 정의
x = np.array([.1, .2])
W1 = np.array([[.3, .25],  # hidden1 - node1
               [.4, .35]]) # hidden1 - node2
W2 = np.array([[.45, .4],  # hidden2 - node1
               [.7, .6]])  # hidden2 - node2
W3 = np.array([[0.5, 0.4]]) # output - node

In [23]:
z1 = np.dot(x, W1.T)  # hidden1 result before activation function
h1 = sigmoid(z1)      # hidden1 result after activation function
z2 = np.dot(h1, W2.T) # hidden2 result before activation function
h2 = sigmoid(z2)      # hidden2 result after activation function
z3 = np.dot(h2, W3.T) # output result before activation function
output = sigmoid(z3)  # output
target = np.array([0.84])  # target

$\frac{\partial E}{\partial W1_{11}} = \frac{\partial E}{\partial h_{11}} \times \frac{\partial h_{11}}{\partial z_{11}} \times \frac{\partial z_{11}}{\partial W1_{11}}$

위에서 $\frac{\partial E}{\partial h_{11}}$를 계산하는 방법으로 다음과 같은 두 가지가 있다.

$\frac{\partial E}{\partial h_{11}} = \frac{\partial E}{\partial h_{21}} \times \frac{\partial h_{21}}{\partial z_{21}} \times \frac{\partial z_{21}}{\partial h_{11}}$

$\frac{\partial E}{\partial h_{11}} = \frac{\partial E}{\partial h_{22}} \times \frac{\partial h_{22}}{\partial z_{22}} \times \frac{\partial z_{22}}{\partial h_{11}}$

두 방법 모두 같은 값을 보내주는지, 확인해보려 함.

In [21]:
(1-sigmoid(z2))*sigmoid(z2) * W2[:, 0]

array([0.10710971, 0.15620839])

In [22]:
((1-sigmoid(z2))*sigmoid(z2) * W2[:, 0]) * W3

array([[0.05355485, 0.06248336]])

다른데? 다름... 평균을 내던가 하는건가.