# 역전파 과정 코딩하기

신경망 모형에서는 역전파 과정을 통해 파라미터를 업데이트하여 성능을 높입니다.  
파이토치 프레임워크에서는 손실함수를 정의하고 `loss.backward()` 와 같은 메서드로 쉽게 역전파가 가능하지만, 이해가 부족했고 직접 해볼 필요성을 느껴서 파이토치의 텐서를 이용하여 역전파 과정을 짜보고자 합니다.

참고 : https://www.youtube.com/watch?v=B3VG-TeO9Lk&list=PLQ28Nx3M4JrhkqBVIXg-i5_CVVoS1UzAv&index=7

### 과정
1. input layer에 feature의 수만큼 노드를 생성
2. N 개의 hidden layer에 직접 노드를 생성
3. 각 hidden layer를 통과할 때마다 활성화 함수를 거침
4. output layer에 얻고 싶은 결과에 따라 노드를 생성
5. chain rule에 의해 gradient 값을 구하고 gradient descent 방법으로 파라미터 업데이트
6. 위의 과정 반복

In [1]:
import torch

In [5]:
torch.__version__
device = "cpu"

In [16]:
# input layer 
X = torch.Tensor([[0,0], [0,1], [1,0], [1,1]]).to(device)
y = torch.Tensor([[0], [1], [1], [0]]).to(device)

# weight & bias
w1 = torch.Tensor(2,2).to(device)
b1 = torch.Tensor(2).to(device)
w2 = torch.Tensor(2,1).to(device)
b2 = torch.Tensor(1).to(device)

# Activation function
def sigmoid(x):
    return 1 / (1+torch.exp(-x))

# Activation function prime
def sigmoid_p(x):
    return sigmoid(x) * (1-sigmoid(x))

# Loss function (binary cross entropy)
def loss(y, y_pred):
    return torch.mean(y * torch.log(y_pred) + (1-y) * torch.log(1-y_pred))

**Sigmoid**
$$ sigmoid(x) = \frac{1}{1+e^{-x}}$$  
$$ \frac{d}{dx}sigmoid(x) = \frac{1}{1+e^{-x}} \times \frac{e^{-x}}{1+e^{-x}}$$ 

**Binary Cross Entropy**
$$ Loss = -\frac{1}{N}\Sigma{y_i\cdot log(p(y_i)) + (1-y_i)\cdot log(1-p(y_i))} $$



In [None]:
EPOCH = 10000
for epoch in range(1,EPOCH+1):
    # 순전파 
    weight1 = torch.add(torch.matmul(X,w1),b1) # w1x + b1
    hidden = sigmoid(weight1)
    weight2 = torch.add(torch.matmul(hidden,w2),b2)
    y_pred = sigmoid(weight2)
    
    loss = loss(y,y_pred)
    
    #역전파
    d_loss = y/pred_y - (1-y)/(1-pred_y)
    d_loss = d_loss * sigmoid_p(pred_y)
    d_w2 = sigmoid_p()

**Chain Rule**
$$ \frac{\partial Loss}{\partial w} = \frac{\partial Loss}{\partial s} \cdot \frac{\partial p(y)}{\partial y} \cdot \frac{\partial y}{\partial w} $$