# Backpropagtion

## 단순계층 구현하기
모든계층은 forward()와 backward()라는 공통의 메서드(인터페이스)를  갑ㅈ도록 구현할 것.
forward()는 순전파, backward()은 역전파.

### 1. 곱셈계층

In [1]:
class MlLayer:
    def __init__(self):
        self.x = None
        self.y = None
    def forward(self, x,y):
        self.x = x
        self.y = y
        out = x*y
        return out
    def backward(self,dout):
        dx = dout*self.y
        dy = dout*self.x
        return dx,dy

### 2. 덧셈계층

In [2]:
class AddLayer:
    def __init__(self):
        pass
    def forward(self,x,y):
        out = x+y
        return out
    def backward(self,dout):
        dx = dout *1
        dy = dout*1
        return dx,dy

## 활성화 함수 계층 구현하기

### 1. ReLU 계층

$$y = \begin{cases}{ x\;(\;>\;0)}\\ {0\;(\leq\;0)}\end{cases}$$

$${\frac{\partial y}{\partial x}} = \begin{cases} {1\;(x>\;0)}\\{0\;(\leq\;0)}\end{cases}$$

In [3]:
class ReLU:
    def __init__(self):
        self.mask=None
    def forward(self,x):
        self.mask = (x<=0)
        out = x.copy()
        out[self.mask]=0
        return out
    def backward(self,dout):
        dout[self.mask]=0
        dx =dout
        return dx

### 2. Sigmoid 계층

$$y = \frac{1}{1+exp(-x)} $$

$$ \frac{\partial y}{\partial x} = -\frac{1}{x^2} = -y^2 $$
  
$$\frac{\partial exp(x)}{\partial x} = exp(x)$$

$$\therefore \;\frac{\partial L}{\partial y}y^2exp(-x)\;=\; \frac{\partial L}{\partial y}y(1-y)$$

이처럼 Sigmoid 계층의 역전파는 순전파의 출력 y만으로 계산할 수 잇음.

순전파의 출력을 인스턴스 변수 out에 보관했다가 역전파 때 사용하는걸 알 수 있음.

In [4]:
class Sigmoid:
    def __init__(self):
        self.out = None
    def forward(self,x):
        out = 1/(1+np.exp(-x))
        self.out = out
        return out
    def backward(self,dout):
        dx = dout *(1.0 - self.out)*self.out
        return dx

## 3. Affine/Softmax 계층 구현하기

행렬곱은 기하학에서 Affine transformation이라고함.

In [5]:
import numpy as np
class Affine:
    def __init__(self,W,b):
        self.W=W
        self.b=b
        self.x =None
        self.dW = None
        self.db = None
    def forward(self,x):
        self.x = x
        out = np.dot(x, self.W)+ self.b
        return out
    
    def backward(self,dout):
        dx = np.dot(dout,self.W.T)
        self.dW = np.dot(self.x.T,dout)
        self.db = np.sum(dout, axis=0)
        return dx

### 4. Softmax-with-Loss 계층

softmax는 분류문제 (classification problem)에서 사용. 소프트맥스함수의 손실함수로 교차 엔트로피 오차를 사용하니, 역전파가 y_1 - t_1로 깔끔히 떨어짐.

In [None]:
class SoftmaxWithLoss:
    def __init__(self):
        self.loss = None #손실함수
        self.y = None #softmax의 출력
        self.t = None #정답 레이블(원-핫 인코딩)
    def forward(self,,x,t):
        self.t=tself.y=softmax(x)
        self.loss = cross_entropy_error(self.y,self.t)
        return self.loss
    def backward(self,dout=1):
        batch_size=self.t.shape[0]
        dx = (sself.y-self.t)/batch_size
        return dx