# 5.5 활성화 함수 계층 구현하기  

계산 그래프를 신경망에 적용해 보자  
신경망을 구성하는 계층 각각을 클래스 하나로 구현해보았다.  
우선 활성화 함수인 ReLU와 Sigmoid 꼐층을 구현해 보자.  

## 5.5.1 ReLU 계층  

ReLU의 수식과 이에대한 미분은 다음과 같다.  

<img src = "./image/e_5_7.png">
<img src = "./image/e_5_8.png">  

순전파 때의 입력인 x가 0보다 크면 역전파는 상류의 값을 그대로 하류로 흘린다.  
반대로 0 이하이면 하류로 신호를 보내지 않는다.  이를 계산 그래프로 나타내면 다음과 같다.  

<img src = "./image/fig_5_18.png" width="40%">

ReLU를 구현해보자.  

In [2]:
class Relu:
    def __init__(self):
        self.mask = None
    
    def forward(self, x):
        self.mask = (x <= 0)
        out = x.copy()
        out[self.mask] = 0

        return out

    def backward(self, dout):
        dout[self.mask] = 0
        dx = dout
        
        return dx

In [2]:
import numpy as np

x=np.array([[1.0,-0.5], [-2.0, 3.0]])
print(x)

mask = (x<=0)
print(mask)

[[ 1.  -0.5]
 [-2.   3. ]]
[[False  True]
 [ True False]]


순전파 때의 입력이 0이하이면 역전파 때의 값 = 0  
ReLU 계층은 전기 회로의 스위치와 비슷한 역할을 한다.  

## 5.5.2 Sigmoid 계층  

시그모이드 함수의 수식은 다음과 같다.  

<img src="./image/e_5_9.png">  

이를 계산그래프로 그리면 다음과 같다.  

<img src = "./image/fig_5_19.png" width = "40%">  

'/'노드의 경우 미분하면 다음 식이 된다. (y = 1/x)  

<img src = "./image/e_5_10.png">  

위 식에 따르면 역전파 때는 상류에서 흘러온 값에 -y^2(순전파의 출력을 제곱한 후 마이너스를 붙인 값)을 곱해서 하류로 전달한다.  
계산 그래프는 다음과 같다.  

<img src ="./image/fig_5_20.png" width = "40%">  

여기서 exp 함수의 미분값은 (exp(x))' = exp(x) 이므로 위와 같이 나타낼 수 있다.  

값을 보면 x와 y의 값으로만 표현이 가능하다. 이를 간소화 하여 나타내면 다음과 같다. 

<img src = "./image/fig_5_21.png">  

다음과 같은 방법으로 y로만 표현도 가능하다.  

<img src = "./image/e_5_12.png" width="40%">  

파이썬으로 sigmoid 함수를 구현해보자  