In [3]:
# 신경망에 계산 그래프를 적용해보자.
# 신경망을 구성하는 층(계층) 각각을 클래스 하나로 구현한다.
# 우선 활성화 함수인 ReLU와 Sigmoid 계층을 구현해보자.

import numpy as np

In [5]:
# ReLU 계층
# x>0 때 y=x, x<=0일때 y=0
# 미분 시 x>0일때 y=1, x<=0일떄 y=0

class ReLU:
    def __init__(self):
        self.mask = None # x가 0 이하면 True, 0 초과면 False를 할당하는 넘파이 배열
    
    def forward(self, x):
        self.mask = (x <= 0) # 괄호 안의 값에 따라 True or False를 할당한다
        out = x.copy() 
        out[self.mask] = 0
        
        return out
    
    def backward(self, dout):
        dout[self.mask] = 0
        dx = dout
        
        return dx
    
x = np.array([[1.0, -0.5], [-2.0, 3.0]])
print(x)

mask = (x <=0)
print(mask) # 1.0, 3.0에는 False를, -0.5, -2.0에는 True를 할당


# ReLU 계층은 전기 회로의 '스위치'에 비유할 수 있다. 순전파때 전류가 흐르고 있으면 스위치를 ON하고, 흐르지 않으면 OFF한다. 역전파때는 스위치가 ON이면 전류가 그대로 흐르고, 스위치가 OFF면 전류가 흐르지 않는다.

[[ 1.  -0.5]
 [-2.   3. ]]
[[False  True]
 [ True False]]


In [8]:
# Sigmoid 계층
# *, exp, +, / 연산이 사용된다.
# 1/x 미분은 -x^2과 같다.
# exp(x) 미분은 exp(x)이다. 
# 자세한 역전파 과정은 책을 참조하자.

class Sigmoid:
    def __init__(self):
        self.out = None
    
    # 순전파
    def forward(self, x):
        out = 1 / (1 + np.exp(-x)) # 시그모이드 함수식
        self.out = out
        
        return out
    
    # 역전파
    def backward(self, dout):
        dx = dout * (1.0 - self.out) * self.out # (출력값 미분)*(-y(1-y))로 간소화 할 수 있다.
        
        return dx