In [4]:
def step(x):
    return np.array(x > 0, dtype=np.int)

In [5]:
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

In [11]:
def ReLU(x):
    return np.maximum(0,x)

In [12]:
def ident(x):
    return x 

# 신경망 구현

3층 신경망을 구현해 봅시다. 두 개의 입력 뉴런 $x_1$, $x_2$, 3개의 1층 뉴런 $a_1^{(1)}$, $a_2^{(1)}$, $a_3^{(1)}$, 2개의 2층 뉴런 $a_1^{(2)}$, $a_2^{(2)}$, 마지막으로 두 개의 출력 뉴런 $y_1$, $y_2$으로 이루어져 있습니다. 1층과 2층의 뉴런은 적절한 활성화 함수 $h()$를 통해 $z_i^{(j)}$로 재해석됩니다. 또한 다음층으로 넘어갈 때에는 적절한 가중치 $w_{i,i+1}^{(j)}$와 편향 $b_i^{(j)}$이 적용됩니다.

이를 행렬곱으로 표현해 봅시다. $X = \begin{bmatrix} x_1 & x_2\end{bmatrix}$, 를 각각 입력 뉴런 벡터라 하고, 
$$W^{(1)} = \begin{bmatrix} w_{11}^{(1)} & w_{12}^{(1)} & w_{13}^{(1)} \\
w_{21}^{(1)} & w_{22}^{(1)} & w_{23}^{(1)} \end{bmatrix},\quad B^{(1)} = [b_1^{(1)}, b_2^{(1)}, b_3^{(1)}]$$
를 각각 1층에서 2층으로의 가중치 벡터, 편향 벡터라 합시다. 이때, 1층 뉴런 벡터 $A^{(1)} = \begin{bmatrix} a_1^{(1)} & a_2^{(1)} & a_3^{(1)}\end{bmatrix}$는 다음과 같이 계산됩니다.
$$A^{(1)} = XW^{(1)} + B^{(1)}$$

In [15]:
import numpy as np

# 입력층에서 1층으로
X = np.array([1., 1.5])
W1 = np.array([[.1, .3, .5], [.2, .4, .6]])
B1 = np.array([.1, .2, .3])

A1 = np.dot(X, W1) + B1 # 1층 뉴런 계산
Z1 = sigmoid(A1) # Sigmoid 활성화 함수

이 후에도 위와 비슷한 방식으로 적용합니다.

In [13]:
# 1층에서 2층 뉴런으로
W2 = np.array([[.1, .4], [.2, .5], [.3, .6]])
B2 = np.array([.1, .2])

A2 = np.dot(Z1, W2) + B2
Z2 = sigmoid(A2)

# 2층에서 3층(출력층)으로
W3 = np.array([[.1, .3], [.2, .4]])
B3 = np.array([.1, .2])

A3 = np.dot(Z2, W3) + B3
Y = ident(A3)

이를 함수로 정리해 봅시다

In [17]:
def init_network():
    network = {}
    network['W1'] = np.array([[.1, .3, .5], [.2, .4, .6]])
    network['B1'] = np.array([.1, .2, .3])
    network['W2'] = np.array([[.1, .4], [.2, .5], [.3, .6]])
    network['B2'] = np.array([.1, .2])
    network['W3'] = np.array([[.1, .3], [.2, .4]])
    network['B3'] = np.array([.1, .2])
    
    return network

def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    B1, B2, B3 = network['B1'], network['B2'], network['B3']

    A1 = np.dot(x, W1) + B1
    Z1 = sigmoid(A1)
    A2 = np.dot(Z1, W2) + B2
    Z2 = sigmoid(A2)
    A3 = np.dot(Z2, W3) + B3
    Y = ident(A3)
    
    return Y

network = init_network()
x = np.array([1., .5])
y = forward(network, x)
print(y)

[0.31682708 0.69627909]
