## 행렬과 신경망

In [1]:
import numpy as np

In [2]:
# 1층
# x : 입력값
# w : 가중치
# b : 편향
x = np.array([1.0, 0.5])
w1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
b1 = np.array([0.1, 0.2, 0.3])

In [3]:
z1 = np.dot(x, w1) + b1
z1

array([0.3, 0.7, 1.1])

In [4]:
# 활성화 함수( 시그모이드 )
def sigmoid(x):
    return 1 / (1+ np.exp(-x))

In [6]:
a1 = sigmoid(z1)
a1

array([0.57444252, 0.66818777, 0.75026011])

In [8]:
# 2층
w2 = np.array([[0.1, 0.4],[0.2, 0.5], [0.3, 0.6]])
b2 = np.array([0.1, 0.2])

In [9]:
# 내적 가능한지 확인
print(a1.shape, w2.shape)

(3,) (3, 2)


In [11]:
z2 = np.dot(a1, w2) + b2
a2 = sigmoid(z2)
a2

array([0.62624937, 0.7710107 ])

In [13]:
# 출력층

# 항등함수
# 보통 회귀에서 사용
def identity_function(x):
    return x
w3 = np.array([[0.1, 0.3], [0.2, 0.4]])

b3 = np.array([0.1, 0.2])

In [14]:
a2.shape, w3.shape

((2,), (2, 2))

In [15]:
z3 = np.dot(a2, w3) + b3
y = identity_function(z3)
y

array([0.31682708, 0.69627909])

In [20]:
# 최종 구현
def init_network():
    
    # 네트워크 초기화 과정
    # 네트워크 초기화 되면 일반적으로 정규분표 * 0.01 정도의 랜덤값으로 초기화
    # 다른 방법으로 카이밍 히(He 초기값) 또는 사비에르(Xavier) 초깃값을 사용한다.
        # 활성화 함수에 따라 
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    
    return network

# 순전파 과정
def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    
    z1 = np.dot(x, W1) + b1
    a1 = sigmoid(z1)
    
    z2 = np.dot(a1, W2) + b2
    a2 = sigmoid(z2)
    
    z3 = np.dot(a2, W3) + b3
    y  = identity_function(z3)
    
    return y

In [21]:
network = init_network()

x = np.array([1.0, 0.5])

y = forward(network, x)

y

array([0.31682708, 0.69627909])