### 넘파이를 이용한 MLP 구현(역전파 기능 추가)

순방향 전파(p201 코드와 동일)

In [None]:
import numpy as np

# 시그모이드 함수
def actf(x):
	return 1/(1+np.exp(-x))

# 시그모이드 함수의 미분치
def actf_deriv(x):
	    return x*(1-x)

# 입력 유닛의 개수, 은닉 유닛의 개수, 출력 유닛의 개수
inputs, hiddens, outputs = 2, 2, 1
learning_rate=0.2

# 훈련 샘플과 정답
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
T = np.array([[1], [0], [0], [1]])

W1 = np.array([[0.10,0.20], [0.30,0.40]])
W2 = np.array([[0.50],[0.60]])
B1 = np.array([0.1, 0.2])
B2 = np.array([0.3])   

# W1 = 2*np.random.random((inputs, hiddens)) - 1   
# W2 = 2*np.random.random((hiddens, outputs)) - 1   
# B1 = np.zeros(hiddens)   
# B2 = np.zeros(outputs)

# 순방향 전파 계산
def predict(x):
        layer0 = x			# 입력을 layer0에 대입한다. 
        Z1 = np.dot(layer0, W1)+B1	# 행렬의 곱을 계산한다. 
        layer1 = actf(Z1)		# 활성화 함수를 적용한다. 
        Z2 = np.dot(layer1, W2)+B2	# 행렬의 곱을 계산한다. 
        layer2 = actf(Z2)		# 활성화 함수를 적용한다. 
        return layer0, layer1, layer2

역방향 전파 계산

In [None]:
def fit():
    global W1, W2, B1, B2		# 우리는 외부에 정의된 변수를 변경해야 한다. 
    cnt = 0
    for i in range(90000):		# 9만번 반복한다. 
        for x, y in zip(X, T):		# 학습 샘플을 하나씩 꺼낸다. 
            x = np.reshape(x, (1, -1))	# 2차원 행렬로 만든다. ①
            y = np.reshape(y, (1, -1))	# 2차원 행렬로 만든다. 

            layer0, layer1, layer2 = predict(x)			# 순방향 계산
            layer2_error = layer2-y				# 오차 계산
            layer2_delta = layer2_error*actf_deriv(layer2)	# 출력층의 델타 계산 
            layer1_error = np.dot(layer2_delta, W2.T)		# 은닉층의 오차 계산 ②
            layer1_delta = layer1_error*actf_deriv(layer1)	# 은닉층의 델타 계산 ③
            
            W2 += -learning_rate*np.dot(layer1.T, layer2_delta)	# ④
            W1 += -learning_rate*np.dot(layer0.T, layer1_delta)	# 
            B2 += -learning_rate*np.sum(layer2_delta, axis=0)	# ⑤
            B1 += -learning_rate*np.sum(layer1_delta, axis=0)	# 
            
            cnt += 1
            if cnt % 3000 == 0 :    # 3000번에 한번씩 출력
                print(W1, W2, B1, B2)

In [None]:
def test():
    for x, y in zip(X, T):
        x = np.reshape(x, (1, -1))	# 하나의 샘플을 꺼내서 2차원 행렬로 만든다. 
        layer0, layer1, layer2 = predict(x)
        print(x, y, layer2)		# 출력층의 값을 출력해본다. 

In [None]:
fit()

In [None]:
test()

도전문제 (3)   
XOR, OR, AND 연산도 학습시켜 본다.   
T를 바꾸어 보자. 거기에 맞는 오차역전파를 수행하여 W1, W2, B1, B2를 구하는 것을 확인할 수 있다.

도전문제 (6)   
가중치를 -1.0에서 1.0 사이로 난수로 초기화하여 실행해보자.   
W1 = 2*np.random.random((inputs, hiddens)) - 1   
W2 = 2*np.random.random((hiddens, outputs)) - 1   
B1 = np.zeros(hiddens)   
B2 = np.zeros(outputs)