# cross-entropy 함수를 사용하는 이진 분류 문제 backpropagation

## XOR 데이터

In [15]:
import numpy as np

X = np.array([
    [0, 0, 1],
    [0, 1, 1],
    [1, 0, 1],
    [1, 1, 1]
])

D = np.array([
    [0], [1], [1], [0]
])

# 가중치 랜덤 설정
W1 = 2 * np.random.random((4, 3)) -1
W2 = 2 * np.random.random((1, 4)) -1

## 시그모이드 함수

In [16]:
def sigmoid(x) :
    return 1.0 / (1.0 + np.exp(-x))

## 모델의 순방향 연산 함수 정의

In [17]:
def calc_output(W1, W2, x) :
    v1 = np.matmul(W1, x)
    y1 = sigmoid(v1)        # 은닉층에서의 sigmoid 함수 결과값 : (4,1)
    v = np.matmul(W2, y1)
    y = sigmoid(v)          # 출력층에서의 sigmoid 함수 결과값 : (1,1)

    return y, y1

## 델타 계산 함수
- 모델의 출력값과 실제값 사이의 오차를 계산하여 delta 얻기
- cross-entropy 함수 사용

In [18]:
def calcDelta_ce(d, y) :
    e = d - y
    delta = e

    return delta

## 역전파 시 은닉층에서 delta 계산하는 함수 정의
- 은닉층에서의 미분이므로 시그모이드 함수에 대한 미분 활용

In [19]:
def calcDelta1_ce(W2, delta, y1) :
    e1 = np.matmul(W2.T, delta)
    delta1 = y1 * (1 - y1) * e1

    return delta1

## 역전파 수행

In [20]:
def BackpropCE(W1, W2, X, D, alpha) :
    for k in range(4) :     # 은닉층의 뉴런이 4개이므로
        x = X[k, :].T
        d = D[k]

        y, y1 = calc_output(W1, W2, x)  # y1 : 은닉층 결과값 / y : 출력층 결과값
        delta = calcDelta_ce(d, y)      # 출력층과 실제값 간의 오차를 통해 계산된 delta 값
        delta1 = calcDelta1_ce(W2, delta, y1)   # delta와 출력층과 은닉층 사이의 가중치의 연산을 통해 계산된 delta값

        dW1 = (alpha*delta1).reshape(4, 1) * x.reshape(1, 3)
        W1 = W1 + dW1   # W1(입력층과 은닉층 사이의 가중치) 업데이트

        dW2 = alpha * delta * y1
        W2 = W2 + dW2   # W2(은닉층과 출력층 사이의 가중치) 업데이트

    return W1, W2

## 학습

In [21]:
alpha = 0.9
for epoch in range(10000) :
    W1, W2 = BackpropCE(W1, W2, X, D, alpha)

## 학습 완료된 가중치로 순방향연산 다시 수행

In [22]:
N = 4
for k in range(N) :
    x = X[k, :].T
    v1 = np.matmul(W1, x)
    y1 = sigmoid(v1)
    v = np.matmul(W2, y1)
    y = sigmoid(v)

    print(y)

[7.92973875e-05]
[0.9997761]
[0.99985421]
[0.00033198]
