# 11_DL from scratch - 오차의 역전파

# `XOR`

In [19]:
import numpy as np

X = np.array([[0,0,1],      # 같은 수가 두개이면 0 (0,0)
            [0,1,1],        # 다른 수가 두개이면 1 (0,1)
            [1,0,1],
            [1,1,1]])
D = np.array([[0],[1],[1],[0]])

W = 2*np.random.random((1,3)) -1

In [20]:
def sigmoid(x):
    return 1.0 / (1.0 + np.exp(-x))

In [21]:
def calc_output(W, x):
    v = np.matmul(W, x)
    y = sigmoid(v)

    return y

In [22]:
def calc_error(d, y):
    e = d - y
    delta = y * (1-y) * e

    return delta

In [23]:
def delta_GD(W, X, D, alpha):
    for k in range(4):
        x = X[k, :].T
        d = D[k]

        y = calc_output(W, x)
        delta = calc_error(d, y)

        dW = alpha * delta * x
        W = W + dW

    return W

In [24]:
# 학습
alpha = 0.9
for epoch in range(10000):
    W = delta_GD(W, X, D, alpha)

In [25]:
N = 4
for k in range(N):
    x = X[k, :].T
    v = np.matmul(W, x)
    y = sigmoid(v)

    print(y)

[0.52965337]
[0.5]
[0.47034663]
[0.44090112]


> ## 학습이 `안되었다.`

# `역전파`

### `XOR 극복하기`

![](./lecture_image/11-02.png)
> 역으로 올라가자

In [26]:
# output 계산 함수
def calc_output(W1, W2, x):
    v1 = np.matmul(W1, x)
    y1 = sigmoid(v1)
    v = np.matmul(W2, y1)   # 2번째 레이어로 들어간다.
    y = sigmoid(v)

    return y, y1

In [27]:
# 출력 층의 델타 계산
def calc_delta(d, y):
    e = d - y 
    delta = y * (1-y) * e

    return delta
            # 최종 출력단에 대한 에러를 계산하는 것

In [28]:
# 은닉층의 델타 계산
def calc_delta1(W2, delta, y1):
    e1 = np.matmul(W2.T, delta)
    delta1 = y1 * (1-y1) * e1

    return delta1

![](./lecture_image/11-01.png)

In [29]:
# 역전파 코드
def backprop_XOR(W1, W2, X, D, alpha):
    for k in range(4):
        x = X[k, :].T
        d = D[k]

        y, y1 = calc_output(W1, W2, x)
        delta = calc_delta(d, y)
        delta1 = calc_delta1(W2, delta, y1)

        dW1 = (alpha * delta1).reshape(4, 1) * x.reshape(1, 3)
        W1 = W1 + dW1

        dW2 = alpha * delta * y1
        W2 = W2 + dW2

    return W1, W2

In [30]:
X = np.array([
    [0,0,1],
    [0,1,1],
    [1,0,1],
    [1,1,1],
    
])

D = np.array([
    [0],[1],[1],[0]
])

In [31]:
W1 = 2*np.random.random((4,3)) - 1
                        # 노드가 4개 점이 3개
W2 = 2*np.random.random((1,4)) - 1
                        # 노드가 4개 점이 1개

> ![](./lecture_image/11-02.png)

In [32]:
alpha = 0.9
for epoch in range(10000):
    W1, W2 = backprop_XOR(W1, W2, X, D, alpha)

In [33]:
N  = 4
for k in range(N):
    x = X[k, :].T
    v1 = np.matmul(W1, x)
    y1 = sigmoid(v1)
    v = np.matmul(W2, y1)
    y = sigmoid(v)

    print(y)

[0.00748409]
[0.99050981]
[0.99123247]
[0.01090682]


> ## XOR도 완벽하게 `해결`할 수 있게 되었다.