다층 퍼셉트론
===
## 1. 다층 퍼셉트론의 설계
* 단일 퍼셉트론으로는 XOR 문제를 해결할 수 없음.
  * 예를 들어, 성냥개비 여섯 개로 정삼각형 네 개를 만들기 위해서는,   
  → **2차원 평면**이 아닌 __3차원의 정사면체__ 모양으로 쌓아 해결.
* XOR 문제를 극복하는 것 역시 평면을 휘어주면서 해결.
* 다층 퍼셈트론 : 좌표 평면 자체에 변화를 주는 것으로 XOR 문제를 해결.
* 은닉층(hidden layer)을 만들면 우리는 두 개의 퍼셉트론을 한 번에 계산할 수 있게 됨.
* 가운데 숨어있는 은닉층으로 퍼셉트론이 각각 자신의 가중치$w$와 바이어스$b$ 값을 보냄.
* 이 은닉층에 모인 값이 시그모이드 함수$(\sigma)$를 이용해 최종 값으로 결과를 보냄.
* 노드(node) : 은닉층에 모이는 중간 정거장.
## 2. XOR 문제의 해결
* 은닉층의 노드 $n_1$과 $n_2$의 값은 각각 단일 퍼셉트론의 값과 같음
$$n_1 = \sigma(x_1w_{11} + x_2w_{21} + b_1)$$
$$n_2 = \sigma(x_1w_{12} + x_2w_{22} + b_2)$$
* $n_1, n_2$ 결과값이 출력층으로 보내짐.
* 출력층에서는 역시 시그모이드 함수를 통해 $y$값이 정해짐.
  * 이 값을 $y_{out}$이라 할 때 식으로 표현하면 다음과 같음.
$$y_{out}=\sigma(n_1w_{31} + n_2w_{32} + b_3)$$
</br>

* 이제 각각의 가중치 $w$와 바이어스 $b$의 값을 정할 차례.
* 2차원 배열로 늘어놓으면 다음과 같이 표시할 수 있음.
  * 은닉층을 포함해 가중치 6개와 바이어스 3개.
$$W(1) = \begin{bmatrix} w_{11} \ w_{12} \\ w_{21} \ w_{22} \end{bmatrix} \quad B(1) = \begin{bmatrix} b_1 \\ b_2 \end{bmatrix}$$
$$W(2) = \begin{bmatrix} w_{31} \\ w_{22} \end{bmatrix} \quad B(2) = \begin{bmatrix} b_3 \end{bmatrix}$$
* NAND(Negative AND)게이트 : AND 게이트의 정반대 값을 출력함.
* NAND 게이트와 OR 게이트, 이 두가지를 내재한 각각의 퍼셉트론이 다중 레이어 안에서 각각 작동하고, 이 두가지 값에 대해 AND 게이트를 수행한 결과 값이 $y_{out}$.
  * 숨어있는 2개의 노드를 둔 다층 퍼셉트론을 구성해 XOR 문제를 해결할 수 있음.
## 3. 코딩으로 XOR 문제 해결하기

In [6]:
import numpy as np

# 가중치(w11, w12, w2)와 바이어스(b1, b2, b3)
w11 = np.array([-2, -2])
w12 = np.array([2, 2])
w2 = np.array([1, 1])
b1 = 3
b2 = -1
b3 = -1

# 퍼셉트론 함수 정의 : 0 또는 1을 출력
def MLP(x, w, b) :
    y = np.sum(w * x) + b
    if y <= 0 :
        return 0
    else :
        return 1

# NAND 게이트
def NAND(x1, x2) :
    return MLP(np.array([x1, x2]), w11, b1)

# OR 게이트
def OR(x1, x2) :
    return MLP(np.array([x1, x2]), w12, b2)

# AND 게이트
def AND(x1, x2) :
    return MLP(np.array([x1, x2]), w2, b3)

# XOR 게이트
def XOR(x1, x2) :
    return AND(NAND(x1, x2), OR(x1, x2))

In [7]:
# x1, x2 값을 번갈아 대입해 가며 최종값 출력
if __name__ == '__main__' :
    for x in [(0, 0), (1, 0), (0, 1), (1, 1)] :
        y = XOR(x[0], x[1])
        print(f"입력 값 : {str(x)} 출력값 : {str(y)}")

입력 값 : (0, 0) 출력값 : 0
입력 값 : (1, 0) 출력값 : 1
입력 값 : (0, 1) 출력값 : 1
입력 값 : (1, 1) 출력값 : 0
