# 퍼셉트론: Perceptron

## 1. 퍼셉트론: Perceptron
* 퍼셉트론(Perceptron)은 프랑크 로젠블라트(Frank Rosenblatt)가 1957년에 제안한 초기 형태의 인공 신경망으로 다수의 입력으로부터 하나의 결과를 내보내는 알고리즘
* 퍼셉트론은 실제 뇌를 구성하는 신경 세포 뉴런의 동작과 유사합니다.

    ![image.png](attachment:image.png)
    ![image-2.png](attachment:image-2.png)
* 각 입력값이 가중치와 곱해져서 인공 뉴런에 보내지고, 그 값의 전체 합이 임계치(threshold)를 넘으면 종착지에 있는 인공 뉴런은 1을 출력하고 아니면 0을 출력합니다.

    ![image-3.png](attachment:image-3.png)
    ![image-4.png](attachment:image-4.png)
* 편향 b(bias)로도 표현 가능합니다.

    ![image-5.png](attachment:image-5.png)
    ![image-6.png](attachment:image-6.png)

## 2. 단층 퍼셉트론: Single-Layer Perceptron
* 초기엔 단층 퍼셉트론은 간단한 XOR 게이트조차도 구현할 수 없는 인공 신경망이라고 지적 받았습니다.
* 단층 퍼셉트론의 식을 통해 AND 게이트를 만족하는 두 개의 가중치와 편향 값에는 뭐가 있을까요? 
* 각각 w1, w2, b라고 한다면 [0.5, 0.5, -0.7], [0.5, 0.5, -0.8] 또는 [1.0, 1.0, -1.0] 등 이 외에도 다양한 가중치와 편향의 조합이 나올 수 있습니다.

    ![image-3.png](attachment:image-3.png)
    ![image-2.png](attachment:image-2.png)
* 하지만, 아래의 파이썬 코드에 아무리 수많은 가중치와 편향을 넣어봐도 XOR 게이트를 구현하는 것은 불가능합니다. 
* 그 이유는 단층 퍼셉트론은 직선 하나로 두 영역을 나눌 수 있는 문제에 대해서만 구현이 가능하기 때문입니다.

    ![image.png](attachment:image.png)

In [1]:
def AND_gate(x1, x2):
    w1 = 0.5
    w2 = 0.5
    b = -0.7
    result = x1*w1 + x2*w2 + b
    if result <= 0:
        return 0
    else:
        return 1

In [2]:
AND_gate(0, 0), AND_gate(0, 1), AND_gate(1, 0), AND_gate(1, 1)

(0, 0, 0, 1)

In [3]:
def NAND_gate(x1, x2):
    w1 = -0.5
    w2 = -0.5
    b = 0.7
    result = x1*w1 + x2*w2 + b
    if result <= 0:
        return 0
    else:
        return 1

In [5]:
NAND_gate(0, 0), NAND_gate(0, 1), NAND_gate(1, 0), NAND_gate(1, 1)

(1, 1, 1, 0)

In [6]:
def OR_gate(x1, x2):
    w1 = 0.6
    w2 = 0.6
    b = -0.5
    result = x1*w1 + x2*w2 + b
    if result <= 0:
        return 0
    else:
        return 1

In [7]:
OR_gate(0, 0), OR_gate(0, 1), OR_gate(1, 0), OR_gate(1, 1)

(0, 1, 1, 1)

## 3. 다층 퍼셉트론: MultiLayer Perceptron, MLP
* XOR 게이트는 기존의 AND, NAND, OR 게이트를 조합하면 만들 수 있습니다. 퍼셉트론 관점에서 말하면 층을 더 쌓으면 만들 수 있습니다. 
* 단층 퍼셉트론은 입력층과 출력층만 존재하지만, 다층 퍼셉트론은 그 사이에 은닉층(hidden layer)이 존재합니다.

    ![image.png](attachment:image.png)
* 아래와 같이 은닉층이 2개 이상인 신경망을 **심층 신경망(Deep Nueral Network, DNN)**이라고 합니다.
* 지금까지 가중치를 수동으로 찾았지만 기계가 스스로 가중치를 찾아내도록 자동화시키는 것을 머신러닝에서 **훈련(training) 또는 학습(learning)**단계에 해당됩니다.
* 그리고 **손실함수(Loss function)와 옵티마이저(Optimizer)**를 사용합니다.
* 만약 학습시키는 인공 신경망이 심층 신경망일 경우, 이를 **딥러닝(Deep Learning)**이라고 합니다.

In [8]:
def XOR_gate(x1, x2):
    s1 = NAND_gate(x1, x2)
    s2 = OR_gate(x1, x2)
    y = AND_gate(s1, s2)
    return y

In [9]:
XOR_gate(0, 0), XOR_gate(0, 1), XOR_gate(1, 0), XOR_gate(1, 1)

(0, 1, 1, 0)