# 2장 - 퍼셉트론
신경망(딥러닝)의 기원이 되는 알고리즘.

### 퍼셉트론이란?
다수의 신호를 입력으로 받아 하나의 신호를 출력한다.
이 때, 신호는 흐른다(1)/안 흐른다(0)의 두 가지 값 중 하나만 가진다.

![입력이 2개인 퍼셉트론](%ED%8D%BC%EC%85%89%ED%8A%B8%EB%A1%A0.png)

그림은 입력으로 2개의 신호를 받은 퍼셉트론의 예이다.
x1, x2는 입력신호, y는 출력신호, w1, w2는 가중치이다.
그림의 원을 뉴런 혹은 노드라고 부른다.
입력 신호가 뉴런에 보내질 때는 각각 고유한 가중치가 곱해진다.(w1x1, w2x2)
뉴런에서 보내온 신호의 총합이 정해진 한계(임계값, θ)를 넘어설 때만 1을 출력한다.(="뉴런이 활성화한다."고 표현하기도 함)

이상을 수식으로 나타내면 다음과 같다.

![퍼셉트론 수식](퍼셉트론수식.png)

퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여한다.
가중치는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용한다.
즉, 가중치가 클수록 해당 신호가 그만큼 더 중요함을 뜻한다.

### 단순한 논리 회로
(1) AND 게이트
입력이 둘이고 출력이 하나이다.
입력이 모두 1일 때만 1을 출력하고, 그 외에는 0을 출력한다.
다음은 AND 게이트의 진리표다.

![AND 게이트의 진리표](andgate.png)

이 AND 게이트를 퍼셉트론으로 표현하고자 한다면, 이 진리표대로 작동하는 w1, w2, θ 값을 정하면 된다.
(w1, w2, θ)의 예시: (0.5, 0.5, 0.7), (0.5, 0.5, 0.8), (1.0, 1.0, 1.0)

(2) NAND 게이트
NAND 게이트는 Not AND 게이트를 말한다. 즉, AND 게이트의 출력을 뒤집은 것을 동작한다.
x1, x2가 모두 1일 때만 0을 출력하고, 그 외에는 1을 출력한다.
다음은 NAND 게이트의 진리표다.

![NAND 게이트의 진리표](nandgate.png)

NAND 게이트를 표현하는 (w1, w2, θ)의 예시: (-0.5, -0.5, -0.7)
이 외에도 AND  게이트를 구현하는 매개변수의 부호를 모두 반전한 것 등이 있다.

(3) OR 게이트
OR 게이트는 입력 신호 중 하나 이상이 1이면 출력이 1이 되는 논리 회로이다.
OR 게이트의 진리표는 다음과 같다.
![OR 게이트의 진리표](orgate.png)

**퍼셉트론의 구조는 AND, NAND, OR 게이트 모두에서 똑같다.**
*다른 것은 오직 매개변수(가중치와 임계값) 뿐이다.*

### 퍼셉트론 구현하기
(1) 간단한 구현부터

In [2]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

In [3]:
AND(0, 0)

0

In [4]:
AND(1, 0)

0

In [5]:
AND(0, 1)

0

In [6]:
AND(1, 1)

1

(2) 가중치와 편향 도입

θ를 -b로 치환하면 퍼셉트론의 동작이 다음과 같이 변환된다.

![퍼셉트론 수식2](퍼셉트론수식2.png)

여기서 b를 편향이라 하며, w1과 w2는 여전히 가중치이다.
이 관점에서 보면, 퍼셉트론은 입력신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않으면 0을 출력한다.

In [7]:
import numpy as np
x = np.array([0, 1]) # 입력
w = np.array([0.5, 0.5]) # 가중치
b = -0.7

In [8]:
w*x

array([0. , 0.5])

In [9]:
np.sum(w*x)

0.5

In [11]:
np.sum(w*x) + b # 대략 -0.2

-0.19999999999999996

(3) 가중치와 편향 구현하기

'가중치와 편향을 도입'한 AND 게이트는 다음과 같이 구현할 수 있다.

In [12]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5]) # 가중치: 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수
    b = -0.7 # 편향: 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하느냐를 조정하는 매개변수
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [15]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1
    
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

### 퍼셉트론의 한계
(1) XOR 게이트(배타적 논리합이라고 하는 논리회로)

x1과 x2 중 한쪽이 1일 때만 1을 출력한다.

![XOR 게이트의 진리표](xorgate.png)

지금까지 본 퍼셉트론으로는 이 XOR 게이트를 구현할 수 없다.

OR 게이트는 가중치 매개변수가 (b, w1, w2) = (-0.5, 1.0, 1.0)일 때 진리표를 만족한다.

이때의 퍼셉트론은 다음의 식으로 표현될 수 있으며, 그래프로 표현하면 그 옆의 그래프와 같다.

![OR 게이트 식](orgate2.png)
![OR 게이트 그래프](orgate3.png)

회색 영역은 0을 출력하는 영역이며, 전체 영역은 OR 게이트의 성질을 만족한다.

OR 게이트는 (x1, x2) = (0, 0)일 때 0을 출력하고 (0, 1), (1, 0), (1, 1)일 때는 1을 출력한다.

그림에서는 0을 동그라미, 1을 세모로 표시했다.

OR 게이트를 만들려면 이 그래프와 같이 동그라미와 세모를 직선으로 나눠야 한다.

XOR 게이트는 OR 게이트 때처럼 직선 하나로 동그라미와 세모를 나누는 영역을 만들어낼 수 없다.

XOR 게이트의 동그라미와 세모 분포가 다음과 같기 때문이다.

![XOR 게이트 그래프](xorgate2.png)

(2) 선형과 비선형

직선이 아닌 곡선이라면 다음과 같이 구현 가능해 진다.

![XOR 게이트 그래프2](xorgate3.png)

**퍼셉트론은 직선 하나로 나눈 영역만 표현할 수 있다는 한계가 있다.**

*XOR 게이트 그래프 같은 경우의 곡선 영역을 **비선형 영역**이라고 한다.*

*그 외 게이트 그래프 같은 경우의 직선 영역을 **선형 영역**이라고 한다.*

앞으로 기계학습 분야에서 만날 선형, 비선형이라는 말은 여기 그래프를 생각하면 된다.

### 다층 퍼셉트론이 출동한다면
'층을 쌓아' **다층 퍼셉트론**을 만들면 XOR 게이트도 표현 가능하다.

(1) 기존 게이트 조합하기

앞서 만든 AND, NAND, OR 게이트를 조합하면 XOR 게이트를 만드는 것이 가능하다.

![AND, NAND, OR 게이트 기호](기호.jpg)
![XOR 게이트](xorgate4.png)

왼편 그림은 게이트들의 기호 도식화이고, 오른편 그림은 도식을 활용해 표현한 XOR 게이트다.

x1, x2는 NAND와 OR 게이트의 입력이 되고,

NAND와 OR 게이트의 출력이 AND 게이트의 입력으로 이어진다.

NAND의 출력을 s1, OR의 출력을 s2로 해서 진리표를 만들면 다음과 같다.

![XOR 게이트 진리표](xor진리표.png)

x1, x2, y에 주목하면 진리표가 참임을 알 수 있다.

(2) XOR 게이트 구현하기

In [16]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [17]:
XOR(0, 0)

0

In [18]:
XOR(1, 0)

1

In [19]:
XOR(0, 1)

1

In [20]:
XOR(1, 1)

0

지금 구현한 XOR을 뉴런을 이용한 퍼셉트론으로 표현하면 다음과 같다.

![XOR 퍼셉트론](xor퍼셉트론.png)

이처럼 XOR은 다층 구조의 네트워크이다.

이처럼 층이 여러 개인 퍼셉트론을 다층 퍼셉트론이라 한다.

이 동작의 작동 프로세스는 다음과 같다.
1. 0층의 두 뉴런이 입력 신호를 받아 1층의 뉴런으로 신호를 보낸다.
2. 1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴런은 y를 출력한다.