# 퍼셉트론
---
**퍼셉트론**은 프랑크 로젠블라트가 1957년 고안한 알고리즘이다.  
이 알고리즘은 신경망(딥러닝)의 기원이되는 알고리즘이다.

## 2.1 퍼셉트론이란?
퍼셉트론은 다수의 신호를 입력으로 받아 하나의 신호를 출력한다. 여기서 말하는 **신호**란 전류나 강물처럼 **흐름**이 있는 것을 상상하면 좋다.  
다만 퍼셉트론 신호는 '흐른다/안 흐른다(1이나 0)'의 두 가지 값을 가진다.

예를 들어, 2개의 입력으로 1개의 출력이 일어난다고 하자.  
이때, $x_1$과 $x_2$는 입력 신호, $y$는 출력 신호, $w_1$과 $w_2$는 가중치를 뜻한다.

이때 입력 신호를 **뉴런** 혹은 **노드**라고 한다. 입력 신호가 뉴런에 보내질 때는 각각 고유한 **가중치**가 곱해진다.
뉴런에서 보내온 신호의 총합이 정해진 한계를 넘어설 때만 1을 출력한다(이를 '뉴런이 활성화한다'라 표현함).  
이 한계를 **임계값**이라 하며, $\theta$기호<sup>theta, 세타</sup> 로 표현한다.

$
y=
\begin{cases}
0 & (w_1x_1 + w_2x_2 \le \theta) \\
1 & (w_1x_1 + w_2x_2 > \theta)
\end{cases}
$

퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여한다. 가중치는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용한다.  
즉, 가중치가 클수록 해당 신호가 그만큼 더 중요함을 뜻한다.

**※ NOTE**  
가중치는 전류에서 말하는 **저항**에 해당한다. 저항이 낮을수록 전류는 더 세게 흐른다.  
한편 퍼셉트론의 가중치는 그 값이 클수록 강한 신호를 보낸다. 이처럼 작용하는 방향은 반대지만 신호가 얼마나 잘 흐르는가를 통제하는 점에서 저항과 가중치는 같은 기능을 한다.

## 2.2 단순한 논리회로
### 2.2.1 AND 게이트
- AND 게이트  
$
\begin{array}
{|c|c|c|} x_1 & x_2 & y \\
\hline
0&0&0\\
0&1&0\\
1&0&0\\
1&1&1\\
\end{array}
$

### 2.2.2 NAND 게이트와 OR 게이트
- NAND 게이트  
$
\begin{array}
{|c|c|c|} x_1 & x_2 & y \\
\hline
0&0&1\\
0&1&1\\
1&0&1\\
1&1&0\\
\end{array}
$

- OR 게이트  
$
\begin{array}
{|c|c|c|} x_1 & x_2 & y \\
\hline
0&0&0\\
0&1&1\\
1&0&1\\
1&1&1\\
\end{array}
$

## 2.3 퍼셉트론 구현하기
### 2.3.1 간단한 구현부터

In [1]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    
    if tmp <= theta:
        return 0
    else:
        return 1

In [3]:
print(AND(0, 0))
print(AND(0, 1))
print(AND(1, 0))
print(AND(1, 1))

0
0
0
1


### 2.3.2 가중치와 편향 도입
위의 퍼셉트론 식의 $\theta$를 $-b$로 치환하면 다음과 같은 식으로 표현된다.  
$
y=
\begin{cases}
0 & (b + w_1x_1 + w_2x_2 \le 0) \\
1 & (b + w_1x_1 + w_2x_2 > 0)
\end{cases}
$

여기에서 $b$를 **편향**<sup>bias</sup>이라 하며 $w_1$과 $w_2$는 그대로 가중치<sup>weight</sup>이다.

In [5]:
import numpy as np

x = np.array([0, 1])
w = np.array([0.5, 0.5])
b = -0.7

display(w*x)
display(np.sum(w*x))
display(np.sum(w*x) + b)

array([0. , 0.5])

0.5

-0.19999999999999996

### 2.3.3 가중치와 편향 구하기
'가중치와 편향을 도입'한 AND 게이트는 다음과 같이 구할 수 있다.

In [23]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
#     print(tmp)
    if tmp <= 0:
        return 0
    else:
        return 1

위에서 보듯이 **편향**은 뉴런이 얼마나 쉽게 활성화 하는지 조정하는 매개변수이다.

In [24]:
print(AND(0, 0))
print(AND(0, 1))
print(AND(1, 0))
print(AND(1, 1))

0
0
0
1


In [21]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
#     print(tmp)
    if tmp <= 0:
        return 0
    else:
        return 1

In [22]:
print(NAND(0, 0))
print(NAND(0, 1))
print(NAND(1, 0))
print(NAND(1, 1))

1
1
1
0


In [19]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
#     print(tmp)
    if tmp <= 0:
        return 0
    else:
        return 1

In [20]:
print(OR(0, 0))
print(OR(0, 1))
print(OR(1, 0))
print(OR(1, 1))

0
1
1
1


## 2.4 퍼셉트론의 한계
### 2.4.1 XOR 게이트
- XOR 게이트  
$
\begin{array}
{|c|c|c|} x_1 & x_2 & y \\
\hline
0&0&0\\
0&1&1\\
1&0&1\\
1&1&0\\
\end{array}
$

지금까지 살펴본 퍼셉트론으로는 XOR 게이트를 구현할 수 없다.  
OR 게이트는, 예를들어 편향ㆍ가중치가 $(b, w_1, w_2) = (-0.5, 1.0, 1.0)$일 때 다음 진리표를 만족한다.

$
y=
\begin{cases}
0 & (-0.5 + x_1 + x_2 \le 0) \\
1 & (-0.5 + x_1 + x_2 > 0)
\end{cases}
$

하지만 XOR 게이트에서 $(x_1, x_2)$ = (1, 1) 일 때, 0 을 만족할 수 없으므로 구현할 수 없다.

### 2.4.2 선형과 비선형
퍼셉트론은 직선 하나로 나눈 영역만 표현할 수 있다는 한계가 있다.  

- 직선의 영역을 **선형** 영역
- 곡선의 영역을 **비선형** 영역

## 2.5 다층 퍼셉트론이라면?
퍼셉트론만으로는 XOR 게이트를 표현할 수 없다. 하지만 '층을 쌓아' **다층 퍼셉트론**<sup>multi-layer perceptron</sup>을 만들 수 있다.

### 2.5.1 기존 게이트 조합하기
- XOR 게이트  
$
\begin{array}
{|c|c|c|c|c|} x_1 & x_2 & s_1 & s_2 & y \\
\hline
0&0&1&0&0\\
1&0&1&1&1\\
0&1&1&1&1\\
1&1&0&1&0\\
\end{array}
$

$x_1$ NAND $x_2$ → $s_1$  
$x_1$ OR   $x_2$ → $s_2$  
$s_1$ AND  $s_2$ → y

In [27]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [28]:
print(XOR(0, 0))
print(XOR(0, 1))
print(XOR(1, 0))
print(XOR(1, 1))

0
1
1
0
