- Perceptron은 프랑크 로젠블라트가 1957년에 고안한 알고리즘
- 신경망 딥러닝의 기원이 되는 알고리즘
___
### 1. Perceptron이란?

- Perceptron은 다수의 신호를 입력으로 받아 하나의 신호를 출력
- 다만 신호는 1이나 0 두가지 값만 가질 수 있음

___
![입력이 2개인 Perceptron](image/fig 2-1.png)

___
- x1, x2는 입력 신호를, w1, w2는 각각의 가중치를 의미
- 그림의 원을 **Neuron**, 또는 **Node**라고 지칭
- 입력 신호가 neuron에 보내질 때는 각각 고유한 가중치가 곱해짐
- Neuron에서는 받은 신호의 총합이 **$\theta$(Theta, 임계값)**를 넘을 경우만 1을 출력


$$y = \left\{
    \begin{array}{ll}
        0  \quad (w_1x_1 + w_2x_2 \leq \theta)\\
        1  \quad (w_1x_1 + w_2x_2 > \theta)
    \end{array}
\right.$$


- 위의 내용을 수식으로 나타내면 위와 같음
- 가중치가 높을수록 신호가 더 중요하다는 의미이며, 영향력을 조절하는 요소로 작동함
- 가중치는 전류에서 흔히 이야기하는 **저항**에 해당
___
### 2. 단순한 논리 회로

#### AND 게이트
![](image/fig 2-2.png)

- $x_1$과 $x_2$가 모두 1일때만 1을 출력

- 위의 AND 게이트를 perceptron으로 표현

- i.e. $(w_1, w_2, \theta)$가 (0.5, 0.5, 0.7)이나 (0.5, 0.5, 0.8)을 따른다면 모두 AND 게이트 조건을 만족

- $x_1과 x_2$가 모두 1일때만 가중신호의 총합이 $\theta$를 넘어설 수 있음

#### NAND 게이터
![](image/fig 2-3.png)

- NAND는 Not AND를 의미함
- AND 테이블과 정 반대 역할 수행


#### OR 게이트
![](image/fig 2-3.png)


- 말 그대로 or 연산
- 입력 신호 중 어느 하나라도 1 이상이면 출력값 반환

> ### - perceptron의 매개변수 값을 정하는 것은 인간임
### - 기계학습 문제는 이 매개변수 값을 정하는 작업을 컴퓨터가 수행

<br>
## 3. Perceptron 구현하기

#### 3-1. 간단히 구현하기

In [1]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7    # w1, w2, theta 값 초기화
    temp = x1*w1 + x2*w2
    if temp <= theta:                # 입력의 총합이 임계값을 넘지 못하면 0 반환
        return 0
    else:
        return 1

In [2]:
AND(0, 0)

0

In [3]:
AND(1, 1)

1

1. 매개변수 w1, w2, theta 값 지정
2. 가중치 반영 입력 총합 계산
3. 입계값 대비 판별 및 출력값 반환

#### 3-2. 가중치와 편향 도입

위에서 본 AND 게이트 식은 다음과 같음:

$$y = \left\{
    \begin{array}{ll}
        0  \quad (w_1x_1 + w_2x_2 \leq \theta)\\
        1  \quad (w_1x_1 + w_2x_2 > \theta)
    \end{array}
\right.$$


$\theta$를 -b로 치환하면 다음과 같이 변경 가능:


$$y = \left\{
    \begin{array}{ll}
        0  \quad (b + w_1x_1 + w_2x_2 \leq 0)\\
        1  \quad (b + w_1x_1 + w_2x_2 > 0)
    \end{array}
\right.$$

여기서 b를 **bias**(편향)이라고 함

위 식을 재해석 하면 다음과 같음:
- 입력값에 가중치를 곱하고 편향을 더함
- 위 결과값이 0을 넘으면 1을 출력하고, 0을 못넘으면 0을 반환

NumPy를 활용하여 위 식을 표현

In [4]:
import numpy as np
x = np.array([0,1])       # 입력
w = np.array([0.5, 0.5])  # 가중치
b = -0.7                  # 편향

x* w

array([0. , 0.5])

In [6]:
np.sum(x*w)

0.5

In [7]:
np.sum(x*w)+b

-0.19999999999999996

**NumPy 활용하여 위 식을 구현**

In [8]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    temp = sum(x*w) + b
    
    if temp <= 0:
        return 0
    else:
        return 1

In [9]:
AND(1, 1)

1

In [10]:
AND( 0, 1)

0

- -$\theta$가 편향 b로 치환되어 구현
- b 는 w1, w2와 엄연히 다른 기능
- w1, w2는 가중치로, 각 입력 신호가 결과에 주는 **각각의 영향력**을 조절하는 매개변수임
- b 는 편향으로, 뉴런이 **얼마나 쉽게 활성화** 하느냐를 조정하는 매개변수임

#### 3-3. **NumPy 활용 NAND / OR 게이트 구현**

In [20]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    temp = sum(x*w) + b
    
    if temp <= 0:
        return 1
    else:
        return 0

def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.5
    temp = sum(x*w) + b
    
    if temp < 0:
        return 0
    else:
        return 1

In [12]:
NAND(1, 1)

0

In [13]:
NAND(0, 1)

1

In [21]:
OR(0,1)

1

In [22]:
OR(0,0)

0

### 4. Perceptron의 한계

- Perceptron은 직선 하나로 나눈 영역만 구분 가능
- OR게이트의 경우를 보면 아래의 그림과 같이 설명할 수 있음
![](image/fig 2-6.png)
- 세모로 표기한 (0,1), (1,0), (1,1)과 동그라미로 표기한 (0,0)은 직선으로 구분 가능

- XOR 게이트의 경우 직선 하나로 구분 불가능하며, 따라서 Perceptron으로 구현 불가능
- XOR 게이트는 배타적 논리합이라는 논리회로로 $x_1, x_2$ 둘 중 하나가 1일 때만 1을 출력
![](image/fig 2-5.png)

- 이경우를 2D에 시각화 하면 다음과 같은 형태가 됨
![](image/fig 2-8.png)

### 5. 다층 퍼셉트론

- 단일 Perceptron으로 XOR게이트는 표현 불가능
- 하지만 층을 쌓아 다층 퍼셉트론을 구현함으로써 XOR 게이트도 표현 가능