# 2. 퍼셉트론
퍼셉트론은 신경망의 기원이 되는 알고리즘이다. 그래서 퍼셉트론의 구조부터 차근차근 신경망과 딥러닝까지 배워보자.

# 2.1 퍼셉트론이란?
다수의 신호를 입력으로 받아 하나의 신호를 출력한다.   

![](https://t1.daumcdn.net/cfile/tistory/99BDCE4D5B98A1022C)   
입력이 2개인 퍼셉트론을 예로 들어보자. $x_1, x_2$를 입력받아 이들의 $w_1, w_2$인 가중치가 곱해져 정해진 한계인 임계값($\theta$)을 넘어설 때만 $y$를 출력하게 된다.

퍼셉트론은 복수의 입력 신호에 각각 고유한 가중치를 부여한다. 그리고 가중치가 클수록 신호가 더 중요함을 뜻한다.

# 2.2 단순한 논리 회로

### 2.2.1 AND 게이트
AND 게이트는 $x_1, x_2$가 모두 1인 경우 $y$의 값이 1이 나오고 나머지는 0이 나온다.   
이러한 AND 게이트를 퍼셉트론으로 표현하려면 어떻게 할까?   
$x_1, x_2$를 통해 $y$가 나온다고 가정해보자.   
여기서 $w_1, w_2, \theta$가 (0.5, 0.5, 0.7)이거나 (1.0, 1.0, 1.0) 이러한 값의 범위를 갖고 있으면 가능하다.

### 2.2.2 NAND, OR 게이트
NAND 게이트는 $x_1, x_2$가 모두 1인 경우 $y$의 값이 0이 나오고 나머지는 1이 나온다.   
$w_1, w_2, \theta$ = (-0.5, -0.5, -0.7) 과 같은 무수한 조합이 있다.   

OR 게이트는 입력 신호 중 하나 이상 1이면 출력이 1이 된다.   
$w_1, w_2, \theta$ = (0.5, 0.5, $w_1-0.1$) 와 같이 $x$의 $w$값이 $\theta$값 보다 낮으면 된다.

# 2.3 퍼셉트론 구현하기

In [4]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

In [5]:
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
0
1


### 2.3.2 가중치와 편향
지금까지 본 AND 게이트에 편향을 대입해보자.   
$y = 0(b+w_1x_1+w_2x_2<=0), 1(b+w_1x_1+w_2x_2>0$   
퍼셉트론은 입력 신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않으면 0을 출력함을 의미한다.

In [6]:
import numpy as np
x = np.array([0,1])
w = np.array([0.5,0.5])
b = -0.7
print(w*b)
print(np.sum(w*x))
print(np.sum(w*x)+b)

[-0.35 -0.35]
0.5
-0.19999999999999996


In [8]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print(AND(0, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
1


편향의 값은 가중치의 중요도에 따라 뉴런이 얼마나 쉽게 활성화($y$의 값이 1이 되는지) 하는지 조정하는 매개변수이다.   
편향 $b$의 값이 -20이면 입력 신호에 가중치를 곱한 값들의 합이 20.0을 넘지 않으면 뉴런이 활성화되지 않는다.

In [9]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x)+b
    if tmp <= 0:
        return 0
    else:
        return 1

print(f"NAND 0,0 = {NAND(0, 0)}")
print(f"NAND 1,0 = {NAND(1, 0)}")
print(f"NAND 1,1 = {NAND(1, 1)}")
print(f"OR 0,0 = {OR(0,0)}")
print(f"OR 1,0 = {OR(1,0)}")
print(f"OR 1,1 = {OR(1,1)}")

NAND 0,0 = 1
NAND 1,0 = 1
NAND 1,1 = 0
OR 0,0 = 0
OR 1,0 = 1
OR 1,1 = 1


AND, NAND, OR 게이트를 같은 구조의 퍼셉트론으로 구할 수 있고, 차이는 가중치 매개변수의 값뿐이다.

# 2.4 퍼셉트론의 한계

### 2.4.1 XOR 게이트
XOR 게이트는 $x_1, x_2$중 한 쪽이 1일 때만 1을 출력한다.   
일반적으로 XOR 게이트를 퍼셉트론으로는 구현을 할 수 없다.   
퍼셉트론은 직선 하나로 나눈 영역만 표현할 수 있다는 한계가 있다.   
그래서 이를 비선형적으로 구하면 구할 수 있다.

In [16]:
def XOR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.1
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print(XOR(0,0))
print(XOR(1,0))
print(XOR(1,1))

0
1
1


# 2.5 다층 퍼셉트론이 출동한다면
퍼셉트론은 층을 쌓아 다층 퍼셉트론을 만들 수 있다.   
층을 하나 더 쌓아서 XOR을 표현해보자.

### 2.5.1 기존 게이트 조합하기
XOR 게이트를 만드는 방법은 다양한데, AND, NAND, OR 게이트를 조합해서 만들어보자.   
![](https://velog.velcdn.com/images%2Fchandni_ml%2Fpost%2F8ff9a63c-f46d-4b80-a35c-a6632e382eeb%2Ffig%202-11.png)   
$s_1$ 부분 NAND, $s_2$ 부분 OR, $y$ 좌측 AND으로 퍼셉트론을 쌓으면 XOR을 구현할 수 있다.

In [17]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

print(XOR(0,0))
print(XOR(0,1))
print(XOR(1,0))
print(XOR(1,1))

0
1
1
0


![](https://wikidocs.net/images/page/24958/xorgate_nonlinearity.PNG)

![](https://wikidocs.net/images/page/24958/perceptron_4image.jpg)

XOR의 퍼셉트론은 위와 같이 비선형이고 다층 구조의 네트워크를 갖고 있다.   
이처럼 퍼셉트론은 층을 깊게 쌓아 더 다양한 것을 표현할 수 있다.   
예를들어 덧셈을 처리하는 가산기, 2진수를 10진수로 변환하는 인코더, 조건을 충족하면 1을 출력하는 회로(패리티 검사 회로) 심지어 컴퓨터 마저 퍼셉트론으로 표현할 수 있다.

이론상 2층의 퍼셉트론이면 컴퓨터를 만들 수 있다. 정확히 비선형인 시그모이드 함수를 활성화 함수로 이용하면 임의의 함수를 표현할 수 있다. 그러나 2층의 퍼셉트론 구조에서 가중치를 적절히 설정하여 컴퓨터를 만들기란 어렵다.

__퍼셉트론은 층을 거듭 쌓으면 비선형적인 표현도 가능하고, 이론상 컴퓨터가 수행하는 처리도 모두 표현할 수 있다.__