# 퍼셉트론

이번 장에서는 퍼셉트론 알고리즘에 대해 설명한다.
퍼셉트론은 신경망(딥러닝)의 기원이 되는 알고리즘이다.
퍼셉트론의 구조를 배우는 것은 신경망과 딥러닝으로 나아가는 데 중요한 아이디어를 배우는 일

## 퍼셉트론이란?

- 퍼셉트론은 다수의 신호를 입력으로 받아 하나의 신호를 출력함
    - 신호는 전류나 강물처럼 흐름이 있는 것을 상상하면 좋음
    - 퍼셉트론 신호도 흐름을 만들고 정보를 앞으로 전달
    - 그렇지만 실제 전류와는 달리 퍼셉트론은 신호가 흐른다, 신호가 흐르지 않는다의 두 가지 값을 가진다.
        - 1을 '신호가 흐른다', 0을 '신호가 흐르지 않는다'라고 가정할 것임
    
- 교재 49p 그림 참고
    - x1, x2는 입력 신호, y는 출력 신호, w1과 w2는 가중치를 의미
    - 그림의 원은 뉴런 혹은 노드라고 부름
    - 입력 신호가 뉴런에 보내질 때에는 각각 고유한 가중치가 곱해짐(w1x1, w2x2)
    - 뉴런에서 보내온 신호으 ㅣ총합이 정해진 한계를 넘어설 때만 1을 출력한다. (= 뉴런이 활성화한다)
        - 여기서는 이 한계를 "임계값"이라고 표현
    - 이상을 수식으로 나타내면;
    
    $y =
    \begin{cases}
    y = 0 (w_1w_2 + w_2x_2) \le 𝜽 \\
    y = 1 (w_1x_1 + w_2x_2) > 𝜽
    \end{cases}$
 
 - 퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여
 
 ## 단순한 논리 회로
 
 ### AND 게이트
 
 $\begin{array}{|c|c|c|} x_1 & x_2 & y \\
 \hline
 0 & 0 & 0 \\
 1 & 0 & 0 \\
 0 & 1 & 0 \\
 1 & 1 & 0 \\
 \end{array}$
 
 
 - 위와 같은 입력 신호와 출력 신호의 대응 표를 진리표라고 한다.
 - AND 게이트는 입력이 둘이고 출력이 하나
     - 두 입력이 모두 1일 때만 1을 출력하고, 그 외에는 0을 출력한다
     
 - 우리가 원하는 것은 이 AND 게이트를 퍼셉트론으로 표현하는 것
     - 그러기 위해서는 $w_1, w_2, 𝜽$ 의 값을 정하는 것.
 
 - 위 그림을 만족하는 매개변수 조합 $(w_1, w_2, 𝜽)$은 무수히 많다.
     - 가령 (0.5, 0.5, 0.7), (0.5, 0.5, 0.8), (1.0,1.0,1.0) 때 모두 조건을 만족
     - 매개변수를 이렇게 설정하면 $x_1$과 $x_2$ 모두 1일 때만 가중 신호의 총합이 주어진 임계값을 웃돌게 된다.
     
 ### NAND 게이트와 OR 게이트
 
 1. NAND 게이트
     - NAND는 Not AND를 의미하며, AND 게이트의 출력을 뒤집은 것이 된다.
     
 $\begin{array}{|c|c|c|} x_1 & x_2 & y \\
 \hline
 0 & 0 & 1 \\
 1 & 0 & 1 \\
 0 & 1 & 1 \\
 1 & 1 & 0 \\
 \end{array}$



 2. OR 게이트
    - OR 게이트는 입력 신호 중 하나 이상이 1이면 출력이 1이 되는 논리 회로이다.
    
 $\begin{array}{|c|c|c|} x_1 & x_2 & y \\
 \hline
 0 & 0 & 0 \\
 1 & 0 & 1 \\
 0 & 1 & 1 \\
 1 & 1 & 1 \\
 \end{array}$
 
 
 - 이상과 같이 퍼셉트론으로 AND, NAND, OR 논리 회로를 표현할 수 있다.
 - 중요한 점은 퍼셉트론의 구조는 세 게이트에서 모두 똑같다는 것!
     - 세 가지 게이트에서 다른 것은 매개변수(가중치와 임계값)의 값뿐이다.
     
     
## 퍼셉트론 구현하기

### 간단한 구현

논리 회로를 파이썬으로 구현해보자. $x_1$과 $x_2$를 인수로 받는 AND 함수이다.

In [1]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

- 매개변수 w1, w2, theta는 함수 안에서 초기화되고, 가중치를 곱한 입력의 총합이 임계값을 넘으면 1 반환, 넘지 않으면 0을 반환한다.

In [3]:
AND(0,0)

0

In [4]:
AND(0,1)

0

In [5]:
AND(1,0)

0

In [6]:
AND(1,1)

1

### 가중치와 편향 도입

앞에서 구현한 AND 게아트를 수정해보자.

$ y =
\begin{cases}
0 (b + w_! * x_1 + w_2 * x_2 \le 0) \\
1 (b + w_1 * x_1 + w_2 * x_2 > 0)
\end{cases}$

위 식은 기호 표기만 바꿨을 뿐, 의미는 같다.
b는 편향(biases)라고 하며, $w_1, w_2$은 그대로 가중치이다.

퍼셉트론은 입력 신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을, 그렇지 않으면 0을 출력한다.
앞에서 다룬 식에서 임계치를 -(편향)으로 대체한 값이다.

In [8]:
import numpy as np
x = np.array([0,1])
w = np.array([0.5, 0.5])
b = -0.7
w*x

array([0. , 0.5])

In [9]:
np.sum(w*x) # 행렬끼리의 곱의 합

0.5

In [10]:
np.sum(w*x) + b

-0.19999999999999996

따라서 가중치와 편향을 도입한 AND 게이트는 다음과 같이 구현할 수 있다.

In [9]:
def AND (x1, x2): # def 다음에 ":" 붙이는 것 잊지 말기!
    x = np.array([x1, x2]) # 아까의 vector가 아닌 다차원 계산을 위해 행렬로 변수를 넣는다.
    w = np.array([0.5, 0.5]) # x와 마찬가지.
    b = -0.7
    tmp = np.sum(x*w) + b
    if tmp > 0: # if와 else에도 ":"을 붙여야 한다.
        return 1
    else:
        return 0

In [11]:
AND (1,1)

1

In [12]:
AND(0,1)

0

In [13]:
AND(1,0)

0

In [14]:
AND(0,0)

0

### NAND 게이트와 OR 게이트의 구현

#### 1. NAND 게이트

In [19]:
import numpy as np

def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(x*w) + b
    if tmp > 0:
        return 1
    else:
        return 0
    
NAND(1,1)

0

In [21]:
NAND(1,0)

1

In [22]:
NAND(0,1)

1

In [23]:
NAND(0,0)

1

#### 2. OR 게이트

In [24]:
def OR(x1, x2): # 들여쓰기를 할 때 :을 쓴다고 생각하면 될 듯
    x = np.array([x1, x2])
    w = np.array([0.6, 0.6])
    b = -0.5
    tmp = np.sum(x*w) + b
    if tmp > 0:
        return 1
    else:
        return 0

OR(1,0)

1

In [25]:
OR(0,1)

1

In [26]:
OR(1,1)

1

In [27]:
OR(0,0)

0

## 퍼셉트론의 한계

퍼셉트론을 이용하면 AND, NAND, OR의 논리 회로를 구현할 수 있다.
계속해서 XOR 게이트를 생각해보자.

### 도전! XOR 게이트

XOR 게이트는 배타적 논리합이라는 논리 회로이다.

$\begin{array}{|c|c|c|} x_1 & x_2 & y \\
 \hline
 0 & 0 & 0 \\
 1 & 0 & 1 \\
 0 & 1 & 1 \\
 1 & 1 & 0 \\
 \end{array}$
 
 
 위와 같이 x1 x2 중 한 쪽이 1일 때만 1을 출력한다. (배타적이라는 것은 자기 외에는 거부한다는 것)
 

- 위에서 구현한 퍼셉트론은 모두 선형으로 표현 가능하다. $(x_1, x_2, w_1, w_2)$의 선형 결합으로 표현할 수 있었다는 말
- 그렇지만 XOR 게이트는 선형결합으로 표현 불가능하다. 그림 예는 교재 참고
    - 따라서 XOR 게이트를 표현하려면 비선형으로 나누는 것을 생각해야 한다.
    - 곡선의 영역을 **비선형 영역** 직선의 영역을 **선형 영역**이라고 한다. 
        - 선형, 비선형은 기계학습 분야에서 자주 쓰이는 용어이니 익숙해질 것.
    

## 다층 퍼셉트론이 출동한다면

- 퍼셉트론으로는 XOR 게아트를 표현할 수 없었음
- 그렇지만 퍼셉트론의 '층을 쌓는' **다층 퍼셉트론**으로 XOR 게이트를 구현할 수 있다.
    - 여기서에서는 층을 한 번 더 쌓아서 XOR을 표현할 것이다.
    
### 기존 게이트 조합하기

- 첫 번쨰 방법은 AND, NAND, OR 게이트를 조합하는 것
    - XOR 게이트를 구현하는 방법은 첫 번째로는 OR 게이트와 NAND 게이트를 활용하고, 이 결과를 AND 게이트에 넣는 것이다.
    
- 이와 같은 방법의 진리표는 다음과 같다.

$$\begin{array}{c|c|c|c|c|} x_! & x_2 & x_1 & x_2 & y \\
\hline
0 & 0 & 1 & 0 & 0 \\
1 & 0 & 1 & 1 & 1 \\
0 & 1 & 1 & 1 & 1 \\
1 & 1 & 0 & 1 & 0 \\
\end{array}$$

### XOR 게이트 구현하기

In [28]:
def XOR (x1, x2):
    s1 = NAND (x1, x2)
    s2 = OR (x1, x2)
    y = AND (s1, s2)
    return y

XOR(0,0)

0

In [29]:
XOR(0,1)

1

In [30]:
XOR(1,0)

1

In [31]:
XOR(1,1)

0

위와 같은 2층 퍼셉트론에서는 0층에서 1층으로 신호가 전달되고, 이어서 1층에서 2층으로 신호가 전달된다.

이와 같은 다층 퍼셉트론으로 **단층 퍼셉트론으로는 표현하지 못한 것을 층을 하나 늘려 구현**할 수 있었음.
퍼셉트론은 층을 쌓아 더 다양한 것을 표현할 수 있다.

## NAND에서 컴퓨터까지

- 다층 퍼셉트론은 지금까지 보아온 회로보다 복잡한 회로를 만들 수 있다.
- 이를테면 컴퓨터는 NAND 게이트의 조합만으로 만들 수 있다. 
    - 이론 상 2층 퍼셉트론으로도 컴퓨터를 만들 수 있음
    - 비선형인 시그모이드 함수를 활성화 함수로 이용하면 임의의 함수로 표현할 수 있다는 것이 증명되었음
        - 하지만 2층 퍼셉트론 구조에서 **가중치를 적절히 설정**하여 컴퓨터를 만들기란 어렵다.
   
   
# 정리 코드

## AND 게이트

In [33]:
import numpy as np

def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(x*w) + b
    if tmp > 0:
        return 1
    if tmp < 0:
        return 0
    
AND(0,0)

0

In [34]:
AND(0,1)

0

In [35]:
AND(1,0)

0

In [36]:
AND(1,1)

1

## NAND 게이트 

In [37]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(x*w) + b
    if tmp > 0:
        return 1
    else:
        return 0
    
NAND(0,0)

1

In [38]:
NAND(0,1)

1

In [39]:
NAND(1,0)

1

In [40]:
NAND(1,1)

0

## OR 게이트 

In [41]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.3
    tmp = np.sum(x*w) + b
    if tmp > 0:
        return 1
    else:
        return 0
    
OR(0,0)

0

In [42]:
OR(0,1)

1

In [43]:
OR(1,0)

1

In [44]:
OR(1,1)

1

## XOR 게이트 : 다층 퍼셉트론

In [48]:
def XOR(x1, x2):
    s1 = OR(x1, x2)
    s2 = NAND(x1, x2)
    y = AND(s1, s2)
    return y

XOR(0,0)

0

In [49]:
XOR(1,0)

1

In [50]:
XOR(0,1)

1

In [51]:
XOR(1,1)

0