## 퍼셉트론이란

퍼셉트론은 다수의 신호를 입력으로 받아 하나의 신호를 출력한다. **신호란** 전튜나 강물처럼 **흐름**이 있는 것을 상상하면 좋다. 전류가 전선을 타고 흐르는 전자를 내보내듯, 퍼셉트론 신호도 흐름을 만들고 정보를 앞으로 전달한다. 퍼셉트론 신호는 '흐른다 /안흐른다'(1,0)의 두가지 값을 가질 수 있다.

<img src="https://miro.medium.com/max/471/1*y_dt-Kj9Bg1GB9LWGRDI8Q.png" width="300" height="300"/>  

x1, X2는 입력신호, y는 출력신호, w1, w2는 가중치를 뜻한다. 그림의 원은 뉴련 혹은 노드라고 부른다.   
입력신호가 뉴런에 보내질 때는 각각 고유한 가중치가 곱해진다. ($w1x1w2x2$) 뉴런에서 보내온 신호의 총합이 정해진 한계를 넘어설 때만 1을 출력한다.(이를 뉴런이 활성화한다 라고 표현), 그 한계를 임계값이라고 하며 $\theta\$로 나타낸다.

$\text{y }  =
\begin{cases}
0 & (w1x1 + w2x2 <=0)\\
1 & (w1x1 + w2x2 > 0) \\
\end{cases}
$

퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여한다. 가중치는 각 신호가 결과에 주는 영항력을 조절하는 요소로 작용한다. 즉 가중치가 클수록 해당 신호가 그만큼 더 중요함을 뜻한다.

## 단순한 논리 회로

### AND 게이트

AND게이트는. 입력이 둘이고 출력은 하나이다. 

<img src="https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQJOsh_3r_09SqEPgLvt-gaxP1KPy4Y803b_peL1_8IIuZkiLcebtvap992BVhjYzjqN1k&usqp=CAU" width="300" height="300"/>  

(w1, w2, $\theta\$) 가 (0.5, 0.5, 0.7)일때 , 또 (0.5,0.5,0.8)이나 (1.0,1.0,1.0)때 모두 AND게이트 조건을 만족한다. 매개변수를 이렇게 설명하면 x1, x2 모두가 1일 때만 가중 신호의 총합이 주어진 임계값을 웃돌게 된다.


### NADN 게이트와 OR 게이트

NAND는 Not AND를 의미하며, 그 동작은 AND게이트의 출력을 뒤집은 것이 된다. 진리표로 나타내먄 x1, x2 모두 1일 때만 0을 출력하고 그 외에는 1을 출력한다.   
(w1, w2, $\theta\$) = (-0.5,-0.5,-0.7)

<img src="https://media.vlpt.us/images/kimkihoon0515/post/b0e519a7-b52e-4d16-985c-7273fa7798b1/image.png" width="300" height="300"/>  


OR게이트는 입력 신호 중 하나 이상이 1이면 출력이 1이 되는 논리 회로이다.
<img src="https://t1.daumcdn.net/cfile/tistory/99F23B4C5D6727AD30" width="300" height="300"/>  


중요한 점은 퍼셉트론의 구조는 AND, NAND, OR 게이트 모두 똑같다는 것이다. 세가지 게이트에서 다른것은 매겨변수(가중치와 임계값)의 값뿐이다. 

### 퍼셉트론 구현

In [1]:
def AND (x1, x2) :
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta :
        return 0
    elif tmp > theta :
        return 1

In [2]:
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
0
1


### 가중치와 편향 도입 

$\text{y }  =
\begin{cases}
0 & (b+w1x1 + w2x2 <=0)\\
1 & (b+w1x1 + w2x2 > 0) \\
\end{cases}
$

$\theta\$를 -b로 치환하면 위의 퍼셉트론이 동작   
b를 편향이라 하며 w1과 w2는 그대로 가중치 이다. 퍼셉트론은 입력신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않으면 0을 출력한다. 


In [3]:
import numpy as np


x = np.array([0,1])
w = np.array([0.5, 0.5])
b = -0.7

w*x

array([0. , 0.5])

In [4]:
np.sum(w*x)

0.5

In [5]:
np.sum(w*x) + b

-0.19999999999999996

In [6]:
def AND (x1, x2) :
    x = np.array([x1,x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    
    if tmp <= 0: 
        return 0
    else :
        return 1

In [7]:
if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = AND(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 0
(1, 0) -> 0
(0, 1) -> 0
(1, 1) -> 1


$\theta\$가 편향b로 치환, **구체적으로 w1, w2는 각 입력 신호가 결과에 주는 영향력 (중요도)를 조절하는 매개변수고, 편항은 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)을 하느냐를 조정하는 매개변수 이다.**  
예를 들어 b가 -0.1이면 각 입력 신호에 가중치를 곱한 값들의 합이 0.1을 초과할 때만 뉴련이 활성화 된다. 편향의 값은 뉴련이 얼마나 쉽게 활성화되는지를 결정한다. 

In [8]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [9]:
if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = NAND(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 1
(1, 0) -> 1
(0, 1) -> 1
(1, 1) -> 0


In [10]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [11]:
if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = OR(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 0
(1, 0) -> 1
(0, 1) -> 1
(1, 1) -> 1


### XOR 게이트  

배타적 논리합이라는 논리 회로이다. x1과 x2중 한쪽이 1일 때만 1을 출력한다.  

<img src="https://t1.daumcdn.net/cfile/tistory/997331445D67323F04" width="300" height="300"/>  


원이 0, 삼각형이 1을 표현  
OR 게이트에서는 직선으로 네 점을 나눌 수 있다.
<img src="https://t1.daumcdn.net/cfile/tistory/99AA4F355D672D140C" width="300" height="300"/>  


XOR게이트 에서는 직선을 통해 네 점을 나눌 수 없다.

<img src="https://t1.daumcdn.net/cfile/tistory/99248C4D5D6732AF38" width="300" height="300"/>  

### 선형과 비선형 

<img src="https://poddeeplearning.readthedocs.io/ko/latest/%EB%B0%91%EB%B0%94%EB%8B%A5%EB%B6%80%ED%84%B0%20%EC%8B%9C%EC%9E%91%ED%95%98%EB%8A%94%20%EB%94%A5%EB%9F%AC%EB%8B%9D/2_perceptron_pulpan92_image/image4.png" width="300" height="300"/>  

#### 퍼셉트론은 직선하나로 나눈 영역만 표현할 수 있다는 한계가 있다. 곡선은 표현 불가 

### 다층 퍼셉트론 충돌

안타깝게도 퍼셉트론은 XOR게이트를 표현할 수 없다. 퍼셉트론의 아름다움은 **다층 퍼셉트론**을 만들 수 있다는데 있다. 

#### 기존게이트 조합 

AND , NAND, OR을 조합해서 XOR 게이트 생성 

<img src="https://t1.daumcdn.net/cfile/tistory/999D814B5D675DBB37" width="300" height="300"/>  


x1, x2가 입력 신호, y가 출력 신호이다. x1, x2는 NAND와 OR게이트의 입력이 되고, NAND와 OR의 출력이 AND게이트 입력으로 이어진다.

In [12]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = XOR(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 0
(1, 0) -> 1
(0, 1) -> 1
(1, 1) -> 0


<img src="https://media.vlpt.us/post-images/dscwinterstudy/754c7c20-3a21-11ea-8734-d1dac55eae87/2-13XOR%EC%9D%98-%ED%8D%BC%EC%85%89%ED%8A%B8%EB%A1%A0.png" width="300" height="300"/>  

2층 퍼셉트론에서는 0층에서 1층으로 신호가 전달되고, 이어서 1층에서 2층으로 신호가 전달된다.   

* 0층의 두 뉴련이 입력 신호를 받아 1층의 뉴련으로 신호를 보낸다.
* 1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴련은 y를 출력한다. 

#### 정리 

* 퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력한다.
* 퍼셉트론에서는 ‘가중치’와 ‘편향’을 매개변수로 설정한다.
* 퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있다.
* XOR 게이트는 단층 퍼셉트론으로는 표현할 수 없다.
* 2층 퍼셉트론을 이용하면 XOR 게이트를 표현할 수 있다.
* 단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다.
* 다층 퍼셉트론은 (이론상) 컴퓨터를 표현할 수 있다.