Perceptron은 신경망의 기원이 되는 알고리즘이다.  
다수의 신호를 입력으로 받아 하나의 신호를 출력한다.  
퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여하고, 가중치는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용한다.  
입력신호가 뉴런에 보내진 값의 총 합이 임계값을 넘어설 때 1을 출력한다.  

입력값은 $\mathbf{x}=(x_1, x_2,..., x_i)$로 표현된다.  
가중치는 $\mathbf{w}=(w_1, w_2,..., w_i)$로 표현된다.  
임계값은 $\theta$로 표현되며, 최종 출력값 $y$는 다음과 같이 정의된다.
$$
y=\begin{cases}0 \; (\mathbf{wx} \leqq \theta) \\ 1 \; (\mathbf{wx} > \theta) \end{cases}
$$

논리회로를 구현해보자.  
지금의 구현은 퍼셉트론의 Parameter인 가중치를 직접 설정한다.  
원래의 기계학습은 데이터를 보고 이 매개변수의 값을 자동으로 설정하도록 **학습**시킨다. 이 때의 사람은 퍼셉트론의 구조(모델)을 고민하고, 컴퓨터에 학습할 데이터를 주는 역할만 수행하게 된다.  

가중치 $\mathbf{w}$는 각 입력값의 중요도를 결정하는 역할을 하며, 편향 $b$은 얼마나 높은 값에서 뉴런을 활성화 시킬지를 결정하는 역할을 수행한다.

AND Gate는 입력값 2개에 대해서, 두 입력값이 모두 참(1)인 경우에만 참(1)을 반환하는 논리구조이다.  
이를 만족하는 가중치와 theta를 계산하여 구현하면 다음과 같다.

In [1]:
# AND Gate 1
def AND(x1, x2) :
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = w1*x1 + w2*x2
    if tmp <= theta :
        return 0
    elif tmp > theta :
        return 1

위의 코드에서 임계값의 역할을 하는 $\theta$에 대한 표기를 $-b$로 바꾸고 좌변으로 옮기면 다음과 같이 표기할 수 있다.  
$$
y=\begin{cases}0 \; (\mathbf{wx} + b \leqq 0) \\ 1 \; (\mathbf{wx} + b > 0) \end{cases}
$$
이는 위의 식과 완전히 동일한 의미를 가진다. 임계값만큼의 편향을 가진 함수가 0의 값을 넘을 수 있는지에 대한 판단으로 바꾸어 생각할 수 있다.  
이를 numpy를 통해 구현하면 아래와 같다.

In [2]:
# AND Gate 2
import numpy as np
def AND(x1, x2) :
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0 :
        return 0
    elif tmp > 0 :
        return 1

In [3]:
print(f'0,0:{AND(0,0)}\n0,1:{AND(0,1)}\n1,0:{AND(1,0)}\n1,1:{AND(1,1)}')

0,0:0
0,1:0
1,0:0
1,1:1


NAND Gate는 AND Gate와 정확하게 반대의 논리값을 갖는다.  
이를 표현하면 아래와 같으며, 부호만 다른 것을 확인할 수 있다.

In [4]:
# NAND Gate
import numpy as np
def NAND(x1, x2) :
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0 :
        return 0
    elif tmp > 0 :
        return 1

In [5]:
print(f'0,0:{NAND(0,0)}\n0,1:{NAND(0,1)}\n1,0:{NAND(1,0)}\n1,1:{NAND(1,1)}')

0,0:1
0,1:1
1,0:1
1,1:0


OR Gate는 입력값 중 한개만 참(1)이어도 참(1)을 출력하는 논리구조이다.  
AND Gate와 편향만 다른 값을 갖는 것을 확인할 수 있다.  

In [6]:
# OR Gate
import numpy as np
def OR(x1, x2) :
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.3
    tmp = np.sum(w*x) + b
    if tmp <= 0 :
        return 0
    elif tmp > 0 :
        return 1

In [7]:
print(f'0,0:{OR(0,0)}\n0,1:{OR(0,1)}\n1,0:{OR(1,0)}\n1,1:{OR(1,1)}')

0,0:0
0,1:1
1,0:1
1,1:1


단층 Perceptron은 비선형적 구조를 표현할 수 없다.  
XOR Gate, 배타적 논리합의 논리구조는 선형적으로 표현할 수 없기 때문이다.  
이를 표현하기 위해 다층 구조를 사용해볼 수 있다.  
AND, NAND, OR의 조합으로 각 Gate의 출력값을 입력값으로 하는 다층구조를 구현할 수 있다.

In [8]:
def XOR(x1, x2) : 
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [9]:
print(f'0,0:{XOR(0,0)}\n0,1:{XOR(0,1)}\n1,0:{XOR(1,0)}\n1,1:{XOR(1,1)}')

0,0:0
0,1:1
1,0:1
1,1:0


위의 XOR Gate처럼 여러층의 구조를 이용해 단층으로는 표현하지 못하는 것을 구현할 수 있다.  
이론상으론 2층 구조의 Perceptron으로 컴퓨터를 구현할 수 있지만, 일반적으로는 여러 층을 쌓는 구조로 Perceptron을 구현한다.  
Perceptron의 층을 거듭 쌓으면 비선형적인 표현이 가능하고, 컴퓨터의 모든 수행도 표현할 수 있다.