<a href="https://colab.research.google.com/github/msjun23/Deep-Learning-from-Scratch/blob/main/Chapter2/perceptron1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**퍼셉트론**은 1957년에 소개된 알고리즘으로, 신경망(딥러닝)의 기원이 되는 알고리즘이다.

$y=\left\{\begin{matrix}
0\;\;(w_1x_1+w_2x_2\leq \theta)\\ 
1\;\;(w_1x_1+w_2x_2> \theta)
\end{matrix}\right.$

여기서 $x$는 입력 신호, $y$는 출력, $w$는 가중치, $\theta$는 임계값

**가중치**는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용한다. 가중치가 클 수록 해당 신호가 더 중요하다는 뜻이다.



# 퍼셉트론 구현하기


In [3]:
# AND 게이트 구현
def AND(x1, x2):
  w1, w2, theta = 0.5, 0.5, 0.7
  tmp = x1*w1 + x2*w2
  if tmp <= theta:
    return 0
  else:
    return 1

print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
0
1


위와 같은 내용이지만, $theta$를 $-b$로 치환하여 표현하겠다.

$y=\left\{\begin{matrix}
0\;\;(b+w_1x_1+w_2x_2\leq 0)\\ 
1\;\;(b+w_1x_1+w_2x_2> 0)
\end{matrix}\right.$

나머지는 기존과 동일하고, $b$를 편향(bias)라고 한다.

In [7]:
import numpy as np

x = np.array([0, 1])    # 입력
w = np.array([0.5, 0.5])    # 가중치
b = -0.7    # 편향
print(w * x)

print(np.sum(w * x))

print(np.sum(w * x) + b)    # 대략 -0.2 (부동소수점 수에 의한 연산 오차)

[0.  0.5]
0.5
-0.19999999999999996


**가중치**와 **편향**을 도입한 AND 게이트는 다음과 같이 구현할 수 있다.

이때 가중치와 편향을 서로 기능이 다르다는 것을 주의해야한다.
- 가중치($w_1, w_2$)는 각 입력 신호가 결과에 주는 영향력을 조절하는 매개변수이다.
- 편향($b$)은 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력) 하느냐를 조정하는 매개변수이다.

In [8]:
# 가중치와 편향을 이요해 AND 게이트 구현
def AND(x1, x2):
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.7

  tmp = np.sum(w * x) + b
  if tmp <= 0:
    return 0
  else:
    return 1

In [12]:
# NAND 게이트 구현
def NAND(x1, x2):
  x = np.array([x1, x2])
  w = np.array([-0.5, -0.5])
  b = 0.7

  tmp = np.sum(w * x) + b
  if tmp <= 0:
    return 0
  else:
    return 1

# OR 게이트 구현
def OR(x1, x2):
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.2

  tmp = np.sum(w * x) + b
  if tmp <= 0:
    return 0
  else:
    return 1

#퍼셉트론의 한계

퍼셉트론을 이용하여 AND, NAND, OR의 3가지 논리회로를 구현할 수 있었다. 이때 **XOR(배타적 논리합)**을 구현하기 위해서는 가중치 매개변수 값을 어떻게 설정해야 할까?

지금까지 본 퍼셉트론으로는 **XOR 게이트를 구현할 수 없다.**

기존의 AND, NAND, OR 게이트의 결과값을 좌표평면에 그려본다면 이들은 직선을 이용해 두 구간(출력이 0 또는 1)으로 나눌 수 있다. 반면, XOR 게이트의 출력을 좌표평면에 그려보면 직선으로는 나눌 수 없다.

하지만 층을 쌓아 **다층 퍼셉트론**을 만들 수 있다면 XOR를 표현할 수 있다.

In [13]:
# AND, NAND, OR를 사용해 XOR 구현
def XOR(x1, x2):
  s1 = NAND(x1, x2)
  s2 = OR(x1, x2)
  y = AND(s1, s2)

  return y

print(XOR(0, 0))
print(XOR(1, 0))
print(XOR(0, 1))
print(XOR(1, 1))

0
1
1
0


기존의 AND, OR 퍼셉트론은 단층 퍼셉트론인 데 반해, XOR는 2층 퍼셉트론이다. 이처럼 **층이 여러 개**인 퍼셉트론을 **다층 퍼셉트론**이라고 한다.



1.   0층의 두 뉴런이 입력 신호를 받아 1층의 뉴런으로 신호를 보낸다.
2.   1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴런은 $y$를 출력한다.

이처럼 **단층 퍼셉트론으로 구현하지 못한 것을 층을 늘려 구현**할 수 있다.