## Single-layer Perceptron(Artificial Neuron)

- 다수의 신호를 입력으로 받아 하나의 신호를 출력한다.
- 1 또는 0 의 두가지 값을 가질 수 있다.

$
y =
\begin{cases}
0 & (x_1w_1 + x_2w_2 + ... + x_nw_n \le \theta) \\
1 & (x_1w_1 + x_2w_2 + ... + x_nw_n > \theta)
\end{cases}
$

- $y$ : 출력 신호(output)
- $x_n$ : 입력 신호(input)
- $w_n$ : 가중치(weight)
- $\theta$ : 임계값(threshold)


퍼셉트론의 매개변수 값을 정하는 것은 컴퓨터가 아니라 사람.  
인간이 직접 진리표(AND, NAND, OR)라는 ‘학습 데이터’를 보면서 매개변수의 값을 추론.  
기계학습 문제는 이 매개변수의 값을 정하는 작업을 컴퓨터가 자동으로 수행.  
학습이란 적절한 매개변수 값을 정하는 작업이며, 사람은 퍼셉트론의 구조(모델)를 고민하고 컴퓨터에 학습할 데이터를 주는 역할.  

## Implement Perceptron

In [2]:
# AND gate, 고전적 방식

def C_AND (x1, x2):
  w1, w2, t = 0.5, 0.5, 0.7
  tmp = x1*w1 + x2*w2
  if tmp <= t:
    return 0
  elif tmp > t:
    return 1

In [3]:
print(C_AND(0,0))
print(C_AND(1,0))
print(C_AND(0,1))
print(C_AND(1,1))

0
0
0
1


$\theta$를 $-b$로 치환하여 정리하면,

$
y =
\begin{cases}
1 & (b + x_1w_1 + x_2w_2 + ... + x_nw_n \le o) \\
0 & (b + x_1w_1 + x_2w_2 + ... + x_nw_n > o)
\end{cases}
$

편향은 가중치(w)와 기능이 다르다는 사실에 주의.  
구체적으로 말하면,  
- w는 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수.  
- 편향(b)은 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하느냐를 조정하는 매개변수.  

e.g. b가 -0.1이면 각 입력 신호에 가중치를 곱한 값들의 합이 0.1을 초과할 때만 뉴런이 활성화하는 반면 b가 -20.0이면 각 입력 신호에 가중치를 곱한 값들의 합이 20.0을 넘지 않으면 활성화하지 않는다.

In [14]:
# 가중치와 편향(bias) 도입

import numpy as np

def AND (x1, x2):
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.7
  tmp = np.sum(w*x) + b
  if tmp <= 0:
    return 0
  else:
    return 1

In [7]:
print(AND(0,0))
print(AND(1,0))
print(AND(0,1))
print(AND(1,1))

0
0
0
1


In [10]:
# NAND gate

import numpy as np

def NAND (x1, x2):
  x = np.array([x1, x2])
  # 가중치와 편향의 부호만 반대로.
  w = np.array([-0.5, -0.5])
  b = 0.7
  tmp = np.sum(w*x) + b
  if tmp <= 0:
    return 0
  else:
    return 1

In [11]:
print(NAND(0,0))
print(NAND(1,0))
print(NAND(0,1))
print(NAND(1,1))

1
1
1
0


In [12]:
# OR gate

import numpy as np

def OR (x1, x2):
  x = np.array([x1, x2])
  # 편향의 값만 다르다.
  w = np.array([0.5, 0.5])
  b = -0.2
  tmp = np.sum(w*x) + b
  if tmp <= 0:
    return 0
  else:
    return 1

In [13]:
print(OR(0,0))
print(OR(1,0))
print(OR(0,1))
print(OR(1,1))

0
1
1
1


## Limitation of Single-layer Perceptron

- XOR(배타적 논리합) 게이트를 구현할 수 없다.
- 즉, 비선형 영역을 분리할 수 없다.

## Multi-layer Perceptron

위에서 구현한 AND, NAND, OR 게이트를 예시로 x1, x2가 입력, y가 출력일 때,  
x1과 x2를 각각 NAND 게이트와 OR 게이트의 입력으로 하여 출력된 결과 S1, S2를 AND 게이트의 입력으로 하였을 때, XOR 게이트를 구현할 수 있다.

- x1 --> s1 ⤵︎
- ----- x ----- y
- x2 --> s2 ⤴︎

- 0층, 1층, 2층으로 이루어진 다층 퍼셉트론

- Con. 퍼셉트론을 쌓는 것으로 비선형적 표현도 할 수 있다.

In [17]:
# XOR Gate

def XOR(x1, x2):
  s1 = NAND(x1, x2)
  s2 = OR(x1, x2)
  y = AND(s1, s2)
  return y

In [18]:
print(XOR(0,0))
print(XOR(1,0))
print(XOR(0,1))
print(XOR(1,1))

0
1
1
0


## Summary

- 퍼셉트론은 입출력을 갖춘 알고리즘, 입력했을 때 정해진 규칙에 따른 값을 출력한다.
- 퍼셉트론에서는 ‘가중치’와 ‘편향’을 매개변수로 설정한다.
- 퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있다.
- XOR 게이트는 단층 퍼셉트론으로는 표현할 수 없다.
- 2층 퍼셉트론을 이용하면 XOR 게이트를 표현할 수 있다.
- 단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다.
- 다층 퍼셉트론은 (이론상) 컴퓨터를 표현할 수 있다.