# 2.1 퍼셉트론이란? 

Perceptron : 프랑크 로젠블라트가 1957년에 고안한 알고리즘. 퍼셉트론이 신경망(딥러닝)의 기원이 되는 알고리즘. 
- 다수의 신호를 받아서 하나의 신호를 출력함. 
- 그 신호는 흐른다(1)/안흐른다(0)의 두가지로 출력함 

# 2.2 단순한 논리회로
- AND, NAND, OR 등 
- 여기서 가중치나 임계값 등은 hyperparameter.

# 2.3 퍼셉트론 구현하기

In [None]:
# 1. AND gate 간단한 구현
def AND(x1, x2) : 
  w1, w2, theta = 0.5, 0.5, 0.7
  tmp = x1*w1 + x2*w2 
  if tmp <= theta : 
    return 0
  elif tmp > theta :
    return 1

print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
0
1


In [None]:
# 2. 가중치와 편향 도입 
import numpy as np
x = np.array([0, 1])
w = np.array([0.5, 0.5])
b = - 0.7  # theta 값에 -를 붙임. 이를 편향이라고 칭함. 

print(w*x)
print(np.sum(w*x)) 
print(np.sum(w*x) + b)

[0.  0.5]
0.5
-0.19999999999999996


In [None]:
# 3. 가중치와 편향 구현하기 
def AND(x1, x2) :
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.7
  tmp = np.sum(w*x) + b
  if tmp <= 0 :
    return 0
  else :
    return 1

가중치와 편향의 역할은 다름. 
- 가중치(w1, w2) : 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수. 
- 편향 : 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하느냐를 조정하는 매개변수.<br> 

<br> 
예를 들어, b가 -0.1이면 각 입력 신호에 가중치를 곱한 값들의 합이 0.1을 초과할 때만 뉴런이 활성화 됨. 반면 b가 -20.0이면 각 입력 신호에 가중치를 곱한 값들이 20.0을 넘지 않으면 뉴런은 활성화 되지 않음. 이처럼 편향의 값은 뉴련이 얼마나 쉽게 활성화되는지 결정함. 

In [None]:
# NAND 구현
def NAND(x1, x2) :
  x = np.array([x1, x2])
  w = np.array([-0.5, -0.5]) # and와 반대 부호
  b = 0.7 # and와 반대 부호 
  tmp = np.sum(w*x) + b
  if tmp <= 0 :
    return 0
  else :
    return 1


# OR 구현
def OR(x1, x2) :
  x = np.array([x1, x2])
  w = np.array([0.5, 0.5])
  b = -0.2 
  tmp = np.sum(w*x)  + b
  if tmp <= 0 :
    return 0
  else :
    return 1

# 2.4 퍼셉트론의 한계

XOR 게이트 : 배타적 논리. x1, x2 중 하나만 1인 값을 가질 때 1을 출력. <br>
$\rightarrow$ 선형 퍼셉트론에서는 못 만듦. 하지만 선형을 가정하지 않은 비선형에 대해서는 가능. 
$\rightarrow$ 퍼셉트론은 직선 하나로 나눈 영역만 표현할 수 있다는 한계가 있음.

# 2.5 다층 퍼셉트론이 충돌한다면

XOR은 퍼셉트론으로는 구현이 불가함. 다층 퍼셉트론(multi-layer perceptron)의 개념이 이제 도입됨.

In [None]:
# 2. XOR 게이트 구현하기
def XOR(x1, x2) :
  s1 = NAND(x1, x2) 
  s2 = OR(x1, x2)
  y = AND(s1, s2)
  return y

In [None]:
print(XOR(0, 0))
print(XOR(1, 0))
print(XOR(0, 1))
print(XOR(1, 1))

0
1
1
0


방금 2-layer perceptron을 이용하여 XOR 게이트를 구현해 보았음. 이와 같이 비선형적인 표현은 다층 퍼셉트론을 이용하여 가능함. <br>
다층 퍼셉트론 만으로도 (그 중 NAND 만으로도) 컴퓨터를 만드는 일이 가능함. 
비선형적인 시그모이드 함수를 활성화 함수로 이용하면 임의의 함수를 표현할 수 있다는 사실이 증명됨(3장에서). ...