#[2장 퍼셉트론]
퍼셉트론의 구조와 작동을 배웠습니다. AND, OR, NAND Gate가 단층 퍼셉트론 구조에서 입력 신호를 가중치에 맞추어 분류할 수 있었습니다. 하지만, XOR gate는 단층이 아닌 다층 퍼셉트론(Multi Layer Perceptron)으로 풀 수 있었습니다. 다음 장에서는 이에 대해 더 자세히 공부해 볼 것입니다.


---


#[정리]
퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력한다.
퍼셉트론에서는 ‘가중치’와 ‘편향’을 매개변수로 설정한다.
퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있다.
XOR 게이트는 단층 퍼셉트론으로는 표현할 수 없다.
층 퍼셉트론을 이용하면 XOR 게이트를 표현할 수 있다.
단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다.
다층 퍼셉트론은 (이론상) 컴퓨터를 표현할 수 있다.



---
##2.1 퍼셉트론이란?
: 다수의 신호를 입력으로 받아 하나의 신호를 출력


$y = \begin{cases}
0, & (w_1 x_1 + w_2 x_2 \leq \theta) \\
1, & (w_1 x_1 + w_2 x_2 > \theta)
\end{cases}$


- $x_{1}$과 $x_{2}$ : 입력 신호
- $y$ : 출력 신호
- $w_{1}$과 $w_{2}$ : 가중치
- 뉴런(노드)
- **임계값** : 정해진 한계, $\theta$(세타)로 나타냄

→ 입력 신호에 고유한 **가중치**를 곱해 총합이 정해진 한계를 넘어서면 1을 출력  




---
##2.2 단순한 논리 회로  
##2.2.1 AND 게이트
x1, x2 두 입력이 모두 1일 때만 1을 출력하고, 그 외에는 0 출력




##2.2.2 NAND 게이트 와 OR 게이트
NAND 게이트: x1, x2가 모두 1일 때만 0 출력, 그 외에는 1 출력
OR 게이트: 입력 신호 중 하나 이상이 1이면 출력이 1이 되는 논리 회로



---
##2.3 퍼셉트론 구현하기
##2.3.1 간단한 구현부터




In [1]:
def AND(x1,x2):
  w1, w2, theta = 0.5, 0.5, 0.7
  tmp = x1*w1 +x2*w2
  if tmp <=theta:
    return 0
  elif tmp>theta:
    return 1

In [2]:
AND(0,0)

0

In [3]:
AND(0,1)

0

In [4]:
AND(1,0)

0

In [5]:
AND(1,1)

1

##2.3.2 가중치와 편향 도입
 $\theta$를 $-b$로 치환

$y = \begin{cases}
0, & (b+w_1 x_1 + w_2 x_2 \leq 0) \\
1, & (b+w_1 x_1 + w_2 x_2 > 0)
\end{cases}$



 $b$: 편향

In [6]:
import numpy as np
x=np.array([0,1]) #입력
w=np.array([0.5, 0.5]) #가중치
b=-0.7 #편향
w*x

array([0. , 0.5])

In [7]:
np.sum(w*x)

0.5

In [8]:
np.sum(w*x)+b #대략 -0.2 (부동소수점 수에 의한 연산 오차 )

-0.19999999999999996

##2.3.3 가중치와 편향 구현하기
AND, NAND, OR 는 모두 같은 구조의 퍼셉트론

차이는 가중치 매개변수의 값뿐

In [9]:
#AND
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = AND(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 0
(1, 0) -> 0
(0, 1) -> 0
(1, 1) -> 1


In [10]:
#NAND
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5]) #and와 가중치(w와 b)만 다르다!
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = NAND(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 1
(1, 0) -> 1
(0, 1) -> 1
(1, 1) -> 0


In [11]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2 #w와 b 가중치에서 차이
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

if __name__ == '__main__':
    for xs in [(0, 0), (1, 0), (0, 1), (1, 1)]:
        y = OR(xs[0], xs[1])
        print(str(xs) + " -> " + str(y))

(0, 0) -> 0
(1, 0) -> 1
(0, 1) -> 1
(1, 1) -> 1




---


##2.4 퍼셉트론의 한계
##2.4.1 도전! XOR 게이트
: 배타적 논리합 , x1과 x2 중 한쪽이 1일 때만 1을 출력 -> 선형에서는 불가능

##2.4.2 선형과 비선형
곡선의 영역을 비선형, 직선의 영역을 선형 영역



---


##2.5 다층 퍼셉트론이 출동한다면
다층 퍼셉트론 '층을 쌓는다'
##2.5.1 기존 게이트 조합하기


##2.5.2 XOR 게이트 구현하기



In [12]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [13]:
XOR(0,0)

0

In [14]:
XOR(1,0)

1

In [15]:
XOR(0,1)

1

In [16]:
XOR(1,1)

0

1. 0층의 두 뉴런이 입력 신호를 받아 1층의 뉴런으로 신호를 보낸다.
2. 1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴런은 y를 출력한다.

-> XOR 구현



---

##2.6 NAND에서 컴퓨터까지
다층 퍼셉트론은 컴퓨터를 표현할 수 있음