# CHAPTER2 퍼셉트론

- 퍼셉트론이란?
- 단순한 논리 회로
- 퍼셉트론 구현하기
- 퍼셉트론의 한계
- 다층 퍼셉트론이 출동한다면
- NAND에서 컴퓨터까지
- 정리

---

### 2.1 퍼셉트론이란?

- 퍼셉트론은 프링크 로젠블라트가 1957년에 고안한 알고리즘입니다.
- 퍼셉트론은 다수의 신호를 입력으로 받아 `하나의 신호`를 출력합니다.
- 실제 전류와 달리 퍼셉트론 신호는 `'흐른다/안흐른다(1이나 0)'`의 두 가지 값을 가질 수 있습니다.

<img src = 'img/perceptron1.png'>

- $X_1$, $X_2$는 입력신호라고 하고, $y$는 출력신호, $W_1$, $W_2$는 가중치라고 합니다.
- 그림의 원은 `뉴런`, 혹은 `노드`라고 부릅니다.
- 입력신호가 뉴런에 보내질 때는 각각의 고유한 가중치가 곱해집니다.
- $y = X_1W_1 + X_2W_2$
- 뉴런에서 보내온 신호의 총합이 정해진 한계(임계값, $\theta$)를 넘어설 때만 1을 출력합니다.
- 가중치가 클수록 해당 신호가 값이 커지기 때문에 그만큼 더 중요하다는 것을 의미합니다.

---

### 2.2 단순한 논리 회로

#### 2.2.1 AND 게이트

: 두 입력이 모두 1일때만 1을 출력, 그 외에는 0을 출력

In [2]:
AND = pd.DataFrame(columns = ['x1', 'x2', 'y'])
AND['x1'] = [0, 1, 0, 1]
AND['x2'] = [0, 0, 1, 1]
AND['y'] = [0, 0, 0, 1]
AND

Unnamed: 0,x1,x2,y
0,0,0,0
1,1,0,0
2,0,1,0
3,1,1,1


#### 2.2.2 NAND 게이트

: Not AND (AND와 반대), 두 입력이 모두 1일때만 0을 출력, 그 외에는 1을 출력

In [3]:
NAND = pd.DataFrame(columns = ['x1', 'x2', 'y'])
NAND['x1'] = [0, 1, 0, 1]
NAND['x2'] = [0, 0, 1, 1]
NAND['y'] = [1, 1, 1, 0]
NAND

Unnamed: 0,x1,x2,y
0,0,0,1
1,1,0,1
2,0,1,1
3,1,1,0


#### 2.2.3 OR 게이트

: 두 입력 중 하나만 1일이여도 1을 출력, 그 외에는 0을 출력

In [4]:
OR = pd.DataFrame(columns = ['x1', 'x2', 'y'])
OR['x1'] = [0, 1, 0, 1]
OR['x2'] = [0, 0, 1, 1]
OR['y'] = [0, 1, 1, 1]
OR

Unnamed: 0,x1,x2,y
0,0,0,0
1,1,0,1
2,0,1,1
3,1,1,1


---

### 2.3 퍼셉트론 구현하기

#### 2.3.1 간단한 구현부터

In [8]:
# make AND function
def AND(x1, x2) :
    
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2

    if tmp < theta :
        return 0
    elif tmp > theta :
        return 1
    

print(AND(0,0))
print(AND(1,0))
print(AND(0,1))
print(AND(1,1))

0
0
0
1


#### 2.3.2 가중치와 편향 도입

- 우변을 0으로 만들기 위해 $\theta$를 좌편으로 옮기고 이를 $b$라고 한다. ($\theta$ = $-b$)
- $b$를 편향(bias)이라고 한다.
- $b$에 값에 따라 뉴런의 활성화 기준이 세워지는 것이기 때문에 이 값은 뉴런이 얼마나 쉽게 활성화되는지를 결정한다.

In [13]:
# make AND function (bias)
# w와 b는 조건에 맞게 적절히 설정해줘야 한다.
def AND(x1, x2) :
    
    X = np.array([x1, x2])
    W = np.array([0.5, 0.5])
    b = -0.7
    
    tmp = np.sum(X*W) + b

    if tmp <= 0 :
        return 0
    elif tmp > 0 :
        return 1
    

print(AND(0,0))
print(AND(1,0))
print(AND(0,1))
print(AND(1,1))

0
0
0
1


In [15]:
# make NAND function (bias)
# w와 b는 조건에 맞게 적절히 설정해줘야 한다.
def NAND(x1, x2) :
    
    X = np.array([x1, x2])
    W = np.array([-0.5, -0.5])
    b = 0.7
    
    tmp = np.sum(X*W) + b

    if tmp <= 0 :
        return 0
    elif tmp > 0 :
        return 1
    

print(NAND(0,0))
print(NAND(1,0))
print(NAND(0,1))
print(NAND(1,1))

1
1
1
0


In [16]:
# make NAND function (bias)
# w와 b는 조건에 맞게 적절히 설정해줘야 한다.
def OR(x1, x2) :
    
    X = np.array([x1, x2])
    W = np.array([0.5, 0.5])
    b = -0.2
    
    tmp = np.sum(X*W) + b

    if tmp <= 0 :
        return 0
    elif tmp > 0 :
        return 1
    

print(OR(0,0))
print(OR(1,0))
print(OR(0,1))
print(OR(1,1))

0
1
1
1


### 2.4 퍼셉트론의 한계

#### 2.4.1 XOR 게이트

: $x_1$, $x_2$ 중 한쪽이 1일때만 1을 출력한다. (배타적 논리합)

In [17]:
XOR = pd.DataFrame(columns = ['x1', 'x2', 'y'])
XOR['x1'] = [0, 1, 0, 1]
XOR['x2'] = [0, 0, 1, 1]
XOR['y'] = [0, 1, 1, 0]
XOR

Unnamed: 0,x1,x2,y
0,0,0,0
1,1,0,1
2,0,1,1
3,1,1,0


: 문제는 XOR은 하나의 직선으로 0, 1을 구분할수가 없다는 점이다.

#### 2.4.2 선형과 비션형

<img src = 'img/perceptron2.png' width = 500>

- 하지만 곡선으로 나눌수 있다.
- 곡선을 활용하는 방법은 퍼셉트론을 여러개 사용하는 것이다.

---

### 2.5 다중 퍼셉트론이 출동한다면

#### 2.5.1 기존 게이트 조합하기

<img src = 'img/perceptron3.jpg'>

- 왼쪽 위 (AND), 왼쪽 아래 (OR)를 합하고 (AND)과정을 겪으면 곡선형태로 나타낼 수 있다.

#### 2.5.2 XOR 게이트 구현하기

In [18]:
def XOR(x1, x2) :
    
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y


print(XOR(0,0))
print(XOR(1,0))
print(XOR(0,1))
print(XOR(1,1))

0
1
1
0


<img src = 'img/perceptron4.png' width = 400>

- 이처럼 층이 여러개인 퍼셉트론을 다층 퍼셉트론이라 한다.
- 퍼셉트론은 층을 쌓아(깊게 하여) 더 다양한 것을 표현할 수 있습니다.

---

### 2.6 NAND에서 컴퓨터까지 

: NAND 게이트의 조합만으로 컴퓨터가 수행하는 일을 재현할 수 있다.

---

### 2.7 정리

- 퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력한다.
- 퍼셉트론에서는 '가중치'와 '편향'을 매개변수로 설정한다.
- 퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있다.
- XOR 게이트 단층 퍼셉트론으로는 표현할 수 없다.
- 2층 퍼셉트론을 이용하면 XOR 게이트를 표현할 수 있다. 
- 단층 퍼셉트론을 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다.
- 다층 퍼셉트론은 (이론상) 컴퓨터를 표현할 수 있다.