# 밑바닥 부터 시작하는 딥러닝

> **목차**
```
2.1 퍼셉트론이란? 
2.2 단순한 논리 회로 
__2.2.1 AND 게이트 
__2.2.2 NAND 게이트와 OR 게이트 
2.3 퍼셉트론 구현하기 
__2.3.1 간단한 구현부터 
__2.3.2 가중치와 편향 도입 
__2.3.3 가중치와 편향 구현하기 
2.4 퍼셉트론의 한계 
__2.4.1 도전! XOR 게이트 
__2.4.2 선형과 비선형 
2.5 다층 퍼셉트론이 출동한다면 
__2.5.1 기존 게이트 조합하기 
__2.5.2 XOR 게이트 구현하기 
2.6 NAND에서 컴퓨터까지
```
---

# Chapter 2: 퍼셉트론

- 퍼셉트론(perceptron) 알고리즘

- 1957년, 프랑크 로젠블라트(Frank Rosenblatt)

- 신경망(딥러닝)의 기원이 되는 알고리즘

## 2.1 퍼셉트론이란?

- 퍼셉트론: 다수의 신호(흐름)를 입력으로 받아 하나의 신호를 출력한다.

<img src = "deep_learning_images/fig 2-1.png" width = "30%" height = "30%" align="left">  

- 입력 신호 2개: x1, x2
- 출력신호: y
- 가중치: w1, w2

$\begin{split}y = \begin{cases}
0 & \quad (w_1 x_1 + w_2 x_2 <= \theta) \\
1 & \quad (w_1 x_1 + w_2 x_2 > \theta)
\end{cases}\end{split}$

- 신호의 총합이 한계(임계값)를 넘어설 때만 1 출력
- 가중치는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용. 즉, 가중치가 클수록 해당 신호가 그만큼 더 중요하다.
    - 가중치(=전류에서 말하는 저항)

## 2.2 단순한 논리 회로

### 2.2.1 AND 게이트


|x1|x2|y|
|---|---|---|
|0|0|0|
|1|0|0|
|0|1|0|
|1|1|1|

- 조건을 충족하는 퍼셉트론 만들기
    - w1, w1, theta 값
    - ex) (0.5, 0.5, 0.7), (0.5, 0.5, 0.8), (1.0, 1.0, 1.0)

### 2.2.2 NAND 게이트와 OR 게이트

1. NAND: Not AND
|x1|x2|y|
|---|---|---|
|0|0|1|
|1|0|1|
|0|1|1|
|1|1|0|

    - 조건을 충족하는 퍼셉트론 만들기
        - w1, w1, theta 값
        - ex) (-0.5, -0.5, -0.7), AND게이트의 부호 반전

<br/>

2. OR
|x1|x2|y|
|---|---|---|
|0|0|0|
|1|0|1|
|0|1|1|
|1|1|1|

    - 조건을 충족하는 퍼셉트론 만들기
        - w1, w1, theta 값
        - ex) (0.5, 0.5, 0.4)

> 퍼셉트론의 매개변수 값을 정하는 것은 컴퓨터가 아니라 우리 인간이다. 인간이 직접 진리표라는 '학습 데이터'를 보면서 매개변수의 값을 생각한다. 기계학습 문제는 이 매개변수의 값을 정하는 작업을 컴퓨터가 자동으로 하도록 한다. 학습이란 적절한 매개변수 값을 정하는 작업이며, 사람은 퍼셉트론의 구조(모델)를 고민하고 컴퓨터에 학습할 데이터를 주는 일을 한다.

## 2.3 퍼셉트론 구현하기

### 2.3.1 간단한 구현부터

In [1]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

print(AND(0, 0)) # 0
print(AND(1, 0)) # 0
print(AND(0, 1)) # 0
print(AND(1, 1)) # 1

0
0
0
1


### 2.3.2 가중치와 편향 도입

$\begin{split}y = \begin{cases}
0 & \quad (b + w_1 x_1 + w_2 x_2 <= 0) \\
1 & \quad (b + w_1 x_1 + w_2 x_2 > 0)
\end{cases}\end{split}$

- theta를 -b로 치환(bias:편향)

In [2]:
import numpy as np

x = np.array([0, 1]) # 입력
w = np.array([0.5, 0.5]) # 가중치
b = -0.7 # 편향
print(w*x)
print(np.sum(x*w))
print((np.sum(x*w)+b))

[0.  0.5]
0.5
-0.19999999999999996


### 2.3.3 가중치와 편향 구현하기

In [3]:
def AND(x1, x2):
    x = np.array([x1, x2]) # 입력
    w = np.array([0.5, 0.5]) # 가중치
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print(AND(0, 0)) # 0
print(AND(1, 0)) # 0
print(AND(0, 1)) # 0
print(AND(1, 1)) # 1

0
0
0
1


- 편향은 가중치(w1, w2)와 기능이 다르다.
    - 가중치(w1, w2): 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수
    - 편향: 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하느냐를 조정하는 매개변수

In [4]:
import numpy as np 

def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(x*w) + b
    if tmp <= 0:
        return 0
    else:
        return 1

def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(x*w) + b
    if tmp <= 0:
        return 0
    else:
        return 1

print(NAND(0,0)) # 1
print(NAND(1,0)) # 1
print(NAND(0,1)) # 1
print(NAND(1,1)) # 0

print(OR(0,0)) # 0
print(OR(1,0)) # 1
print(OR(0,1)) # 1
print(OR(1,1)) # 1

1
1
1
0
0
1
1
1


- AND, NAND, OR은 모두 같은 구조의 퍼셉트론
- 차이는 가중치 매개변수 값 뿐이다.

## 2.4 퍼셉트론의 한계

### 2.4.1 도전! XOR 게이트

- XOR 게이트: 베타적 논리 합

|x1|x2|y|
|---|---|---|
|0|0|0|
|1|0|1|
|0|1|1|
|1|1|0|

    - x1, x2 중 한쪽이 1일 때만 1을 출력

- OR 게이트의 동작
    - (b, w1, w2) = (-0.5, 1.0, 1.0)
    - (x1, x2) = (0, 0) -> 0 출력. 나머지 1 출력.
    - 원을 0, 삼각형을 1
    - 네 점을 나누는 직선 표현 가능
    <br/><br/>
    $\begin{split}y = \begin{cases}
    0 & \quad (-0.5 + x_1 + x_2 <= 0) \\
    1 & \quad (-0.5 + x_1 + x_2 > 0)
    \end{cases}\end{split}$

    <img src = "deep_learning_images/fig 2-6.png" width = "30%" height = "30%" align="left">


- XOR
    - 직선으로 나누기 불가능
    
    <img src = "deep_learning_images/fig 2-7.png" width = "30%" height = "30%" align="left">  

### 2.4.2 선형과 비선형

- 곡선이라면 XOR 나누기 가능(비선형)

    <img src = "deep_learning_images/fig 2-8.png" width = "30%" height = "30%" align="left">  

## 2.5 다층 퍼셉트론이 출동한다면

- 단층 퍼셉트론(single-layer perceptron)으로 XOR 게이트 표현 X
- 다층 퍼셉트론(multi-layer perceptron)으로 XOR 게이트 표현 O

### 2.5.1 기존 게이트 조합하기

- (NAND, OR) -> (AND)
    - s1: NAND 통과
    - s2: OR 통과
    - y: AND 통과

    <img src = "deep_learning_images/fig 2-11.png" width = "30%" height = "30%" align="left">  
    <img src = "deep_learning_images/fig 2-12.png" width = "30%" height = "30%" align="left">  

### 2.5.2 XOR 게이트 구현하기

In [5]:
# NAND, OR 이후 AND -> 다층 퍼셉트론(multi-layer perceptron)
def XOR(x1, x2):
    s1 = NAND(x1,x2)
    s2 = OR(x1,x2)
    y = AND(s1,s2)
    return y

print(XOR(0,0)) # 0
print(XOR(1,0)) # 1
print(XOR(0,1)) # 1
print(XOR(1,1)) # 0

0
1
1
0


<img src = "deep_learning_images/fig 2-13.png" width = "30%" height = "30%" align="left">

## 2.6 NAND에서 컴퓨터까지

- NAND 게이트만으로 컴퓨터를 만들 수 있다 --> 퍼셉트론으로도 컴퓨터를 표현할 수 있다
- 퍼셉트론은 층을 거듭 쌓으면 비선형적인 표현도 가능하고, 이론상 컴퓨터가 수행하는 처리도 모두 표현할 수 있다

## 2.7 정리

> **이번 장에서 배운 내용**
* 퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력한다.
* 퍼셉트론에서는 ‘가중치’와 ‘편향’을 매개변수로 설정한다.
* 퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있다.
* XOR 게이트는 단층 퍼셉트론으로는 표현할 수 없다.
* 2층 퍼셉트론을 이용하면 XOR 게이트를 표현할 수 있다.
* 단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다.
* 다층 퍼셉트론은 (이론상) 컴퓨터를 표현할 수 있다.