In [2]:
import numpy as np

# 2. 퍼셉트론

퍼셉트론은 다수의 신호를 입력으로, 하나의 신호를 출력으로 하는 알고리즘이다. 딥러닝의 기반이 되는 알고리즘이기도 하다. 가중치 w를 고려하며, 임계값 theta를 넘을 때 신호가 1을 출력하고 넘지 않을 때는 0을 출력한다.


<div>
<img src="fig2.1.jpg" width="500"/>
</div>

<div>
<img src="equ2.1.jpg" width="500"/>
</div>

## 2.2 단순 논리 회로 (AND, NAND, OR)

논리 회로에는 AND, NAND, OR 게이트가 있다. 단순히 이야기하자면, AND는 y=1을 조건으로 x1과 x2의 교집합, OR는 합집합, NAND는 AND의 반대 게이트 역할을 한다. 게이트마다 가능한 w1, w2, theta 조합은 무한하다.

e.g.
- AND: x1 = 0, x2 = 1, then y = 0
- NAND: x1 = 1, x2 = 1, then y = 0
- OR: x1 = 1, x2 = 0, then y = 1

In [1]:
# AND gate

def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w1 + x2*w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1
    
print(AND(0, 0))
print(AND(1, 0))
print(AND(0, 1))
print(AND(1, 1))

0
0
0
1


<div>
<img src="equ2.2.jpg" width="500"/>
</div>

여기서는 임계값 대신 편향 b를 사용했다. 입력 신호에 가중치를 곱한 값과 편향을 합하여 0 이상이면 1을, 그렇지 않다면 0을 출력한다.

In [3]:
x = np.array([0, 1])
w = np.array([0.5, 0.5])
b = -0.7

print(w*x)
print(np.sum(w*x))
print(np.sum(w*x)+b)

[0.  0.5]
0.5
-0.19999999999999996


**가중치 w는 입력 신호가 결과에 주는 영향력을 조절**하는 매개변수고, **편향 b는 뉴런이 얼마나 쉽게 활성화(1 출력)되는지 조정**하는 매개변수다.

In [11]:
# AND gate using bias

def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [9]:
# NAND gate using bias

def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5]) # Note that w is reversed
    b = 0.7                    # Note that b is reversed
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [7]:
# OR gate using bias

def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5]) # Note that w is different
    b = -0.2                 # Note that b is different
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

## 2.4 퍼셉트론의 한계

XOR 게이트는 배타적 논리합으로, x1과 x2 중 하나가 1일 때만 1을 출력한다. 하나의 퍼셉트론으로 구분할 수 없는 이유는 그림으로 설명 가능하다.

<div>
<img src="fig2.2.jpg" width="500"/>
</div>

퍼셉트론은 직선 하나로 영역을 나누는데, XOR 게이트는 그림에서 보이듯 곡선으로만 영역을 나눌 수 있다. 따라서 비선형 영역이기에 하나의 퍼셉트론으로는 구현할 수 없다.

이와 같은 논리 회로를 구현하려면 층을 쌓아 **다층 퍼셉트론**을 구현한다:

1. x1과 x2를 NAND 게이트로 입력시킨다.
2. x1과 x2를 OR 게이트로 입력시킨다. (1과 독립적으로)
3. NAND 출력값과 OR 출력값을 AND 게이트로 입력시킨다.

<div>
<img src="fig2.3.jpg" width="500"/>
</div>

In [12]:
# XOR gate

def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

print(XOR(0, 0))
print(XOR(1, 0))
print(XOR(0, 1))
print(XOR(0, 0))

0
1
1
0


## Takeaways:

- 퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력한다.
- 퍼셉트론에서는 *가중치*와 *편향*을 매개변수로 설정한다.
- 퍼셉트론으로 AND, NAND, OR 게이트 등의 논리 회로를 표현할 수 있다.
- XOR 게이트는 단층 퍼셉트론으로는 표현할 수 없다. 2층 퍼셉트론으로 표현할 수 있다.
- 단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현할 수 있다. (다층 퍼셉트론은 이론상 컴퓨터도 표현 가능하다.)

# 3. 신경망

퍼셉트론으로 복잡한 함수도 표현이 가능하나, 단점은 가중치 설정은 여전히 수동으로 해야 한다는 점이다. 신경망의 경우 해당 단점이 개선된다.

## 3.1 신경망의 개념

<div>
<img src="fig3.1.jpg" width="500"/>
</div>

신경망의 형태는 퍼셉트론과 다르지 않으나, 신호를 보내는 방식이 다양해진다. 편향을 사용했던 퍼셉트론 공식을 다음과 같이 다른 형태로 바꿔 쓸 수 있다.

<div>
<img src="equ3.1.jpg" width="500"/>
</div>

여기서 h(x)를 **활성화 함수**라 칭하며, 해당 함수는 **입력 신호의 총합이 활성화를 일으키는지 판단**한다.