## 퍼셉트론

### 퍼셉트론이란?

퍼셉트론(perceptron)

- 다수의 신호를 입력으로 받아 하나의 신호를 출력

- 신호 -> 전류나 강물처럼 '흐름'이 있는 것
- 퍼셉트론 신호는 흐름을 만들고 정보를 앞으로 전달
- 실제 전류와 달리 퍼셉트론 신호는 '흐른다/안 흐른다'(1이나 0)의 두 가지 값을 가질 수 있음

- 입력 신호가 뉴런(노드)에 보내질 때 각각 고유한 가중치가 곱해짐

- 뉴런에서 보내온 신호의 총합이 정해진 한계를 넘어설 때만 1을 출력
- - 이를 '뉴런이 활성화한다'라 표현하기도 함
- 그 한계를 '임계값'이라 나타냄

- 퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여

- 가중치는 각 신호가 결과에 주는 영향력을 조절하는 요소로 작용
- 가중치가 클수록 해당 신호가 그만큼 더 중요

- 가중치는 전류에서 말하는 저항에 해당

- 다중치의 값이 클수록 강한 신호를 흘려보냄

### 단순한 논리회로

#### AND 게이트

- 입력이 둘이고 출력이 하나

- 두 입력이 모두 1일 때만 1을 출력하고, 그 외에는 0을 출력

#### NAND 게이트와 OR 게이트

- NAND -> Not AND

- AND 게이트의 출력을 뒤집은 것
- 입력이 모두 1일 떄만 0을 출력하고, 그 외에는 1을 출력

- OR 게이트

- 입력 신호 중 하나 이상이 1이면 출력이 1인 논리회로

- 퍼셉트론의 구조는 AND, NAND, OR 게이트 모두 똑같음

- 세 가지 게이트에서 다른 것은 매개변수(가중치와 임계값)의 값뿐
- 똑같은 구조의 퍼셉트론이 매개변수의 값만 적절히 조정하는 것

### 퍼셉트론 구현하기

#### 간단한 구현부터

- 논리회로를 파이썬으로 구현

- AND

In [1]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1 * w1 + x2 * w2
    if tmp <= theta:
        return 0
    elif tmp > theta:
        return 1

- 매개변수 w1, w2, theta는 함수 안에서 초기화

- 가중치를 곱한 입력의 총합이 임계값을 넘으면 1을 반환하고 그 외에는 0을 반환

In [3]:
print(AND(0, 0))  # 0
print(AND(1, 0))  # 0
print(AND(0, 1))  # 0
print(AND(1, 1))  # 1

0
0
0
1


#### 가중치와 편향 도입

- 편향(bias)

- 퍼셉트론은 입력 신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않으면 0을 출력

In [4]:
import numpy as np
x = np.array([0, 1])  # 입력
w = np.array([0.5, 0.5])  # 가중치
b = -0.7  # 편향
print(w * x)

[0.  0.5]


In [5]:
np.sum(w * x) + b

-0.19999999999999996

- 넘파이 배열끼리의 곱셈은 두 배열의 원소 수가 같다면 각 원소끼리 곱함

- np.sum() 메서드는 입력한 배열에 담긴 모든 원소의 총합을 계산
- 이 가중치에 편향을 더하면 계산 완료

#### 가중치와 편향 구현하기

- 가중치와 편향을 도입한 AND 게이트 구현

In [6]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w * x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

- w1, w2는 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수

- 편향은 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하느냐를 조정하는 매개변수
- 편향의 값은 뉴런이 얼마나 쉽게 활성화되는지를 결정

- 편향이라는 용어는 '한쪽으로 치우쳐 균형을 깬다'라는 의미를 가지고 있음

- NAND와 OR 게이트 구현

In [7]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w * x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

In [8]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w * x) + b
    if tmp <= 0:
        return 0
    else:
        return 1

- AND, NAND, OR는 모두 같은 구조의 퍼셉트론이고, 차이는 가중치 매개변수의 값

- AND와 다른 것은 가중치와 편향 값을 설정하는 부분밖에 없음

### 퍼셉트론의 한계

#### XOR 게이트

- XOR 게이트는 '베타적 논리합'이라는 논리 회로
- 베타적 -> 자기 외에는 거부

- 입력 중 한쪽이 1일 때만 1을 출력


#### 선형과 비선형

- 퍼셉트론은 직선 하나로 나눈 영역만 표현할 수 있다는 한계가 있음

- 곡선은 표현 불가
- 곡선의 영역을 비선형 영역, 직선의 영역을 선형 영역이라고 함

### 다층 퍼셉트론이 출동한다면

- 단층 퍼셉트론은 XOR 게이트를 표현할 수 없음


- 퍼셉트론은 층을 쌓아 다층 퍼셉트론(multi-layer perceptron)을 만들 수 있음

#### 기존 게이트 조합하기

- 처음 입력은 NAND와 OR 게이트의 입력

- NAND와 OR의 출력이 AND 게이트의 입력으로 이어짐

#### XOR 게이트 구현하기

In [9]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [10]:
print(XOR(0, 0))  # 0
print(XOR(1, 0))  # 1
print(XOR(0, 1))  # 1
print(XOR(1, 1))  # 0

0
1
1
0


- 다층 퍼셉트론 -> 층이 여러 개인 퍼셉트론

- 0층의 두 뉴런이 입력 신호를 받아 1층의 뉴런으로 신호를 보냄

- 1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴런은 y를 출력.....

- 다층 퍼셉트론은 단층 퍼셉트론으로 표현하지 못한 것을 층을 늘려 구현할 수 있음

- 퍼셉트론은 층을 쌓아(깊게 하여) 더 다양한 것을 표현 가능

### NAND에서 컴퓨터까지

- 다층 퍼셉트론은 지금까지 봐온 회로보다 복잡한 회로를 만들 수 있음

- 퍼셉트론을 이용하면 컴퓨터마저 표현 가능!

- 컴퓨터 -> 정보를 처리하는 기계

- 컴퓨터에 무언가를 입력하면 정해진 방법으로 처리하고 그 결과를 출력
- 정해진 방법으로 처리한다는 것은 컴퓨터도 마치 퍼셉트론처럼 입력과 출력으로 구성된 특정 규칙대로 계산을 수행한다는 뜻

- 컴퓨터 내부에서 이루어지는 처리가 매우 복잡할 것 같지만, 사실은 NAND 게이트의 조합만으로 컴퓨터가 수행하는 일을 재현할 수 있음

- 이 말은 곧 퍼셉트론으로도 컴퓨터를 표현할 수 있다는 말로 이어짐

- 다층 퍼셉트론은 컴퓨터도 만들 정도로 복잡한 표현을 해냄

### 정리

- 퍼셉트론은 입출력을 갖춘 알고리즘이다. 입력을 주면 정해진 규칙에 따른 값을 출력

- 퍼셉트론에서는 '가중치'와 '편향'을 매개변수로 설정
- 퍼셉트론으로 AND, OR 게이트 등의 논리 회로를 표현할 수 있음
- XOR 게이트는 단층 퍼셉트론으로는 표현할 수 없음
- 2층 퍼셉트론을 이용하면 XOR 게이트를 표현할 수 있음
- 단층 퍼셉트론은 직선형 영역만 표현할 수 있고, 다층 퍼셉트론은 비선형 영역도 표현 다능
- 다층 퍼셉트론은 이론상 컴퓨터를 표현할 수 있음