# 딥러닝(Deep Learning) 개요
- https://wikidocs.net/22882
- 머신러닝의 특정한 한 분야로서 인공 신경망(Artificial Neural Network)의 층을 연속적으로 깊게 쌓아올려 데이터를 학습하는 방법

## 퍼셉트론(Perceptron)
- https://wikidocs.net/24958
- 초기 인공 신경망인 퍼센트론

### 퍼셉트론
- 다수의 입력으로부터 하나의 결과를 내보내는 알고리즘
- 실제 뇌를 구성하는 신경 세포 뉴런의 동작과 유사
    - 뉴런은 가지돌기에서 신호를 받아들이고, 이 신호가 일정치 이상의 크기를 가지면 축삭돌기를 통해 신호를 전달
![image.png](attachment:image.png) <br>
![image-2.png](attachment:image-2.png) <br>
- 퍼센트론
    - 신경세포 뉴런의 입력신호와 출력신호가 퍼셉트론에서 각각 입력값과 출력값에 해당
    - x는 입력값을 의미, w는 가중치, y를 출력값
    - 그림 안의 원은 인공 뉴런에 해당
    - 실제 신경 세포 뉴런에서의 신호를 전달하는 축삭 돌기의 역할을 퍼센트론에서는 가중치가 대신
    - 각각의 입력값에는 각각의 가중치가 존재, 가중치의 값이 클수록 해당 입력값이 중요하다는 것을 의미
    - 각 입력값이 가중치와 곱해져서 인공 뉴런에 보내지고, 각 입력값과 그에 해당되는 가중치의 곱의 전체 합이 임계치(threshold)를 넘으면 종착지에 있는 인공 뉴런은 출력신호로서 1을 출력, 그렇지 않으면 0을 출력 -> 계단함수 Step Function
![image-3.png](attachment:image-3.png)
- 임계치값을 수식으로 표현할 때 보통 세타로 표현
![image-4.png](attachment:image-4.png)
- 편향b(bias)
    - 인공 신경망 자료에서 편의상 편향 b가 그림, 수식에서 생략돼서 표현, 실제로는 편향 b또한 딥러닝이 최적의 값을 찾아야 할 변수 중 하나
![image-5.png](attachment:image-5.png)<br>
- 활성화 함수 Activation Function: 뉴런에서 출력값을 변경시키는 함수
    - 초기 인공신경망 모델인 퍼셉트론은 활성화 함수로 계단함수를 사용
    - 이외에도 여러 다양한 활성화 함수 있음 (ex. 시그모이드 함수나 소프트맥스 포함)
        - 계단함수 대신 활성화함수를 시그모이드 함수로 변경 가능
        - 로지스틱 회귀 모델이 인공 신경망에서는 하나의 인공 뉴런으로 볼 수 있음

### 단층 퍼셉트론(Single-Layer Perceptron)
- 퍼셉트론은 단층 퍼센트론과 다층 퍼셉트론으로 나뉨
- 단층 퍼셉트론: 값을 보내는 단계과 값을 받아서 출력하는 두 단계로 구성
    - 각 단계를 보통 층(layer)라고 부름
    - 두 개의 층을 입력층 input layer과 출력층 output layer라고 함   

- 단층 퍼센트론의 기능과 한계점
    - 컴퓨터는 두 개의 값 0과 1을 입력해 하나의 값을 출력하는 회로가 모여 만들어짐
    - 이 회로를 게이트 gate 라고 부름
    - 초기 형태의 인공신경망인 단층 퍼셉트론은 간단한 XOR게이트조차 구현하지 못함
    - 단층 퍼셉트론을 이용하면, AND, NAND, OR 게이트는 구현 가능
    - AND게이트란 두 개의 입력값 x1, x2이 각각 0 또는 1의 값을 가질 수 있으면서 모두 1인 경우에만 출력값 y가 1이 나오는 구조
    ![image.png](attachment:image.png)

In [1]:
# AND 게이트를 위한 매개변수 값을 가진 단층 퍼센트론 식 구현
def AND_gate(x1, x2):
    w1 = 0.5 #임의로 가중치, 편향 조합 설정
    w2 = 0.5
    b = -0.7
    result = x1*w1 + x2*w2 + b
    if result <= 0:
        return 0
    else:
        return 1

In [2]:
# 오직 두 개의 입력값이 1인 경우에만 1을 출력
AND_gate(0, 0), AND_gate(0, 1), AND_gate(1, 0), AND_gate(1, 1)

(0, 0, 0, 1)

- NAND 게이트: 두 개의 입력값이 1인 경우에만 출력값이 0, 나머지 입력값의 쌍에 대해서는 모두 출력값이 1이 나오는 게이트
![image.png](attachment:image.png)

In [4]:
# NAND 게이트 단층 퍼셉트론 식 구현
# AND 게이트 같은 코드에 가중치와 편향만 수정
def NAND_gate(x1, x2):
    w1 = -0.5
    w2 = -0.5
    b = 0.7
    result = x1*w1 + x2*w2 + b
    if result <= 0:
        return 0
    else:
        return 1

In [5]:
NAND_gate(0, 0), NAND_gate(0, 1), NAND_gate(1, 0), NAND_gate(1, 1)

(1, 1, 1, 0)

- OR 게이트: 두 개의 입력이 모두 0인 경우에만 출력값이 0이고 나머지 경우에는 모두 출력값이 1인 게이트
![image.png](attachment:image.png)

In [6]:
# OR게이트 단층 퍼셉트론 식 구현
def OR_gate(x1, x2):
    w1 = 0.6
    w2 = 0.6
    b = -0.5
    result = x1*w1 + x2*w2 + b
    if result <= 0:
        return 0
    else:
        return 1

In [7]:
OR_gate(0, 0), OR_gate(0, 1), OR_gate(1, 0), OR_gate(1, 1)

(0, 1, 1, 1)

- XOR 게이트: 입력값 두 개가 서로 다른 값을 가지고 있을 때에만 출력값이 1이 되고, 입력값 두 개가 서로 같은 값을 가지면 출력값이 0이 되는 게이트
    - 단층 퍼센트론에서 구현 불가
    - 이유: 단층 퍼센트론은 직선 하나로 두 영역을 나눌 수 있는 문제에 대해서만 구현이 가능하기 때문
- AND 게이트 시각화
![image.png](attachment:image.png) <br>
- XOR 게이트 시각화
![image-2.png](attachment:image-2.png)
- 흰색 원과 검은색 원을 직선 하나로 나누는 것은 불가능
- 적어도 두 개의 선이 필요 -> 다층 퍼셉트론 (여러 개의 선으로 분류하는 효과 가능)

### 다층 퍼셉트론(MultiLayer Perceptron, MLP)
- XOR 게이트는 기존의 AND, NAND, OR 게이트를 조합하면 구현 가능 (퍼셉트론 관점에서, 층을 더 쌓으면 구현 가능)
- 다층 퍼셉트론과 단층 퍼셉트론의 차이
    - 단층 퍼셉트론은 입력층과 출력층만 존재
    - 다층 퍼셉트론은 중간에 층을 더 추가함
    - 입력층과 출력층 사이에 존재하는 층을 은닉층(Hidden Layer)라고 함
- 다층 퍼셉트론을 줄여서 MLP라고도 부름

- XOR 게이트 구현 다층 퍼셉트론의 예
![image.png](attachment:image.png)


- 심층 신경망
    - 은닉층이 2개 이상인 신경망
    ![image.png](attachment:image.png)