# 다층 신경망 (Multi Layer Preceptron)

- 인공지능 > 머신러닝 < 딥러닝
    - 딥러닝 : 신경망, 비 선형 문제에서 좀 더 장점을 보인다.
        - **활성화 함수 : 비선형 문제의 핵심**
    - 전통적인 머신러닝
        - 선형적인 분포와 가정을 기반한다.
        - 특징 추출 과정에서 도메인 지식을 요한다.
        - 선택한 피쳐의 퀄리티에 크게 의존

## 기본적으로 알아야 할 이론

- 신경망 학습 프로세스
- 활성화 함수, 비용(Error) 함수
- 오차 역전파 (back propagation)
- 옵티마이저
- 오버피팅

## 종류

- FNN : Feedforward neural Net - 지도학습
- CNN : Convolution neural Net - 지도학습
    - 사전 학습 모델
    - 전이 학습
    - 오브젝트 Detection 모델 : YOLO, SSD, R-CNN 종류 등
- RNN : Recurrent neural Net - 지도학습
    - Seq2Seq
    - LSTM, GRU
- LM : Language Model
    - Transformer(Attention is all you need)
    - BERT & BERT 파생들
    - GPT 모
- AE : Auto Encoder - Self Supervised model

# 딥러닝의 구조

## 노드 (Node, 뉴런)

정보를 받아 입 출력하는 기본단위.

여러 입력을 받아 하나의 출력을 생성

- 역할 :
    1. 신호 처리 : 곱과 합을 이용
    2. 비 선형성 : 활성화 함수 이용
    3. 정보 통합 : 곱하여 더하므로 정보를 통합

## 가중치 (weights)

각 연결선에 할당.

영향을 끼치는 정도

- 역할 :
    - 입력 중요도 : 각 피쳐 별 중요도 부여
    - 학습 : 가중치를 업데이트 하며 학습한다.
    - 신호 전달

## 편향 노드 (bias node)

선형 회귀에서의 절편 : 즉 평행 이동, 모델 일반화에 큰 도움을 준다

활성화 함수가 결정하는 임계 값 이상일 때 노드를 활성화 한다.

(바이어스 값이 노드의 활성화를 조절한다.)

- 활성화 임계를 조정
  편향을 통해 모델은 입력 데이터가 없거나 0에 가까울 때도 활성화 <br>
-> 모델의 학습 능력과 일반화 능력 향상


## 레이어

- 입력 레이어 및 출력 레이어 : 각 1층 씩
- 은닉층은 설계자의 결정
- 레이어 별 이름
    - Single Layer Perceptron : 단층, 은닉 층 없음
    - Multi Layer Perceptron : 다층, 은닉 층 있음
    - Shallow Neural Net : 얕은 신경망, 은닉 층은 하나
    - Deep Neural Net : 심층 신경망, 은닉 층은 두개 이상

### 단층 퍼셉트론 및 다층 퍼셉트론

- 단층 퍼셉트론의 한계점 : XOR 같은 비선형 문제를 해결 불가능 하다. 실제 세상은 대부분 비선형
- 단층 퍼셉트론 에서의 역 전파? : 역 전파의 개념이 생긴 시점은 다층 퍼셉트론 부터 이다.
- 다층 퍼셉트론의 특징 : 비선형성은 활성화 함수로 표현 된다(**범용 근사자 : 충분히 크고 복잡한 문제라도 이론적으로 학습이 가능하다.**), 역 전파로 오류를 최소화 한다.

## 인공 신경망의 프로세스

- 프로그래밍 적 관점 :
    1. 데이터 세팅
    2. 독립 변수 및 종속변수 관계 파악 및 비용함수 최소화
    3. 모델 성능 평가
    4. 종속 변수의 예측
- 내부 거동의 관점 :
    1. Weights 및 biases 초기화
    2. 순 전파
    3. 오차 계산
    4. 오류 함수의 역 전파 
    5. 가중치 업데이트
    6. 과 적합 및 정규화 : L1 및 L2 정규화, 드롭 아웃 등
    7. 반복 학습

## 선형 회귀 모형과 신경망 모델의 차이

- 선형 회귀 모형 : $\hat{y} = b_0 + b_1  X_1 +  b_2  X_2 + b_3  X_3 + b_4  X_4$
- 위의 선형 회귀 모형과 신경망 모델의 차이 : 은닉 층의 존재 여부

## 출력 노드의 수

- 회귀 문제 : 1개
- 분류 문제 : 정답 라벨의 개 수.