<a href="https://colab.research.google.com/github/wldopie/ESAA/blob/main/HW_221125.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Chap 3. 케라스 (Keras)**

---




## **1. 딥러닝 준비**

### **1.1 주요 용어**

> 하이퍼파라미터 (hyper-parameter)

  - `하이퍼파라미터`
    - 머신러닝 모델을 훈련할 때 사용자가 직접 설정해주는 설정 값
    - 학습 속도, 반복 훈련 횟수 등

  - 하이퍼 파라미터 튜닝
    - 하이퍼파라미터의 값을 조절하는 행위

> 과소적합 vs. 과대적합 (underfitting vs. overfitting)

  - `과소적합` (underfitting)
    - 모델이 `충분히 학습되지 않은` 경우

  - `과대적합` (overfitting)
    - 학습 데이터를 `지나치게 반복 학습하여 과하게 적합`된 상태
    - 이 경우 훈련 데이터에 존재하는 불필요한 노이즈까지 과도하게 모델에 반영되어 주어진 훈련 데이터에 대한 예측 성능은 좋지만, 정작 예측 데이터에 대한 예측 오차가 발생할 확률이 커진다.

  - 해결 방법
    1. 훈련 데이터와 예측 데이터의 분포가 동일하도록 구성한다.
    2. 불필요한 노이즈는 데이터 분석 및 전처리를 통해 해소한다.
    3. 훈련 데이터의 일부를 검증 데이터로 사용해 검증 성능이 가장 좋은 구간을 모델의 가장 이상적인 학습된 지점이라 판단하여 최종 모델을 결정한다.

> 에포크 (epoch)

  - 딥러닝은 데이터셋을 학습하는 과정을 여러 번 반복하면서 최적의 모델 가중치를 찾는 과정이다.
  - 에포크 (epoch)
    - 딥러닝 모델이 반복 훈련을 할 때 데이터셋을 전부 학습에 사용하는 1회의 훈련 루프

> 손실함수 (loss function)

  - 손실함수
    - 예측 값과 정답 값의 차이 또는 오차

  - 지도 학습의 `분류`
    - `이진 분류` (binary classification) : `binary_crossentropy` 손실함수를 사용, 출력층의 `활성화 함수`는 `sigmoid`
    - `다중 분류` (multi-class classification)
      1. 정답 클래스가 `원핫 벡터`인 경우
        - `categorical_crossentropy` 손실함수를 사용
      2. 정답 클래스가 `원핫 벡터가 아닌` 경우
        - `sparse_categorical_crossentropy` 손실함수를 사용
      - 두 경우 모두 출력층의 `활성함수`로 `softmax`를 사용

  - 지도 학습의 `회귀`
    - MSE, MAE, Huber 등


In [1]:
# 예시
import tensorflow as tf

# 클래스
tf.keras.losses.BinaryCrossentropy()

# 함수
tf.keras.losses.binary_crossentropy

<function keras.losses.binary_crossentropy(y_true, y_pred, from_logits=False, label_smoothing=0.0, axis=-1)>

> 경사하강법 (gradient descent)

  - 경사하강법
    - 딥러닝 모델을 훈련할 때, 모델 내부의 가중치에 대한 미분 값을 구하고 목적 함수 값이 낮아지는 방향으로 차감하면서 결국 최소 함수 값을 갖도록 하는 방법

### **1.2 딥러닝 프로세스**

> 데이터 전처리

> 모델 생성

> 모델 컴파일

> 모델 훈련

> 모델 검증

> 모델 예측

---

## **2. 단순 신경망 훈련**

### **2.1 선형회귀**

### **2.2 뉴런 (Neuron)**

### **2.3 Dense 레이어**

### **2.4 데이터셋 만들기**

### **2.5 Sequential API**

> 모델 구조

> 입력 데이터 형태

> 단순선형회귀 모델 정의

### **2.6 모델 요약**

### **2.7 컴파일**

### **2.8 훈련**

### **2.9 검증**

### **2.10 예측**

---

## **3. 심층 신경망으로 이미지 분류**

### **3.1 케라스 내장 데이터셋 로드**

### **3.2 데이터 전처리**

### **3.3 Flatten 레이어**

### **3.4 활성화 함수**

### **3.5 입력과 출력**

### **3.6 손실함수**

### **3.7 옵티마이저**

### **3.8 평가지표**

### **3.9 훈련**

### **3.10 평가**

### **3.11 예측**

---

## **4. 모델 세부 설정** 

### **4.1 초기값 설정**

### **4.2 규제 (Regularization)**

### **4.3 드롭아웃 (Dropout)**

### **4.4 배치 정규화 (Batch Normalization)**

### **4.5 활성화 함수**