# 02. 다층신경망

In [2]:
from tensorflow import keras
from sklearn.model_selection import train_test_split

In [3]:
(x_train, y_train), (x_test, y_test) = keras.datasets.fashion_mnist.load_data()

## 1. 데이터 전처리

- 픽셀값을 0 ~ 1 사이로 스테일링
- 2차원 배열을 1차원 배열로 변환
- 훈련, 검증 나누기

In [5]:
scaled_train = x_train / 255
scaled_train = scaled_train.reshape(-1, 28 * 28)
scaled_train, scaled_val, y_train, y_test = train_test_split(scaled_train, y_train,
                                                             test_size = 0.2,
                                                             stratify = y_train, random_state = 26)

## 2. 심층 신경망(Deep Neural Network) 구성

- 인공신경망에 층을 추가한 구조

<img src="./image/ml_perceptron.png" />

- 단층신경망과의 차이는 입력층과 출력층 사이에 밀집층이 추가된 것
    - 입력층과 출력층 사이에 있는 모든 층을 은닉층(hidden layer)라고 부름

### 2.1 활성화 함수 (Activation Function)

- 활성화 함수를 쓰는 이유
    - 예) a x 4 + 2 = b
    - b x 3 - 5 = c
    - 위 2개의 식은 a x 12 + 1 = c로 단순화가 가능
- 은닉층이 선형적인 산술계산만 한다면 층이 깊어지더라도 계산식이 단순화되어 학습 효율이 떨어짐
    - 따라서 활성화함수로 선형계산을 비선형 계산으로 비틀어주는 과정이 필요

<img src="./image/activation.jpg" />

- 출력층에 적용하는 활성화 함수와 은닉층에 적용하는 활성화 함수는 차이가 있음
    - 출력층의 활성화 함수
        - 출력층 함수라고도 부름
        - 결과물을 적절한 형식으로 출력하도록 유도해서, 데이터셋과 잘 비교할 수 있도록 하는 역할
        - 종류에 제한이 있음(이진 분류: 시그모이드, 다중 분류: 소프트맥스)
    - 은닉층의 활성화 함수
        - 여러 겹의 layer들 사이에서 사용됨
        - 출력층 함수에 비해 선택이 자유로움
        - 대표적인 활성화 함수 : ReLU(렐루)
        - 모든 신경망의 은닉층에는 항상 활성화 함수가 있음

In [13]:
# 입력층
inputs = keras.Input(shape = (784,))

# 은닉층
dense1 = keras.layers.Dense(100, activation = "sigmoid")

# 출력층
dense2 = keras.layers.Dense(10, activation = "softmax")

### 2.2 은닉층(dense1)

- 은닉층
- 100개의 유닛을 가진 밀집층
    - 유닛 개수를 정하는 것은 특별한 기준이 없음
    - 다만, 출력층의 유닛보다는 많게 하는 것을 추천
        - 은닉층의 유닛이 출력층보다 적다면 전달되는 정보량이 부족해질 수 있음
- 활성화 함수는 시그모이드

### 2.3 출력층(dense2)

- 출력층
- 10개의 클래스로 분류하므로 10개의 유닛
- 다중 분류이기 때문에 화성화 함수는 소프트맥스

In [17]:
model = keras.Sequential()

- 가장 처음 등장하는 입력층부터 마지막 출력층까지 순서대로 추가해야함

In [20]:
model.add(inputs)
model.add(dense1)
model.add(dense2)

In [22]:
model.summary()