## DNN
- 복잡한 데이터 학습위해 히든레이어 늘려보기
- 오버피팅의 위험이 있지만 이를 위한 방법들 존재

#### Vanishing gradient
- activation function에 따라 vanishing gradient가 발생할 수 있음
- 여러 레이어로 구성된 DNN에서 각 레이어 사이에 activation function이 반복적으로 들어있기 때문에
    - 오차역전파를 계산할 때 경사도가 누적..
- 특히 sigmoid는 입력을 특정 범위로 줄여버리기 때문에
    - 이처럼 입력을 특정 범위로 줄이는 activation function들은 
    - 입력이 크면 경사도도 매우 작아져(끝부분에 기울기 거의0) 기울기 소실 유발가능성
    - 0근처의 작은 입력에 대해서만 기울기 온전함
- ReLu가 해결책이 될 수. 0보다 큰 구간에선 직선 함수라서 값이 커져도 기울기 구할 수

In [1]:
Nin = 784
Nh_l = [100 ,50]
number_of_class = 10
Nout = number_of_class

In [2]:
from keras import layers, models

class DNN(models.Sequential):
    def __init__(self, Nin, Nh_l, Nout):
        super().__init__() # 연쇄 방식으로 구성할 땐, 부모의 초기화를 먼저해서 모델의 시작을 알려야함
        # 연쇄 방식으로 할 때는, 특정 계층의 입력 노드 수를 자동으로 설정해줌 (맨 첫 레이어는 제외)
        self.add(layers.Dense(Nh_l[0], activation='relu', input_shape=(Nin,), name='Hidden-1'))
        self.add(layers.Dropout(0.2))
        self.add(layers.Dense(Nh_l[1], activation='relu', name='Hidden-2'))
        self.add(layers.Dropout(0.2))
        self.add(layers.Dense(Nout, activation='softmax'))
        self.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

Using TensorFlow backend.


In [3]:
import numpy as np
from keras import datasets
from keras.utils import np_utils

(X_train, y_train), (X_test, y_test) = datasets.mnist.load_data()
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
L, W, H = X_train.shape
X_train = X_train.reshape(-1, W * H)
X_test = X_test.reshape(-1, W * H)
X_train = X_train / 255.0
X_test = X_test / 255.0

In [4]:
model = DNN(Nin, Nh_l, Nout)
history = model.fit(X_train, y_train, epochs=10, batch_size=100, validation_split=0.2)
performance_test = model.evaluate(X_test, y_test, batch_size=100)
print('Test Loss and Accuracy -> ', performance_test)

Train on 48000 samples, validate on 12000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test Loss and Accuracy ->  [0.07973407174620661, 0.9769000059366226]
