# MNIST NN ( NN )
이전 Softmax의 NN은 입력층과 출력층만으로 네트워크를 구성하였습니다.  
이번엔 은닉층을 추가하여 3개층의 네트워크를 구성하여 MNIST데이터를 훈련하고자 합니다.

In [1]:
from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf

## 1. 데이터 로드 & 간단한 전처리
### 1-1. shape
원래 텐서플로우에서 이미지는 아래와 같이 처리한다.
```python
[N, 28, 28, 1] 
# [batch_size, height, width, channel]
# 채널의 의미를 이미지의 RGB채널입니다.
```
이 노트북에서는 height, width를 합쳐서 벡터로 만들어 훈련을 시킵니다.  
그리고 MNIST데이터는 흑백이므로 channel이 1입니다.

---
### 1-2. normalize  
이미지는 한 픽셀당 0에서 255의 숫자값을 가집니다. ( RGB )  
즉, 각 Feature이 이미지의 픽셀 값이므로 0~255의 값을 가지는데 이럴경우 normalization(정규화)를 통해 값들은 0과 1사이의 값을 통하면 Gradient를 더 빠르게 찾을 수 있게 됩니다.  
정규화에 대한 내용은 앤드류 응 교수님의 수업을 참고하면 이해가 쉽습니다.  
( 이 노트북의 코드에서는 정규화를 하지 않았습니다. )

In [2]:
def load_data():
    (train_x, train_y), (test_x, test_y) = tf.keras.datasets.mnist.load_data() # numpy타입

    # 훈련 데이터
    train_X = tf.constant(train_x, dtype=tf.float32)
    train_X = tf.reshape(train_X, shape=[-1, 28*28]) # 이미지 해상도가 28*28 -> flatten -> 784 
    train_Y = tf.one_hot(train_y, depth=10)

    # 검증 데이터
    test_X = tf.constant(test_x, dtype=tf.float32)
    test_X = tf.reshape(test_X, shape=[-1, 28*28])
    test_Y = tf.one_hot(test_y, depth=10)

    return train_X, train_Y, test_X, test_Y

train_X , train_Y, test_X, test_Y = load_data()

## 2. 파라미터 

In [3]:
# 하이퍼 파라미터 설정
learning_rate = 0.001
batch_size = 128
num_epochs = 15
num_classes = 10
num_features = 28*28

## 3. 모델 생성 및 구성
> relu 참고자료
1. https://www.edwith.org/boostcourse-dl-tensorflow/lecture/43735/
2. https://doorbw.tistory.com/144


* Input Layer 784 -> Hidden Layer 256 ( activation : relu )
* Hidden Layer 256 -> Hidden Layer 256 ( activation : relu )
* Output Layer 256 -> 10 ( activation : softmax )

In [4]:
# 네트워크 생성 및 구성
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(input_dim=num_features, units=256, activation='relu'))
model.add(tf.keras.layers.Dense(input_dim=256, units=256, activation='relu'))
model.add(tf.keras.layers.Dense(input_dim=256, units=num_classes, activation='softmax'))

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 256)               200960    
_________________________________________________________________
dense_1 (Dense)              (None, 256)               65792     
_________________________________________________________________
dense_2 (Dense)              (None, 10)                2570      
Total params: 269,322
Trainable params: 269,322
Non-trainable params: 0
_________________________________________________________________


## 4. 훈련 준비 & 훈련
* 비용 함수 : categorical_crossentropy
* optimizer : Adam
> optimizer 참고
>1. https://light-tree.tistory.com/141
>2. https://gomguard.tistory.com/187

In [5]:
# 훈련 준비
model.compile(loss='categorical_crossentropy', optimizer=tf.optimizers.Adam(learning_rate=learning_rate), metrics=['accuracy'])
model.summary()

# 훈련
model.fit(train_X, train_Y, batch_size=batch_size, epochs=num_epochs)

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 256)               200960    
_________________________________________________________________
dense_1 (Dense)              (None, 256)               65792     
_________________________________________________________________
dense_2 (Dense)              (None, 10)                2570      
Total params: 269,322
Trainable params: 269,322
Non-trainable params: 0
_________________________________________________________________
Train on 60000 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<tensorflow.python.keras.callbacks.History at 0x139b040d0>

## 5. 모델 평가

In [6]:
loss, accuracy = model.evaluate(test_X,test_Y,batch_size=batch_size,verbose=0)
print("loss : {:.5f}, accuracy : {}".format(loss,accuracy))

loss : 0.22859, accuracy : 0.964900016784668


### 결과
입력층, 출력층 말고 은닉층 하나만을 추가하였는데도 정확도를 높이 올릴 수 있게 되었다.
### 정확도 : 96%