<a href="https://colab.research.google.com/github/idjoopal/mnist_practice/blob/master/%EC%8B%A4%EC%8A%B5_1_%EC%9D%B8%EA%B3%B5%EC%8B%A0%EA%B2%BD%EB%A7%9D%EA%B8%B0%EB%B3%B8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

TF 2.0 Tutorial(DL Camp) - MNIST 입니다.

해당 문서는 TensorFlow 공식 Tutorial을 기반으로 수정하였습니다.



먼저 프로그램에 텐서플로 라이브러리를 임포트합니다:

In [None]:
import tensorflow as tf

from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.models import Sequential

데이터셋을 로드하여 준비합니다.

공식적으로 제공하는 데이터셋은 [해당 링크](https://www.tensorflow.org/api_docs/python/tf/keras/datasets) 에서 확인할 수 있습니다.

In [None]:
# data load
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data() 

# 0~255의 픽셀 값을 0~1로 조정
x_train, x_test = x_train / 255.0, x_test / 255.0

# shape 조정
x_train = x_train.reshape(60000,28,28,1)
x_test = x_test.reshape(10000,28,28,1)

# 정답 label을 길이10 벡터화
y_train = tf.one_hot(y_train, depth=10)
y_test = tf.one_hot(y_test, depth=10)

# Training set으로부터 Validation set을 따로 분리.
x_train, x_val = x_train[:50000], x_train[50000:]
y_train, y_val = y_train[:50000], y_train[50000:]

Dataset의 shape와 실제 값은 아래와 같습니다. 이미지의 각각의 pixel 값이라고 생각하시면 됩니다.

In [None]:
print("Train set input shape : \t", x_train.shape)
print("Validation set input shape : \t", x_val.shape)
print("Test set input shape : \t\t", x_test.shape)
print()
print("Train set output shape : \t", y_train.shape)
print("Validation set output shape : \t", y_val.shape)
print("Test set output shape : \t", y_test.shape)

해당하는 Dataset의 shape와 이미지는 아래와 같습니다.

In [None]:
import matplotlib.pyplot as plt

INDEX = 0

plt.imshow(x_train[INDEX].reshape(28,28), cmap='gray_r')

print(x_train[INDEX].shape)
print(y_train[INDEX])

인공신경망 아키텍처를 구성합니다. (교재상의 모델 구현)

In [None]:
model = Sequential([
                    Flatten(),
                    Dense(15, activation='sigmoid'),
                    Dense(10, activation='softmax')
])

훈련에 필요한 옵티마이저(optimizer)와 손실 함수를 선택합니다.

현재는 MSE(Quadratic error) Loss 함수와 SGD Optimizer를 사용할 예정입니다.

성능 평가는 분류정확도(accuracy)를 기준으로 합니다

In [None]:
my_opt = tf.keras.optimizers.SGD()
my_loss = tf.keras.losses.MeanSquaredError()
model.compile(optimizer=my_opt, loss=my_loss, metrics=['acc'])

이제 모델을 5 Epoch 동안 학습하면서, 테스트할 예정입니다.

학습이 진행되는 동안 수집된 측정 지표를 바탕으로 최종 결과를 출력합니다.

학습은 미니배치 32를 단위로 하여 진행합니다.

In [None]:
EPOCHS = 5
BATCH = 32
history = model.fit(x=x_train, y=y_train, batch_size=BATCH, epochs=EPOCHS, validation_data=(x_val, y_val), verbose=1)

test 데이터에 대해 최종 성능을 체크합니다

In [None]:
model.evaluate(x_test, y_test, verbose=2)

학습과정 동안의 Train Accuracy, Loss를 그래프로 확인할 수 있습니다. 



In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(5,5))
plt.plot(range(1,EPOCHS+1), history.history['acc'], label="Train")
plt.plot(range(1,EPOCHS+1), history.history['val_acc'], label="Validation")

plt.title("Accuracy Graph")
plt.xticks(range(1,EPOCHS+1), range(1,EPOCHS+1))
plt.legend(loc=2)

plt.show()

In [None]:
plt.figure(figsize=(5,5))
plt.plot(range(1,EPOCHS+1), history.history['loss'], label="Train")
plt.plot(range(1,EPOCHS+1), history.history['val_loss'], label="Validation")

plt.title("Loss Graph")
plt.xticks(range(1,EPOCHS+1), range(1,EPOCHS+1))
plt.legend(loc=3)

plt.show()

아래에는 Model의 구조와 Parameter 수를 확인할 수 있습니다.

In [None]:
model.summary()

# 실습 MISSION #1



* 첫 번째 레이어 node 수 조정하기 : node 수 50 
* 두 번째 레이어를 추가 : node 수 40
* 세 번째 레이어를 추가 : node 수 30
* 50 epoch동안 돌려보고 테스트 정확도를 확인해봅니다.
* 하이퍼파라미터 조정하기 : Learning Rate 10.0

(힌트:learning rate은 파라미터를 업데이트할 때 이용됩니다. 어디에 넣어야 할까요?)



In [None]:
model = Sequential([
                    Flatten(),
                    Dense(50, activation='sigmoid'),
                    Dense(40, activation='sigmoid'),
                    Dense(30, activation='sigmoid'),
                    Dense(10, activation='softmax')
])

my_opt = tf.keras.optimizers.SGD(lr=10.0)
my_loss = tf.keras.losses.MeanSquaredError()
model.compile(optimizer=my_opt, loss=my_loss, metrics=['acc'])

EPOCHS = 50
BATCH = 32
history = model.fit(x=x_train, y=y_train, batch_size=BATCH, epochs=EPOCHS, validation_data=(x_val, y_val), verbose=1)

# 실습 MISSION #2

더 나은 성능을 내기 위해 네트워크를 수정해보자!

아래 항목을 자유로이 변경하고 **test set**에 대한 성능을 확인해봅시다

---



* 레이어 수 
* 레이어 당 노드 수
* learning rate
* epoch 수
* mini-batch size


In [None]:
model = Sequential([
                    Flatten(),
                    Dense(50, activation='sigmoid'),
                    Dense(40, activation='sigmoid'),
                    Dense(30, activation='sigmoid'),
                    Dense(10, activation='softmax')
])

my_opt = tf.keras.optimizers.SGD(lr=5.0)
my_loss = tf.keras.losses.MeanSquaredError()
model.compile(optimizer=my_opt, loss=my_loss, metrics=['acc'])

EPOCHS = 50
BATCH = 64
history = model.fit(x=x_train, y=y_train, batch_size=BATCH, epochs=EPOCHS, validation_data=(x_val, y_val), verbose=1)