<a href="https://colab.research.google.com/github/Gavinkim/tensorflow-mnist-tutorial/blob/master/mnist.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [0]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten,Dropout

"""
minist 데이터를 로딩하여 트레이닝 데이터 와 테스트 데이터 세트로 구성한다
모델 학습시 train 사용 > 입력: x_train 출력: y_train
정확도 평가시 test 사용 > 입력: x_test 출력: y_test
"""
(x_train,y_train), (x_test,y_test) = tf.keras.datasets.mnist.load_data()

"""
해당 이미지 데이터는 0~255 사이의 값을 가지게 되기 때문에 normalize 해야 한다.
해당 데이터를 0~1 사이의 값을 가지도록 변경이 필요
"""
x_train,x_test = x_train/255.0, x_test/255.0

"""
뉴럴 네트워크 구성
input_layer=784,hidden_layer=128,output_layer=10 (0~9)
"""
model = Sequential([
  Flatten(input_shape=(28,28)),
  #활성화 함수로 relu 사용 why?
  Dense(256, activation='relu'),
  Dense(128,activation='relu'),
  Dense(64, activation='relu'),
  #오버피팅을 방지하기 위해 무작위로 이전 레이어의 출력을 20% 끄도록 한다.
  Dropout(0.2),
  #출력 레이어의 노드 개수는 10이며, softmax 를 활성화 함수로 사용
  #softmax 를 사용시 출력값 간의 편차가 커져 분류하기 쉽게 된다.
  Dense(10,activation='softmax'),
])

"""
모델 컴파일
optimizer > 경사하강법(Gradient Descent)을 개선 한것이다.
경사하강법: 2차원일 경우 현재의 위치에서 현재 위치에서의 기울기를 빼서 에러가 최소화 되는 방향으로 위치를 이동
손실함수(loss) > 크로스 엔트로피를 손실함수로 사용
  모델의 출력이 one-hot 인코딩 되어 있을 경우 categorical_crossentropy 를 사용
  모델의 출력이 정수라면 sparse_categorical_crossentropy 를 사용
메트릭(metric) > 메트릭은 모델을 평가할때 사용되며, 여기서는 정확도로 설정.
"""
model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['acc']
)
"""
#모델 훈련
#학습 데이터셋을 사용하여 모델을 10번 반복하여 훈련
"""
model.fit(x_train, y_train,epochs=10)

#테스트 데이터셋을 사용하여 모델 평가
"""
실행시 손실(loss)은 감소하고, 정확도(acc) 는 커지는것을 볼 수 있다.
학습이 완료 된 후 테스트 데이터를 사용하여 모델 평가
"""
print(">>>> Evaluate >>>>")
model.evaluate(x_test,y_test,verbose=1)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
>>>> Evaluate >>>>


[0.08621665835380554, 0.9803000092506409]

In [0]:

class_names = ['(0)Zero','(1)One','(2)Two','(3)Three','(4)Four','(5)Five','(6)Six','(7)Seven','(8)Eight','(9)Mine']
img = x_test[95]
label = y_test[95]
print('label: ', class_names[label])
import numpy as np
img = np.expand_dims(img,0)
predictions = model.predict(img)
result = class_names[np.argmax(predictions)]
print('predict result',result)

label:  (4)Four
predict result (4)Four
