# 8. MNIST 손글씨 이미지 분류하기

https://codetorial.net/tensorflow/mnist_classification.html

MNIST 데이터셋은 0에서 9까지 10가지로 분류될 수 있는 손글씨 숫자 이미지 70,000개로 이루어져 있습니다.

각 이미지는 28*28 픽셀로 구성되고 각 픽셀은 0~255 사이의 숫자 행렬로 표현됩니다.

이러한 60,000개의 이미지는 인공신경망의 훈련(Training)에 사용되고, 10,000개의 이미지는 테스트(Test)에 사용됩니다.

이번 페이지에서는 Dense 층들로 구성되는 완전 연결된 인공신경망(Fully-Connected Neural Network)을 이용해서 MNIST 데이터셋을 분류해보겠습니다.

# 예제

In [12]:
import tensorflow as tf

# 1. 데이터셋 임포트
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 2. 데이터 전처리
x_train, x_test = x_train/255.0, x_test/255.0

# 3. 모델 구성
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(units=512, activation = tf.nn.relu),
    tf.keras.layers.Dense(units=10, activation = tf.nn.softmax)
])

# 4. 모델 컴파일
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 5. 모델 훈련
model.fit(x_train, y_train, epochs=5)

# 6. 정확도 평가
test_loss, test_acc = model.evaluate(x_test, y_test)
print('테스트 정확도', test_acc)

# 설명

## **0. tensorflow 불러오기**

In [13]:
import tensorflow as tf

tensorflow 라이브러리를 불러옵니다.

## **1.MNIST 데이터셋 임포트**

In [25]:
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

In [26]:
x_train.shape, y_train.shape, x_test.shape, y_test.shape

tensorflow에서 직접 MNIST손글씨 이미지 데이터셋을 불러와서 사용합니다.

load_data()함수는 x_train, y_train, x_test, y_test 네개의 NumPy 어레이를 반환합니다.

x_train, x_test는 28*28 픽셀의 각 손글씨 이미지 데이터이고, y_train, y_test는 분류에 사용되는 0~9사이의 레이블 값을 갖습니다.

In [30]:
plt.imshow(x_train[0])
print(y_train[0])

## **2. 데이터 전처리**

In [31]:
x_train, x_test = x_train/255.0, x_test/255.0

0~255.0 사이의 값을 갖는 픽셀값들을 0 ~ 1.0 사이의 값을 갖도록 변환합니다.

## **3. 모델 구성**

In [33]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(units = 512, activation = tf.nn.relu),
    tf.keras.layers.Dense(units = 10, activation = tf.nn.softmax)
])

tf.keras.models.Sequential()을 이용해서 인공신경망 모델을 구성합니다.

입력층(input layer)에서 Flatten()을 이용해서 28*28 픽셀의 값을 784개의 1차원 배열로 변환합니다.

다음 두 개의 뉴런 층(Neuron layer)은 Dense()을 이용해서 완전 연결된 층(Fully-connected layer)를 구성합니다.

각 층은 512개와 10개의 인공 뉴런 노드를 갖고 활성화 함수(activation function)로는 각각 ReLU(tf.nn.relu)와 소프트맥스(tf.nn.softmax)를 사용합니다.

## **4. 모델 컴파일**

In [34]:
model.compile(optimizer = 'adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

다음은 모델 컴파일 단계입니다. 학습 과정에서 손실 함수(loss function)을 줄이기 위해 사용되는 optimizer로는 Adam(Adaptive Momentum estimation)을 사용합니다.

손실함수는 spare_categorical_crossentropy를 지정하고, 평가 지표로는 정확도(accuracy)를 사용합니다.

정확도는 테스트 이미지 중 올바르게 분류한 비율을 의미합니다.

## **5. 모델 훈련**

In [35]:
model.fit(x_train, y_train, epochs = 5)

model.fit() 메서드에 학습 데이터와 레이블, 에포크를 순서대로 입력하면, 학습이 이루어집니다.

에포크는 60,000개의 전체 학습데이터를 몇번 반복해서 학습할지를 의미합니다.

## **정확도 평가**

In [37]:
test_loss, test_acc = model.evaluate(x_test, y_test)
print('테스트 정확도', test_acc)

model.evaluate()를 이용해서 10,000개의 테스트 샘플에 대해 손실값(loss)과 정확도(accuracy)를 평가합니다.

In [48]:
loss, accuracy = [], []
for i in range(10):
    model.fit(x_train, y_train, epochs=1)
    loss.append(model.evaluate(x_test, y_test)[0])
    accuracy.append(model.evaluate(x_test, y_test)[1])

print(accuracy)

In [51]:
import matplotlib.pyplot as plt

plt.style.use('default')
plt.rcParams['figure.figsize'] = (12,5)
plt.rcParams['font.size'] = 12
plt.plot(loss, label='loss')
plt.plot(accuracy, label='acc')
plt.xlabel('epoch')
plt.legend()
plt.show()

# **MNIST 손글씨 인식 프로그램**

https://codetorial.net/pyqt5/examples/mnist_classifier.html