# Распознавание рукописных цифр из набора данных MNIST

In [3]:
from tensorflow.keras.datasets import mnist
from tensorflow.python.keras.models import Sequential
from tensorflow.python.keras.layers import Dense
from tensorflow.python.keras import utils
import numpy as np
import matplotlib.pyplot as plt
#from scipy.misc import toimage
%matplotlib inline 

## Подготовка данных для обучения сети

**Загружаем набор данных с рукописными цифрами**

In [4]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


**Преобразование размерности данных в наборе**

In [5]:
X_train = X_train.reshape(60000, 784)
X_test = X_test.reshape(10000, 784)

**Нормализация данных**

In [6]:
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

**Работа с правильными ответами**

In [7]:
n = 100
print(y_train[n])

5


**Преобразуем метки в формат one hot encoding**

In [10]:
from keras.utils import to_categorical
Y_train = to_categorical(y_train, 10)
Y_test = to_categorical(y_test, 10)

**Правильный ответ в формате one hot encoding**

In [11]:
print(Y_train[n])

[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]


## Создаем нейронную сеть

**Создаем последовательную модель**

In [12]:
model = Sequential()

**Добавляем уровни сети**

In [13]:
model.add(Dense(800, input_dim=784, activation="relu"))
model.add(Dense(10, activation="softmax"))

**Компилируем сеть**

In [14]:
model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"])

print(model.summary())

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 800)               628000    
_________________________________________________________________
dense_1 (Dense)              (None, 10)                8010      
Total params: 636,010
Trainable params: 636,010
Non-trainable params: 0
_________________________________________________________________
None


## Обучаем нейронную сеть

In [15]:
history = model.fit(X_train, Y_train, batch_size=200, epochs=25, validation_split=0.2, verbose=2)

Epoch 1/25
240/240 - 2s - loss: 0.3096 - accuracy: 0.9116 - val_loss: 0.1554 - val_accuracy: 0.9573
Epoch 2/25
240/240 - 0s - loss: 0.1250 - accuracy: 0.9642 - val_loss: 0.1114 - val_accuracy: 0.9663
Epoch 3/25
240/240 - 0s - loss: 0.0820 - accuracy: 0.9768 - val_loss: 0.0973 - val_accuracy: 0.9703
Epoch 4/25
240/240 - 0s - loss: 0.0578 - accuracy: 0.9832 - val_loss: 0.0771 - val_accuracy: 0.9750
Epoch 5/25
240/240 - 0s - loss: 0.0406 - accuracy: 0.9886 - val_loss: 0.0727 - val_accuracy: 0.9776
Epoch 6/25
240/240 - 0s - loss: 0.0301 - accuracy: 0.9923 - val_loss: 0.0769 - val_accuracy: 0.9760
Epoch 7/25
240/240 - 1s - loss: 0.0233 - accuracy: 0.9939 - val_loss: 0.0725 - val_accuracy: 0.9781
Epoch 8/25
240/240 - 0s - loss: 0.0167 - accuracy: 0.9962 - val_loss: 0.0692 - val_accuracy: 0.9793
Epoch 9/25
240/240 - 0s - loss: 0.0126 - accuracy: 0.9975 - val_loss: 0.0728 - val_accuracy: 0.9789
Epoch 10/25
240/240 - 0s - loss: 0.0093 - accuracy: 0.9985 - val_loss: 0.0719 - val_accuracy: 0.9785

## Оцениваем качество работы сети

**Качество работы сети на тестовых данных**

In [12]:
scores = model.evaluate(X_test, Y_test, verbose=0)
print("Точность работы на тестовых данных: %.2f%%" % (scores[1]*100))

Точность работы на тестовых данных: 98.30%


**Графики качества во время обучения**

In [16]:
plt.plot(history.history['acc'], label='Аккуратность на обучающем наборе')
plt.plot(history.history['val_acc'], label='Аккуратность на проверочном наборе')
plt.xlabel('Эпоха обучения')
plt.ylabel('Аккуратность')
plt.legend()
plt.show()

KeyError: 'acc'

## Используем сеть для распознавания рукописных цифр

In [14]:
n_rec = 488

**Меняем размерность изображения и нормализуем его**

In [15]:
x = X_test[n_rec]
x = np.expand_dims(x, axis=0)


**Запускаем распознавание**

In [16]:
prediction = model.predict(x)


**Печатаем результаты распознавания**

In [17]:
print(prediction)

[[1.9918456e-11 8.2595373e-13 1.2210451e-10 2.7252136e-09 2.1977241e-06
  2.1778244e-13 2.4081031e-14 1.2990685e-04 6.6416298e-08 9.9986780e-01]]


**Преобразуем результаты из формата one hot encoding**

In [18]:
prediction = np.argmax(prediction)
print(prediction)

9


**Печатаем правильный ответ**

In [19]:
print(y_test[n_rec])

9
