# Практика: Распознавание рукописных цифр из набора данных MNIST на Keras

**Задача**: Распознование рукописных цифр из набора данных MNIST

<img src="http://img1.imagilive.com/0717/mnist-sample.png">

## Подключаем библиотеки

In [21]:
import numpy
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras.utils import np_utils

Устанавливаем seed для повторяемости результатов

In [2]:
numpy.random.seed(42)

Загружаем данные

In [3]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Преобразование размерности изображений и нормализация данных

In [4]:
X_train = X_train.reshape(60000, 784)
X_test = X_test.reshape(10000, 784)

In [5]:
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

Преобразуем метки в категории

In [6]:
Y_train = np_utils.to_categorical(y_train, 10)
Y_test = np_utils.to_categorical(y_test, 10)

Создаем последовательную модель

In [7]:
model = Sequential()

Добавляем уровни сети

In [8]:
model.add(Dense(800, input_dim=784, activation="relu", kernel_initializer="normal"))
model.add(Dense(10, activation="softmax", kernel_initializer="normal"))

Компилируем модель

In [9]:
model.compile(loss="categorical_crossentropy", optimizer="SGD", metrics=["accuracy"])

In [10]:
print(model.summary())

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 800)               628000    
_________________________________________________________________
dense_2 (Dense)              (None, 10)                8010      
Total params: 636,010
Trainable params: 636,010
Non-trainable params: 0
_________________________________________________________________
None


Обучаем модель

In [11]:
model.fit(X_train, Y_train, batch_size=200, epochs=100, validation_split=0.2, verbose=2)

Train on 48000 samples, validate on 12000 samples
Epoch 1/100
 - 20s - loss: 1.3220 - acc: 0.6916 - val_loss: 0.7795 - val_acc: 0.8502
Epoch 2/100
 - 11s - loss: 0.6730 - acc: 0.8522 - val_loss: 0.5376 - val_acc: 0.8732
Epoch 3/100
 - 10s - loss: 0.5239 - acc: 0.8726 - val_loss: 0.4494 - val_acc: 0.8883
Epoch 4/100
 - 10s - loss: 0.4561 - acc: 0.8836 - val_loss: 0.4033 - val_acc: 0.8976
Epoch 5/100
 - 10s - loss: 0.4161 - acc: 0.8912 - val_loss: 0.3734 - val_acc: 0.9034
Epoch 6/100
 - 12s - loss: 0.3889 - acc: 0.8961 - val_loss: 0.3530 - val_acc: 0.9062
Epoch 7/100
 - 14s - loss: 0.3686 - acc: 0.9008 - val_loss: 0.3370 - val_acc: 0.9103
Epoch 8/100
 - 12s - loss: 0.3528 - acc: 0.9039 - val_loss: 0.3249 - val_acc: 0.9113
Epoch 9/100
 - 13s - loss: 0.3399 - acc: 0.9068 - val_loss: 0.3145 - val_acc: 0.9141
Epoch 10/100
 - 16s - loss: 0.3289 - acc: 0.9095 - val_loss: 0.3061 - val_acc: 0.9165
Epoch 11/100
 - 15s - loss: 0.3194 - acc: 0.9123 - val_loss: 0.2985 - val_acc: 0.9170
Epoch 12/100


Epoch 96/100
 - 16s - loss: 0.1201 - acc: 0.9675 - val_loss: 0.1369 - val_acc: 0.9628
Epoch 97/100
 - 14s - loss: 0.1191 - acc: 0.9682 - val_loss: 0.1361 - val_acc: 0.9628
Epoch 98/100
 - 17s - loss: 0.1183 - acc: 0.9682 - val_loss: 0.1355 - val_acc: 0.9628
Epoch 99/100
 - 15s - loss: 0.1174 - acc: 0.9682 - val_loss: 0.1350 - val_acc: 0.9629
Epoch 100/100
 - 15s - loss: 0.1165 - acc: 0.9686 - val_loss: 0.1345 - val_acc: 0.9633


<keras.callbacks.History at 0x20fb854e668>

Оцениваем качество обучения сети на тестовых данных

In [12]:
scores = model.evaluate(X_test, Y_test, verbose=0)
print("Точность работы на тестовых данных: %.2f%%" % (scores[1]*100))

Точность работы на тестовых данных: 96.20%


Попробуем улучшить модель

Мы будем использовать сверточную нейронную сеть, которая состоит из 6 слоев:

    Слой свертки, 75 карт признаков, размер ядра свертки: 5х5.
    Слой подвыборки, размер пула 2х2.
    Слой свертки, 100 карт признаков, размер ядра свертки 5х5.
    Слой подвыборки, размер пула 2х2.
    Полносвязный слой, 500 нейронов.
    Полносвязный выходной слой, 10 нейронов, которые соответствуют классам рукописных цифр от 0 до 9.


Размер изображения

In [13]:
img_rows, img_cols = 28, 28

Загрузим данные

In [14]:
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Преобразование размерности изображений

In [15]:
X_train = X_train.reshape(X_train.shape[0], img_rows, img_cols, 1)
X_test = X_test.reshape(X_test.shape[0], img_rows, img_cols, 1)
input_shape = (img_rows, img_cols, 1)

Нормализация данных

In [16]:
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

Преобразуем метки в категории

In [17]:
Y_train = np_utils.to_categorical(y_train, 10)
Y_test = np_utils.to_categorical(y_test, 10)

Создаем последовательную модель

In [18]:
model = Sequential()

In [22]:
model.add(Conv2D(75, kernel_size=(5, 5),
                 activation='relu',
                 input_shape=input_shape))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.2))
model.add(Conv2D(100, (5, 5), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.2))
model.add(Flatten())
model.add(Dense(500, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

Компилируем модель

In [23]:
model.compile(loss="categorical_crossentropy", optimizer="adam", metrics=["accuracy"])

print(model.summary())

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_1 (Conv2D)            (None, 24, 24, 75)        1950      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 12, 12, 75)        0         
_________________________________________________________________
dropout_1 (Dropout)          (None, 12, 12, 75)        0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 8, 8, 100)         187600    
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 4, 4, 100)         0         
_________________________________________________________________
dropout_2 (Dropout)          (None, 4, 4, 100)         0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 1600)              0         
__________

Обучаем сеть

In [24]:
model.fit(X_train, Y_train, batch_size=200, epochs=10, validation_split=0.2, verbose=2)

Train on 48000 samples, validate on 12000 samples
Epoch 1/10
 - 556s - loss: 0.2510 - acc: 0.9216 - val_loss: 0.0594 - val_acc: 0.9817
Epoch 2/10
 - 564s - loss: 0.0671 - acc: 0.9793 - val_loss: 0.0513 - val_acc: 0.9845
Epoch 3/10
 - 557s - loss: 0.0475 - acc: 0.9852 - val_loss: 0.0369 - val_acc: 0.9897
Epoch 4/10
 - 602s - loss: 0.0380 - acc: 0.9881 - val_loss: 0.0369 - val_acc: 0.9888
Epoch 5/10
 - 488s - loss: 0.0306 - acc: 0.9897 - val_loss: 0.0366 - val_acc: 0.9897
Epoch 6/10
 - 518s - loss: 0.0266 - acc: 0.9915 - val_loss: 0.0288 - val_acc: 0.9920
Epoch 7/10
 - 564s - loss: 0.0225 - acc: 0.9928 - val_loss: 0.0273 - val_acc: 0.9929
Epoch 8/10
 - 452s - loss: 0.0201 - acc: 0.9933 - val_loss: 0.0299 - val_acc: 0.9918
Epoch 9/10
 - 526s - loss: 0.0182 - acc: 0.9941 - val_loss: 0.0301 - val_acc: 0.9923
Epoch 10/10
 - 612s - loss: 0.0189 - acc: 0.9939 - val_loss: 0.0273 - val_acc: 0.9931


<keras.callbacks.History at 0x20fc7e46eb8>

Оцениваем качество обучения сети на тестовых данных

In [25]:
scores = model.evaluate(X_test, Y_test, verbose=0)
print("Точность работы на тестовых данных: %.2f%%" % (scores[1]*100))

Точность работы на тестовых данных: 99.42%
