# <center>Классификация рукописных цифр

In [1]:
import numpy as np

import keras
from keras.datasets import mnist

Using TensorFlow backend.


Загрузим обучающую и тестовую выборки.

In [42]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()

Для распознавания рукописных цифр будем использовать полносвязную нейронную сеть, где каждый нейрон входного слоя характеризует один пиксель исходного изображения. При этом сами изображения представляют собой матрицу чисел, поэтому для дальнейшей работы необходимо выполнить преобразования над данными.

С помощью функции `reshape` преобразуем каждую матрицу в вектор длины 28`*`28 (размер исходных изображений).

In [41]:
#  черновик

# y_train.shape
# x_test.shape[0]
# y_train
# x_train.reshape(60000,28*28).shape

(60000,)

In [43]:
x_train, x_test =  x_train.reshape(x_train.shape[0],28*28), x_test.reshape(x_test.shape[0],28*28)

Поскольку мы будем использовать градиентные методы обучения, необходимо также нормализовать данные.

In [44]:
np.max(x_train) #максимальная интенсивность цвета

255

In [45]:
x_train = x_train / 255 
x_test = x_test / 255

В данный момент значение целевой переменной каждого изображения представляет собой цифру от 0 до 9. Для решения задачи многоклассовой классификации можно использовать функцию softmax. Её выход при этом - вектор вероятностей принадлежности к каждому из классов. Таким образом, возникает необходимость преобразовать `y_train` и `y_test`.

Для этих целей в `keras` доступна функция `keras.utils.to_categorical`, принимающая на вход исходный вектор значений и количество классов. Применим данную функцию к  `y_train` и  `y_test`.

In [46]:
from keras.utils import to_categorical

y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

In [7]:
y_train[0].shape # 10 классов, всё ок

(10,)

##  Полносвязная нейронная сеть

Теперь можно приступать к обучению сети. Будем использовать следующую архитектуру:
- на вход подается 784 значения;
- далее идет полносвязный слой с 256 нейронами и функцией активации `relu`;
- для повышения обобщающей способности модели добавим `Dropout(0.2)`, где `0.2` - вероятность отключения каждого из нейронов слоя;
- далее еще один полносвязный слой с 256 нейронами и функцией активации `relu`;
- последний слой - выход сети - полносвязный слой с числом нейронов, равным числу классов и функцией активации `softmax`.

In [8]:
from keras.models import Sequential
from keras.layers import Input, Dense, Dropout

In [9]:
28*28

784

In [10]:
model = Sequential() 

model.add(Dense(256, input_shape=(28*28,), activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(256, activation='relu'))
model.add(Dense(10, activation='softmax'))

Обучим полученную модель на обучающей выборке. Для обучения:
- функция потерь: https://keras.io/losses/; 
- optimizer - RMSProp: https://keras.io/optimizers/; 
- размер мини-батча - 128;
- число эпох - 10;
- на каждом шаге выводите значение `accuracy` как на обучающей, так и на тестовой выборках.

In [11]:
model.compile(optimizer='RMSProp', loss='categorical_crossentropy', metrics=['accuracy'])

In [12]:
model.fit(x_train, y_train, validation_data=(x_test, y_test), epochs=10, batch_size=128)

Train on 60000 samples, validate on 10000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.callbacks.History at 0xb0f3feef98>

In [13]:
score = model.evaluate(x_test, y_test, batch_size=128)
score



[0.07092731841329951, 0.9830999970436096]

In [14]:
model.layers

[<keras.layers.core.Dense at 0xb0f16686a0>,
 <keras.layers.core.Dropout at 0xb0f16689b0>,
 <keras.layers.core.Dense at 0xb0f1668c50>,
 <keras.layers.core.Dense at 0xb0f1668cc0>]

Попробуем улучшить полученный результат, меняя архитектуру сети.

In [51]:
model2 = Sequential() 
model2.add(Dense(512, input_shape=(28*28,), activation='relu'))
model2.add(Dropout(0.25))
model2.add(Dense(256, activation='relu'))
model2.add(Dropout(0.2))
model2.add(Dense(128, activation='relu'))
model2.add(Dense(64, activation='relu'))
#model2.add(Dense(32, activation='relu'))
model2.add(Dense(10, activation='softmax'))

In [52]:
model2.compile(optimizer='RMSProp', loss='categorical_crossentropy', metrics=['accuracy'])

In [53]:
model2.fit(x_train, y_train, validation_data=(x_test, y_test), epochs=15, batch_size=128)

Train on 60000 samples, validate on 10000 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<keras.callbacks.callbacks.History at 0xb085c95c50>

In [54]:
score2 = model2.evaluate(x_test, y_test, batch_size=128)
score2



[0.06898705225066151, 0.9854000210762024]

##  Свёрточная нейронная сеть

**Вариант 3**

In [18]:
from keras.layers import Conv2D, Flatten, MaxPool2D

In [26]:
model4 = Sequential() 

model4.add(Conv2D(10, kernel_size=5, activation='relu', input_shape=(28,28,1)))
#model4.add(Conv2D(10, kernel_size=5, activation='relu'))
model4.add(MaxPool2D(pool_size=(2,2)))
model4.add(Conv2D(20, kernel_size=5, activation='relu'))
model4.add(MaxPool2D(pool_size=(2,2)))
model4.add(Dropout(0.25))
model4.add(Flatten())
model4.add(Dense(100, activation='relu'))
model4.add(Dense(10, activation='softmax'))

In [27]:
model4.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

In [31]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train.reshape(x_train.shape[0], 28, 28, 1), x_test.reshape(x_test.shape[0], 28, 28, 1)
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

In [32]:
model4.fit(x_train, y_train, validation_data=(x_test, y_test), epochs=5)

Train on 60000 samples, validate on 10000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.callbacks.History at 0xb0801fb3c8>

In [33]:
score3 = model4.evaluate(x_test, y_test, batch_size=128)
score3



[0.04247035065311938, 0.9853000044822693]

### Вывод
1. Были рассмотрены полносвязные и свёрточные неейронные сети.
2. В полносвязных нейронных сетях увеличение числа слоёв и нейронов позволило добиться высокой точности классификации модели (accuracy = 0.9854).
3. Свёрточная нейронная сеть позволила добиться точности классификации (accuracy = 0.9853)