In [0]:
import numpy as np
from keras.datasets import mnist
from keras.models import Sequential # нейронная сеть, слои которой соединены друг с другом
from keras.layers import Dense # тип слоёв
from keras.utils import np_utils # для работы с массивами

In [0]:
# Устанавливаем seed для повторяемости результатов
np.random.seed(42)

In [0]:
# Загружаем данные
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# X_train - данные с картинками
# y_train - метки для картинок

In [0]:
# Преобразование размерности изображений
X_train = X_train.reshape(60000, 784) # 60000 изображений (строчек) на 784 столбца (пикселя)
X_test = X_test.reshape(10000, 784)

# Нормализация данных
X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255 # диапазон данных будет от 0 до 1
X_test /= 255

In [0]:
# Преобразуем метки в категории
"""
10 классов -> нужно представить массив в таком виде, чтобы правильный ответ был единицей в 
массиве, состоящем из нулей. То есть если правильным ответом является третий, то будет что-то
вроде:

[0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

"""
y_train = np_utils.to_categorical(y_train, 10) # 10 - количество классов
y_test = np_utils.to_categorical(y_test, 10)

In [0]:
# Создаём модель нейронной сети, где слои нерйонной сети идут друг за другом
model = Sequential()

In [0]:
"""
В модель добавляем два слоя.
На первом входном слое 800 нейронов. У каждого из 800 нейронов 784 входа по колчиеству пикелей во
входном изображений. Веса инициализируются случайно с помощью нормального распределения.
"""
model.add(Dense(800, input_dim=784, kernel_initializer='normal', activation='relu'))
# Второй слой
model.add(Dense(10, kernel_initializer='normal', activation='softmax'))

# Dense --> проихсодит соединение нейронов одного уровня с нейронами следующего уровня


In [19]:
# Компилируем модель
# Метод обучения - стохастический градиентный спуск
# Мера ошибки - категориальнвя кроссэнтропия - лучше подходит в качестве меры ошибки, когда в качестве выходного значения есть несколько категорий.
# Метрика ошибки - точность
model.compile(loss='categorical_crossentropy', optimizer='SGD', metrics=['accuracy'])
print(model.summary())

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_4 (Dense)              (None, 800)               628000    
_________________________________________________________________
dense_5 (Dense)              (None, 10)                8010      
Total params: 636,010
Trainable params: 636,010
Non-trainable params: 0
_________________________________________________________________
None


In [11]:
# Обучаем сеть
# Анализиуем 200 изображений -> вычисляем градмент -> изменяем веса
model.fit(X_train, y_train, batch_size=200, epochs=100, validation_split=0.2, verbose=2)

Train on 48000 samples, validate on 12000 samples
Epoch 1/100
 - 12s - loss: 1.1300 - acc: 0.7398 - val_loss: 0.5826 - val_acc: 0.8714
Epoch 2/100
 - 13s - loss: 0.5078 - acc: 0.8755 - val_loss: 0.4067 - val_acc: 0.8947
Epoch 3/100
 - 13s - loss: 0.4000 - acc: 0.8943 - val_loss: 0.3465 - val_acc: 0.9074
Epoch 4/100
 - 13s - loss: 0.3518 - acc: 0.9041 - val_loss: 0.3154 - val_acc: 0.9151
Epoch 5/100
 - 13s - loss: 0.3229 - acc: 0.9099 - val_loss: 0.2934 - val_acc: 0.9198
Epoch 6/100
 - 13s - loss: 0.3019 - acc: 0.9157 - val_loss: 0.2788 - val_acc: 0.9233
Epoch 7/100
 - 13s - loss: 0.2856 - acc: 0.9203 - val_loss: 0.2654 - val_acc: 0.9253
Epoch 8/100
 - 13s - loss: 0.2724 - acc: 0.9238 - val_loss: 0.2552 - val_acc: 0.9286
Epoch 9/100
 - 13s - loss: 0.2608 - acc: 0.9267 - val_loss: 0.2462 - val_acc: 0.9298
Epoch 10/100
 - 12s - loss: 0.2507 - acc: 0.9293 - val_loss: 0.2392 - val_acc: 0.9328
Epoch 11/100
 - 13s - loss: 0.2416 - acc: 0.9325 - val_loss: 0.2323 - val_acc: 0.9336
Epoch 12/100


 - 12s - loss: 0.1346 - acc: 0.9632 - val_loss: 0.1468 - val_acc: 0.9591
Epoch 35/100
 - 13s - loss: 0.1317 - acc: 0.9642 - val_loss: 0.1455 - val_acc: 0.9582
Epoch 36/100
 - 12s - loss: 0.1292 - acc: 0.9654 - val_loss: 0.1431 - val_acc: 0.9594
Epoch 37/100
 - 12s - loss: 0.1266 - acc: 0.9660 - val_loss: 0.1410 - val_acc: 0.9604
Epoch 38/100
 - 12s - loss: 0.1242 - acc: 0.9662 - val_loss: 0.1400 - val_acc: 0.9608
Epoch 39/100
 - 13s - loss: 0.1218 - acc: 0.9671 - val_loss: 0.1379 - val_acc: 0.9618
Epoch 40/100
 - 12s - loss: 0.1195 - acc: 0.9677 - val_loss: 0.1361 - val_acc: 0.9617
Epoch 41/100
 - 12s - loss: 0.1173 - acc: 0.9685 - val_loss: 0.1360 - val_acc: 0.9613
Epoch 42/100
 - 12s - loss: 0.1151 - acc: 0.9691 - val_loss: 0.1329 - val_acc: 0.9622
Epoch 43/100
 - 12s - loss: 0.1129 - acc: 0.9694 - val_loss: 0.1315 - val_acc: 0.9621
Epoch 44/100
 - 12s - loss: 0.1109 - acc: 0.9701 - val_loss: 0.1306 - val_acc: 0.9630
Epoch 45/100
 - 12s - loss: 0.1089 - acc: 0.9705 - val_loss: 0.1296

Epoch 68/100
 - 12s - loss: 0.0750 - acc: 0.9804 - val_loss: 0.1075 - val_acc: 0.9698
Epoch 69/100
 - 12s - loss: 0.0738 - acc: 0.9808 - val_loss: 0.1065 - val_acc: 0.9703
Epoch 70/100
 - 12s - loss: 0.0726 - acc: 0.9811 - val_loss: 0.1062 - val_acc: 0.9699
Epoch 71/100
 - 12s - loss: 0.0717 - acc: 0.9814 - val_loss: 0.1052 - val_acc: 0.9703
Epoch 72/100
 - 13s - loss: 0.0706 - acc: 0.9815 - val_loss: 0.1047 - val_acc: 0.9701
Epoch 73/100
 - 12s - loss: 0.0695 - acc: 0.9819 - val_loss: 0.1041 - val_acc: 0.9698
Epoch 74/100
 - 13s - loss: 0.0685 - acc: 0.9823 - val_loss: 0.1040 - val_acc: 0.9701
Epoch 75/100
 - 12s - loss: 0.0676 - acc: 0.9825 - val_loss: 0.1025 - val_acc: 0.9702
Epoch 76/100
 - 12s - loss: 0.0666 - acc: 0.9830 - val_loss: 0.1020 - val_acc: 0.9707
Epoch 77/100
 - 12s - loss: 0.0657 - acc: 0.9832 - val_loss: 0.1016 - val_acc: 0.9711
Epoch 78/100
 - 12s - loss: 0.0648 - acc: 0.9834 - val_loss: 0.1015 - val_acc: 0.9711
Epoch 79/100
 - 12s - loss: 0.0639 - acc: 0.9836 - val

<keras.callbacks.History at 0x7f9ba29872e8>

In [20]:
# Оцениваем качество сети на тестовых данных
scores = model.evaluate(X_test, y_test, verbose=0)
print('Точность работы на тестовых данных: {}%', scores[1]*100)

Точность работы на тестовых данных: {}% 8.82


In [0]:
# Запускаем сеть на входных данных
predictions = model.predict(X_train)

# Преобразуем выходные данные сети из категорий в метки классов (цифры от 0 до 9)
#predictions = np_utils.categorical_probas_to_classes(predictions)

# Полученные метки можно сравнивать с правильными