# Базовая модель с многослойным персептроном

Простая многослойная модель персептрона.

In [1]:
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.utils import np_utils

Загрузка набора данных MNIST с помощью вспомогательной функции Keras.

In [2]:
# load data
(X_train, y_train), (X_test, y_test) = mnist.load_data()

Делаем преобразование каждого изображения 28*28 до вектора пикселей 784
([[ 1 , 2 , 3 ],  [ 4 , 5 , 6 ]])  -> ([1, 2, 3, 4, 5, 6])
Уменьшаем наши требования к памяти, установив точность значений пикселей на 32 бита

In [3]:
# flatten 28*28 images to a 784 vector for each image
num_pixels = X_train.shape[1] * X_train.shape[2]
X_train = X_train.reshape((X_train.shape[0], num_pixels)).astype('float32')
X_test = X_test.reshape((X_test.shape[0], num_pixels)).astype('float32')

Значения пикселей представляют собой шкалу серого от 0 до 255. Делаем масштабирование входных значений, нормализовав значения пикселей до диапазона 0 и 1, разделив каждое значение на максимальное значение 255.

In [4]:
# normalize inputs from 0-255 to 0-1
X_train = X_train / 255
X_test = X_test / 255

Выходная переменная представляет собой целое число от 0 до 9. Используем однократное горячее кодирование значений класса, преобразуя вектор целых чисел класса в двоичную матрицу.

In [5]:
# one hot encode outputs
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
num_classes = y_test.shape[1]

Создаем простую модель нейронной сети.

In [6]:
# define baseline model
def baseline_model():
    
    # create model
    model = Sequential()
    model.add(Dense(num_pixels, input_dim=num_pixels, kernel_initializer='normal', activation='relu'))
    model.add(Dense(num_classes, kernel_initializer='normal', activation='softmax'))

    # Compile model
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    
    return model

Модель представляет собой простую нейронную сеть с одним скрытым слоем с тем же количеством нейронов, что и на входе (784). Для нейронов скрытого слоя используется функция активации выпрямителя.

Функция активации softmax используется на выходном слое для преобразования выходных данных в вероятностные значения и позволяет выбрать один класс из 10 в качестве прогнозирования выходных данных модели. Логарифмические потери используются в качестве функции потерь (loss='categorical_crossentropy'), а эффективный алгоритм градиентного спуска ADAM используется для изучения весов.

Модель рассчитана на 10 эпох с обновлением каждые 200 изображений. Тестовые данные используются в качестве набора данных для проверки, что позволяет увидеть навыки модели в процессе ее обучения. Подробное значение 2 используется для уменьшения вывода до одной строки для каждой эпохи обучения.

In [7]:
# build the model
model = baseline_model()

# Fit the model
model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=200, verbose=2)

# Final evaluation of the model
scores = model.evaluate(X_test, y_test, verbose=0)
print("Baseline Error: %.2f%%" % (100-scores[1]*100))

Epoch 1/10
300/300 - 1s - loss: 0.2818 - accuracy: 0.9194 - val_loss: 0.1400 - val_accuracy: 0.9579
Epoch 2/10
300/300 - 1s - loss: 0.1108 - accuracy: 0.9686 - val_loss: 0.0989 - val_accuracy: 0.9715
Epoch 3/10
300/300 - 1s - loss: 0.0718 - accuracy: 0.9791 - val_loss: 0.0770 - val_accuracy: 0.9764
Epoch 4/10
300/300 - 1s - loss: 0.0505 - accuracy: 0.9855 - val_loss: 0.0765 - val_accuracy: 0.9756
Epoch 5/10
300/300 - 1s - loss: 0.0375 - accuracy: 0.9890 - val_loss: 0.0683 - val_accuracy: 0.9783
Epoch 6/10
300/300 - 1s - loss: 0.0265 - accuracy: 0.9929 - val_loss: 0.0613 - val_accuracy: 0.9802
Epoch 7/10
300/300 - 1s - loss: 0.0199 - accuracy: 0.9947 - val_loss: 0.0629 - val_accuracy: 0.9796
Epoch 8/10
300/300 - 1s - loss: 0.0142 - accuracy: 0.9968 - val_loss: 0.0604 - val_accuracy: 0.9822
Epoch 9/10
300/300 - 1s - loss: 0.0101 - accuracy: 0.9980 - val_loss: 0.0577 - val_accuracy: 0.9830
Epoch 10/10
300/300 - 1s - loss: 0.0079 - accuracy: 0.9986 - val_loss: 0.0584 - val_accuracy: 0.9823