# Лабораторная работа №6
## Задание
1. С использованием библиотеки Keras загрузить обучающую выборку, создать модель сверточной сети, обучить ее на обучающей выборке, сохранить модель в файл.
2. Написать дополнительно программу, которая загружает модель из файла, и предоставляет возможность загрузить файл или данные любым иным способом, чтобы проверить точность классификатора.

Данные: MNIST.

## Выполнение работы
### Пункт 1
Импортируем необходимые для работы библиотеки. Сразу отметим, что библиотека `tensorflow` начиная с версии 2.0 содержит внутри себя `keras`, так что дополнительно подключать его нет необходимости.

In [46]:
import numpy as np
import pandas as pd
import tensorflow as tf

from typing import Tuple
from numpy import random as rnd

Sequential = tf.keras.models.Sequential
Conv2D = tf.keras.layers.Conv2D
MaxPool2D = tf.keras.layers.MaxPool2D
BatchNormalization = tf.keras.layers.BatchNormalization
Dropout = tf.keras.layers.Dropout
Flatten = tf.keras.layers.Flatten
Dense = tf.keras.layers.Dense

Прочитаем датасет `MNIST` из `keras`.

In [47]:
print('Reading data')
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()
print('Done!')

Reading data
Done!


Датасет представляет из себя набор черно-белых картинок, которые представлены 784 пикселями, поэтому необходимо отмасштабировать признаки и представить данные в виде тензора размерности (28, 28, 1).

In [48]:
X_train, X_test = X_train / 255.0, X_test / 255.0
X_train = X_train.reshape((-1, 28, 28, 1))
X_test = X_test.reshape((-1, 28, 28, 1))
print('Done!')

Done!


Теперь же определим архитектуру сверточной нейронной сети: Conv2D -> MaxPooling -> BatchNormalization -> Dropout -> Conv2D -> MaxPooling -> BatchNormalization -> Dropout -> Flatten -> Dense -> BatchNormalization -> Dropout -> Dense.

Объясним назначение некоторых слоев.
- `BatchNormalization` - выполняет масштабирование весов внутри скрытых слоев. По сути то же самое, что мы делает перед входным слоем, только теперь будем делать это перед каждым. Позволяет ускорить сходимость, также является небольшой регуляризцаией.
- `Dropout` - просто выключает некоторые нейроны из сети - является средством регуляризации.

In [58]:
model = Sequential([
    Conv2D(32, kernel_size=5, activation='relu', input_shape=(28, 28, 1)),
    MaxPool2D(),
    BatchNormalization(),
    Dropout(0.4),

    Conv2D(64, kernel_size=5, activation='relu'),
    MaxPool2D(),
    BatchNormalization(),
    Dropout(0.4),

    Flatten(),
    Dense(128, activation='relu'),
    BatchNormalization(),
    Dropout(0.4),
    Dense(10, activation='softmax')
])

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])
print('Done!')

Done!


Осталось обучить модель и сохранить ее в файл. Для обучения необходимо определить следующие параметры:
- `epochs` - количество проходов модели по **всему** датасету.
- `batch_size` - количество семплов после которого будет произведено обновление весов.

In [59]:
fit_params = {
    'epochs': 20,
    'batch_size': 64,
    'verbose': 0
}

print('Fitting')
model.fit(X_train, y_train, **fit_params)
model.save('../../models/mnist_cnn7.h5')
print('Done!')

Fitting
Done!


### Пункт 2
Чтобы загрузить существующую модель воспользуемся функцией `load_model`.

In [56]:
model = tf.keras.models.load_model('../../models/mnist_cnn7.h5')

Теперь с помощью функции `evaluate` проверим точность нашей модели.

In [57]:
score = model.evaluate(X_test, y_test)[1]
print("Model's accuracy: {:.2f}".format(score * 100))
print('Done!')



Model's accuracy: 99.48
Done!


Как и ожидалось, сверточная нейронная сеть справилась с задачей просто отлично.

## Вывод
В ходе выполнения лабораторной работы было произведено ознакомление со сверточными нейронными сетями с помощью библиотеки `keras`. Описаны некоторые нейронные слои, а также параметры тренировки моделей. Также рассмотрена возможность сохранения модели в файл и дальнейшее использование ее после считывания. Была достигнута точность в 99.48% на датасете MNIST.