## Введение в нейронные сети с Keras

[Keras](https://keras.io/) - библиотека для Python, предназначенная для создания и обучения нейронных сетей.  Keras позволяет создавать модели нейронных сетей из определенных блоков и является высокоуровневой оберткой для библиотек тензорных вычислений Tensorflow и Theano, в которых работа с данными ведется на уровне произведений тензоров (многомерных массивов). При необходимости вы можете дополнять код написанный на Keras вставками из Tensorflow / Theano.

Стоит отметить, что работа над Theano остановлена, поэтому для работы с Keras рекомендуется использовать Tensorflow, разрабатываемый Google. Также Tensorflow позволяет использовать для обучения сетей мощности нескольких видеокарт (поддерживающих технологию Nvidia CUDA).

### 1. Установка библиотек

Для выполнения заданий необходимо установить:
1. Tensorflow, установка  описана на странице: https://www.tensorflow.org/install/install_windows

2. Keras:      
    Windows, OSX: pip install keras   
    Linux: sudo pip install keras

Для проверки, что Keras установлен, запустите python и выполните команду:

In [0]:
# Для Google Colab - Устанавливаем последнюю версию tensorflow и keras
! pip install tensorflow keras --upgrade

In [0]:
# Для Google Colab
# Сохраняем текущую конфигурацию в Google Drive
from google.colab import drive
drive.mount('/content/drive')
! pip freeze --local > /content/drive/My\ Drive/installed.txt

In [0]:
# Для Google Colab
# Читаем сохраненную конфигурацию с Google Drive
# from google.colab import drive
# drive.mount('/content/drive')
# ! pip install --upgrade --force-reinstall `cat/content/drive/My\ Drive/installed

In [0]:
import tensorflow as tf
import keras
print(tf.__version__)
print(keras.__version__)

### 2. Обучение нейронной сети на наборе MNIST

MNIST - набор из 70 000 изображений 28*28 пикселей рукописных цифр. 
Далее мы рассмотрим создание нейронной сети, позволяющей определить какая цифра написана на изображении. В этом задании мы будем рассматривать полносвязные нейронные сети, которые принимают на вход изображения в виде вектора (длины 784).

#### Подключение NumPy и Keras

In [0]:
# coding=utf-8

#Подключение Keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers.core import Dense
from keras.utils import np_utils

#### Загрузка обучающих и тестовых примеров из MNIST

In [0]:
nb_classes = 10 # задаем количество классов - количество цифр от 0 до 9

# данные были перемешаны и разделены на обучающий и проверочный наборы
(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train = X_train.reshape(60000, 784) #переводим изображение в вектор
X_test = X_test.reshape(10000, 784)

X_train = X_train.astype("float32")
X_test = X_test.astype("float32")

X_train /= 255 #переводим значения в диапазон от 0 до 1
X_test /= 255

print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')

# преобразование вектора разметки в матрицу кол-во примеров*кол-во классов
#это необходимо, потому что сеть будет выдавать результат в таком виде
Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

print(Y_train.shape, 'Y_train')

#### Создание и обучение сети

In [0]:
#Задаем последовательную модель, то есть слои сети идут друг за другом
model = Sequential()

# Создадим однослойную сеть
#Задаем количество нейронов слоя, функцию активации и количество входных параметров
model.add(Dense(units=10, activation="softmax", input_dim=784))

model.summary() #Вывести информацию о модели

#optimizer - алгоритм, используемый для обучения сети, например - градиентный спуск
#loss - функция стоимости(потерь), используемая для выполнения шага градиентного спуска
#metrics - метрика, позволяющая нам оценить качество классификации сети
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# validation_data предназначены для проверки качества работы сети, они не используются для обучения
# verbose: 0, 1, or 2. Отвечает за вывод информации при обучении. 
#          0 = silent, 1 = progress bar, 2 = one line per epoch.
model.fit(X_train, Y_train, batch_size=128, epochs=5, verbose=2, validation_data=(X_test, Y_test))

#проверим качество работы на проверочном наборе
score = model.evaluate(X_test, Y_test,verbose=0)

#print('Test score:', score[0])
print('Test accuracy:', score[1])


#### Создание двухслойной сети

Обучите двухслойную сеть:

In [0]:
model = Sequential()
model.add(Dense(units=100, input_dim=784, activation='relu'))
model.add(Dense(units=nb_classes, activation='softmax'))

### Вопросы

1. Зачем разделять данные на обучающий и проверочный наборы?
2. За что отвечает параметры batch_size и epochs метода model.fit?
3. Зачем нужна нормировка данных? Проверьте как обучится сеть без нее.
4. Добавьте в сеть еще один скрытый слой с 200 нейронами и проверьте насколько трехслойная сеть работает лучше двухслойной.