# Глубокое обучение 2025


## Занятие 2. Глубокое обучение с Keras


### Создание виртуального окружения для Jupyter Notebook

Последовательность действий:
* `conda create -n <имя> python=3.11.9` или через Anaconda Navigator
* `conda activate <имя>` или через Anaconda Navigator
* `conda install <пакеты>` или через Anaconda Navigator или `pip install <пакеты>`
* `conda install ipykernel` или через Anaconda Navigator
* `python -m ipykernel install --user --name=<имя>`

Убираем предупреждения и импортируем библиотеки:

In [None]:
# убираем предупреждающие сообщения
from silence_tensorflow import silence_tensorflow
silence_tensorflow()

In [None]:
# импорт библиотек
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import keras 
from keras import datasets 

## Пример
Будем использовать набор данных `Fashion-MNIST`, который состоит из изображений размером 28x28 пикселей для 10 классов модных товаров.


In [None]:
(X_train, y_train), (X_test, y_test) = datasets.fashion_mnist.load_data()
X_train.shape, X_test.shape, y_train.shape, y_test.shape

In [None]:
fmnist_classes = {0:"T-shirt/top", 1: "Trouser", 2: "Pullover", 
                  3: "Dress", 4: "Coat", 5: "Sandal", 
                  6: "Shirt", 7: "Sneaker", 8: "Bag", 9: "Ankle boot"}

# Выберем случайные изображения
from random import randint
fig, axes = plt.subplots(1, 5,  figsize=(10, 5))
for i in range(5):
    n = randint(0,60000) # 70000
    axes[i].imshow(X_train[n], cmap=plt.cm.gray_r) # .reshape(28, 28)
    axes[i].set_xticks([])
    axes[i].set_yticks([])
    axes[i].set_xlabel("{}".format(fmnist_classes[y_train[n]]))
plt.show();

### Препроцессинг
#### Изменение формы (reshaping)
Чтобы иметь возможность передавать эти данные через нейронную сеть, форма входных данных должна соответствовать форме входного слоя.
Для обычных плотных слоев это будет плоский массив. Можно использовать:

* [numpy.reshape()](https://numpy.org/doc/stable/reference/generated/numpy.reshape.html)
* [слои Keras](https://keras.io/api/layers/reshaping_layers/), например, [Flatten](https://keras.io/api/layers/reshaping_layers/flatten/)


#### Изменение масштаба (rescaling)
Изменение масштаба данных помогает при обучении нейронной сети и приведет к более быстрой сходимости.
Вы можете использовать минимальное и максимальное масштабирование до [0,1] или стандартизацию (среднее значение 0, стандартное отклонение 1).
Используем здесь простое деление на максимально возможное значение. 


In [None]:
X_train = X_train.astype('float32') / 255
X_test  = X_test.astype('float32') / 255

#### Форматирование меток
Для многоклассовой классификации наш выходной слой обычно будет иметь один выходной нейрон для каждого класса. Поэтому нам необходимо выполнить прямое кодирование меток (one-hot-encoding). Например, классу '4' соответствует вектор `[0,0,0,0,1,0,...]` с единицей на пятой позиции (метки кодируются с нуля).

Для этого в Keras есть вспомогательная функция [to_categorical](https://www.tensorflow.org/api_docs/python/tf/keras/utils/to_categorical).


In [None]:
y_train

In [None]:
from keras.utils import to_categorical
y_train = to_categorical(y_train)
y_test  = to_categorical(y_test)
y_train

In [None]:
X_train.shape, y_train.shape

In [None]:
X_train = X_train.reshape((-1, 28*28))
X_test  = X_test.reshape((-1, 28*28))

In [None]:
X_train.shape

### Разделение на обучающую, тестовую и проверочную выборки
Если наборы данных достаточно велики, то обычно используются простые алгоритмы разделения. Для небольших наборов данных также можно использовать перекрестную валидацию, но можно столкнуться с высокой дисперсией результатов.

Разделим обучающую выборку на набор для обучения и проверки (валидации).

In [None]:
from sklearn.model_selection import train_test_split
Xf_train, X_val, yf_train, y_val = \
    train_test_split(X_train, y_train, train_size=50000, 
                     shuffle=True, stratify=y_train, random_state=0)

In [None]:
Xf_train.shape, yf_train.shape, X_val.shape, y_val.shape, X_test.shape, y_test.shape

### Построение последовательных моделей нейронных сетей
* [Последовательные](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential) модели `Tensorflow` — это самый простой вид нейронных сетей. Они состоят из ряда слоев, идущих один за другим.
* В `Tensorflow` определено [много типов слоев](https://www.tensorflow.org/api_docs/python/tf/keras/layers)
* Пока будем использовать только плотные [Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense) (полносвязные) слои. В плотных слоях имеется несколько важных настроек:
    * __units__: количество узлов (нейронов)
    * __activation__: [функция активации](https://www.tensorflow.org/api_docs/python/tf/keras/activations)
    * __kernel_initializer__: как [инициализировать веса](https://www.tensorflow.org/api_docs/python/tf/keras/initializers)
    * __kernel_regularizer__: применять ли L1/L2 [регуляризацию](https://www.tensorflow.org/api_docs/python/tf/keras/regularizers)
    
``` python
keras.layers.Dense(
    units, activation=None, use_bias=True, kernel_initializer='glorot_uniform',
    bias_initializer='zeros', kernel_regularizer=None, bias_regularizer=None,
    activity_regularizer=None, kernel_constraint=None, bias_constraint=None,
    **kwargs
)
```

Рассмотрим следующую простую сеть с одним скрытым слоем:
* метод `Sequential.add()` добавляет слой в сеть
* также можно передать в конструктор массив слоев: `Sequential([layers])`
* используется активация `ReLU` для скрытого слоя и `SoftMax` для выходного слоя

In [None]:
from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
model.add(layers.Dense(10, activation='softmax'))

#### Входной слой
Обратите внимание, что входной слой может быть определен с помощью параметра `input_shape`. В качестве альтернативы также можно добавить явный входной слой `InputLayer` с параметром `shape`.
В нашем случае данные представляют собой плоский массив из 28*28 входов.

In [None]:
model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

#### Слои активации
Большинство функций активации, инициализаторов и регуляризаторов можно указать в виде  ключевых слов. Если нужен больший контроль над нейронной сетью, то можно указать активацию как отдельный слой. Тогда плотный слой будет использовать линейную активацию, а в следующем слое будет применяться выбранная активация.


In [None]:
model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(512))
model.add(layers.ReLU(negative_slope=0.1)) # слой leaky ReLU
model.add(layers.Dense(10, activation='softmax'))

#### Краткое описание модели
- вызов `model.summary()` выводит краткое описание модели по слоям
    - скрытый слой 1: (28 * 28 + 1) * 512 = 401920
    - скрытый слой 2: (512 + 1) * 512 = 262656
    - выходной слой: (512 + 1) * 10 = 5130

In [None]:
## добавим дополнительный скрытый слой для лучшей производительности
model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

In [None]:
model.summary()

### Выбор функции потерь, оптимизатора, метрик

Вызов `model.compile()` указывает, как модель должна обучаться, т. е. какую функцию потерь и оптимизатор использовать и какие показатели оценки качества модели вычислять.

* __Функция потерь__ [см. обзор](https://www.tensorflow.org/api_docs/python/tf/keras/losses)
     - Кросс-энтропия (логарифмические потери) для многоклассовой классификации (метка $y_{true}$ должна иметь прямое кодирование (one-hot encoded))
     - Используйте бинарную кросс-энтропию для задач бинарной классификации (один выходной нейрон)
     - Используйте разреженную категориальную кросс-энтропию, если выход $y_{true}$ закодирован метками 0,1,2,3,...
* __Оптимизатор__ [см. обзор](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers)
     - Любой из доступных оптимизаторов. `RMSprop` и `Adam` обычно работают хорошо.
* __Метрики__ [см. обзор](https://www.tensorflow.org/api_docs/python/tf/keras/metrics)
     - Для мониторинга производительности во время обучения и тестирования, например,  доля верных ответов (accuracy)


Значения всех объектов в методе `compile()` можно указать как текст:

In [None]:
# коротко
model.compile(loss = 'categorical_crossentropy', 
              optimizer = 'rmsprop', 
              metrics = ['accuracy'])

Для большего контроля можно передать названия фактических функций (с параметрами):

In [None]:
from keras.optimizers import RMSprop
from keras.losses import CategoricalCrossentropy
from keras.metrics import Accuracy

# детально
model.compile(loss = CategoricalCrossentropy(label_smoothing=0.01),
              optimizer = RMSprop(learning_rate=0.001, momentum=0.0),
              metrics = [Accuracy()])

### Обучение (подгонка)
Функция `fit` обучает сеть и возвращает историю потерь при обучении и проверке, а также значения всех метрик за эпоху.

```python
network.fit(X_train, y_train, epochs=3, batch_size=64)
```

Имеется два важных гиперпараметра:
* __Количество эпох__ (epochs): должно быть достаточно, чтобы обеспечить сходимость
     * Слишком много: модель начинает переобучаться (или просто теряет время)
* __Размер пакета__ (batch_size): часто предпочтительнее небольшие пакеты (например, 32, 64 и т. д.)
     * «Зашумленные» обучающие данные  снижают вероятность переобучения
         * Большие пакеты хуже обобщаются 
     * Требуют меньше памяти (особенно в графических процессорах)
     * Большие пакеты ускоряют обучение и сходимость достигается за меньшее количество эпох

#### Повторяющееся обучение
Вызов `model.fit` несколько раз не воссоздает модель с нуля (как это делается в `scikit-learn`), а просто продолжает обучение с сохраненными весами. Для обучения с нуля, например, с разными гиперпараметрами, необходимо воссоздать модель, например, оформив  создание модели как функцию `create_model`.

In [None]:
def create_model():
    model = models.Sequential()
    model.add(layers.InputLayer(shape=(28 * 28,)))
    model.add(layers.Dense(512, activation='relu', kernel_initializer='he_normal'))
    model.add(layers.Dense(512, activation='relu', kernel_initializer='he_normal'))
    model.add(layers.Dense(10, activation='softmax'))
    model.compile(loss='categorical_crossentropy', 
                  optimizer='rmsprop', 
                  metrics=['accuracy'])
    return model

#### Отслеживание прогресса обучения
Вызов `fit` обеспечивает вывод прогресса для каждой эпохи и возвращает объект `history`, содержащий все потери и показатели метрик оценки.

In [None]:
model = create_model()
history = model.fit(Xf_train, yf_train, epochs=3, batch_size=64);

In [None]:
model.to_json()

Можно также указать проверочную (валидационную) выборку, чтобы также возвращались показатели потерь и доли верных ответов на проверочной выборке. Параметр `verbose=0` заглушает вывод данных.

In [None]:
model = create_model()
history = model.fit(Xf_train, yf_train, epochs=3, batch_size=32, verbose=0,
                    validation_data=(X_val, y_val))

Возвращенная история обучения (объект `history`) содержит данные оценки качества модели (потери и метрики) для каждой эпохи.

In [None]:
history.history

### Прогнозы и оценки
Теперь можно вызывать `predict` для генерации прогнозов и оценить качество обученной модели на всем тестовом наборе при помощи `evaluate`.

``` python
network.predict(X_test)
test_loss, test_acc = network.evaluate(X_test, y_test)
```

In [None]:
predictions = model.predict(X_test)

# Visualize one of the predictions
sample_id = 0
print('Прогнозируемые вероятности меток:\n', predictions[sample_id])

np.set_printoptions(precision=7)
fig, axes = plt.subplots(1, 1, figsize=(4, 4))
axes.imshow(X_test[sample_id].reshape(28, 28), cmap=plt.cm.gray_r)
axes.set_xlabel("Истинная метка: {}".format(y_test[sample_id]))
axes.set_xticks([])
axes.set_yticks([]);

In [None]:
test_loss, test_acc = model.evaluate(X_test, y_test)
print('Доля верных ответов (accuracy) на тестовой выборке:', test_acc)

## Проверка кривых обучения
Есть несколько способов проверить кривые обучения
* Подождите, пока обучение завершится, затем нарисуйте кривые обучения из возвращенной истории
* Добавьте обратный вызов (callback) в функцию `fit`, который перерисовывает кривые  обучения в режиме реального времени при каждом обновлении (пример реализации приведен ниже)
* Используйте внешний инструмент, например [TensorBoard](https://www.tensorflow.org/tensorboard/get_started)

In [None]:
from IPython.display import clear_output

# For plotting the learning curve in real time
class TrainingPlot(keras.callbacks.Callback):
    
    # This function is called when the training begins
    def on_train_begin(self, logs={}):
        # Initialize the lists for holding the logs, losses and accuracies
        self.losses = []
        self.acc = []
        self.val_losses = []
        self.val_acc = []
        self.logs = []
        self.max_acc = 0
    
    # This function is called at the end of each epoch
    def on_epoch_end(self, epoch, logs={}):
        
        # Append the logs, losses and accuracies to the lists
        self.logs.append(logs)
        self.losses.append(logs.get('loss'))
        self.acc.append(logs.get('accuracy'))
        self.val_losses.append(logs.get('val_loss'))
        self.val_acc.append(logs.get('val_accuracy'))
        self.max_acc = max(self.max_acc, logs.get('val_accuracy'))
        
        # Before plotting ensure at least 2 epochs have passed
        if len(self.losses) > 1:
            
            # Clear the previous plot
            clear_output(wait=True)
            N = np.arange(0, len(self.losses))
            
            # Plot train loss, train acc, val loss and val acc against epochs passed
            plt.figure(figsize=(8,3))
            plt.plot(N, self.losses, lw=2, c="b", linestyle="-", label = "train_loss")
            plt.plot(N, self.acc, lw=2, c="r", linestyle="-", label = "train_acc")
            plt.plot(N, self.val_losses, lw=2, c="b", linestyle=":", label = "val_loss")
            plt.plot(N, self.val_acc, lw=2, c="r", linestyle=":", label = "val_acc")
            plt.title("Потери и доля верных ответов при обучении [эпоха {}, Max Acc {:.4f}]".format(epoch, self.max_acc))
            plt.xlabel("Эпоха #")
            plt.ylabel("Loss/accuracy")
            plt.legend()
            plt.show()

In [None]:
plot_losses = TrainingPlot()
model = create_model()
history = model.fit(Xf_train, yf_train, epochs=25, batch_size=512, verbose=0,
                    validation_data=(X_val, y_val), callbacks=[plot_losses])

### Ранняя остановка (early stopping)
* Нужно прекратить обучение, когда потери на валидационной выборке (или доля верных ответов на валидационной выборке) больше не улучшаются
* При этом нужно учитывать, что потери могут быть неровным: используйте скользящее среднее или подождите $k$ шагов без улучшения

``` python
earlystop = callbacks.EarlyStopping(monitor='val_loss', patience=3)
model.fit(x_train, y_train, epochs=25, batch_size=512, callbacks=[earlystop])
```

In [None]:
from keras import callbacks

earlystop = callbacks.EarlyStopping(monitor='val_loss', patience=3)
model = create_model()
history = model.fit(Xf_train, yf_train, epochs=25, batch_size=512, verbose=0,
                    validation_data=(X_val, y_val), callbacks=[plot_losses, earlystop])

## Регуляризация
Есть несколько способов регуляризации моделей в случае переобучения:
- Получить больше обучающих данных
- Уменьшить сеть (например, использовать меньше нейронов в слоях или использовать меньшее количество слоев)
- Регуляризировать веса модели (например, с помощью регуляризации L1/L2)
- Использовать технику исключения нейронов (dropout)
- Пакетная нормализация (batch normalization) также обладает эффектом регуляризации

### Регуляризация весов (уменьшение весов)
* Регуляризацию весов можно применять к слоям с помощью [регуляризатора](https://www.tensorflow.org/api_docs/python/tf/keras/regularizers)
    - Регуляризация L1: приводит к _разреженным сетям_ со многими весами, равными нулю
    - Регуляризация L2: приводит к большому количеству очень маленьких весов

In [None]:
from keras import regularizers

model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(512, activation='relu', kernel_initializer='he_normal', 
                       kernel_regularizer='l1'))
model.add(layers.Dense(512, activation='relu', kernel_initializer='he_normal',
                       kernel_regularizer='l1'))
model.add(layers.Dense(10, activation='softmax'))
model.compile(loss='categorical_crossentropy', 
              optimizer='rmsprop', 
              metrics=['accuracy'])

earlystop = callbacks.EarlyStopping(monitor='val_loss', patience=5)
model = create_model()
history = model.fit(Xf_train, yf_train, epochs=50, batch_size=512, verbose=0,
                    validation_data=(X_val, y_val), callbacks=[plot_losses, earlystop])

### Исключение (отсев) нейронов (dropout)
* Механизм dropout случайным образом устанавливает некоторое количество функций активации в слое равными нулю. Это позволяет избежать запоминания моделью несущественных связей в данных
* Механизм dropout добавляется в модель через слой [Dropout](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dropout).
* Коэффициент отсева (dropout rate) или доля обнулённых выходных значений обычно составляет от 0.1 до 0.5, но этот параметр должен быть настроен на конкретную задачу
* Слой dropout может быть добавлен после любого плотного слоя

In [None]:
model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dropout(0.3))
model.add(layers.Dense(32, activation='relu'))
model.add(layers.Dropout(0.3))
model.add(layers.Dense(10, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
plot_losses = TrainingPlot()
earlystop = callbacks.EarlyStopping(monitor='val_loss', patience=5)
history = model.fit(Xf_train, yf_train, epochs=50, batch_size=512, verbose=0,
                    validation_data=(X_val, y_val), callbacks=[plot_losses, earlystop])

### Пакетная нормализация (batch normalization)
* Пакетная нормализация нормализует выходы предыдущего слоя для каждого пакета
     * Внутри пакета установите среднюю активацию, близкую к 0, и стандартное отклонение, близкое к 1
         * При переходе к обработке другого пакета используется экспоненциальное скользящее среднее и дисперсия пакетов
    * Пакетная нормализация позволяет более глубоким сетям быть менее склонными к исчезновению или взрыву градиентов

In [None]:
model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(265, activation='relu'))
model.add(layers.BatchNormalization())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.BatchNormalization())
model.add(layers.Dense(32, activation='relu'))
model.add(layers.BatchNormalization())
model.add(layers.Dense(10, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
plot_losses = TrainingPlot()
earlystop = callbacks.EarlyStopping(monitor='val_loss', patience=5)
history = model.fit(Xf_train, yf_train, epochs=50, batch_size=512, verbose=0,
                    validation_data=(X_val, y_val), callbacks=[plot_losses, earlystop])

#### Комбинирование нескольких регуляризаторов
Ведутся споры о том, имеет ли смысл объединять несколько регуляризаторов и в каком порядке. Что работает (или нет) зависит от структуры и размера сети и имеющегося набора данных.

Например, поскольку пакетная нормализация уже выполняет некоторую регуляризацию, Dropout может не понадобиться. Однако иногда такая комбинация действительно помогает. Иногда помогает использование Dropout после пакетной нормализации только на самых глубоких уровнях.

Пакетная нормализация иногда выполняется перед плотным слоем, но в целом она работает лучше, если применяется после плотного слоя. Аналогично, Dropout можно применить до или после пакетной нормализации. Однако использование Dropout перед пакетной нормализацией приведет к включению нулей в статистику нормализации, что нежелательно.

In [None]:
network = models.Sequential()
network.add(layers.InputLayer(shape=(28 * 28,)))
network.add(layers.Dense(265, activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.Dropout(0.3))
network.add(layers.Dense(64, activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.Dropout(0.3))
network.add(layers.Dense(32, activation='relu'))
network.add(layers.BatchNormalization())
network.add(layers.Dropout(0.3))
network.add(layers.Dense(10, activation='softmax'))
network.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])
plot_losses = TrainingPlot()
earlystop = callbacks.EarlyStopping(monitor='val_loss', patience=5)
history = network.fit(Xf_train, yf_train, epochs=50, batch_size=512, verbose=0,
                      validation_data=(X_val, y_val), callbacks=[plot_losses, earlystop])

### Настройка множественных гиперпараметров
* Модуль Keras имеет соответствующую библиотеку настройки [keras-tuner](https://www.tensorflow.org/tutorials/keras/keras_tuner) с несколькими методами настройки параметров:
- Случайный поиск (RandomSearch)
- Гипербанд (Hyperband)
- Байесовская оптимизация
- Sklearn (для настройки моделей scikit-learn)

* Модуль keras-tuner создает папку со всеми результатами для каждого проекта (параметр `project_name`). Нужно будет удалить папку или изменить имя проекта, чтобы запустить его снова.

In [None]:
#!pip install -q -U keras-tuner

In [None]:
from keras import optimizers
import keras_tuner as kt


def build_model(hp):
    model = models.Sequential()

    # Настроим число нейронов в плотных слоях.
    # Выберем оптимальное значение между 32-512.
    hp_units = hp.Int('units', min_value = 32, max_value = 512, step = 32)

    model.add(keras.layers.Dense(units = hp_units, activation = 'relu', 
                                 input_shape=(28 * 28,)))
    model.add(keras.layers.Dense(units = hp_units, activation = 'relu'))
    model.add(keras.layers.Dense(10))

    # Настроим шаг обучения для оптимизатора 
    # Выберем оптимальное значение между 0.01, 0.001 или 0.0001
    hp_learning_rate = hp.Choice('learning_rate', values = [1e-2, 1e-3, 1e-4]) 

    model.compile(optimizer = optimizers.Adam(learning_rate = hp_learning_rate),
                  loss = 'categorical_crossentropy',
                  metrics = ['accuracy'])
    return model

tuner = kt.RandomSearch(build_model, max_trials=5, objective = 'val_accuracy', 
                        project_name='lab02')

In [None]:
# выполнение кода может занять определенное время
tuner.search(Xf_train, yf_train, epochs = 10, validation_data = (X_val, y_val), 
             callbacks = [TrainingPlot()])

# получить оптимальные гиперпараметры
best_hps = tuner.get_best_hyperparameters(num_trials = 1)[0]
best_hps.values

* Вы можете обернуть модели Keras как модели scikit-learn, используя [KerasClassifier](https://www.tensorflow.org/api_docs/python/tf/keras/wrappers/scikit_learn/KerasClassifier) и использовать любую технику настройки.

In [None]:
#from tensorflow.keras.wrappers.scikit_learn import KerasClassifier
# pip install scikeras --upgrade
from scikeras.wrappers import KerasClassifier

def build_model(var_activation='relu',var_optimizer='adam'):
    """ Для построения модели Keras используются аргументы функции. """
    model = models.Sequential()
    model.add(layers.InputLayer(shape=(28 * 28,)))
    model.add(layers.Dense(64,activation=var_activation))
    model.add(layers.Dense(32,activation=var_activation))
    model.add(layers.Dense(16,activation=var_activation))
    model.add(layers.Dense(10,activation='softmax'))
    model.compile(loss="categorical_crossentropy",
                optimizer=var_optimizer,
                metrics=["accuracy"])
    return model

# пространство поиска
_activations=['tanh','relu','selu']
_optimizers=['sgd','adam']
_batch_size=[16,32,64]
params=dict(var_activation=_activations,
            var_optimizer=_optimizers,
            batch_size=_batch_size)

# обертка
model = KerasClassifier(model=build_model,epochs=4,batch_size=16,
                        var_optimizer='adam',var_activation='relu')

In [None]:
from sklearn.model_selection import RandomizedSearchCV

# выполнение кода занимает время
rscv = RandomizedSearchCV(model, param_distributions=params, cv=2, 
                          n_iter=3, verbose=1, n_jobs=-1)
rscv_results = rscv.fit(Xf_train,yf_train)

In [None]:
print('Лучший результат равен: {} при использовании параметров {}'.format(\
    rscv_results.best_score_, rscv_results.best_params_))

## Функциональный интерфейс Keras

В модуле __Keras__ имеется два интерфейса (API) для быстрого построения архитектур нейронных сетей: __последовательный интерфейс__ (Sequential API) и __функциональный интерфейс__ (Functional API). 

Первый интерфейс позволяет строить только последовательные архитектуры нейронных сетей, в которых выход каждого слоя передается на вход следующего слоя. 

При помощи функционального интерфейса можно задать нейронную сеть в виде произвольного направленного ациклического графа (DAG или directed acyclic graph), что дает намного больше возможностей для построения сложных моделей. 
__Направленный ациклический граф__ (DAG) — это ориентированный граф, в котором отсутствуют циклы, но могут быть «параллельные» пути, выходящие из одного узла и разным образом приходящие в конечный узел. 
В частности, функциональный интерфейс может обрабатывать модели с нелинейной топологией, модели с общими слоями, и модели с несколькими входами или выходами.

В качестве примера рассмотрим простую нейронную сеть, созданную при помощи последовательного интерфейса:

In [None]:
model = models.Sequential()
model.add(layers.InputLayer(shape=(28 * 28,)))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

или через список слоев:

In [None]:
model = models.Sequential([
    layers.InputLayer(shape=(28 * 28,)),
    layers.Dense(512, activation='relu'),
    layers.Dense(512, activation='relu'),
    layers.Dense(10, activation='softmax')
])

Воссоздадим эту нейронную сеть при помощи функционального интерфейса. Сначала создаем входные данные нейронной сети:

In [None]:
inputs = layers.Input(shape=(28 * 28,))

Здесь указывается размерность данных, при этом количество данных всегда опускается. Переменная `inputs` содержит информацию о размерах и типе данных которые будут передаваться в модель: 

In [None]:
inputs.shape, inputs.dtype

Создаем новый слой в графе слоев с `inputs` в качестве входных данных:

In [None]:
x = layers.Dense(512, activation='relu')(inputs)

Добавим еще один слой в граф слоев:

In [None]:
x = layers.Dense(512, activation='relu')(x)

Наконец, добавим последний слой:

In [None]:
outputs = layers.Dense(10, activation='softmax', name='OutputLayer')(x)

Теперь создаем модель, указав ее входы и выходы в графе слоев:

In [None]:
model2 = keras.Model(inputs=inputs, outputs=outputs)

Сравним две модели:

In [None]:
model.summary()

In [None]:
model2.summary()

## Задание 2 по теме №1

Загрузите из `keras.datasets` набор данных California Housing price regression dataset (https://keras.io/api/datasets/california_housing/), обучите нейронную сеть прогнозировать медианную цену домов в зависимости от количества комнат в доме, визуализируйте процесс обучения.  