# Методы машинного обучения – Лабораторная работа №2

# Линейная регрессия

## Визуализация данных при помощи __Matplotlib__

Библиотека __Matplotlib__ предназначена для визуализации данных.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

Построим простую линейную зависимость $y=x$, дадим нашему графику название, подпишем оси и отобразим сетку:

In [None]:
# Независимая (x) и зависимая (y) переменные
x = np.linspace(0, 10, 50)
y = x

In [None]:
plt.title("Линейная зависимость y = x") # заголовок
plt.xlabel("x") # ось абсцисс
plt.ylabel("y") # ось ординат
plt.grid(True)  # включение отображение сетки
plt.plot(x, y); # построение графика

Изменим тип линии и ее цвет, для этого в функцию `plot()` в качестве третьего параметра передадим строку, сформированную определенным образом, в нашем случае это `“r--”`, где `“r”` означает красный цвет, а `“--”` – это тип линии (пунктирная линия).

In [None]:
plt.title("Линейная зависимость y = x") # заголовок
plt.xlabel("x") # ось абсцисс
plt.ylabel("y") # ось ординат
plt.grid(True)  # включение отображение сетки
plt.plot(x, y, "r--");  # построение графика

Построим несколько графиков на одном поле, для этого добавим квадратичную зависимость $y=x^2$:

In [None]:
x = np.linspace(0, 10, 50)
y1 = x # Линейная зависимость
y2 = [i**2 for i in x] # Квадратичная зависимость с исп. спискового генератора
# Построение графика
plt.title(r"Зависимости: $y_1 = x, y_2 = x^2$") # заголовок с r-строкой
plt.xlabel("x")              # ось абсцисс
plt.ylabel(r"$y_1, y_2$")    # ось ординат (с r-строкой)
plt.grid(True)               # включение отображение сетки
plt.plot(x, y1, x, y2);      # построение графика

В приведенном примере в функцию `plot()` передаются два массива для построения первого графика и два массива для построения второго графика, при этом для обоих графиков массив значений независимой переменной $x$ один и то же.

Построим уже известные нам две зависимости в виде двух рисунков.

In [None]:
x = np.linspace(0, 10, 50)
y1 = x                        # Линейная зависимость
y2 = [i**2 for i in x]        # Квадратичная зависимость
# Построение графиков
plt.figure(figsize=(9, 9))
plt.subplot(2, 1, 1)          # график №1 из двух
plt.plot(x, y1)               # построение графика
plt.title(r"Зависимости: $y_1 = x$, $y_2 = x^2$") # заголовок
plt.ylabel(r"$y_1$", fontsize=14) # ось ординат
plt.grid(True)                # включение отображение сетки
plt.subplot(2, 1, 2)          # график №2 из двух
plt.plot(x, y2)               # построение графика
plt.xlabel(r"$x$", fontsize=14)  # ось абсцисс
plt.ylabel(r"$y_2$", fontsize=14) # ось ординат
plt.grid(True);               # включение отображение сетки

Здесь мы воспользовались новыми функциями: 

`figure()` – функция для задания глобальных параметров отображения графиков. В нее, в качестве аргумента, мы передаем кортеж, определяющий размер общего поля. 

`subplot()` – функция для задания местоположения поля с графиком. Существует несколько способов задания областей для вывода через функцию `subplot()` мы воспользовались следующим: первый аргумент – количество строк, второй – количество столбцов в формируемом поле, третий – индекс (номер поля, считаем сверху вниз, слева направо).

Остальные функции уже вам знакомы, дополнительно мы использовали параметр `fontsize` для функций `xlabel()` и `ylabel()` для задания размера шрифта.

### Основные элементы графика

Рассмотрим основные термины и понятия, касающиеся изображения графиков в библиотеке __Matplotlib__ на следующем более сложном примере:

In [None]:
from matplotlib.ticker import AutoMinorLocator

x = np.linspace(0, 10, 10)
y1 = 4*x
y2 = x**2

fig, ax = plt.subplots(figsize=(8, 6))

ax.set_title(r"Графики зависимостей: $y_1=4x$, $y_2=x^2$", fontsize=16)
ax.set_xlabel(r"$x$", fontsize=14)        
ax.set_ylabel(r"$y_1, y_2$", fontsize=14)
ax.grid(which="major", linewidth=1.2)
ax.grid(which="minor", linestyle="--", color="gray", linewidth=0.5)
ax.scatter(x, y1, c="red", label=r"$y_1 = 4x$")
ax.plot(x, y2, label=r"$y_2 = x^2$")
ax.legend()

ax.xaxis.set_minor_locator(AutoMinorLocator())
ax.yaxis.set_minor_locator(AutoMinorLocator())
ax.tick_params(which='major', length=10, width=2)
ax.tick_params(which='minor', length=5, width=1);

Корневым элементом при построения графиков в системе __Matplotlib__ является объект `Figure`. Все, что нарисовано на рисунке выше является элементами этого объекта.

#### График

На рисунке представлены два графика – линейный и точечный. __Matplotlib__ предоставляет огромное количество различных настроек, которые можно использовать для того, чтобы придать графику вид, который вам нужен: цвет, толщина и тип линии, стиль линии и многое другое.

#### Оси

Вторым, после непосредственно самого графика, по важности элементом являются оси. Для каждой оси можно задать метку (подпись), основные (`major`) и дополнительные (`minor`) тики, их подписи, размер и толщину, также можно задать диапазоны по каждой из осей.

#### Сетка и легенда

Значительно повышают информативность графика сетка и легенда. Сетка может быть основной (`major`) и дополнительной (`minor`). Каждому типу сетки можно задавать цвет, толщину линии и тип. Для отображения сетки и легенды используются соответствующие команды.

## Задача регрессии

Задача регрессии заключается в построении некоторой функции $y\left(x_{1},x_{2},...,x_{d}\right)$, которая наилучшим образом описывает данные из некоторой обучающей выборки $U$, в которой каждому вектору значений независимых переменных (предикторов) $x$ ставится в соответствие зависимая переменная $y$. Эта функция ищется в некотором конкретном классе функций.

### Понятие линейной регрессии

Линейная регрессия (linear regression) — это метод восстановления зависимости одной (объясняемой, зависимой) переменной $y$ от другой или нескольких других переменных (факторов, независимых переменных) $\mathbf{x}$ с линейной функцией зависимости от коэффициентов $\mathbf{a}=\left(a_{1},...,a_{m}\right)^{T}$ вида: 

$y=f\left(\mathbf{x},\mathbf{a}\right)=\sum_{k=1}^{m}a_{i}f_{i}\left(\mathbf{x}\right),$

где $\mathbf{x}\in\mathbb{R}^{d}$, $\mathbf{a}\in\mathbb{R}^{m}$, $f_{1}\left(\mathbf{x}\right),...,f_{m}\left(\mathbf{x}\right)$ – некоторые функции (базисные функции). 

Наиболее популярным вариантом линейной регрессии является предположение $f_{i}\left(\mathbf{x}\right)\equiv x_{i}$.

In [None]:
x = np.array([1., 2., 3., 4., 5.])
y = np.array([1., 3., 2., 3., 5.])

In [None]:
plt.scatter(x, y)
plt.axis([0, 6, 0, 6]);

Для вычисления коэффициентов $a,\,b$ парной линейной регрессии $y=a\,x+b$ нужно вычислить математические ожидания и ковариацию переменных (признаков) $x$ и $y$, дисперсию переменной (признака) $x$:

$$a=\frac{\sigma_{\mathbf{XY}}}{\sigma_{\mathbf{X}}^{2}},\,b=\mu_{\mathbf{Y}}-\frac{\sigma_{\mathbf{XY}}}{\sigma_{\mathbf{X}}^{2}}\,\mu_{\mathbf{X}},$$

где

$$\mu_{\mathbf{X}}=\frac{1}{n}\sum_{i=1}^{n}x_{i},\,\mu_{\mathbf{Y}}=\frac{1}{n}\sum_{i=1}^{n}y_{i},$$
$$\sigma_{\mathbf{XY}}=\frac{1}{n}\sum_{i=1}^{n}\left(x_{i}-\mu_{\mathbf{X}}\right)\left(y_{i}-\mu_{\mathbf{Y}}\right),$$
$$\sigma_{\mathbf{X}}^{2}=\frac{1}{n}\sum_{i=1}^{n}\left(x_{i}-\mu_{\mathbf{X}}\right)^{2}.$$

Вычислим математические ожидания переменных (признаков) $x$ и $y$:

In [None]:
x_mean = np.mean(x)
y_mean = np.mean(y)

и далее коэффициенты регрессии и смещения:

In [None]:
a = (x - x_mean).dot(y - y_mean) / (x - x_mean).dot(x - x_mean)
b = y_mean - a * x_mean

Прогнозируемые значения зависимой переменной вычисляются при помощи полученных коэффициентов так:

In [None]:
y_hat = a * x + b
y_hat

Построим на рисунке точки набора данных и линию регрессии:

In [None]:
plt.scatter(x, y)
plt.plot(x, y_hat, color='r')
plt.axis([0, 6, 0, 6]);

Построенная таким образом линейная функция позволяет прогнозировать значение $y$ по любому значению $x$:

In [None]:
x_predict = 6
y_predict = a * x_predict + b
y_predict

Объединим программный код в следующий класс `SimpleLinearReg`:

In [None]:
class SimpleLinReg:

    def __init__(self):
        self.a_ = None
        self.b_ = None

    def fit(self, x_train, y_train):
        assert x_train.ndim == 1, \
            "В данных должен быть один признак"
        assert len(x_train) == len(y_train), \
            "Данные должны иметь одинаковый размер"

        x_mean = np.mean(x_train)
        y_mean = np.mean(y_train)

        self.a_ = (x_train - x_mean).dot(y_train - y_mean) / \
                  (x_train - x_mean).dot(x_train - x_mean)
        self.b_ = y_mean - self.a_ * x_mean

        return self

    def predict(self, x_predict):
        assert x_predict.ndim == 1, \
            "В данных должен быть один признак"
        assert self.a_ is not None and self.b_ is not None, \
            "Модель вначале должна быть обучена"

        return np.array([self._predict(x) for x in x_predict])

    def _predict(self, x_single):
        return self.a_ * x_single + self.b_

    def __repr__(self):
        return "SimpleLinearReg()"

Теперь можно создавать объекты этого класса при помощи конструктора и применять к объектам методы класса:

In [None]:
reg1 = SimpleLinReg()
reg1

In [None]:
reg1.fit(x, y)
reg1.predict(np.array([x_predict]))

In [None]:
reg1.a_, reg1.b_

In [None]:
y_hat1 = reg1.predict(x)

plt.scatter(x, y)
plt.plot(x, y_hat1, color='r')
plt.axis([0, 6, 0, 6]);

### Загрузка набора данных __boston_housing__

Набор данных содержит 13 атрибутов домов в разных местах в окрестности города Бостон в конце 1970-х годов. Целевые значения представляют собой медианные значения стоимости домов в определенном месте (в тыс. долл. США).

In [None]:
import tensorflow as tf

(x_train, y_train), (x_test, y_test) = \
    tf.keras.datasets.boston_housing.load_data(test_split=0.2)
x_train.shape, y_train.shape, x_test.shape, y_test.shape

Данные из набора загружены в четыре массива:

* `x_train` – массив значений признаков (предикторов) для обучения
* `y_train` - массив значений отклика для `x_train`
* `x_test` – массив значений признаков (предикторов) для тестирования
* `y_test` - массив значений отклика для `x_test`

Преобразуем массив `x_train` в датафрейм:


In [None]:
import pandas as pd

df_train = pd.DataFrame(x_train)
df_train

Рассмотрим задачу парной регрессии с признаком с индексом 5 (признак `rm` – среднее количество комнат в жилом доме) в качестве независимой переменной:

In [None]:
x = x_train[:,5]  # можно 12
y = y_train
x.shape, y.shape

Набор переменных для парной регрессии имеет следующий вид:

In [None]:
plt.scatter(x, y);

Очистим набор от точек, расположенных вдоль верхней границы графика.

In [None]:
np.max(y)

In [None]:
x = x[y < 50.0]
y = y[y < 50.0]
x.shape, y.shape

In [None]:
plt.scatter(x, y);

Построим функцию парной регрессии для очищенного набора данных:

In [None]:
reg = SimpleLinReg()
reg.fit(x, y)

In [None]:
reg.a_, reg.b_

Изобразим на графике точки обучающего набора и линию регрессии:

In [None]:
plt.scatter(x, y)
plt.plot(x, reg.predict(x), color='r');

А теперь добавим также точки тестового набора другим цветом:

In [None]:
plt.scatter(x, y)
plt.scatter(x_test[:,5], y_test, color="c")
plt.plot(x, reg.predict(x), color='r');

Построим прогнозные значения для точек тестового набора, чтобы оценить качество модели регрессии:

In [None]:
y_predict = reg.predict(x_test[:,5])
y_predict

## Метрики регрессии

__Средняя квадратичная ошибка__ (Mean Squared Error, MSE)
применяется в ситуациях, когда нам надо подчеркнуть большие ошибки и выбрать модель, которая дает меньше больших ошибок прогноза. 

$MSE=\frac{1}{n}\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}$

Грубые ошибки становятся заметнее за счет того, что ошибку прогноза мы возводим в квадрат. И про модель, которая дает нам меньшее значение среднеквадратической ошибки, можно сказать, что что у этой модели меньше грубых ошибок.

In [None]:
mse_test = np.sum((y_predict - y_test)**2) / len(y_test)
mse_test

__Корень из средней квадратичной ошибки__ (Root Mean Squared Error, RMSE)
получается из MSE путем извлечения корня.

$RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}$

Каждое отклонение возводится в квадрат, любое небольшое отклонение может значительно повлиять на показатель ошибки. 

In [None]:
rmse_test = np.sqrt(mse_test)
rmse_test

__Cредняя абсолютная ошибка__ (Mean Absolute Error, MAE) не так сильно штрафует за большие отклонения по сравнению со среднеквадратичным, и поэтому менее чувствительна к выбросам.

$MAE=\frac{1}{n}\sum_{i=1}^{n}\left|y_{i}-\hat{y}_{i}\right|$

In [None]:
mae_test = np.sum(np.absolute(y_predict - y_test))/len(y_test)
mae_test

__Коэффициент детерминации__ $R^2$ измеряет долю дисперсии, объясненную моделью, в общей дисперсии целевой переменной. 

$R^{2}=1-\frac{Q}{S_{0}}, Q=\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}, S_{0}=\sum_{i=1}^{n}\left(y-\bar{y}\right)^{2}$,

где $\bar{y}$ – это выборочное среднее зависимой переменной $y$. Фактически, данная мера качества — это нормированная среднеквадратичная ошибка. Если она близка к единице, то модель хорошо объясняет данные, если же она близка к нулю, то прогнозы сопоставимы по качеству с константным предсказанием.

In [None]:
1 - mse_test/np.var(y_test)

## Библиотека Tensorflow

__TensorFlow__ - это комплексная платформа с открытым исходным кодом для машинного обучения с акцентом на обучение искусственных нейронных сетей. 

In [None]:
import tensorflow as tf
print(tf.__version__)

Рассмотрим задачу регрессии для набора boston_housing с использованием средств __Tensorflow__.

Для этого создадим с использованием средств модуля __Keras__ модель простейшей нейронной сети из одного слоя с одним нейроном:

In [None]:
model = tf.keras.Sequential( [ tf.keras.layers.Dense(1, input_shape=(1,)) ] )

In [None]:
model.summary()

После того, как модель построена, настроим процесс ее обучения вызовом метода `compile()`:


In [None]:
model.compile(
    loss=tf.keras.losses.mean_absolute_error,
    optimizer=tf.keras.optimizers.Adam(learning_rate=0.25),
    metrics=['mean_absolute_error']
)

Здесь в качестве функции потерь (ошибки) и для оценки качества модели используется средняя абсолютная ошибка MAE.  

Модель может быть обучена на тренировочных данных, используя метод `fit()`:

In [None]:
model.fit(x, y, epochs=100) # verbose=0

Выполним прогнозирование значений зависимой переменной (отклика):

In [None]:
y_predict2 = model.predict(x_test[:,5])
y_predict2[:5]

и визуализируем их на рисунке:

In [None]:
plt.figure(figsize=(12,8))
plt.scatter(x, y)
plt.scatter(x_test[:,5], y_test, c='c')
plt.plot(x_test[:,5], y_predict, c='m', label='точная линия регрессии')
plt.plot(x_test[:,5], y_predict2, c='r', label='линия регрессии (ANN)')
plt.legend();

### Нормализация

Входные данные могут содержать значения, отличающиеся друг от друга на несколько порядков, например, возраст и доход клиента. Такая ситуация может вызвать неустойчивость работы модели машинного обучения, ухудшить результаты обучения и/или замедлить его процесс. 

__Нормализация__ — это процедура предварительной обработки входных данных, при которой значения признаков, образующих входной вектор, приводятся к некоторому заданному диапазону или распределению с  заданными параметрами (математическим ожиданием и дисперсией).

В Tensorflow для встраивания нормализации в нейронную сеть создают специальный слой нормализации.

Первым шагом является создание слоя:

In [None]:
normalizer = tf.keras.layers.Normalization()

Теперь адаптируем слой к данным (например, признакам с индексами 4,5,7,12):

In [None]:
normalizer.adapt(df_train[[4,5,7,12]])

При этом вычисляются средние значения и дисперсии и сохраняются в слое:

In [None]:
print(normalizer.mean.numpy())
print(normalizer.variance.numpy())

Оценим эффект нормализации:

In [None]:
df_train[[4,5,7,12]][0:5]

In [None]:
normalizer(df_train[[4,5,7,12]][0:5]).numpy()

## Линейная регрессия с нормализацией и визуализацией обучения

### Парная регрессия

Начнем с парной регрессии, чтобы предсказать стоимость дома по признаку `rm` с индексом 5 (среднее количество комнат в жилом доме.).


In [None]:
feature = np.array(df_train[5])

feature_normalizer = tf.keras.layers.Normalization(axis=None,input_shape=(1,)) 
feature_normalizer.adapt(feature)

Построим последовательную модель с двумя слоями:

In [None]:
feature_model = tf.keras.Sequential([
    feature_normalizer,
    tf.keras.layers.Dense(units=1)
])

feature_model.summary()

Эта модель будет предсказывать стоимость дома в зависимости от признака `rm`. 

Для тестирования можно запустить необученную модель на нескольких первых значениях, чтобы проверить результат:

In [None]:
print(feature[:10])
feature_model.predict(feature[:10])

После построения модели настроим процедуру обучения с помощью метода `compile()`. Наиболее важными аргументами для компиляции являются функция потерь и оптимизатор, поскольку они определяют, что будет оптимизировано (`mean_absolute_error`) и как (оптимизатор `Adam`).

In [None]:
feature_model.compile(
    optimizer=tf.optimizers.Adam(learning_rate=0.25),
    loss='mean_absolute_error')

После настройки обучения используем метод `fit()` для выполнения обучения:

In [None]:
%%time
history = feature_model.fit(
    df_train[5], y_train,
    epochs=100,
    # подавляем вывод
    verbose=0,
    # проверка (валидация) на 20% обучающих данных
    validation_split = 0.2)

Визуализируем ход обучения модели, используя статистику, хранящуюся в объекте `history`.

In [None]:
hist = pd.DataFrame(history.history)
hist['epoch'] = history.epoch
hist.tail()

In [None]:
def plot_loss(history):
  plt.plot(history.history['loss'], label='loss')
  plt.plot(history.history['val_loss'], label='val_loss')
  plt.ylim([0, max(history.history['loss'])*0.5])
  plt.xlabel('Эпохи обучения')
  plt.ylabel('Ошибка')
  plt.legend()
  plt.grid(True)

In [None]:
plot_loss(history)

Запоним результаты на тестовом наборе для дальнейшего использования:

In [None]:
test_results = {} # пустой словарь

test_results['feature_model'] = feature_model.evaluate(
    df_train[5],
    y_train, verbose=0)

Поскольку использовалась парная регрессия, прогнозы модели легко рассматривать как функцию входных данных:

In [None]:
x = tf.linspace(4., 9., 51)
y = feature_model.predict(x)

In [None]:
def plot_rm(x, y):
  plt.scatter(df_train[5], y_train, label='Data')
  plt.plot(x, y, color='k', label='Прогноз')
  plt.xlabel('Кол-во комнат')
  plt.ylabel('Стоимость')
  plt.legend()

In [None]:
plot_rm(x,y)

### Множественная регрессия

Можно использовать почти идентичный подход, чтобы делать прогнозы на основе нескольких признаков. 

В многомерном случае используется слой нормализации, адаптированный ко всему набору данных.

In [None]:
linear_model = tf.keras.Sequential([
    normalizer,
    tf.keras.layers.Dense(units=1)
])

При вызове модели для набора входных данных, модель вычисляяет по одному значению для каждого элемента входных данных:

In [None]:
linear_model.predict(df_train[[4,5,7,12]][:10])

При вызове модели будут построены ее весовые матрицы и смещения:

In [None]:
linear_model.layers[1].kernel

In [None]:
linear_model.layers[1].bias

Используем те же вызовы `compile()` и `fit()`, что и для модели парной регрессии:

In [None]:
linear_model.compile(
    optimizer=tf.optimizers.Adam(learning_rate=0.25),
    loss='mean_absolute_error')

In [None]:
%%time
history = linear_model.fit(
    df_train[[4,5,7,12]], y_train, 
    epochs=100,
    # подавляем вывод
    verbose=0,
    # проверка (валидация) на 20% обучающих данных
    validation_split = 0.2)

Использование большего числа признаков обеспечивает меньшую ошибку обучения и валидации, чем модель парной регрессии:

In [None]:
plot_loss(history)

### Регуляризация нейронной сети

Регуляризаторы позволяют применять штрафы к параметрам слоя или активности слоя во время оптимизации. Эти штрафы добавляются к функции потерь, которую оптимизирует нейронная сеть.

Штрафы за регуляризацию применяются для каждого слоя отдельно.

Возможны следующие виды регуляризаторов:

   - `tf.keras.regularizers.L1(l1=0.01)`
   - `tf.keras.regularizers.L2(l2=0.01)`
   - `tf.keras.regularizers.L1L2(l1=0.0, l2=0.0)`

Для регуляризации слоя нейронной сети при его создании должен быть указан параметр `kernel_regularizer`, например:

`layer = tf.keras.layers.Dense(3, kernel_regularizer=tf.keras.regularizers.L2(l2=0.01))`

In [None]:
df_normalizer = tf.keras.layers.Normalization()
df_normalizer.adapt(df_train)
print(df_normalizer.mean.numpy())
print(df_normalizer.variance.numpy())

Создаем модель с нормализацией всех признаков и регуляризацией `L1`:

In [None]:
l1_model = tf.keras.Sequential([
    df_normalizer,
    tf.keras.layers.Dense(units=1, 
                          kernel_regularizer=tf.keras.regularizers.L1(l1=0.01))
])

Компилируем

In [None]:
l1_model.compile(
    optimizer=tf.optimizers.Adam(learning_rate=0.25),
    loss='mean_absolute_error')

и обучаем модель:

In [None]:
%%time
history = l1_model.fit(
    df_train, y_train, 
    epochs=100,
    # подавляем вывод
    verbose=0,
    # проверка (валидация) на 20% обучающих данных
    validation_split = 0.2)

Веса в слое выглядят так:

In [None]:
l1_model.layers[1].kernel

Кривые обучения получаются такими:

In [None]:
plot_loss(history)

In [None]:
hist = pd.DataFrame(history.history)
hist

#### Задание (10 баллов)

Для закрепленного за Вами варианта лабораторной работы:

1.	Загрузите заданный в индивидуальном задании набор данных из Tensorflow Datasets.  

2.	Выполните визуализацию независимой и зависимой переменных в соответствии с индивидуальным заданием, подписывая оси и рисунок.  

3.  Постройте парную линейную регрессию при помощи точного подхода и при помощи нейронной сети с одним нейроном. Вычислите и сравните значения показателей качества R^2 двух подходов.

4. Постройте диаграмму рассеяния для независимого и зависимого признаков и изобразите линии двух построенных парных регрессий, подписывая оси и рисунок и создавая легенду. 

5.	Создайте и адаптируйте нормализующий слой Tensorflow для всех признаков набора данных (за исключением зависимого признака) и постройте диаграмму рассеяния для нормализованного независимого признака и зависимого признака, , подписывая оси и рисунок. 

5.	Используя созданный нормализующий слой, постройте регресоры на базе следующих моделей множественной регрессии:
  * линейной регрессии
  * гребневой регрессии (L2)
  * лассо регрессии (L1)

6. Определите среди построенных моделей модель множественной регрессии с наиболее высоким качеством по показателю, указанному в индивидуальном задании.

7.  Для лучшего регрессора визуализируйте кривые обучения (в зависимости от эпохи обучения).

8. Определите медианные значения признаков (кроме независимого и зависимого признаков) и для построенных медианных значений визуализируйте на плоскости с независимым признаком в качестве оси абсцисс и зависимым признаком в качестве оси ординат точки тестовой выборки и линии (графики) различных моделей множественной регрессии разными цветами. Подпишите оси и создайте легенду и заголовок для рисунка.

