# Метрики регрессии. Недостатки аналитического решения

>Метрика — это численное выражение качества моделирования

Будем рассматривать метрики для задачи регрессии на следующем примере. Возьмём первые пять наблюдений из нашей таблицы и предсказанные для них моделью lr_lstat ответы:

$$ y = (24.0, 21.6, 34.7, 33.4, 36.2) $$
$$ \widehat{y} = (29.82, 25.87, 30.73, 29.49) $$

## Средняя абсолютная ошибка — MAE (Mean Absolute Error)

$$ MAE = \frac{\sum^{n}_{i=1}|y_i - \widehat{y}_i|}{n} $$

Данная метрика интерпретируется очень легко: это число показывает, насколько в среднем наша модель ошибается. Чем меньше значение метрики, тем лучше.

То есть для нашего примера из пяти наблюдений в среднем модель ошибается на 4.482 тысячи долларов.

`sklearn.metrics.mean_absolute_error`

## Средняя абсолютная ошибка в процентах — MAPE (Mean Absolute Percent Error)

$$ MAPE = \sum^{n}_{i=1} \frac{|y_i - \widehat{y_i}|}{|y_i|} \frac{100\%}{n} $$

Эта метрика показывает, на сколько процентов в среднем наше предсказание отклоняется от реального значения. Эта метрика отлично показывает себя в задачах, когда неизвестно, какое значение целевого показателя считать приемлемым.

Например, средняя ошибка — 2 тысячи долларов. Это много или мало? Смотря для чего... А вот средняя ошибка, равная 80 % — это много или мало? Определённо много.
Таким образом, на первых пяти наблюдениях модель в среднем ошибается на 15.781%

`sklearn.metrics.mean_absolute_percentage_error`

## Средняя квадратическая ошибка — MSE

Логика вычисления данной ошибки очень похожа на предыдущую. Разница лишь в том, что вместо модуля разности между предсказанным и реальным значениями мы берём квадрат этого модуля:

$$ MSE = \frac{\sum^{n}_{i=1}(y_i - \widehat{y}_{i})^2}{n} $$

Таким образом, для нашего примера квадрат отклонения составляет 22.116 тысяч долларов в квадрате.

Согласитесь, не очень понятно, о чём идет речь. Однако данная метрика является популярной, так как позволяет «штрафовать» модель за очень большие ошибки.

Например, расхождение в 200 единиц в метрике MSE воспринимается как 40 000, а в метрике MAE это расхождение воспринимается как 200. Поэтому, если у нас есть две модели, но одна из них допускает большие ошибки, эти ошибки становятся ещё больше при расчёте метрики MSE, и нам легче сравнить модели между собой.

> <font color=lightpink>Но в то же время это и проклятие MSE. Если в данных присутствуют выбросы, метрика может быть необъективной. Если модель будет утверждать, что цена здания — 30 тысяч долларов, а в наборе данных ему соответствует цена в 3 миллиона долларов, то при возведении такой ошибки в квадрат получится 9 миллионов, что может сбить с толку исследователя. Необходимо скептически относиться к данной метрике, если вы не проводили исследование данных на предмет наличия выбросов.</font>

`sklearn.metrics.mean_square_error`


## Корень из средней квадратической ошибки — RMSE (Root Mean Squared Error)

$$ RMSE = \sqrt{MSE} = \sqrt{\frac{\sum^{n}_{i=1}(y_i - \widehat{y}_{i})^2}{n}} $$

Корень извлекается для того, чтобы привести размерности ответов и ошибок в соответствие и сделать метрику более понятной.
>Преимущества и недостатки этой метрики такие же, как и у MSE, к преимуществам добавляется только понятная размерность.

Отдельная функция отсутствует, но можно извлечь корень из результата функции `mean_square_error`.

## Коэффициент детерминации $(R^2)$

Коэффициент детерминации $R^2$ является ещё одним показателем, который мы можем использовать для оценки модели. Он тесно связан с $MSE$, но его преимущество в том, что $R^2$ всегда находится в промежутке между $-\infty$ и $1$.

$$ R^2 = 1 - \frac{MSE}{MSE_{mean}} $$
где
$$ MSE_{mean} = \frac{\sum^{n}_{i=1}(y_i - \overline{y})^2}{n} $$
где $\overline{y}$ - среднее по вектору правильных ответов.

То есть $R^2$ показывает, насколько наша модель лучше, чем если бы все предсказания были средним по правильным ответам.

$$ \dots = R^2 = 1 - \frac{22.116}{35.72} = 0.38 $$

Удовлетворительным $R^2$ считается показатель выше $0.5$: чем ближе к $1$, тем лучше. Отрицательные значения  говорят о том, что построенная модель настолько плоха, что лучше было бы присвоить всем ответам среднее значение.

`sklearn.metrics.r2_score`