# Метрики для оценки качества регрессионной модели

<img src="images/100_accuracy.jpg">

---

**Источники:**

[Александр Дьяконов «Анализ малых данных» ГЛАВА 8. Метрики качества](https://alexanderdyakonov.files.wordpress.com/2018/10/book_08_metrics_12_blog1.pdf)

[3 Best metrics to evaluate Regression Model?](https://towardsdatascience.com/what-are-the-best-metrics-to-evaluate-your-regression-model-418ca481755b)

[Metrics for Evaluating Linear Regression Models](https://medium.com/dev-genius/metrics-for-evaluating-linear-regression-models-36df305510d9)

[Как выбрать метрики для валидации результата Machine Learning](http://blog.datalytica.ru/2018/05/blog-post.html)

[Metrics and scoring: quantifying the quality of predictions](https://scikit-learn.org/stable/modules/model_evaluation.html)

[Коэффициент детерминации](https://edu.kpfu.ru/mod/glossary/print.php?id=35061&mode=date&hook=&sortkey=UPDATE&sortorder=desc&offset=0)

[Оценка качества в задачах классификации и регрессии](http://neerc.ifmo.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD%D0%BA%D0%B0_%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0_%D0%B2_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D1%85_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D0%B8_%D0%B8_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8)

[Choosing the Right Metric for Evaluating Machine Learning Models — Part 1](https://medium.com/usf-msds/choosing-the-right-metric-for-machine-learning-models-part-1-a99d7d7414e4)

---

Метрики, которые выбраны для оценки алгоритмов машинного обучения, очень важны.

Выбор метрик влияет на то, как измеряется и сравнивается производительность алгоритмов машинного обучения.

Они влияют на то, как оценивается важность различных характеристик в результатах и окончательный выбор того, какой алгоритм выбрать.

**Пакет Python: [sklearn.metrics](https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metrics)**

Рассмотрим:

- Средняя абсолютная ошибка (MAE – Mean Absolute Error / MAD – Mean Absolute Deviation)
- Средняя квадратическая ошибка (MSE – Mean Squared Error)
- Корень средней квадратичной ошибки (RMSE – Root Mean Squared Error / RMSD – Root Mean Square Deviation)
- Коэффициент детерминации ($R^2$ / R-squared)

**Существует множество других способов оценки**

## Средняя абсолютная ошибка (MAE – Mean Absolute Error / MAD – Mean Absolute Deviation)

$\large MAE = \cfrac{\sum\limits_{i=1}^{n} |y_i - \tilde{y_i}|}{n}$

$MAE=$ mean absolute error

$\large y_i=$ prediction (предсказание)

$\large \tilde{y_i}=$ true value (истинное значение)

$\large n=$ total number of data points (общее количество точек данных)

* Метрика измеряет среднюю сумму абсолютной разницы между фактическим значением и прогнозируемым значением.

* Это дает представление о том, насколько неправильными были прогнозы.

* Мера дает представление о величине ошибки, но не дает представление о направлении.

* Модуль в формуле всё так же позволяет избавиться от знаков и получить некоторую оценку расстояния от фактических до расчётных значений, которое нужно будет потом минимизировать.

* **Не увеличивает в разы отклонения, при наличии выбросов (outliers)**.

* **Чем меньше, тем точнее предсказание**. Оптимум достигается в точке 0, то есть предсказание идеально.

[sklearn.metrics.mean_absolute_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_absolute_error.html#sklearn.metrics.mean_absolute_error)

In [1]:
# импорт пакета с MAE
from sklearn.metrics import mean_absolute_error

In [2]:
# 2D
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mean_absolute_error(y_true, y_pred)

0.5

In [3]:
# 3D
y_true = [[0.5, 1], [-1, 1], [7, -6]]
y_pred = [[0, 2], [-1, 2], [8, -5]]
mean_absolute_error(y_true, y_pred)

0.75

## Средняя квадратическая ошибка (MSE – Mean Squared Error)

$\large MSE = \cfrac{\sum\limits_{i=1}^{n} (y_i - \tilde{y_i})^2}{n}$

$MSE=$ mean squared error

$\large y_i=$ prediction (предсказание)

$\large \tilde{y_i}=$ true value (истинное значение)

$\large n=$ total number of data points (общее количество точек данных)

* Суть метода заключается по сути в том, чтобы минимизировать сумму квадратов отклонений фактических значений от расчётных.

* Очень похожа на среднюю абсолютную ошибку в том, что она дает общее представление о величине ошибки.

* Возведение в квадрат влияет на то, что **существенно увеличивает те значения, которые лежат далеко от всех остальных (outliers)**.

* **Чем меньше, тем точнее предсказание**. Оптимум достигается в точке 0, то есть предсказание идеально.

[sklearn.metrics.mean_squared_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html)

In [4]:
# импорт пакета с MSE/RMSE
from sklearn.metrics import mean_squared_error

In [5]:
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mean_squared_error(y_true, y_pred, squared=True)  # MSE

0.375

## Корень средней квадратичной ошибки (RMSE – Root Mean Squared Error / RMSD – Root Mean Square Deviation)

$\large RMSE = \sqrt{\cfrac{\sum\limits_{i=1}^{n} (y_i - \tilde{y_i})^2}{n}}$

$RMSE=$ root mean squared error

$\large y_i=$ prediction (предсказание)

$\large \tilde{y_i}=$ true value (истинное значение)

$\large n=$ total number of data points (общее количество точек данных)

- **Легко интерпретировать**, поскольку он имеет те же единицы, что и исходные значения (в отличие от MSE). 

- Оперирует меньшими величинами по абсолютному значению, что может быть полезно для вычислений.

- Оптимум достигается в точке 0, то ест предсказание идеально.

[sklearn.metrics.mean_squared_error](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html)

In [6]:
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
mean_squared_error(y_true, y_pred, squared=False)  # RMSE

0.6123724356957945

## Коэффициент детерминации ($R^2$ / R-squared)

$\large R^2 = 1 - \cfrac{RSS}{TSS} = 1 - \cfrac{\sum\limits_{i=1}^{n} (y_i - \tilde{y_i})^2}{\sum\limits_{i=1}^{n} (\bar{y_i} - \tilde{y_i})^2} = 1-\cfrac{\sum\limits_{i=1}^{n} (y_i - \tilde{y_i})^2}{\sum\limits_{i=1}^{n} (\cfrac{1}{n}\sum\limits_{i=1}^{n} y_i - \tilde{y_i})^2}$

$R^2=$ R squared / coefficient of determination

$RSS=$ residual sum of squares (остаточная сумма квадратов)

$TSS=$ total sum of squares (общая сумма квадратов)

$\large y_i=$ prediction (предсказание)

$\large \bar{y_i}=$ mean value of a sample (среднее значение)

$\large \tilde{y_i}=$ true value (истинное значение)

$\large n=$ total number of data points (общее количество точек данных)

* Метрика указывает на достоверность соответствия набора прогнозов фактическим значениям. 

* Корреляция (также известная как $R$) представляет собой число от 1 до -1, где значение +1 означает, что увеличение x приводит к некоторому увеличению y, -1 означает, что увеличение x приводит к уменьшению y и 0 означает, что между x и y нет никакой связи.

- Как и корреляция, $R^2$ говорит, как связаны две вещи. 

* **Это значение между 0 и 1**.
    - **Чем ближе значение коэффициента к 1, тем сильнее зависимость. При оценке регрессионных моделей это интерпретируется как соответствие модели данным.**
    - Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%.
    - Модели с коэффициентом детерминации выше 80% можно признать достаточно хорошими.
    - Значение коэффициента детерминации 1 означает функциональную зависимость между переменными.
    - В общем случае $R^2$ **может быть и отрицательным, это говорит о крайней неадекватности модели: простое среднее приближает лучше**.


[sklearn.metrics.r2_score](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score.html)

In [7]:
from sklearn.metrics import r2_score

In [8]:
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
r2_score(y_true, y_pred)

0.9486081370449679

In [9]:
y_true = [1, 2, 3]
y_pred = [1, 2, 3]
r2_score(y_true, y_pred)

1.0

In [10]:
y_true = [1, 2, 3]
y_pred = [2, 2, 2]
r2_score(y_true, y_pred)

0.0

In [11]:
y_true = [1, 2, 3]
y_pred = [3, 2, 1]
r2_score(y_true, y_pred)

-3.0