# Метрики регрессии

In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from IPython.display import display
from sklearn.datasets import load_iris

from sklearn.pipeline import make_pipeline, Pipeline

from sklearn.preprocessing import MinMaxScaler, StandardScaler
from sklearn.preprocessing import RobustScaler, Normalizer

from sklearn.model_selection import train_test_split, cross_val_score  
from sklearn.model_selection import GridSearchCV, KFold, StratifiedShuffleSplit

from sklearn.metrics import mean_squared_error, mean_absolute_error, mean_absolute_percentage_error

from sklearn.linear_model import Ridge, Lasso, ElasticNet, Lars, OrthogonalMatchingPursuit, SGDRegressor

from sklearn.metrics import classification_report

import sklearn
print(sklearn.__version__)


1.1.2


# Базовые метрики регрессии

Основными и наиболее известными мертиками регрессии являются:

**Абсолютные метрики**

1. MSE - одна из самых популярных метрик в задаче регрессии (входит в сотав большого количества функций потерь)
$$ MSE(y_{true},y_ {pred}) = \frac{1}{n}\sum_{i=1}^{n}(y_i−f(x_i))^2$$
Важный коментарий функция потерь позволяет оценить какая модель лучше, а метрика регрессии как мы ошибаемся по сравнению с истинными значениями, на конкретной модели.\
MSE неограничен сверху, и может быть нелегко понять, насколько “хорошим” или “плохим” является то или иное его значение.\
MSE квадратично штрафует за большие ошибки на объектах. Если большие ошибки для нас действительно неприемлемы, то квадратичный штраф за них - очень полезное свойство (и его даже можно усиливать, повышая степень, в которую мы возводим ошибку на объекте). \

Однако если в наших тестовых данных присутствуют выбросы, то нам будет сложно объективно сравнить модели между собой: **ошибки на выбросах будет маскировать различия в ошибках на основном множестве объектов**.\
Таким образом, если мы будем сравнивать две модели при помощи MSE, у нас будет выигрывать та модель, у которой меньше ошибка на объектах-выбросах, а это, скорее всего, не то, чего требует от нас наша бизнес-задача.

2. MAE - (mean absolute error) абсалютная ошибка. 
$$ MAE(y_{true},y_{pred}) = \frac{1}{n}\sum_{i=1}^{n}|y_i−f(x_i)|$$
Применение данной метрики позволяет избежать квадратичного штрафа выбросов.

**Когда речь заходит об относительных ошибках, сразу возникает вопрос: что мы будем ставить в знаменатель?**

3. $R^2$ - показывает, какая доля дисперсии таргетов (знаменатель) объяснена моделью.
$$R^2 = 1 - \frac{\sum_{i=1}^{n}(y_i−f(x_i))^2}{\sum_{i=1}^{n}(y_i−\hat{y})}$$
где $\hat{y}$ - среднее арифметическое значение $y$. \
У идеального решающего правила $R^2$ равен 1, у наилучшего константного предсказания он равен 0
 на обучающей выборке.
 
4. MAPE (mean absolute percentage error) - средняя абсолютная ошибка в процентах
$$MAPE(y_{true},y_ {pred}) = \frac{1}{n}\sum_{i=1}^{n}\frac{|y_i−f(x_i)|}{|y_i|}$$
Чувствительна к искажениям числового ряда.

5. WAPE (weighted average percentage error) - взвешенная абсолютная процентная ошибка прогнозирования:
$$ WAPE(y_{true},y_ {pred}) = \frac{\sum_{i=1}^{n}|y_i−f(x_i)|}{\sum_{i=1}^{n}|y_i|} $$
Данная ошибка прогнозирования является симметричной и наименее чувствительна к искажениям числового ряда. К сожалению непосредственно не вычисляется в нашей библиотеке.
|     | Понедельник  | Вторник  |  Среда | 
|:---:|:---:|:---:|:---:|
| Прогноз  |  55 |  2 |  50 |  
| Продажи |  50 | 1  | 50  |  
| MAPE |  0.1 | 1  | 0  |  \
MAPE = 0.367, а WAPE = 0.059