# Оценки регрессионных моделей
В данном ноутбуке представлено четыре наиболее известных оценки качетсва рпдесказания по модели: Коэффициент Детерминации, Средняя Квадратическая Ошибка (Среднее Квадратическое Отклонение), Корень Среднего Квадратического Отклонения и Срденяя Абсолютная Ошибка.

[Документация](https://scikit-learn.org/stable/modules/model_evaluation.html)

## Коэффициент Детерминации
Коэффициент Детерминации или Коэффициент R\^2 -  это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными. Более точно — это единица минус доля необъяснённой дисперсии (дисперсии случайной ошибки модели, или условной по факторам дисперсии зависимой переменной) в дисперсии зависимой переменной. Его рассматривают как универсальную меру зависимости одной случайной величины от множества других. В частном случае линейной зависимости $R^{2}$. $R^{2}$ является квадратом так называемого множественного коэффициента корреляции между зависимой переменной и объясняющими переменными. В частности, для модели парной линейной регрессии коэффициент детерминации равен квадрату обычного коэффициента корреляции между y и x.

Она выражается следующей фромулой:

$\huge R^2=1-\frac{\sigma^2}{\sigma_y^2}$,

где:

$\large \sigma^2$ - условная дисперсия зависимой переменной;

$\large \sigma_y^2$ - собственная дисперсия модели, необъячненная дисперсия;

[Википедия](https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%8D%D1%84%D1%84%D0%B8%D1%86%D0%B8%D0%B5%D0%BD%D1%82_%D0%B4%D0%B5%D1%82%D0%B5%D1%80%D0%BC%D0%B8%D0%BD%D0%B0%D1%86%D0%B8%D0%B8)

[Документация](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score.html#sklearn.metrics.r2_score)

In [1]:
from sklearn.metrics import r2_score
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
print(r2_score(y_true, y_pred))
y_true = [[0.5, 1], [-1, 1], [7, -6]]
y_pred = [[0, 2], [-1, 2], [8, -5]]
print(r2_score(y_true, y_pred, multioutput='variance_weighted'))
y_true = [1, 2, 3]
y_pred = [1, 2, 3]
print(r2_score(y_true, y_pred))
y_true = [1, 2, 3]
y_pred = [2, 2, 2]
print(r2_score(y_true, y_pred))
y_true = [1, 2, 3]
y_pred = [3, 2, 1]
print(r2_score(y_true, y_pred))

0.9486081370449679
0.9382566585956417
1.0
0.0
-3.0


## Средняя Квадратическая Ошибка
Среднеквадрати́ческое отклоне́ние (среднее квадрати́ческое отклоне́ние, среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние, станда́ртное отклоне́ние, станда́ртный разбро́с, средняя квадратическая ошибка) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания. Обычно указанные термины означают квадратный корень из дисперсии случайной величины, но иногда могут означать тот или иной вариант оценки этого значения. Иначе, она определяется как средний квадрат ошибок модели (средний квадрат разностей между предсказанием и реальным значением) - MSE - Mean Squared Error.

В литературе обычно обозначают греческой буквой ${\displaystyle \sigma }$  (сигма).

Его формула:

$\huge MSE=\frac{1}{n}\sum_{i=1}^{n} (y_{i}-g_{i})^2$,

где:

$\large n$ - количество значений (семплов);

$\large y_{i}$ - предсказание из i-го индекса в наборе всех значений;   

$\large g_{i}$ - реальное значение из i-го индекса в наборе всех значений; 

[Википедия 1](https://ru.wikipedia.org/wiki/%D0%A1%D1%80%D0%B5%D0%B4%D0%BD%D0%B5%D0%BA%D0%B2%D0%B0%D0%B4%D1%80%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D0%BE%D1%82%D0%BA%D0%BB%D0%BE%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5)

[Википедия 2](https://en.wikipedia.org/wiki/Mean_squared_error)

[Документация](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html#sklearn.metrics.mean_squared_error)

In [3]:
from sklearn.metrics import mean_squared_error
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
print(mean_squared_error(y_true, y_pred))
y_true = [[0.5, 1],[-1, 1],[7, -6]]
y_pred = [[0, 2],[-1, 2],[8, -5]]
print(mean_squared_error(y_true, y_pred))
print(mean_squared_error(y_true, y_pred, multioutput='raw_values'))
print(mean_squared_error(y_true, y_pred, multioutput=[0.3, 0.7]))

0.375
0.7083333333333334
[0.41666667 1.        ]
0.825


## Корень Средней Квадратической Ошибки
Корень из MSE (Иногда - корень средней квадратической девиации), служащий показателем величны *остатков* модели - того, что модель не объясняет.

Формула:

$\large RMSE=RMSD=\sqrt{MSE}$.

[Википедия](https://en.wikipedia.org/wiki/Root-mean-square_deviation)

In [4]:
from sklearn.metrics import mean_squared_error
from numpy import sqrt
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
print(sqrt(mean_squared_error(y_true, y_pred)))

0.6123724356957945


## Средняя Абсолютная Ошибка

Средняя абсолютная ошибка - это средняя разность ошибок модели. Если умножить ее на 100%, то получится ошибка модели в %.

Формула:

$\huge MAE=\frac{1}{n}\sum_{i=1}^{n} (y_{i}-g_{i})$,

где:

$\large n$ - количество значений (семплов);

$\large y_{i}$ - предсказание из i-го индекса в наборе всех значений;   

$\large g_{i}$ - реальное значение из i-го индекса в наборе всех значений; 

[Википедия](https://en.wikipedia.org/wiki/Mean_absolute_error)

[Документация](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_absolute_error.html#sklearn.metrics.mean_absolute_error)

In [5]:
from sklearn.metrics import mean_absolute_error
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
print(mean_absolute_error(y_true, y_pred))
y_true = [[0.5, 1], [-1, 1], [7, -6]]
y_pred = [[0, 2], [-1, 2], [8, -5]]
print(mean_absolute_error(y_true, y_pred))
print(mean_absolute_error(y_true, y_pred, multioutput='raw_values'))
print(mean_absolute_error(y_true, y_pred, multioutput=[0.3, 0.7]))

0.5
0.75
[0.5 1. ]
0.85
