## Функция потерь (Loss function)

Одна из самых популярных функций потерь — квадратичное отклонение:

$ L(a(x 
i
​
 ),y 
i
​
 )=(a(x 
i
​
 )−y 
i
​
 ) 
^2 $



Средняя квадратическая ошибка **(MSE - Mean Squared Error)** — самый простой и распространенный показатель для оценки регрессии, определяется уравнением:

![image.png](attachment:image.png)

Средняя абсолютная ошибка **(MAE, Mean Absolute Error)** — ошибка рассчитывается как среднее абсолютных разностей между целевыми значениями и прогнозами. Основным преимуществом MAE является то, что она является более устойчивой к выбросам, так как модули так не увеличивают отклонения, как возведение в степень.
![image.png](attachment:image.png)

RMSLE — это Root Mean Squared Logarithmic Error или корень из средней квадратичной логарифмической ошибки. Этот показатель часто используется для оценки качества моделей регрессии, особенно когда важно учитывать относительные ошибки, а не абсолютные.
$$
\text{RMSLE}(X, y, a) = \sqrt{\frac{1}{\ell}\sum_{i=1}^{\ell} \big(\log{(y_i + 1)} - \log{(a(x_i) + 1)}\big)^2}
$$


## Линейная регрессия

Общий вид  
$ a(x) = wx_i + wx_{i+1} +..+ wx_n + b $

Поиск экстремума (мин) функции среднеквадратичной ошибки для определения коэффициентов

$ MSE -> min $  
$ Q(a(x), X) = \frac{1}{m}\sum{(a(x_i) - y_i)^2)} $

### Поиск минимальной квадратичной ошибки через производную

Производная - скорось изменения функции

$ f(x)' = \frac{f(x + dx) - f(x)}{dx},  dx -> 0 $

$ f(x)' > 0 => f(x)$ растет  

$ f(x)' < 0 => f(x)$ убывает  

$ f(x)' = 0, f(x)$ точка экстремума (максимум или минимум) или горизонтальный участок графика

![image.png](attachment:image.png)


Вторая произодная = ускорение

$ f(x)'' > 0 => f(x)$ вогнутая 

$ f(x)'' < 0 => f(x)$ выпуклая 

$ f(x)'' = 0, f(x)$ точка перегиба

1) первая производная = 0 в точках a,b 
2) вторая производная в точках a,b
3) если вторая производная в точке > 0, точка - локальный минимум, меньше 0 - локальный максимум

![image.png](attachment:image.png)

### Матрицы

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)

In [5]:
import numpy as np

In [8]:
a = np.array([[2, 5], [3, 8]])
b = np.array([[8, -5], [-3, 2]])

In [9]:
a * b 

array([[ 16, -25],
       [ -9,  16]])

In [10]:
a.dot(b) # скалярное произведение

array([[1, 0],
       [0, 1]])

In [12]:
a.T # транспонированная матрица

array([[2, 3],
       [5, 8]])

In [14]:
np.eye(3) # единичная матрица

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [16]:
np.linalg.inv(a) # обратная матрица

array([[ 8., -5.],
       [-3.,  2.]])

### Матричная форма линейной регрессии

`X` - матрица с фичами $ x_1, x_2...$  
`B` - вектор с весами 

$ Q = (X•B - Y)^T(X•B - Y)\frac{1}{n} $
![image-2.png](attachment:image-2.png)

Диффернциал -> $ B = (X^T • X )^{-1} • X^T • Y$

In [25]:
X = np.array([[23, 0.5, 1], 
              [35, 1, 1], 
              [18, 0, 1]])
Y = np.array([55, 100, 45])

In [31]:
B = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(Y)
B

array([  5., -30., -45.])

### Sklearn

In [32]:
from sklearn.linear_model import LinearRegression

In [35]:
lm = LinearRegression()
lm.fit(X, Y)

lm.coef_

array([  5., -30.,   0.])

In [37]:
lm.intercept_

-44.99999999999996