# **The Linear Algebra Behind Linear Regression**

``` python
x = [1, 1.5, 6, 2, 3]
y = [4, 7, 12, 8, 7]

X = np.asarray([np.ones(5), x]).T
print(X)
>>> [[1. 1. ]
>>> [1. 1.5]
>>> [1. 6. ]
>>> [1. 2. ]
>>> [1. 3. ]]

from numpy.linalg import inv
beta_0, beta_1 = inv(X.T @ X) @ X.T @ y
print(beta_0, beta_1)
>>> (4.028481012658229, 1.3227848101265818)

x_lin_space = np.linspace(0, 7, 100)
y_hat = beta_0 + beta_1 * x_lin_space
```

*Независимите променливи x са стойностите, които използваме за предсказване. Например, ако искаме да предскажем цената на къща според квадратурата ѝ, x е квадратурата. Зависимата променлива y е стойността, която искаме да предскажем, в случая цената на къщата. Линейната регресия има за цел да намери най-добрата права линия, която да описва връзката между x и y. Линейната регресия се чрез формулата:*

$$
\hat{y} = \beta_0 + \beta_1 x
$$

*beta_0 е свободният член - точката, в която линията пресича оста y. За да можем да използваме формулата на обикновените най-малки квадрати, добавяме колона с единици в матрицата X. Eквивалентно e на това, че beta_0 ще се умножава по 1, т.е. ще бъде включено като свободен член. Използваме формулата за обикновени най-малки квадрати:*

$$
\beta = 
\begin{bmatrix} 
\beta_0 \\ 
\beta_1 
\end{bmatrix} 
= (X^T X)^{-1} X^T y
$$

*Целта на формулата е да се намерят стойностите на beta_0 и beta_1, които минимизират сумата на квадратите на разликите между предсказаните и реалните y:*

$$
\text{minimize } \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

*Тук: X^T.X е матрица на взаимната зависимост между колоните на X. (X^T.X)^{-1} е обратната матрица, която позволява решаване на системата. X^T.y комбинира наблюдаваните y със съответните x. Като умножим, получаваме най-добрите коефициенти beta_0 и beta_1, които минимизират грешката. Резултатът за конкретния пример е:*

$$
\beta_0 \approx 4.028, \quad \beta_1 \approx 1.323
$$

*Следователно, най-добрата права е:*

$$
\hat{y} = 4.028 + 1.323\,x
$$
