# Регрессия. Вариант 1. Стефанюк Иван, M3205
![image.png](attachment:9fe4c983-1409-4a22-bdac-fe500ed219fd.png)

In [1]:
import numpy as np
from numpy.linalg import inv

### Уравнение линейной регрессии
Решение линейной регрессии:
$$ \beta = (X^T * X)^{-1} * X^T * y$$
К матрице признаков добавим вектор единиц, чтобы получить свободный коэффициент

In [2]:
X = np.array([
    [0.94, 0.5, 1],
    [0.94, 1.7, 1],
    [0.94, 0.094, 1],
    [1.9, 0.47, 1],
    [1.9, 1.6, 1],
    [1.9, 0.89, 1],
    [1.8, 0.72, 1],
    [1.8, 1.1, 1],
    [1.8, 0.86, 1]
])
y = np.array([4.87872,
              7.00151,
              4.32956,
              8.46136,
              10.1612,
              8.70671,
              9.06106,
              9.21552,
              9.11262])
beta = inv(X.T @ X) @ X.T @ y
print(f"Уравние регрессии: x_1 * {beta[0]} + x_2 * {beta[1]} + {beta[2]}")

Уравние регрессии: x_1 * 3.7314533446971336 + x_2 * 1.5760576302150833 + 0.7202209115210348


### Сумма квадратов остатков
$$RSS = \sum_{i=1}^{n}{(y_i - f(x_i))^2}$$

In [3]:
rss = ((y - X @ beta) ** 2).sum()
print(f"Сумма квадратов остатков: {rss}")

Сумма квадратов остатков: 0.6671482667957439


### Коэффициент детерминации
$$R^2 = 1 - \frac{RSS}{TSS}$$
$$TSS = \sum_{i=1}^{n}{(y_i - \overline{y})^2}$$

In [4]:
tss = ((y - y.mean()) ** 2).sum()
R_2 = 1 - rss / tss
print(f"Коэффициент детерминации R^2={R_2}")

Коэффициент детерминации R^2=0.9799704579555842


### Матрица ковариации

In [5]:
def cov(x_1, x_2):
    return ((x_1 - x_1.mean()) * (x_2 - x_2.mean())).mean()

In [6]:
cov_matrix = np.array([
    [cov(X[:, 0], X[:, 0]), cov(X[:, 0], X[:, 1])],
    [cov(X[:, 1], X[:, 0]), cov(X[:, 1], X[:, 1])]
])
print(f"Матрица ковариации векторов признаков:\n"
      f" x_1, \t\tx_2\n {cov_matrix}")

Матрица ковариации векторов признаков:
 x_1, 		x_2
 [[0.18568889 0.03701185]
 [0.03701185 0.24395269]]
