# Лабораторная работа по линейной регрессии на Python


## 1. Поиск градиента

Продолжим формулу для векторной производной по $x$ для функции квадратичной ошибки:

$$ f(x) = ||Ax - y||^2 = (Ax - y)^T(Ax - y) $$

Раскроем скобки:

$$
f(x) = (Ax)^T(Ax) - 2y^T(Ax) + y^T y = x^T A^T A x - 2 x^T A^T y + y^T y
$$

Найдем градиент по $x$:

$$
\nabla f(x) = \nabla \left( x^T A^T A x - 2 x^T A^T y + y^T y \right)
$$

Так как $y^T y$ — скаляр и не зависит от $x$, производная от него будет 0. Тогда:

$$
\nabla f(x) = 2A^T A x - 2A^T y
$$

**Итоговая формула:**

$$
\boxed{\nabla f(x) = 2A^T A x - 2A^T y}
$$



## 2. Прямое решение через ноль производной

Приравниваем градиент к нулю:

$$
\nabla f(x) = 2A^T A x - 2A^T y = 0
$$

Разделим обе части на 2:

$$
A^T A x = A^T y
$$

Домножим обе части на $(A^T A)^{-1}$, если матрица обратима:

$$
x = (A^T A)^{-1} A^T y
$$

**Итоговая формула:**

$$
\boxed{x = (A^T A)^{-1} A^T y}
$$


In [None]:

import numpy as np
import matplotlib.pyplot as plt

# ваши параметры по вариантам
a_orig = (-1)**3 * 0.1 * 3  # n = 3
b_orig = 3 * (-1)**(3+1)    # n = 3
random_state = 3

x_orig = np.array([a_orig, b_orig])

np.random.seed(random_state)

A = np.stack([np.arange(0, 25), np.ones(25)]).T

# @ - операция матричного умножения в библиотеке NumPy
y = A @ x_orig + np.random.standard_normal(25)

f, ax = plt.subplots(figsize=(7, 7))

plt.scatter(A[:, 0], y)

ax.set_xlim(-25, 25)
ax.set_ylim(-25, 25)

ax.axvline(0, color="black")
ax.axhline(0, color="black")
ax.grid(True)
plt.title("График точек с шумом")
plt.show()



### Вопрос - зачем был дописан вектор единиц справа к иксу?

ответ - Вектор единиц добавлен к $A$ для учета свободного члена (сдвига, смещения) в линейной модели. Это позволяет не ограничиваться только проходящими через начало координат прямыми и обучать модель со сдвигом.


In [None]:

# Решение задачи через аналитическую формулу
A_T_A = A.T @ A
A_T_y = A.T @ y
a_b_analytical = np.linalg.inv(A_T_A) @ A_T_y
print("Аналитическое решение (a, b):", a_b_analytical)


In [None]:

# Визуализация найденной прямой
x_vals = np.linspace(0, 25, 100)
y_vals = a_b_analytical[0] * x_vals + a_b_analytical[1]

plt.figure(figsize=(7, 7))
plt.scatter(A[:, 0], y, label='Данные с шумом')
plt.plot(x_vals, y_vals, color='red', label='Найденная прямая')
plt.axvline(0, color="black")
plt.axhline(0, color="black")
plt.grid(True)
plt.title("Линейная регрессия через аналитическое решение")
plt.legend()
plt.show()
