# Градиентный спуск
<b>Градиентный спуск</b> используется, чтобы найти наилучшие значения параметров $b_0$ и $b_1$ в уравнении линейной регрессии. Это нужно, что бы модель могла наилучшим образом подсказывать целевую переменную, например, оценку ученик по количеству часов, потраченных на учебу.<br>

<b>Что Такое Параметры  $b_0$  и  $b_1$ ?</b><br>
	•	 $b_0$  — это точка, где наша линия пересекает ось Y (свободный член). Это значение, которое наша модель предскажет, когда  x  равно 0.<br>
	•	 $b_1$  — это наклон линии (коэффициент наклона), показывающий, как сильно значение  x  влияет на предсказание.

Например, если  $b_1$  равно 2, это значит, что увеличение  $x$  на 1 увеличивает предсказанное значение  $y$  на 2.

Мы ищем минимальные значения функции потерь, что бы наша модель делала как можно мешьне ошибок. Функция потерь показывает, насколько наши предсказания отличаются от реальных значений. Чем меньше значение функции потерь, тем лучше наша модель.

<b>Что такое Производная и Градиент</b>

- <b>Производная</b> - это мера изменения функции. Если мы знаем производную функции, мы можем понять, как сильно изменится функция, если изменить входное значение. Например, производная $y=x^2$ по $x$ равна $2x$. Это значит, что при увеличении $x$ на небольшое значение, $y$ изменится примерно на $2x$.
- <b>Градиент</b> - это вектор, который указывает направление наибольшего увеличения функции. В нашем случае, градиент показывает, как измеенить пармаетры $b_0$ и $b_1$, что бы уменьшить ошибку.

<b>Как Работает Градиентный Спуск?<b>

1. <b>Инициализация:</b> Начинаем с начальных значений параметров  $b_0$  и  $b_1$  (например, 0 или случайных значений).
2. <b>Вычисление функции потерь:</b> Находим значение функции потерь для текущих параметров.
3. <b>Вычисление градиентов:</b> Определяем градиенты функции потерь по  $b_0$  и  $b_1$ . Это показывает, в каком направлении и насколько нужно изменить параметры, чтобы уменьшить ошибку.
4. <b>Обновление параметров:</b> Корректируем  $b_0$  и  $b_1$  в направлении, противоположном градиенту. Мы делаем это постепенно, используя скорость обучения ($\alpha$).
5. <b>Повторение:</b> Повторяем шаги 2-4 до тех пор, пока не достигнем минимальной ошибки.



In [3]:
import numpy as np

# Данные: часы учебы и оценки
X = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])

# Инициализация коэффициентов
b_0 = 0
b_1 = 0
alpha = 0.01
iterations = 1000 # количество итераций

# Градиентный спуск
for _ in range(iterations):
    # Прогнозы
    y_pred = b_0 + b_1 * X

    grad_b0 = -2 * np.mean(y - y_pred)
    grad_b1 = -2 * np.mean(X * (y - y_pred))

    # Обновление коэффициентов
    b_0 -= alpha * grad_b0
    b_1 -= alpha * grad_b1

print(f'Коэффициент b_0 (свободный член): {b_0}')
print(f'Коэффициент b_1 (наклон): {b_1}')

Коэффициент b_0 (свободный член): 2.136116825825789
Коэффициент b_1 (наклон): 0.6176946148762643


<b>Заключение</b>

Градиентный спуск — это метод, который помогает нам найти наилучшие значения параметров в модели, чтобы предсказания были как можно точнее. Мы используем градиенты, чтобы понять, как нужно изменить параметры, и делаем это постепенно, пока не достигнем минимальной ошибки.