## Описание алгоритма градиентного спуска с методом импульсов (Momentum)

Данный алгоритм используется для поиска локального минимума функции $f(x)$ путем итеративного обновления значения $x$ с учетом "импульса" предыдущих шагов.

**Цель:** Найти значение $x$, минимизирующее функцию:

$$f(x) = -0.5 \cdot x + 0.2 \cdot x^2 - 0.01 \cdot x^3 - 0.3 \cdot \sin(4x)$$

**Алгоритм с методом импульсов:**

Метод импульсов ускоряет сходимость градиентного спуска, особенно в случае функций с сильно изрезанным ландшафтом или узкими оврагами. Он делает это, добавляя долю предыдущего вектора обновления к текущему вектору обновления.

Правила обновления для значения $x$ и вектора импульса $v$:

1.  Вычисление вектора импульса:
    $$v = \gamma \cdot v + (1-\gamma) \cdot \eta \cdot \frac{df(x)}{dx}$$
2.  Обновление значения $x$:
    $$x_n = x_{n-1} - v$$

где:
- $x_n$ - значение $x$ на текущей итерации.
- $x_{n-1}$ - значение $x$ на предыдущей итерации.
- $v$ - вектор импульса.
- $\gamma$ коэффициент памяти (коэффициент момента) - определяет, какая часть предыдущего импульса сохраняется (обычно значение близкое к 1, например, 0.8 или 0.9).
- $\eta$ скорость сходимости (шаг обучения) - определяет размер шага в направлении градиента.
- $\frac{df(x)}{dx}$ - градиент функции $f(x)$ в точке $x$.

**Градиент функции:**

Градиент функции $f(x) = -0.5 \cdot x + 0.2 \cdot x^2 - 0.01 \cdot x^3 - 0.3 \cdot \sin(4x)$ по $x$ вычисляется как ее производная по $x$:

$$\frac{df(x)}{dx} = \frac{d}{dx}(-0.5 \cdot x + 0.2 \cdot x^2 - 0.01 \cdot x^3 - 0.3 \cdot \sin(4x))$$
$$\frac{df(x)}{dx} = -0.5 + 0.4 \cdot x - 0.03 \cdot x^2 - 0.3 \cdot \cos(4x) \cdot 4$$
$$\frac{df(x)}{dx} = -0.5 + 0.4 \cdot x - 0.03 \cdot x^2 - 1.2 \cdot \cos(4x)$$

**Параметры и начальные значения, используемые в коде:**

- $\eta = 0.1$ скорость сходимости (шаг обучения)
- $x_0 = -3.5$ (начальное значение $x$)
- $N = 200$ (число итераций)
- $\gamma = 0.8$ коэффициент памяти (коэффициент инерции)
- $v = 0$ (начальное значение вектора импульса)

**Реализация в коде:**

1. Определяется функция $f(x)$ и ее производная $\frac{df(x)}{dx}$.
2. Инициализируются параметры $\eta$, $x_0$, $N$, $\gamma$ и $v$.
3. В цикле, выполняющем $N$ итераций:
    - Вычисляется градиент функции в текущей точке $x_0$.
    - Обновляется вектор импульса $v$ по формуле с коэффициентом $\gamma$.
    - Обновляется значение $x_0$ с учетом вектора $v$.
4. После завершения итераций, итоговое значение $x_0$, представляющее найденную точку минимума, сохраняется в переменной `x`.

In [1]:
import numpy as np


def func(x):
    return -0.5 * x + 0.2 * x ** 2 - 0.01 * x ** 3 - 0.3 * np.sin(4*x)

def df(x):
    return -0.5 + 0.4 * x - 0.03 * x ** 2 - 1.2 * np.cos(4*x)


n = 0.1
x0 = -3.5
N = 200
gamma = 0.8
v = 0
for _ in range(N):
    v = gamma * v + (1-gamma) * n * df(x0)
    x0 = x0 - v
x = x0