## Градиентный спуск 

Реализация без сторонних библиотек


Пусть у нас есть некоторая функция $f:\mathbb{X}\rightarrow\mathbb{R}$, и мы хотим её минимизировать, т.е: $$f(\vec{x})\rightarrow \min_{\vec{x} \in \mathbb{X}}$$

Тогда на помощь нам приходит любимый градиентный спуск: $$\vec{x}_{n+1}=\vec{x}_n-\alpha\nabla{f(\vec{x}_n)}$$

Сначала реализуем градиент:

In [28]:
from typing import List

def grad(f, x:List[float], eps=10**(-5))->List[float]:
    x_dev=[]
    for i in range(len(x)):
        x_1,x_2=x.copy(),x.copy()
        x_1[i]-=eps
        x_2[i]+=eps
        x_dev.append((f(x_2)-f(x_1))/(2*eps))
    return x_dev

Так как я должен реализовать код без сторонних библиотек, то я решил воспользоваться геометрическим определением частной производной: $$\frac{\partial f}{\partial x_i}=\lim_{\varepsilon \rightarrow 0}{\frac{f(x_1,...,x_i+\varepsilon,...x_n)-f(x_1,...,x_i,...,x_n)}{\varepsilon}}$$
Но в коде немного другая реализация:
$$\frac{\partial f}{\partial x_i}=\lim_{\varepsilon \rightarrow 0}{\frac{f(x_1,...,x_i+\varepsilon,...x_n)-f(x_1,...,x_i-\varepsilon,...,x_n)}{2\varepsilon}}$$
Т.к. погрешность аппроксимации у 1 варианта $O(\varepsilon)$, а у 2 варианта $O(\varepsilon^2)$

Теперь реализуем сам спуск:

In [29]:
def grad_desc(f,x:List[float],learning_rate=0.01,iterations=100000)->List[float]:
    for i in range(iterations):
        x=list(map(lambda a,l,g:a-l*g,x,len(x)*[learning_rate],grad(f,x)))
    return [round(i,5) for i in x]

Ну и давайте какую-нибудь функцию для проверки, например: $f(\vec{x})=(x_1-2)^2+(x_2+3)^2$, тогда нетрудно заметить, что глобальный минимум будет находиться в точке $(2,-3)$

In [30]:
def f(x:List[float])->float:
    return (x[0] - 2)**2 + (x[1] + 3)**2

Тест

In [31]:
print(grad_desc(f,[1,1]))

[2.0, -3.0]


Всё окей