# 1. Градиентный спуск и его модификации
   - Выбрать [тестовые функции оптимизации](https://ru.wikipedia.org/wiki/Тестовые_функции_для_оптимизации) (2 шт)
   - Запрограммировать собственную реализацию классического градиентного спуска
   - Запрограммировать пайлайн тестирования алгоритма оптимизации
     - Визуализации функции и точки оптимума
     - Вычисление погрешности найденного решения в сравнение с аналитическим для нескольких запусков
     - Визуализации точки найденного решения (можно добавить анимацию на плюс балл)
   - Запрограммировать метод вычисления градиента
     - Передача функции градиента от пользователя
     - Символьное вычисление градиента (например с помощью [sympy](https://www.sympy.org/en/index.html)) (на доп балл)
     - Численная аппроксимация градиента (на доп балл)
   - Запрограммировать одну моментную модификацию и протестировать ее
   - Запрограммировать одну адаптивную модификацию и протестировать ее
   - Запрограммировать метод эволюции темпа обучения и/или метод выбора начального приближения и протестировать 


## Алгоритм градиентного спуска и модификации

In [46]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import minimize
import sympy as sp


def gradient_descent(grad_func, x_init, learning_rate=0.001, max_iter=10000, tol=1e-6):
    x = x_init
    for i in range(max_iter):
        grad = grad_func(x)
        x_next = x - learning_rate * grad
        if np.linalg.norm(x_next - x) < tol:
            print(f"Converged in {i} iterations")
            break
        x = x_next
    return x


def learn_nesterov(grad_func, x_init, momentum=0.9, learning_rate=0.0001, max_iter=10000, , tol=1e-6):
    pass



def Adagrad():
    pass


def test_optimization(func, grad_func, x_init, optimizer, **kwargs):
    sp_x_res = minimize(func, x_init).x
    optimal_x = optimizer(func, grad_func, x_init, **kwargs)
    return optimal_x, func(optimal_x), sp_x_res, func(sp_x_res)


def plot_function_and_optimum(func, x_range, y_range, optimal_x):
    X, Y = np.meshgrid(x_range, y_range)
    Z = np.array([func(np.array([x, y])) for x, y in zip(X.flatten(), Y.flatten())]).reshape(X.shape)
    plt.figure(figsize=(10, 6))
    cp = plt.contourf(X, Y, Z, levels=50, cmap='viridis')
    plt.colorbar(cp)
    plt.plot(optimal_x[0], optimal_x[1], 'ro')
    plt.title('Function Contour and Optimum Point')
    plt.xlabel('x')
    plt.ylabel('y')
    plt.show()

## Тестовые функции и градиенты

In [49]:
def rosenbrock(x, y):
    return (1 - x)**2 + 100 * (y - x**2)**2


def rosenbrock_grad(x, y):
    dx = -2 * (1 - x) - 400 * x * (y - x**2)
    dy = 200 * (y - x**2)
    return np.array([dx, dy])


def himmelblau(x, y):
    return (x**2 + y - 11)**2 + (x + y**2 - 7)**2


def himmelblau_grad(x, y):
    dx = 4*x*(x**2 + y - 11) + 2*(x + y**2 - 7)
    dy = 2*(x**2 + y - 11) + 4*y*(x + y**2 - 7)
    return np.array([dx, dy])

In [None]:
# x_init = np.random.randn(2)
# optimal_x = gradient_descent(rosenbrock, grad_rosenbrock, x_init)      

# print("Optimal x:", optimal_x)
# print("Function value at optimal x:", rosenbrock(optimal_x))


# results = test_optimization(rosenbrock, grad_rosenbrock, x_init, gradient_descent, learning_rate=0.001, max_iter=10000)
# print("Test results:", results)


# x_range = np.linspace(-4, 4, 400)
# y_range = np.linspace(-4, 4, 400)
# plot_function_and_optimum(rosenbrock, x_range, y_range, optimal_x)