# Градиентный спуск и его модификации

## Задача #1: Базовый градиентный спуск
Реализуйте градиентный спуск для функции
$$
f(x)=e^{ax}+e^{-bx}+c(x-d)^2
$$
при $a, b, c>0$.

In [None]:
import numpy as np
from typing import List, Union

In [None]:
def gradient_descent_scalar(
                     x_0: float,
                     a: float,
                     b: float,
                     c: float,
                     d: float,
                     iters: int,
                     alpha: Union[float, List[float]]) -> List[float]:
    """
    Применяет градиентный спуск с указанными начальным приближением x_0 и шагами alpha
    к функции exp(ax)+exp(-bx)+c(x-d)^2
    
    Args:
        x_0: начальная точка, с которой начинать спуск
        a, b, c, d: параметры функции
        iters: количество итераций градиентного спуска
        alpha: либо скаляр, обозначающий постоянный размер шага, 
               либо список размера iters с указанием какой размер использовать
               на каждом шаге
        
    Returns:
        последовательность приближений [x_0, x_1, x_2, ..., x_iters] 
    
    """
    pass

In [None]:
import matplotlib.pyplot as plt

In [None]:
a, b, c, d = 1, 2, 3, 2
estimates = gradient_descent_scalar(0, a, b, c, d, 50, 0.05)
f = lambda x: np.exp(a * x) + np.exp(-b * x) + c * (x - d) ** 2
fig = plt.figure(figsize=(7, 7))
ax = fig.add_axes([0, 0, 1, 1])
ax.plot([i for i in range(len(estimates))], [f(x) for x in estimates])
plt.close(fig)
fig

## Задача #2: Градиентный спуск и метод Чебышёва для решение симметричных линейных систем
Реализуйте градиентный спуск и метод Чебышёва для минимизации
$$
f(x)=\frac{1}{2}x^TAx-b^tx
$$

In [None]:
def gradient_descent_quadratic(x_0: np.ndarray,
                               A: np.ndarray,
                               b: np.ndarray,
                               m: float,
                               M: float,
                               iters: int) -> List[np.ndarray]:
    """
    Применяет градиентный спуск к квадратичной функции, заданной A, b
    с начальным приближением x_0. Все собственные числа A лежат на отрезке
    [m: M], m > 0.
    
    Args:
        x_0: ndarray размером (n)
        A: ndarray размером (n, n)
        b: ndarray размером (n)
        m, M: границы спектра A
        iters: количество итераций спуска
        
    Returns:
        последовательность [x_0, x_1, ..., x_iters]
    """
    pass

In [None]:
def chebyshev_descent(x_0: np.ndarray,
                      A: np.ndarray,
                      b: np.ndarray,
                      m: float,
                      M: float,
                      iters: int) -> List[np.ndarray]:
    """
    Применяет метод Чебышёва к квадратичной функции, заданной A, b
    с начальным приближением x_0. Все собственные числа A лежат на отрезке
    [m: M], m > 0.
    
    Args:
        x_0: ndarray размером (n)
        A: ndarray размером (n, n)
        b: ndarray размером (n)
        m, M: границы спектра A
        iters: количество итераций спуска
        
    Returns:
        последовательность [x_0, x_1, ..., x_iters]
    """
    pass

In [None]:
def show_chebyshev_and_gradient():
    A = np.random.rand(5, 5)
    A = A @ A.T
    b = np.random.rand(5)
    fig, axs = plt.subplots(1, 1, figsize=(10, 7))
    eig, v = np.linalg.eigh(A)
    m, M = eig[0], eig[-1]
    x = np.zeros_like(b)
    
    iters = 500
    
    estimates_basic = gradient_descent_quadratic(x, A, b, m, M, iters)
    estimates_chebyshev = chebyshev_descent(x, A, b, m, M, iters)
    
    axs.plot([i for i in range(len(estimates_basic))], [np.linalg.norm(A @ x - b) for x in estimates_basic], label='Basic')
    axs.plot([i for i in range(len(estimates_chebyshev))], [np.linalg.norm(A @ x - b) for x in estimates_chebyshev], label='Chebyshev')
    axs.legend()
    axs.set_ylabel(r'|\Ax_k-b|', fontsize=20)
    axs.set_xlabel(r'k', fontsize=20)
    axs.set_yscale('log')
    plt.close(fig)
    return fig

In [None]:
show_chebyshev_and_gradient()

## Задача #3: полиномиальная регрессия
Дан набор точек $\{x_i, y_i\}_{i=1}^m$, нужно найти такой полином $P$ степени $k$, что величина
$$
\sum_{i=1}^m(P(x_i)-y_i)^2
$$
минимальна среди всех многочленов степени $k$.

In [None]:
def polynomial_regression(x: np.ndarray,
                          y: np.ndarray,
                          k: int) -> np.ndarray:
    """
    Вычисляет наиболее подходящий точкам x, y многочлен степени k
    
    Args:
        x, y: ndarray размером (m) 
        k: степень многочлена
        
    Returns:
        ndarray размером (k) соответствующий коэффициентам минимального
        в порядке от младшего к старшему
    """
    pass

In [None]:
y = [0]
num = 8
for i in range(num - 1):
    y.append(y[-1] + 2 * np.random.rand() - 1)
y = np.stack(y)
x = np.array(list(range(-(num // 2), num - (num // 2))))
coeffs = polynomial_regression(x, y, num - 1)
r = np.arange(x[0], x[-1] + 0.1, 0.1)
fig = plt.figure(figsize=(7, 7))
ax = fig.add_axes([0, 0, 1, 1])
ax.scatter(x, y, color='black')
ax.plot(r, [sum([a * t ** i for i, a in enumerate(coeffs)]) for t in r])
plt.close(fig)
fig