# 2.1 Градиентный алгоритм (градиентный спуск)

### Task 1

Напишите программу поиска точки минимума функции:

$f(x)=0.5⋅x+0.2⋅x^2−0.1⋅x^3$

с помощью градиентного алгоритма:

$x_n=x_{n−1} −η \cdot \frac {df(x)}{dx}$

со следующими начальными значениями:

$η=0.01$<br>
$x_0=−4$<br>
$N=200$ - число итераций градиентного алгоритма<br>

Результат вычисления значения точки минимума $x$ сохраните в переменной **x**.

P.S. На экран ничего выводить не нужно.

In [7]:
import numpy as np


def func(x):
    return 0.5 * x + 0.2 * x ** 2 - 0.1 * x ** 3


def df(x):
    return 0.5 + 0.4*x - 0.3*x**2 # здесь выражение производной функции f(x)


coord_x = np.arange(-5.0, 5.0, 0.1) # значения по оси абсцисс
coord_y = func(coord_x) # значения по оси ординат (значения функции)

# здесь продолжайте программу
N = 200
x = -4
lr = 0.01

for _ in range(N):
    x = x - lr * df(x)

x

-1.0758987284245605

### Task 2

Дана функция:

$f(x)=0.1⋅x^2−sin(x)+5$

Необходимо выполнить ее аппроксимацию (восстановление) на интервале $[-5, 5]$ моделью вида:

$a(x)=w_0+w_1⋅x+w_2⋅x^2+w3⋅x^3$

Вектор параметров $w=[w0,w1,w2,w3]^T$ следует искать с помощью градиентного алгоритма:

$w_n=w_{n−1} − η⋅ \frac {∂Q(w)}{∂w}$

где функционал качества $Q(w)$ имеет вид:

$Q(w)= \frac {1}{n} \cdot \sum_{i=1}^{n} (a(xi)−f(xi))^2$

Его частную производную по вектору параметров $\omega$ можно записать в векторно-матричном виде следующим образом:

$ \frac {∂Q(w)}{∂w}= \frac {2}{n} \cdot \sum_{i=1}^{n} (w^T⋅x_i−f(xi))⋅x_i^T$

где $x_i=[1,x,x2,x3]^T$ - вектор признаков i-го образа обучающей выборки.

Продолжите программу, в которой объявлена функция f(x) с именем func, заданы значения функции по оси абсцисс и ординат, а также начальные значения и параметры для алгоритма градиентного спуска:

```python
import numpy as np

# исходная функция, которую нужно аппроксимировать моделью a(x)
def func(x):
    return 0.1 * x**2 - np.sin(x) + 5.


# здесь объявляйте необходимые функции


coord_x = np.arange(-5.0, 5.0, 0.1) # значения по оси абсцисс [-5; 5] с шагом 0.1
coord_y = func(coord_x) # значения функции по оси ординат

sz = len(coord_x)	# количество значений функций (точек)
eta = np.array([0.1, 0.01, 0.001, 0.0001]) # шаг обучения для каждого параметра w0, w1, w2, w3
w = np.array([0., 0., 0., 0.]) # начальные значения параметров модели
N = 200 # число итераций градиентного алгоритма
```

Вычисленные параметры вектора ww следует сохранить в виде списка или кортежа с именем w. Также нужно вычислить значение среднего эмпирического риска для обученной модели по формуле:

$Q(a,X)= \frac {1}{n} \cdot \sum_{i=1}^{n} (a(x_i)−f(x_i))^2$

Вычисленное значение $Q(a,X)$ сохраните в переменной Q.

P.S. На экран ничего выводить не нужно.

In [1]:
import numpy as np

# исходная функция, которую нужно аппроксимировать моделью a(x)
def func(x):
    return 0.1 * x**2 - np.sin(x) + 5.


# здесь объявляйте необходимые функции


coord_x = np.arange(-5.0, 5.0, 0.1).reshape(-1, 1) # значения по оси абсцисс [-5; 5] с шагом 0.1
coord_y = func(coord_x) # значения функции по оси ординат

sz = len(coord_x)	# количество значений функций (точек)
eta = np.array([0.1, 0.01, 0.001, 0.0001]).reshape(-1, 1) # шаг обучения для каждого параметра w0, w1, w2, w3
w = np.array([0., 0., 0., 0.]).reshape(-1, 1) # начальные значения параметров модели
N = 200 # число итераций градиентного алгоритма

# здесь продолжайте программу
X = np.hstack((
    np.ones_like(coord_x),
    np.power(coord_x, np.arange(1, 4))
))
y = coord_y

for _ in range(N):
    gradient = 2 / sz * X.T @ (X @ w - y)
    w = w - eta * gradient

Q = np.mean((X @ w - y)**2)
w = w.flatten().tolist()

In [2]:
print(f"Параметры модели: {w}")
print(f"Среднеквадратичная ошибка: {Q}")

Параметры модели: [4.986457387535088, -0.41780963958067896, 0.10273087874160171, 0.031724695628790815]
Среднеквадратичная ошибка: 0.13061463936073706
