Решите простую задачу безусловной оптимизации в двумерном пространстве:  
$$f(\boldsymbol x) = -8x_1 - 16x_2 + x_1^2 + 4x_2^2$$
используя два метода:
 - аналитически (функция квадратичная, выпуклая)
 - методом градиентного спуска, используя один из методов оптимизации torch.optim

### Аналитическое решение:



Для нахождения минимума функции $f(\boldsymbol x)$ необходимо найти точку, в которой градиент функции равен нулю. Градиент функции $f(\boldsymbol x)$ равен:
$$\nabla f(\boldsymbol x) = \begin{pmatrix} \frac{\partial f}{\partial x_1} \\ \frac{\partial f}{\partial x_2} \end{pmatrix} = \begin{pmatrix} 2x_1 - 8 \\ 8x_2 - 16 \end{pmatrix}$$
Приравняем градиент к нулю и решим систему уравнений:
$$\begin{cases} 2x_1 - 8 = 0 \\ 8x_2 - 16 = 0 \end{cases}$$
Откуда получаем, что $x_1 = 4$ и $x_2 = 2$. Таким образом, минимум функции $f(\boldsymbol x)$ равен $f(4,2) = -48$.

### Метод градиентного спуска:


Для использования метода градиентного спуска необходимо определить функцию потерь, которую будем минимизировать. 
В данном случае функция потерь будет равна $f(\boldsymbol x)$, так как мы хотим минимизировать именно эту функцию. 

In [11]:
import torch


In [12]:
# Создадим тензор начальной точки f(x) и определим функцию потерь:
x = torch.tensor([0., 0.], requires_grad=True)
def f(x):
    return -8*x[0] - 16*x[1] + x[0]**2 + 4*x[1]**2

In [13]:
# Затем создадим оптимизатор и запустим градиентный спуск:
optimizer = torch.optim.SGD([x], lr=0.1)

for i in range(100):
    optimizer.zero_grad()
    y = f(x)
    y.backward()
    optimizer.step()


In [14]:
print("Minimum value:", x.detach().numpy())
print("Minimum point:", f(x).detach().numpy())

Minimum value: [3.9999995 2.       ]
Minimum point: -32.0
