Решите простую задачу безусловной оптимизации в двумерном пространстве:  
$$f(\boldsymbol x) = -8x_1 - 16x_2 + x_1^2 + 4x_2^2$$
используя два метода:
 - аналитически (функция квадратичная, выпуклая)
 - методом градиентного спуска, используя один из методов оптимизации torch.optim

## Аналитически

$ f'_{x_1} = -8 + 2 x_1 = 0 \quad => x_1 = 4 $ 

$ f'_{x_2} = -16 + 8 x_2 = 0 \quad => x_2 = 2 $

Матрица Гессе (вторых производных):
$\left(
\begin{array}{cccc}
2 & 0 \\
0 & 8
\end{array}
\right).$ 

Она положительно определена, значит точка $ (4, 2) $ является точкой минимума.
$ f(4, 2) = -32 $

## Методом градиентного спуска, используя один из методов оптимизации torch.optim

In [12]:
import torch

def f(x1, x2):
    return - 8 * x1 - 16 * x2 + x1 ** 2 + 4 * x2 ** 2

x1 = torch.tensor(5, dtype=torch.float32, requires_grad=True)
x2 = torch.tensor(10, dtype=torch.float32, requires_grad=True)

optimizer = torch.optim.SGD([x1, x2], lr=0.1)


for i in range(15):
    y = f(x1, x2)
    optimizer.zero_grad()  # у optimizer есть свой zero grad
    y.backward()
    optimizer.step()  # сам делает градиентный спуск (или другой метод)
    print(f'iteration {i}, x1 {x1.item()}, x2 {x2.item()} loss {y.item()}, grad x1 {x1.grad.item()}, grad x2 {x2.grad.item()}')

iteration 0, x1 4.800000190734863, x2 3.5999999046325684 loss 225.0, grad x1 2.0, grad x2 64.0
iteration 1, x1 4.640000343322754, x2 2.319999933242798 loss -21.12000274658203, grad x1 1.6000003814697266, grad x2 12.799999237060547
iteration 2, x1 4.51200008392334, x2 2.063999891281128 loss -31.180805206298828, grad x1 1.2800006866455078, grad x2 2.559999465942383
iteration 3, x1 4.409600257873535, x2 2.0127999782562256 loss -31.721466064453125, grad x1 1.0240001678466797, grad x2 0.5119991302490234
iteration 4, x1 4.3276801109313965, x2 2.0025599002838135 loss -31.83156967163086, grad x1 0.8192005157470703, grad x2 0.10239982604980469
iteration 5, x1 4.262144088745117, x2 2.000511884689331 loss -31.892601013183594, grad x1 0.655360221862793, grad x2 0.020479202270507812
iteration 6, x1 4.209715366363525, x2 2.0001022815704346 loss -31.931283950805664, grad x1 0.5242881774902344, grad x2 0.0040950775146484375
iteration 7, x1 4.16777229309082, x2 2.0000205039978027 loss -31.9560203552246

Ответ: минимум достигается в точке $ (4, 2) $ и равен $ -32 $.