## Задание 2: Автоматическое дифференцирование

In [1]:
import torch

### 2.1 Простые вычисления с градиентами

1) Создайте тензоры x, y, z с requires_grad=True
2) Вычислите функцию: f(x,y,z) = x^2 + y^2 + z^2 + 2*x*y*z
3) Найдите градиенты по всем переменным
4) Проверьте результат аналитически

In [2]:
# 1) Создайте тензоры x, y, z с requires_grad=True
x = torch.tensor(2., requires_grad=True)
y = torch.tensor(3., requires_grad=True)
z = torch.tensor(4., requires_grad=True)

In [3]:
# 2) Вычислите функцию: f(x,y,z) = x^2 + y^2 + z^2 + 2*x*y*z
v = x**2 + y**2 + z**2 + 2*x*y*z
print(f'f(x,y,z): {v}')

f(x,y,z): 77.0


In [4]:
# 3) Найдите градиенты по всем переменным
v.backward()

print(f'x.grad: {x.grad}')
print(f'y.grad: {y.grad}')
print(f'z.grad: {z.grad}')

x.grad: 28.0
y.grad: 22.0
z.grad: 20.0


4\) Проверьте результат аналитически

Чтобы проверить результат, самостоятельно вычислим частные производные функции по каждой переменной ($x=2; y=3; z=4$), которые вместе образуют градиент.


Если $f(x, y, z) = x^{2} + y^{2} + z^{2} + 2xyz$, 

то
$$
\nabla f(x, y, z) = 
\left[
\frac{\partial f}{\partial x},
\frac{\partial f}{\partial y},
\frac{\partial f}{\partial z}
\right]
$$

$$
\frac{\partial f}{\partial x} = 2x + 2yz = 4 + 24 = 28
$$
$$
\frac{\partial f}{\partial y} = 2y + 2xz = 6 + 16 = 22
$$
$$
\frac{\partial f}{\partial z} = 2z + 2xy = 8 + 12 = 20
$$

### 2.2 Градиент функции потерь

1) Реализуйте функцию MSE (Mean Squared Error):

    MSE = (1/n) * Σ(y_pred - y_true)^2, где y_pred = w * x + b (линейная функция)

2) Найдите градиенты по w и b

In [5]:
# 1) Реализуйте функцию MSE
def MSE(y_pred, y_true):
    return ((y_pred - y_true) ** 2).mean()

Сравним созданную функцию MSE с встроенной функцией MSELoss:

In [6]:
import torch.nn as nn

x = torch.tensor([2.5, 4.8, 6.9, 9.5])
y_true = torch.tensor([3, 5.0, 7.0, 9.0])

w = torch.tensor(1.5, requires_grad=True)
b = torch.tensor(0.5, requires_grad=True)

# model: y_pred = w * x + b
y_pred = w * x + b

loss_custom = MSE(y_pred, y_true)
loss_builtin = nn.MSELoss()(y_pred, y_true)

print(f'Custom MSE: {loss_custom:.4f}')
print(f'Built-in MSELoss: {loss_builtin:.4f}')

Custom MSE: 14.1844
Built-in MSELoss: 14.1844


In [7]:
# 2) Найдите градиенты по w и b
loss_custom.backward()

print(f'w.grad: {w.grad}')
print(f'b.grad: {b.grad}')

w.grad: 48.63750457763672
b.grad: 6.77500057220459


### 2.3 Цепное правило

1. Реализуйте составную функцию: f(x) = sin(x^2 + 1)
2. Найдите градиент df/dx
3. Проверьте результат с помощью torch.autograd.grad

In [8]:
# 1) Реализуйте составную функцию: f(x) = sin(x^2 + 1)
x = torch.tensor(3., requires_grad=True)
y = torch.sin(x**2 + 1)

In [9]:
# 2) Найдите градиент df/dx
y.backward()

# df/dx = 2x * cos(x^2 + 1) = 6cos(10) ≈ -5.03443
print(f'x.grad from backward(): {x.grad}')

x.grad from backward(): -5.03442907333374


In [10]:
# 3) Проверьте результат с помощью torch.autograd.grad
x = torch.tensor(3., requires_grad=True)
y = torch.sin(x**2 + 1)

grad = torch.autograd.grad(y, x)
print(f'Gradient via torch.autograd.grad: {grad}')

Gradient via torch.autograd.grad: (tensor(-5.0344),)
