In [None]:
import torch
from tqdm.notebook import tqdm

## **Finding Derivative**

สมมติเรามีสมการพาราโบลาตามด้านล่าง เราจะสามารถหาความชันของกราฟ (slope/gradient/derivative) ได้ด้วยการใช้ Calculus ได้ดังต่อไปนี้

$$ f(x) = x^2 - 4x + 5 $$
$$ f'(x) = 2 x - 4 $$

โดยโค้ดด้านล่าง เราจะแสดงให้ดูว่าเราสามารถหาความชันของกราฟด้วย pytorch ได้เช่นกัน

In [None]:
def f(x):
    return x ** 2 - 4 * x + 5

In [None]:
x = torch.arange(-4, 10, 0.1)
y = f(x)

In [None]:
import matplotlib.pyplot as plt

In [None]:
plt.plot(x, y)

In [None]:
x = torch.tensor(5.).requires_grad_()

In [None]:
y = f(x)

In [None]:
y

In [None]:
y.backward()

In [None]:
x.grad

## **Other derivative**

นอกจากสมการ 1 ตัวแปร เราสามารถหา gradient สำหรับสมการหลายตัวแปรได้เช่นกัน ลองดูสมการด้านล่าง

$$y(x) = sin(x) $$
$$z(x, y) = y ^ 2 + 3 * x$$

$$\frac{dz}{dx} = 2 y \frac{dy}{dx} + 3 = 2 sin(x) cos(x) + 3 $$

โดยถ้าเราใช้ pytorch ในการหา gradient ก็สามารถทำได้เช่นกัน

In [None]:
import math

def f(x):
    y = torch.sin(x)
    z = y ** 2 + 3 * x
    return z

In [None]:
x = torch.tensor(math.pi / 4).requires_grad_()
z = f(x)

In [None]:
z.backward()

In [None]:
x.grad

In [None]:
2 * math.sin(math.pi / 4) * math.cos(math.pi / 4) + 3

## **Gradient descent**

ถ้าเราอยากหาจุดต่ำสุดของกราฟพาราโบลา ตอนเรียนแคลคูลัสเราสามารถหาได้โดยการจับความชันเท่ากับ 0

$$ f(x) = x^2 - 4x + 5 $$

Minimum: $f'(x) = 2 x - 4 = 0$ -> $x = 2$

แต่ในกรณีของคอมพิวเตอร์การแก้สมการแบบนี้อาจต้องใช้ symbolic อาจจะที่กินเวลา gradient descent เป็นวิธีนึงที่เราสามารถหาจุดต่ำสุดของกราฟได้ (หรือ loss function/ cost function) โดยการให้พารามิเตอร์ของเรา ($x$) เดินไปในทิศตรงกันข้ามกับ gradient นั่นเอง

In [None]:
x = torch.tensor(5.).requires_grad_()
def f(x):
    return x ** 2 - 4 * x + 5
y = f(x)
print(x, y)
y.backward()
print(x.grad.data)

In [None]:
print(x.data)
alpha = 0.001
print(x.data - alpha * x.grad.data)

In [None]:
x_opt = torch.tensor(5.).requires_grad_()

for i in tqdm(range(3000)): # loop
    loss = f(x_opt) # คำนวณ loss
    loss.backward() # คำนวณ gradient
    x_opt.data -= x_opt.grad.data * alpha # gradient decent
    x_opt.grad.zero_()

In [None]:
x_opt