일반적인 연산으로는 기울기를 구할 수 없고, 다만 변수에 값을 저장할 뿐이다

In [1]:
import torch

In [2]:
x = 3.5
y = x*x + 2
print(x, y)

3.5 14.25


pytorch의 tensor는 값을 저장하는 변수의 역할도 하지만,
연쇄법칙을 통한 기울기를 구하는 것이 가능하다

In [3]:
x = torch.tensor(3.5)
print(x)

tensor(3.5000)


In [4]:
x = torch.tensor(3.5, requires_grad=True)  # x를 통한 미분이 가능하다
print(x)

tensor(3.5000, requires_grad=True)


In [5]:
y = (x-1) * (x-2) * (x-3)
print(y)

tensor(1.8750, grad_fn=<MulBackward0>)


In [6]:
y.backward()

In [7]:
x.grad    # y값에 대한 x기울기(x가 변할 때 y는 어떻게 변하냐)

tensor(5.7500)

기울기 구하기 재실습

In [8]:
# w가 연쇄적인 함수를 통해 다른 tensor에 전달되어도
# 해당 tensor에 미치는 영향(즉, 기울기)을 구하는 설정
# requires_grad=True이다.
w = torch.tensor(1.0, requires_grad=True)
w

tensor(1., requires_grad=True)

In [9]:
a = w*3
a

tensor(3., grad_fn=<MulBackward0>)

In [10]:
l = a**2
l

tensor(9., grad_fn=<PowBackward0>)

In [11]:
l.backward()
print('l을 w로 미분한 값은 {}'.format(w.grad))

l을 w로 미분한 값은 18.0


l = a<sup>2</sup>=(3w)<sup>2</sup>=9w<sup>2</sup>  => 2*9w<sup>2-1</sup>

기울기 구하기 재실습

In [12]:
a = torch.tensor(2.0, requires_grad=True)
b = torch.tensor(1.0, requires_grad=True)

x = 2*a + 3*b
y = 5*a*a + 3*b*b*b
z = 2*x + 3*y

In [13]:
z.backward()

In [14]:
print(a.grad, b.grad)

tensor(64.) tensor(33.)
