<a href="https://colab.research.google.com/github/ejrtks1020/Pytorch-basic/blob/main/pytorch-tutorials/pytorch_Autograd_3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## reference : https://tutorials.pytorch.kr/beginner/basics/autogradqs_tutorial.html

# torch.autograd를 사용한 자동미분

역전파 알고리즘에서 weight(매개변수)는 주어진 weight에 대한 손실함수의 gradient에 따라 update됨

Pytorch에는 torch.autograd라는 자동 미분엔진이 내장되어 있다.

In [6]:
# example
import torch

x = torch.ones(5) # input tensor
y = torch.zeros(3) # expected output
w = torch.randn(5, 3, requires_grad = True)
b = torch.randn(3, requires_grad = True)
z = torch.matmul(x, w) + b
loss = torch.nn.functional.binary_cross_entropy_with_logits(z, y)

In [7]:
print('Gradient function for z = ', z.grad_fn)
print('Gradient function for loss = ', loss.grad_fn)

Gradient function for z =  <AddBackward0 object at 0x7fc1c5159d90>
Gradient function for loss =  <BinaryCrossEntropyWithLogitsBackward0 object at 0x7fc1c5159f90>


# 변화도(Gradient) 계산하기

In [8]:
# 신경망에서 가중치를 최적호 하려면 가중치에 대한 손실함수의 도함수(derivate)계산해야함
# 도함수 계산을 위해 loss.backward() 호출
loss.backward()

# requires_grad = True인 텐서들의 gradient 출력
print(w.grad)
print(b.grad)

tensor([[0.1403, 0.3212, 0.1119],
        [0.1403, 0.3212, 0.1119],
        [0.1403, 0.3212, 0.1119],
        [0.1403, 0.3212, 0.1119],
        [0.1403, 0.3212, 0.1119]])
tensor([0.1403, 0.3212, 0.1119])


#Gradient 계산 멈추기

In [9]:
# 모델을 학습한뒤 입력데이터를 적용하는 순전파 연산만 필요한 경우, torch.no_grad()로 연산계산을 멈춘다.

z = torch.matmul(x, w) + b
print(z.requires_grad)

with torch.no_grad():
  z = torch.matmul(x, w) + b
print(z.requires_grad)

True
False


In [10]:
# gradient update를 멈추는 또 다른 방법
z = torch.matmul(x, w) + b
z_det = z.detach()
print(z_det.requires_grad)

False


## gradient update를 멈춰야 하는 이유
* transfer learning(전이학습)시 사전학습된 신경망을 fine-tuning(미세조정)할때, 신경망의 일부 매개변수를 고정된 매개변수로 표시하기때문(frozen parameter)

* gradient를 추적하지 않는 텐서의 연산이 더 효율적이기 때문에, 순저파 단계만 수행할 때 연산 속도가 향상됨