<a href="https://colab.research.google.com/github/DrJHSIM/PyTorch_Practice/blob/main/Autograd.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Automatic Differentiation with `torch.autograd`
- 신경망 학습할 때, 가장 자주 사용되는 알고리즘은 역전파(back propagation)임.
- 매개변수의 손실함수의 미분에 따라 매개변수 가중치들이 조정됨.
- PyTorch에서는 `torch.autograd` 엔진이 어떠한 계산 그래프도 자동으로 미분을 계산해줌.

In [2]:
import torch

x = torch.ones(5)  # 입력 텐서
y = torch.zeros(3) # 기대되는 출력
w = torch.randn(5, 3, requires_grad = True)
b = torch.randn(3, requires_grad = True)
z = torch.matmul(x, w) + b
loss = torch.nn.functional.binary_cross_entropy_with_logits(z, y)

Tensors, Functions and Computational graph
==========================================

This code defines the following **computational graph**:

![](https://pytorch.org/tutorials/_static/img/basics/comp-graph.png)

In this network, `w` and `b` are **parameters**, which we need to
optimize. Thus, we need to be able to compute the gradients of loss
function with respect to those variables. In order to do that, we set
the `requires_grad` property of those tensors.


텐서를 만들 때 `requires_grad`의 값을 설정할 수 있지만, 나중에 `x.requires_grad_(True)` 메소드로도 가능함.

In [4]:
x = torch.ones(5)  # 입력 텐서
y = torch.zeros(3) # 기대되는 출력
w = torch.randn(5, 3)
b = torch.randn(3)
w = w.requires_grad_(True)
b = b.requires_grad_(True)
z = torch.matmul(x, w) + b
loss = torch.nn.functional.binary_cross_entropy_with_logits(z, y)

## Computing Gradients
- 신경망에서 매개변수들의 가중치들을 최적화 하기 위해, 매개변수에 관한 손실함수의 미분을 계산할 필요가 있음. ($\frac{\partial loss}{\partial w}$와 $\frac{\partial loss}{\partial b}$)
- 이런 미분들을 계산하기 위해, `loss.backward()`을 불러오고 `w.grad`와 `b.grad`로 값들을 찾을 수 있음.

In [5]:
loss.backward()
print(w.grad)
print(b.grad)

tensor([[0.2818, 0.0147, 0.1841],
        [0.2818, 0.0147, 0.1841],
        [0.2818, 0.0147, 0.1841],
        [0.2818, 0.0147, 0.1841],
        [0.2818, 0.0147, 0.1841]])
tensor([0.2818, 0.0147, 0.1841])


## Disabling Gradient Tracking (미분 추적을 할 수 없게 할 경우)

- 기본값으로 모든 텐서는 `requires_grad = True`이어서 계산 history와 미분 계산을 지원함.
- 하지만, 이것이 필요하지 않을 때가 있는 데 학습된 모델로 추론을 할 경우임.
- 즉, 오직 *forward* 계산만 할 경우임.
- 이럴 경우 계산 코드를 `torch.no_grad()` 블록으로 감싸주면 됨.


In [None]:
z = torch.matmul(x, w)+b
print(z.requires_grad)

with torch.no_grad():
    z = torch.matmul(x, w)+b
print(z.requires_grad)

True
False


In [8]:
z = torch.matmul(x, w) + b
print(z.requires_grad)

with torch.no_grad():
    z = torch.matmul(x, w) + b
print(z.requires_grad)

True
False


같은 결과를 얻는 다른 방법으로는 `detach()` 메소드를 텐서에 사용하는 것임.

In [None]:
z = torch.matmul(x, w)+b
z_det = z.detach()
print(z_det.requires_grad)

False


In [9]:
z = torch.matmul(x, w) + b
z_det = z.detach()
print(z_det.requires_grad)

False


Further Reading
===============

-   [Autograd
    Mechanics](https://pytorch.org/docs/stable/notes/autograd.html)
