## torch.autograd 를 사용한 자동 미분
신경망 학습에서 중요한 **역전파 알고리즘**은 모델 가중치를 손실함수의 기울기에 따라 조정되도록 해주는데, <br>
이런 미분(gradient) 계산을 자동으로 수행해주는 도구로 `torch.autograd` 가 쓰인다.

In [6]:
import torch

x = torch.ones(5)  # input tensor
y = torch.zeros(3)  # expected output
# 최적화 해야하는 매개변수에는 손실 함수의 변화도를 계산할 수 있도록 requries_grad 속성을 설정한다.
w = torch.randn(5, 3, requires_grad=True)  # weight
b = torch. randn(3, requires_grad=True)  # bias
z = torch. matmul(x, w) + b
loss = torch.nn.functional.binary_cross_entropy_with_logits(z,y)

### Tensor, Function과 연산그래프(Computational graph)


![](https://velog.velcdn.com/images/changh2_00/post/13246418-179f-4aa8-a57e-8ab7e4293fef/image.png)

In [7]:
#📌 모든 연산 결과(tensor)에는 .grad_fn 속성이 있어서, 해당 텐서가 어떤 함수(Function) 을 통해 만들어졌는지 추적 가능
print(f"Gradient function for z = {z.grad_fn}")
print(f"Gradient function for loss = {loss.grad_fn}")

Gradient function for z = <AddBackward0 object at 0x0000017D1F431E70>
Gradient function for loss = <BinaryCrossEntropyWithLogitsBackward0 object at 0x0000017D1F581ED0>


### 변화도(Gradient) 계산하기

In [8]:
#📌 신경망에서 매개변수의 가중치를 최적화하려면 매개변수에 대한 손실함수의 도함수(derivative)를 계산해야 합니다.
#📌 이러한 도함수를 계산하기 위해, loss.backward() 를 호출한 다음 w.grad와 b.grad에서 값을 가져옵니다
loss.backward()
print(w.grad)
print(b.grad)

tensor([[0.1476, 0.2585, 0.1248],
        [0.1476, 0.2585, 0.1248],
        [0.1476, 0.2585, 0.1248],
        [0.1476, 0.2585, 0.1248],
        [0.1476, 0.2585, 0.1248]])
tensor([0.1476, 0.2585, 0.1248])


### 변화도 추적 멈추기

In [None]:
#📌 매개변수값을 고정시키고 싶거나, 예측단계에서는 변화도 추적을 멈춤
z = torch.matmul(x, w) + b         # gradient 추적됨
print(z.requires_grad)             # True

with torch.no_grad():              # gradient 추적 끔
    z = torch.matmul(x, w) + b     # 추적 안 됨
print(z.requires_grad)             # False


True
False


In [11]:
#📌 다른 방법으로 detach() 메소드를 사용할 수 있음 (동일한 결과)
z = torch.matmul(x, w)+b
z_det = z.detach()
print(z_det.requires_grad)

False
