<a href="https://colab.research.google.com/github/Saeeeae/Pytorch-Studying/blob/master/torch_with_autograde_varialbes_py.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [0]:
import torch
from torch.autograd import Variable

#자동미분(autograd)를 사용해 신경망에서 역전파 단계의 연산 자동화
# x가 Variable일 때, x.data는 그 값을 가지는 Tensor, x.grad는 어떤 스칼라 값에 대해 x에 대한 변화도를 가지는 또 다른 Variable

In [0]:
dtype = torch.cuda.FloatTensor

N, D_in, H, D_out = 64, 1000, 100, 10
# N = batch_size

# 입출력 저장위해 무작위 값을 가지는 tensor 생성, Variable로 묶어준다
# requires_grad = False 설정해 역전파 중에 이 Variable에 대한 변화도 계산 x로 설정
x = Variable(torch.randn(N, D_in).type(dtype), requires_grad = False)
y = Variable(torch.randn(N, D_out).type(dtype), requires_grad = False)

# 가중치 저장하기 위해 무작위 값을 가지는 Tensor 생성, Variable로 묶어준다
# requires_grad = True 설정해 역전파 중에 이 Variable에 대한 변화도 계산 o로 설정
w1 = Variable(torch.randn(D_in, H).type(dtype), requires_grad = True)
w2 = Variable(torch.randn(H, D_out).type(dtype), requires_grad = True)

learning_rate = 1e-6

In [0]:
for t in range(500):
  # 순전파 단계
  # h = x.mm(w1)
  # h_relu = h.clamp(min=0)
  # y_pred = h_relu.mm(w2)
  # 위 3줄에 대해 한줄로 적어준 것인데, 역전파 단계 구현하지 않기때문에 
  # 별도로 h, h_relu라는 변수를 저장할 필요가 없다
  y_pred = x.mm(w1).clamp(min=0).mm(w2)

  # loss 계산, 출력
  loss = (y_pred - y).pow(2).sum()
  print(t, loss.data)

  # autograde를 사용해 역전파 단계 계산
  # requires_grad=True를 가지는 모든 Variable에 대해 손실의 변화도를 계산
  # w1.grad, w2.grad는 w1, w2에 대한 손실의 변화도를 가지는 Variable이 됨
  loss.backward()

  # 가중치 갱신
  # w1.data, w2.data는 Tensor, w1.grad, w2.grad는 Varuable
  # w1.grad.data, w2.grad.data는 Tensor
  w1.data -= learning_rate * w1.grad.data
  w2.data -= learning_rate * w2.grad.data

  # 가중치 갱신 후, 수동으로 변화도 0으로 만듦
  w1.grad.data.zero_()
  w2.grad.data.zero_()

0 tensor(1.9094e-06, device='cuda:0')
1 tensor(1.9027e-06, device='cuda:0')
2 tensor(1.8993e-06, device='cuda:0')
3 tensor(1.9035e-06, device='cuda:0')
4 tensor(1.9042e-06, device='cuda:0')
5 tensor(1.9043e-06, device='cuda:0')
6 tensor(1.8967e-06, device='cuda:0')
7 tensor(1.8990e-06, device='cuda:0')
8 tensor(1.8943e-06, device='cuda:0')
9 tensor(1.8865e-06, device='cuda:0')
10 tensor(1.8835e-06, device='cuda:0')
11 tensor(1.8825e-06, device='cuda:0')
12 tensor(1.8784e-06, device='cuda:0')
13 tensor(1.8722e-06, device='cuda:0')
14 tensor(1.8672e-06, device='cuda:0')
15 tensor(1.8635e-06, device='cuda:0')
16 tensor(1.8602e-06, device='cuda:0')
17 tensor(1.8570e-06, device='cuda:0')
18 tensor(1.8578e-06, device='cuda:0')
19 tensor(1.8530e-06, device='cuda:0')
20 tensor(1.8479e-06, device='cuda:0')
21 tensor(1.8447e-06, device='cuda:0')
22 tensor(1.8345e-06, device='cuda:0')
23 tensor(1.8381e-06, device='cuda:0')
24 tensor(1.8330e-06, device='cuda:0')
25 tensor(1.8206e-06, device='cuda: