In [3]:
import torch 
from torch.autograd import Variable 

x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]

w = Variable(torch.Tensor([1.0]), requires_grad=True) 
# Tensor를 Variable로 wrapping 한다. 
# Variable에서는 Tensor에서 가능한 거의 모든 연산들을 수행할 수 있으며 
# 차이점은 연산 그래프를 정의할 때, Variable을 사용하면 자동으로 gradient 계산할 수 있다는 것이다.  
# requires_grad = True는 backward 과정에서 gradient를 계산할 필요가 있음을 의미한다. 

# our model forward pass
#전방 계산 
def forward(x): 
    return x * w

# Loss function
# loss 설정, 목적함수 역할  
def loss(x, y): 
    y_pred = forward(x) 
    return (y_pred - y) * (y_pred - y)

# Before training 
print("predict (before training)", 4, forward(4).data[0])

# Training loop 
for epoch in range(10): 
    for x_val, y_val in zip(x_data, y_data): 
        
        l = loss(x_val, y_val) 
        # forward pass in the function and then compute loss 
        # Variable 연산을 사용하여 loss를 계산한다.
        # loss 는 (1,) 모양의 Variable이 되고, loss.data 는 (1,) 모양의 Tensor 가 된다. 
        
        l.backward()
        # autograd를 통한 backward 단계 계산 
        # requires_grad = True인 모든 Variable 변수에 대해 gradient를 계산한다.
        # 이후 w.grad 값을 가지는데, 이는 weight의 gradient 를 나타내는 또 다른 Variable이다. 
        
        print("\tgrad: ", x_val, y_val, w.grad.data[0]) 
        # w.grad.data 는 gradient를 나타내는 Tensor이고, w.grad.data[0] 은 gradient의 스칼라 값이다. 
        
        w.data = w.data - 0.01 * w.grad.data 
        # weight 값을 update
         
        w.grad.data.zero_() 
        # Manually zero the gradients after updating weights
        # 가중치 업데이트 후 수동으로 gradient를 0으로 만든다.  

    print("progress:", epoch, l.data[0])
# After training 
print("predict (after training)", 4, forward(4).data[0])

predict (before training) 4 tensor(4.)
	grad:  1.0 2.0 tensor(-2.)
	grad:  2.0 4.0 tensor(-7.8400)
	grad:  3.0 6.0 tensor(-16.2288)
progress: 0 tensor(7.3159)
	grad:  1.0 2.0 tensor(-1.4786)
	grad:  2.0 4.0 tensor(-5.7962)
	grad:  3.0 6.0 tensor(-11.9981)
progress: 1 tensor(3.9988)
	grad:  1.0 2.0 tensor(-1.0932)
	grad:  2.0 4.0 tensor(-4.2852)
	grad:  3.0 6.0 tensor(-8.8704)
progress: 2 tensor(2.1857)
	grad:  1.0 2.0 tensor(-0.8082)
	grad:  2.0 4.0 tensor(-3.1681)
	grad:  3.0 6.0 tensor(-6.5580)
progress: 3 tensor(1.1946)
	grad:  1.0 2.0 tensor(-0.5975)
	grad:  2.0 4.0 tensor(-2.3422)
	grad:  3.0 6.0 tensor(-4.8484)
progress: 4 tensor(0.6530)
	grad:  1.0 2.0 tensor(-0.4417)
	grad:  2.0 4.0 tensor(-1.7316)
	grad:  3.0 6.0 tensor(-3.5845)
progress: 5 tensor(0.3569)
	grad:  1.0 2.0 tensor(-0.3266)
	grad:  2.0 4.0 tensor(-1.2802)
	grad:  3.0 6.0 tensor(-2.6500)
progress: 6 tensor(0.1951)
	grad:  1.0 2.0 tensor(-0.2414)
	grad:  2.0 4.0 tensor(-0.9465)
	grad:  3.0 6.0 tensor(-1.9592)
progre

1) 실습 1번 코드와 다른 부분을 명시 하시오. Line 31의 w.grad.data는 어떤 값을 가지는가.<br><br>
주석 참조

2) Autograd의 기능에 대해 설명하시오.

autograd 는 tensor로 수행한 모든 연산에 대해 자동 미분 기능을 제공한다. autograd 는 실행 시점에 정의되는 프레임워크이다.<br> 
즉, 코드가 어떻게 실행되냐에 따라 backprop가 정의된다. 따라서 반복마다 역전파가 달라질 수 있다.  <br><br>
autograd의 기본 연산자는 실제로 Tensor를 조작하는 2개의 함수이다.<br>
forward : 입력 Tensor로부터 출력 Tensor를 계산 <br> 
backward : 출력 Tensor의 변화도를 받고 입력 Tensor의 변화도를 계산 <br><br>
autograd.Variable 은 autograd 패키지의 핵심 클래스이다. <br>
Variable 클래스는 Tensor를 감싸고 있으며, Tensor에 정의된 거의 모든 연산을 지원한다. 연산 중 gradient 계산이 필요하면 <br> 
requires_grad = True 로 설정해 준다. 모든 연산을 마친 뒤, .backward()를 호출하면, 자동으로 gradient가 require한 Variable에 대해<br> 
gradient가 계산된다. <br> 
 

