### 이전에 구축한 모델

In [27]:
import torch
from torch.autograd import Variable

x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
w = Variable(torch.Tensor([1.0]), requires_grad = True)

def forward(x):
    return w*x

def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y)**2

for epoch in range(10):
    for x_val, y_val in zip(x_data, y_data):
        l = loss(x_val, y_val)
        l.backward()
        print("\t grad: ", x_val, y_val, w.grad.data[0])
        w.data = w.data - 0.01 * w.grad.data
        
        w.grad.data.zero_()
        
    print("progress:", epoch, l.data[0])

	 grad:  1.0 2.0 tensor(-2.)
	 grad:  2.0 4.0 tensor(-7.8400)
	 grad:  3.0 6.0 tensor(-16.2288)
progress: 0 tensor(7.3159)
	 grad:  1.0 2.0 tensor(-1.4786)
	 grad:  2.0 4.0 tensor(-5.7962)
	 grad:  3.0 6.0 tensor(-11.9981)
progress: 1 tensor(3.9988)
	 grad:  1.0 2.0 tensor(-1.0932)
	 grad:  2.0 4.0 tensor(-4.2852)
	 grad:  3.0 6.0 tensor(-8.8704)
progress: 2 tensor(2.1857)
	 grad:  1.0 2.0 tensor(-0.8082)
	 grad:  2.0 4.0 tensor(-3.1681)
	 grad:  3.0 6.0 tensor(-6.5580)
progress: 3 tensor(1.1946)
	 grad:  1.0 2.0 tensor(-0.5975)
	 grad:  2.0 4.0 tensor(-2.3422)
	 grad:  3.0 6.0 tensor(-4.8484)
progress: 4 tensor(0.6530)
	 grad:  1.0 2.0 tensor(-0.4417)
	 grad:  2.0 4.0 tensor(-1.7316)
	 grad:  3.0 6.0 tensor(-3.5845)
progress: 5 tensor(0.3569)
	 grad:  1.0 2.0 tensor(-0.3266)
	 grad:  2.0 4.0 tensor(-1.2802)
	 grad:  3.0 6.0 tensor(-2.6500)
progress: 6 tensor(0.1951)
	 grad:  1.0 2.0 tensor(-0.2414)
	 grad:  2.0 4.0 tensor(-0.9465)
	 grad:  3.0 6.0 tensor(-1.9592)
progress: 7 tensor(0.

## Pytorch Rhythm
1. Variables를 이용하여 클래스로 모델을 만든다.
2. loss와 optimizer를 만든다.
3. training cycle을 만든다.

### 1. Variables를 이용하여 클래스로 모델을 만든다.

In [28]:
import torch
from torch.autograd import Variable

x_data = Variable(torch.Tensor([[1.0], [2.0], [3.0]]))
y_data = Variable(torch.Tensor([[2.0], [4.0], [6.0]]))



In [29]:
class Model(torch.nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.linear = torch.nn.Linear(1, 1)
    
    def forward(self, x):
        y_pred = self.linear(x)
        return y_pred
    
model = Model()

### 2. loss와 optimizer 구축

In [30]:
# criterion : 기준. 어떤 loss를 줄일 것인지에 대해 명시한다. 
# MSE 방식의 loss 구한다. size_average = False로 하면 Loss를 발생시키는 것들의 평균으로 나누지 않는다.
criterion = torch.nn.MSELoss(size_average = False)
# 직접 빼는 대신에 SGD optimizer를 이용한다.
optimizer = torch.optim.SGD(model.parameters(), lr = 0.01)


### 3. Training : forward, loss, backward, step

- zero.grad()
: 
> NN model 인스턴스를 만든 후, 
> 역전파 단계를 실행하기 전에 변화도를 0으로 만든다. 
> autograd의 추적기록을 피하기 위해 학습 가능한 매개변수를 갖는 Tensor를 직접 0으로 조작하여 모델의 가중치를 갱신할 때 사용한다. 
> 왜냐하면 .backward()를 호출할 때마다 변화도가 buffer에 누적되기 때문이라고 한다. 
> **변화도를 업데이트 하기 전에 초기화**

In [31]:
for epoch in range(500):
    # forward 수행
    y_pred = model(x_data)
    
    # loss 계산 및 출력
    loss = criterion(y_pred, y_data)
    
    # w_data = w_data - 0.01 * w.grad.data 의 과정.
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    

In [32]:
hour_var = Variable(torch.Tensor([[4.0]]))
print("predict(after training", 4, model.forward(hour_var).data[0][0])

predict(after training 4 tensor(7.9806)
