## 1. import

In [2]:
import torch
import torch.nn as nn
from torch.autograd import Variable

## 2. random 함수를 위한 seed 설정

In [3]:
torch.manual_seed(777)

<torch._C.Generator at 0x10912e990>

## 3. training set과 Variable 만들기

In [14]:
# x_train과 y_train은 3 * 1 행렬이다.
x_train = [[1],
           [2],
           [3],
           [4],
           [5]]
y_train = [[1],
           [2],
           [3],
           [4],
           [5]]

# 각 행렬에 대해 Variable을 만든다. 
# torch.Tensor는 행렬의 wrapper이고, torch.autograd.Variable는 그래프 상의 node를 만드는 wrapper이다.
X = Variable(torch.Tensor(x_train))
Y = Variable(torch.Tensor(y_train))

## 4. 가설 세우기 (make a hypothesis)

In [7]:
# nn.Linear(in_features, out_features, bias=True)
# 이 클래스는 weight, bias를 멤버변수로 가진다.
model = nn.Linear(1, 1, bias=True)

## 5. cost function과 cost 최소화하기 위한 optimizer 만들기

In [10]:
# MSE = mean squared error
criterion = nn.MSELoss()

# SGD = Stochastic gradient descent algorithm
#
# 일반 gradient descent algorithm이 시간이 너무 오래걸리기 때문에 SGD를 쓴다.
# lr은 learning rate.
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

## 6. model 훈련시키기

In [17]:
for step in range(20001):
    # optimizer 초기화
    optimizer.zero_grad()
    # 선형 모델에 데이터를 집어 넣는다. 여기서 hypothesis는 y_hat에 해당한다.
    hypothesis = model(X)
    # cost function에 인자값을 넣는다. 인자 순서 주의
    cost = criterion(hypothesis, Y)
    # backward를 통해 결과에서 입력으로 gradient를 미분을 통해 보낸다. Backpropagation이다
    cost.backward()
    # step 메서드는 optimizer가 가진 parameter들을 update 시킨다.
    optimizer.step()
    
    if step % 200 == 0:
        print(step, cost.data.numpy(), model.weight.data.numpy(), model.bias.data.numpy())

0 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
200 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
400 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
600 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
800 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
1000 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
1200 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
1400 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
1600 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
1800 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
2000 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
2200 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
2400 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
2600 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
2800 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
3000 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
3200 [  1.02318154e-12] [[ 0.99999928]] [  2.20494326e-06]
3400

## 7. 훈련된 Model 확인하기

In [18]:
predicted = model(Variable(torch.Tensor([[5]])))
print(predicted.data.numpy())
predicted = model(Variable(torch.Tensor([[2.5]])))
print(predicted.data.numpy())
predicted = model(Variable(torch.Tensor([[1.5], [3.5]])))
print(predicted.data.numpy())

[[ 4.99999857]]
[[ 2.50000024]]
[[ 1.50000107]
 [ 3.49999976]]
