In [2]:
import pandas as pd
import torch
import torch.nn as nn
import torch.nn.functional as F

torch.manual_seed(1)

In [12]:
# 데이터
x_train = torch.FloatTensor([[1, 3, 4, 2],
                             [2, 2, 2, 2],
                             [3, 4, 4, 2]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [35]:
x_train[0].size()

torch.Size([4])

In [41]:
# 모델을 선언 및 초기화. 단순 선형 회귀이므로 input_dim=1, output_dim=1.
model = nn.Linear(4,1)

In [42]:
print(list(model.parameters()))

[Parameter containing:
tensor([[-0.1814,  0.3992,  0.0356,  0.2689]], requires_grad=True), Parameter containing:
tensor([0.3866], requires_grad=True)]


In [43]:
# optimizer 설정. 경사 하강법 SGD를 사용하고 learning rate를 의미하는 lr은 0.01
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

In [44]:
# 전체 훈련 데이터에 대해 경사 하강법을 2,000회 반복
nb_epochs = 2000
for epoch in range(nb_epochs+1):

    # H(x) 계산
    prediction = model(x_train)

    # cost 계산
    cost = F.mse_loss(prediction, y_train) # <== 파이토치에서 제공하는 평균 제곱 오차 함수

    # cost로 H(x) 개선하는 부분
    # gradient를 0으로 초기화
    optimizer.zero_grad()
    # 비용 함수를 미분하여 gradient 계산
    cost.backward() # backward 연산
    # W와 b를 업데이트
    optimizer.step()

    if epoch % 100 == 0:
    # 100번마다 로그 출력
      print('Epoch {:4d}/{} Cost: {:.6f}'.format(
          epoch, nb_epochs, cost.item()
      ))

Epoch    0/2000 Cost: 7.220409
Epoch  100/2000 Cost: 0.159203
Epoch  200/2000 Cost: 0.018727
Epoch  300/2000 Cost: 0.004784
Epoch  400/2000 Cost: 0.001649
Epoch  500/2000 Cost: 0.000601
Epoch  600/2000 Cost: 0.000221
Epoch  700/2000 Cost: 0.000081
Epoch  800/2000 Cost: 0.000030
Epoch  900/2000 Cost: 0.000011
Epoch 1000/2000 Cost: 0.000004
Epoch 1100/2000 Cost: 0.000001
Epoch 1200/2000 Cost: 0.000001
Epoch 1300/2000 Cost: 0.000000
Epoch 1400/2000 Cost: 0.000000
Epoch 1500/2000 Cost: 0.000000
Epoch 1600/2000 Cost: 0.000000
Epoch 1700/2000 Cost: 0.000000
Epoch 1800/2000 Cost: 0.000000
Epoch 1900/2000 Cost: 0.000000
Epoch 2000/2000 Cost: 0.000000


In [45]:
# 임의의 입력 4를 선언
new_var =  torch.FloatTensor([[4,1,2,3]])
# 입력한 값 4에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) # forward 연산
# y = 2x 이므로 입력이 4라면 y가 8에 가까운 값이 나와야 제대로 학습이 된 것
print("훈련 후 입력이 4,1,2,3 일 때의 예측값 :", pred_y)

훈련 후 입력이 4,1,2,3 일 때의 예측값 : tensor([[6.3957]], grad_fn=<AddmmBackward0>)
