In [109]:
import torch

In [110]:
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

전체 데이터의 양이 매우 많을 경우 메모리의 한계로 계산이 불가능하거나 매우 시간이 오래 걸릴 수 있음

따라서 전체 데이터를 작은 단위로 나누어서 학습하는 개념이 필요함 -> 미니매치(Mini Batch)

- 전체 데이터에 대해 경사하강법 수행 : 배치 경사 하강법
- 미니 배치 단위로 경사하강법 수행 : 미니 배치 경사 하강법

- 배치 경사 하강법 : 전체 데이터를 사용하므로 가중치 최적값에 수렴하는 과정이 안정적 But, 계산량이 많음
- 미니 배치 경사 하강법 : 전체 데이터의 일부만 보고 수행하므로 최적값으로 수렴하는 과정에서 값을 조금 헤매지만 훈련속도가 빠름


이터레이션 : 한번의 에포크 내에서 이루어지는 매개변수인 W,b의 업데이트 횟수

In [111]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [112]:
from torch.utils.data import TensorDataset # 텐서데이터셋
from torch.utils.data import DataLoader # 데이터로더

In [113]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

In [114]:
dataset = TensorDataset(x_train, y_train)

In [115]:
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [116]:
model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

In [117]:
nb_epochs = 200
for epoch in range(nb_epochs + 1):
  for batch_idx, samples in enumerate(dataloader):
    # print(batch_idx)
    print(samples)
    x_train, y_train = samples
    # H(x) 계산
    prediction = model(x_train)

    # cost 계산
    cost = F.mse_loss(prediction, y_train)

    # cost로 H(x) 계산
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()
        ))

[tensor([[93., 88., 93.],
        [89., 91., 90.]]), tensor([[185.],
        [180.]])]
Epoch    0/200 Batch 1/3 Cost: 4138.214355
[tensor([[ 96.,  98., 100.],
        [ 73.,  66.,  70.]]), tensor([[196.],
        [142.]])]
Epoch    0/200 Batch 2/3 Cost: 944.343872
[tensor([[73., 80., 75.]]), tensor([[152.]])]
Epoch    0/200 Batch 3/3 Cost: 197.108551
[tensor([[89., 91., 90.],
        [73., 66., 70.]]), tensor([[180.],
        [142.]])]
Epoch    1/200 Batch 1/3 Cost: 126.042130
[tensor([[ 96.,  98., 100.],
        [ 93.,  88.,  93.]]), tensor([[196.],
        [185.]])]
Epoch    1/200 Batch 2/3 Cost: 68.960678
[tensor([[73., 80., 75.]]), tensor([[152.]])]
Epoch    1/200 Batch 3/3 Cost: 2.359610
[tensor([[73., 66., 70.],
        [73., 80., 75.]]), tensor([[142.],
        [152.]])]
Epoch    2/200 Batch 1/3 Cost: 7.929239
[tensor([[ 96.,  98., 100.],
        [ 93.,  88.,  93.]]), tensor([[196.],
        [185.]])]
Epoch    2/200 Batch 2/3 Cost: 5.965538
[tensor([[89., 91., 90.]]), tensor([[1

In [118]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[152.5145]], grad_fn=<AddmmBackward>)
