In [1]:
import torch

## Minibatch Gradient Descent
전체 데이터를 minibatch로 균일하게 나눠서 학습하자.
- 업데이트를 좀더 빠르게 할 수 있다.
- 전체 데이터를 쓰지 않아서 잘못된 방향으로 업데이트할 수도 있다.

## PyTorch Dataset

- `torch.utils.data.Dataset` 상속
- `__len__()` : 이 데이터셋의 총 데이터 수
- `__getitem__()` : 어떠한 인덱스 idx를 받았을 때, 그에 상응하는 입출력 데이터를 반환함.

In [20]:
from torch.utils.data import Dataset

class CustomDataset(Dataset):
  def __init__(self):
    self.x_data = [[73, 80, 75], 
                   [93, 88, 93],
                   [89, 91, 90],
                   [96, 98, 100],
                   [73, 66, 70]]

    self.y_data = [[152], [185], [180], [196], [142]]

  def __len__(self):
    return len(self.x_data)
  
  def __getitem__(self, idx):
    x = torch.FloatTensor(self.x_data[idx])
    y = torch.FloatTensor(self.y_data[idx])

    return x, y

dataset = CustomDataset()

Dataset을 만들었으면 pytorch에서 제공하는 DataLoader를 사용할 수 있음.
- `batch_size = 2`

  각 minibatch의 크기로, 통상적으로 2의 제곱수로 설정된다.
- `shuffle = True`

  Epoch마다 데이터셋을 섞어서 데이터가 학습되는 순서를 바꾼다.

In [21]:
from torch.utils.data import DataLoader
dataloader = DataLoader(
    dataset,
    batch_size = 2,
    shuffle = True
)




- `enumerate(dataloader)`

  minibatch 인덱스와 데이터를 받음.

- `len(dataloader)`

  한 epoch당 minibatch의 개수

In [23]:
import torch.nn as nn
import torch.nn.functional as F

class MultivariateLinearRegressionModel(nn.Module):
  def __init__(self):
    super().__init__()
    self.linear = nn.Linear(3, 1)

  def forward(self, x):
    return self.linear(x)

model = MultivariateLinearRegressionModel()
optimizer = torch.optim.SGD(model.parameters(), lr = 1e-5)

nb_epochs = 20

for epoch in range(nb_epochs+1):
  for batch_idx, samples in enumerate(dataloader):
    x_train, y_train = samples

    # compute H(x)
    prediction = model(x_train)

    # compute cost
    cost = F.mse_loss(prediction, y_train)

    # compute H(x) with cost function
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader), cost.item()
    ))

Epoch    0/20 Batch 1/3 Cost: 16937.949219
Epoch    0/20 Batch 2/3 Cost: 2618.766113
Epoch    0/20 Batch 3/3 Cost: 871.337402
Epoch    1/20 Batch 1/3 Cost: 469.784546
Epoch    1/20 Batch 2/3 Cost: 157.781311
Epoch    1/20 Batch 3/3 Cost: 44.423763
Epoch    2/20 Batch 1/3 Cost: 23.522087
Epoch    2/20 Batch 2/3 Cost: 11.068324
Epoch    2/20 Batch 3/3 Cost: 1.284993
Epoch    3/20 Batch 1/3 Cost: 5.700742
Epoch    3/20 Batch 2/3 Cost: 1.225294
Epoch    3/20 Batch 3/3 Cost: 16.088623
Epoch    4/20 Batch 1/3 Cost: 2.765476
Epoch    4/20 Batch 2/3 Cost: 4.812294
Epoch    4/20 Batch 3/3 Cost: 13.542346
Epoch    5/20 Batch 1/3 Cost: 6.549115
Epoch    5/20 Batch 2/3 Cost: 3.987715
Epoch    5/20 Batch 3/3 Cost: 2.875637
Epoch    6/20 Batch 1/3 Cost: 7.041916
Epoch    6/20 Batch 2/3 Cost: 2.299312
Epoch    6/20 Batch 3/3 Cost: 7.708638
Epoch    7/20 Batch 1/3 Cost: 4.685853
Epoch    7/20 Batch 2/3 Cost: 7.435233
Epoch    7/20 Batch 3/3 Cost: 4.479963
Epoch    8/20 Batch 1/3 Cost: 6.548425
Epoch  