## Minibatch Gradient Descent<br>
1. 목적 : 전체 데이터를 균일하게 나눠서 학습하도록 함<br> 
2. 장점 : 업데이트를 좀 더 빠르게 할 수 있다.<br>
3. 단점 : 모델의 cost를 계산할 때 전체 데이터를 쓰지 않게 되므로 모델이 가끔 잘못된 방향으로 학습가능<br>-> 매끄럽게 cost줄어들지 않고 거칠게 감소

## PyTorch Dataset

In [2]:
import torch
from torch.utils.data import Dataset

class CustomDataset(Dataset):
    def __init__(self):
        self.x_data = [[73, 80, 75],
                       [93, 88, 93],
                       [89, 91, 90],
                       [96, 98, 100],
                       [73, 66, 70]]
        self.y_data = [[152], [185], [180], [196], [142]]
    
    def __len__(self): ## 데이터셋의 총 데이터 수
        return len(self.x_data)
    
    def __getitem__(self, idx): ## 인덱스 idx 받았을때 상응하는 입출력 데이터 반환
        x = torch.FloatTensor(self.x_data[idx])
        y = torch.FloatTensor(self.y_data[idx])
        
        return x, y
    
    
dataset = CustomDataset()

## PyTorch DataLoader

In [3]:
from torch.utils.data import DataLoader

dataloader = DataLoader(
    dataset,
    batch_size=2, ## 각 minibatch의 크기. 보통 2의 제곱수로 설정
    shuffle=True, ## Epoch마다 데이터셋을 섞어서 데이터가 학습되는 순서를 바꾼다.
)

## Full Code with Dataset and DataLoader

In [4]:
import torch.nn as nn
import torch.nn.functional as F

class MultivariateLinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(3, 1)
        
    def forward(self, x):
        return self.linear(x)
    
# 모델 초기화
model = MultivariateLinearRegressionModel()

# optimizer 설정
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [5]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    for batch_idx, samples in enumerate(dataloader): # minbatch 인덱스와 데이터 받음
        x_train, y_train = samples
        # H(x) 계산
        prediction = model(x_train)
        
        # cost 계산
        cost = F.mse_loss(prediction, y_train)
        
        # cost로 H(x) 계산
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()
        
        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, batch_idx+1, len(dataloader),# 한 epoch당 minibatch 개수
            cost.item()
        ))
        

Epoch    0/20 Batch 1/3 Cost: 30842.869141
Epoch    0/20 Batch 2/3 Cost: 16052.613281
Epoch    0/20 Batch 3/3 Cost: 1708.995972
Epoch    1/20 Batch 1/3 Cost: 1346.030029
Epoch    1/20 Batch 2/3 Cost: 390.327667
Epoch    1/20 Batch 3/3 Cost: 92.762856
Epoch    2/20 Batch 1/3 Cost: 33.945480
Epoch    2/20 Batch 2/3 Cost: 32.349308
Epoch    2/20 Batch 3/3 Cost: 47.363235
Epoch    3/20 Batch 1/3 Cost: 13.792077
Epoch    3/20 Batch 2/3 Cost: 12.887241
Epoch    3/20 Batch 3/3 Cost: 22.764879
Epoch    4/20 Batch 1/3 Cost: 13.414057
Epoch    4/20 Batch 2/3 Cost: 6.839171
Epoch    4/20 Batch 3/3 Cost: 31.838860
Epoch    5/20 Batch 1/3 Cost: 15.115717
Epoch    5/20 Batch 2/3 Cost: 10.100679
Epoch    5/20 Batch 3/3 Cost: 24.029982
Epoch    6/20 Batch 1/3 Cost: 5.310058
Epoch    6/20 Batch 2/3 Cost: 21.074743
Epoch    6/20 Batch 3/3 Cost: 25.562979
Epoch    7/20 Batch 1/3 Cost: 9.618969
Epoch    7/20 Batch 2/3 Cost: 10.256859
Epoch    7/20 Batch 3/3 Cost: 30.993202
Epoch    8/20 Batch 1/3 Cost: 0.