In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F

# Mini Batch

- 데이터의 양이 굉장히 많을 경우 전체 데이터에 대해 경사 하강법을 수행하는 것은 매우 힘들다.
- **Mini Batch** : 전체 데이터를 더 작은 단위로 나누어 해당 단위로 학습하는 개념
- **Batch Size** : 미니 배치의 크기
- **Epoch** : 전체 훈련 데이터가 학습에 한 번 사용된 주기
- 미니 배치 단위로 cost(비용)를 계산해 마지막 미니 배치까지 반복했을때 1Epoch(에포크)가 끝난다.
- 미니 배치 경사 하강법 : 미니 배치 단위로 경사 하강법을 수행하는 방법
### ![MiniBatch](../img/Batch1.png)

# Iteration(이터레이션)

### ![](../img/Batch2.png)
- **Iteration** : 한 번에 에포크 내에서 매개변수(W, b)의 업데이트 횟수

# Data Load

- PyTorch에서는 Dataset과 DataLoader를 제공하며 이를 사용해 미니 배치 학습, 데이터 셔플, 병렬 처리 또한 간단히 수행할 수 있다. (사용 : Dataset 정의 => DataLoader에 전달)

In [2]:
from torch.utils.data import TensorDataset # 텐서데이터셋
from torch.utils.data import DataLoader # 데이터로더

In [3]:
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

In [4]:
dataset = TensorDataset(x_train, y_train) # 텐서를 입력받아 데이터셋으로 저장

In [5]:
# 데이터로더는 데이터셋과 미니 배치 크기를 인자로 받는다. 추가로 shuffle을 쓰기도 한다.
# shuffle = True : Epoch마다 데이터셋을 섞어 데이터 학습 순서를 바꾼다.
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [6]:
model = nn.Linear(3, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5)

In [7]:
nb_epochs = 20
for epoch in range(nb_epochs+1):
    for batch_idx, samples in enumerate(dataloader):
        # print(batch_idx)
        # print(samples)
        x_train, y_train = samples

        # H(x)
        prediction = model(x_train)

        # cost
        cost = F.mse_loss(prediction, y_train)

        # cost -> H(x)
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()))

Epoch    0/20 Batch 1/3 Cost: 17801.974609
Epoch    0/20 Batch 2/3 Cost: 8998.156250
Epoch    0/20 Batch 3/3 Cost: 939.364136
Epoch    1/20 Batch 1/3 Cost: 792.502930
Epoch    1/20 Batch 2/3 Cost: 235.984802
Epoch    1/20 Batch 3/3 Cost: 51.318546
Epoch    2/20 Batch 1/3 Cost: 55.313774
Epoch    2/20 Batch 2/3 Cost: 21.184156
Epoch    2/20 Batch 3/3 Cost: 10.826164
Epoch    3/20 Batch 1/3 Cost: 27.360197
Epoch    3/20 Batch 2/3 Cost: 15.786427
Epoch    3/20 Batch 3/3 Cost: 4.305739
Epoch    4/20 Batch 1/3 Cost: 17.347420
Epoch    4/20 Batch 2/3 Cost: 20.698421
Epoch    4/20 Batch 3/3 Cost: 3.239517
Epoch    5/20 Batch 1/3 Cost: 1.533963
Epoch    5/20 Batch 2/3 Cost: 36.828766
Epoch    5/20 Batch 3/3 Cost: 24.325594
Epoch    6/20 Batch 1/3 Cost: 11.273576
Epoch    6/20 Batch 2/3 Cost: 24.004501
Epoch    6/20 Batch 3/3 Cost: 7.260515
Epoch    7/20 Batch 1/3 Cost: 33.615459
Epoch    7/20 Batch 2/3 Cost: 20.115871
Epoch    7/20 Batch 3/3 Cost: 1.007705
Epoch    8/20 Batch 1/3 Cost: 34.4789

In [8]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y)

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[155.3194]], grad_fn=<AddmmBackward>)
