In [None]:
# 미니 배치 학습을 하게되면 미니 배치만큼만 가져가서 미니 배치에 대한 대한 비용(cost)를 계산하고, 경사 하강법을 수행
# 에포크(Epoch)는 전체 훈련 데이터가 학습에 한 번 사용된 주기

# 미니 배치 학습에서는 미니 배치의 개수만큼 경사 하강법을 수행해야 전체 데이터가 한 번 전부 사용되어 1 에포크(Epoch)가 된다

# 배치 크기는 보통 2의 제곱수를 사용한다. 
# ex) 2, 4, 8, 16, 32, 64... 
# 그 이유는 CPU와 GPU의 메모리가 2의 배수이므로 
# 배치크기가 2의 제곱수일 경우에 데이터 송수신의 효율을 높일 수 있다고 한다.

In [None]:
# 이터레이션(Iteration)

# 전체 데이터가 2,000일 때 배치 크기를 200으로 한다면 이터레이션의 수는 총 10개
# 이는 한 번의 에포크 당 매개변수 업데이트가 10번 이루어짐을 의미

In [6]:
# 파이토치에서는 데이터셋(Dataset)과 데이터로더(DataLoader)를 제공
# 미니 배치 학습, 데이터 셔플(shuffle), 병렬 처리까지 간단히 수행
# 기본적인 사용 방법은 Dataset을 정의하고, 이를 DataLoader에 전달하는 것

import torch
import torch.nn as nn
import torch.nn.functional as F

from torch.utils.data import TensorDataset # 텐서데이터셋
from torch.utils.data import DataLoader # 데이터로더

x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

print(x_train.shape) # torch.Size([5, 3])
print(y_train.shape) # torch.Size([5, 1])

dataset = TensorDataset(x_train, y_train)

dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

nb_epochs = 20
for epoch in range(nb_epochs + 1):
  for batch_idx, samples in enumerate(dataloader):
    # enumerate() : 인덱스, 원소로 이루어진 tuple 을 만들어준다
    print('batch_idx : ',batch_idx)
    print('samples : ',samples)
    x_train, y_train = samples
    # H(x) 계산
    prediction = model(x_train)

    # cost 계산
    cost = F.mse_loss(prediction, y_train)

    # cost로 H(x) 계산
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()
        ))
        
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

torch.Size([5, 3])
torch.Size([5, 1])
batch_idx :  0
samples :  [tensor([[73., 66., 70.],
        [89., 91., 90.]]), tensor([[142.],
        [180.]])]
Epoch    0/20 Batch 1/3 Cost: 14877.716797
batch_idx :  1
samples :  [tensor([[93., 88., 93.],
        [73., 80., 75.]]), tensor([[185.],
        [152.]])]
Epoch    0/20 Batch 2/3 Cost: 6132.025879
batch_idx :  2
samples :  [tensor([[ 96.,  98., 100.]]), tensor([[196.]])]
Epoch    0/20 Batch 3/3 Cost: 2717.976562
batch_idx :  0
samples :  [tensor([[ 89.,  91.,  90.],
        [ 96.,  98., 100.]]), tensor([[180.],
        [196.]])]
Epoch    1/20 Batch 1/3 Cost: 428.130859
batch_idx :  1
samples :  [tensor([[73., 66., 70.],
        [73., 80., 75.]]), tensor([[142.],
        [152.]])]
Epoch    1/20 Batch 2/3 Cost: 66.451736
batch_idx :  2
samples :  [tensor([[93., 88., 93.]]), tensor([[185.]])]
Epoch    1/20 Batch 3/3 Cost: 69.312691
batch_idx :  0
samples :  [tensor([[ 96.,  98., 100.],
        [ 89.,  91.,  90.]]), tensor([[196.],
        