- Mini Batch and Data Load

1. Mini Batch and Batch Size

  Mini Batch : 전체 데이터를 더 작은 단위로 나누어 학습할때, 작은 단위를 미니 배치라고 한다. 미니 배치 개수만큼 경사하강법을 수행해야 1 epoch가 끝난다. 

  미니 배치 경사 하강법은 배치 경사 하강법에 비해 데이터의 일부만을 사용하므로 최적값으로 수렴하는 과정에서 헤매기도하지만 훈련 속도가 빠르다.

2. Iteration

  한 번의 epoch 내에서 이루어지는 매개변수인 가중치 W와 b의 업데이트 횟수

  전체 데이터가 2000일 때 배치 크기가 200이라면 이터레이션 수는 총 10

3. Data Load



In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

x_train = torch.FloatTensor([[73,80,75],
                             [93,88,93],
                             [89,91,90],
                             [96,98,100],
                             [73,66,70]])
y_train = torch.FloatTensor([[152],[185],[180],[196],[142]])

dataset = TensorDataset(x_train,y_train)

dataloader = DataLoader(dataset, batch_size = 2, shuffle = True) # 미니배치 사이즈는 통상 2 배수

model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(),lr=1e-5)

nb_epochs = 20
for epoch in range(nb_epochs +1):
  for batch_idx,samples in enumerate(dataloader):
    x_train, y_train = samples

    h = model(x_train)
    cost = F.mse_loss(h,y_train)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
      epoch, nb_epochs, batch_idx+1, len(dataloader),
      cost.item()
      ))

Epoch    0/20 Batch 1/3 Cost: 26367.265625
Epoch    0/20 Batch 2/3 Cost: 4581.831543
Epoch    0/20 Batch 3/3 Cost: 3516.888428
Epoch    1/20 Batch 1/3 Cost: 459.109467
Epoch    1/20 Batch 2/3 Cost: 211.533142
Epoch    1/20 Batch 3/3 Cost: 61.706470
Epoch    2/20 Batch 1/3 Cost: 14.327942
Epoch    2/20 Batch 2/3 Cost: 10.670218
Epoch    2/20 Batch 3/3 Cost: 0.000889
Epoch    3/20 Batch 1/3 Cost: 5.978586
Epoch    3/20 Batch 2/3 Cost: 0.104985
Epoch    3/20 Batch 3/3 Cost: 0.595259
Epoch    4/20 Batch 1/3 Cost: 5.145258
Epoch    4/20 Batch 2/3 Cost: 1.626124
Epoch    4/20 Batch 3/3 Cost: 0.004361
Epoch    5/20 Batch 1/3 Cost: 4.680658
Epoch    5/20 Batch 2/3 Cost: 1.854223
Epoch    5/20 Batch 3/3 Cost: 0.008967
Epoch    6/20 Batch 1/3 Cost: 0.353780
Epoch    6/20 Batch 2/3 Cost: 4.505916
Epoch    6/20 Batch 3/3 Cost: 1.304927
Epoch    7/20 Batch 1/3 Cost: 4.552724
Epoch    7/20 Batch 2/3 Cost: 0.665520
Epoch    7/20 Batch 3/3 Cost: 0.047658
Epoch    8/20 Batch 1/3 Cost: 4.152449
Epoch   

- Custom Dataset

In [None]:
# sample

class CustomDataset(torch.utils.data.Dataset):
  def __init__(self):
    # 데이터셋의 전처리를 해주는 부분

  def __len__(self):
    # 데이터셋의 길이(총 샘플 수) 적는 부분

  def __getitem__(self,idx):
    # 데이터셋에서 특정 1개 샘플을 가져오는 함수

In [4]:
import torch 
import torch.nn.functional as F
from torch.utils.data import Dataset
from torch.utils.data import DataLoader

class CustomDataset(Dataset):
  def __init__(self):
    self.x_data = [[73, 80, 75],
                   [93, 88, 93],
                   [89, 91, 90],
                   [96, 98, 100],
                   [73, 66, 70]]
    self.y_data = [[152], [185], [180], [196], [142]]

  def __len__(self):
    return len(self.x_data)

  def __getitem__(self, idx):
    x = torch.FloatTensor(self.x_data[idx])
    y = torch.FloatTensor(self.y_data[idx])
    return x,y

dataset = CustomDataset()
dataloader = DataLoader(dataset,batch_size = 2, shuffle = True)

model = torch.nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(),lr=1e-5)

nb_epochs = 20

for epoch in range(nb_epochs + 1):
  for batch_idx, samples in enumerate(dataloader):
    x_train, y_train = samples

    h = model(x_train)
    cost = F.mse_loss(h, y_train)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
      epoch, nb_epochs, batch_idx+1, len(dataloader),
      cost.item()
      ))

Epoch    0/20 Batch 1/3 Cost: 24223.845703
Epoch    0/20 Batch 2/3 Cost: 3994.194824
Epoch    0/20 Batch 3/3 Cost: 1325.740601
Epoch    1/20 Batch 1/3 Cost: 749.752563
Epoch    1/20 Batch 2/3 Cost: 132.375885
Epoch    1/20 Batch 3/3 Cost: 107.559586
Epoch    2/20 Batch 1/3 Cost: 12.665815
Epoch    2/20 Batch 2/3 Cost: 7.249213
Epoch    2/20 Batch 3/3 Cost: 0.254152
Epoch    3/20 Batch 1/3 Cost: 1.624306
Epoch    3/20 Batch 2/3 Cost: 0.099982
Epoch    3/20 Batch 3/3 Cost: 0.164308
Epoch    4/20 Batch 1/3 Cost: 0.210675
Epoch    4/20 Batch 2/3 Cost: 0.459442
Epoch    4/20 Batch 3/3 Cost: 0.416424
Epoch    5/20 Batch 1/3 Cost: 0.143471
Epoch    5/20 Batch 2/3 Cost: 0.378763
Epoch    5/20 Batch 3/3 Cost: 0.469849
Epoch    6/20 Batch 1/3 Cost: 0.525421
Epoch    6/20 Batch 2/3 Cost: 0.284532
Epoch    6/20 Batch 3/3 Cost: 0.091805
Epoch    7/20 Batch 1/3 Cost: 0.182790
Epoch    7/20 Batch 2/3 Cost: 0.333478
Epoch    7/20 Batch 3/3 Cost: 0.063773
Epoch    8/20 Batch 1/3 Cost: 0.254045
Epoch   