# **1. 배치**

* 전체 데이터를 작은 단위로 나눠서 학습하는 개념
* 배치 학습을 하게 되면 배치만큼만 가져가서 배치에 대한 비용을 계산하고 경사하강법을 수행한다.
* 모든 배치를 가져가서 경사 하강법을 수행하고, 마지막 배치까지 이를 반복한다.
* 전체 데이터에 대한 학습이 모두 끝나면 1 에폭이 끝나게 된다.
* 배치 크기(batch_size)는 보통 2의 제곱수를 사용한다.(cpu와 gpu의 메모리가 2의 배수이므로, 배치 크기가 2의 제곱수일 경우 데이터의 송수신의 효율을 높일 수 있다.)

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [2]:
x_train = torch.FloatTensor([[2, 0, 0], 
                             [2, 1, 0], 
                             [2, 2, 1], 
                             [3, 1, 1], 
                             [4, 1, 2], 
                             [4, 2, 2]])
y_train = torch.FloatTensor([[50], [60], [65], [70], [75], [85]]) 

# **2. 데이터로드**

* 데이터를 좀 더 쉽게 다룰 수 있도록 데이터셋과 데이터로더를 파이토치 및 텐서플로우에서 제공
* 배치 학습, 데이터 셔플, 병렬 처리를 간단하게 수행

In [3]:
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
# import 와 from import 의 차이
# import : 파이썬 파일을 가져와서 그 안의 모든 데이터를 가져옴
# from import : 파이썬 파일 안에서 일부 클래스만 지정하여 가져옴 : 메모리를 아낄 수 있다.

In [4]:
# BGD (Batch Gradient Descent)
# 전체 데이터셋에 대해 에러를 구한 뒤 기울기를 한 번만 계산하여 모델의 파라미터를 업데이트

# SGD (Stochastic Gradient Descent)
# 추출된 각각의 데이터에 대해 Gradient 를 계산한 뒤 모델에 업데이트하는 알고리즘

# Mini-Batch SGD
# batch 를 구성하고 해당 batch 의 기울기를 통해 모델을 업데이트

dataset = TensorDataset(x_train, y_train)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [5]:
model = nn.Linear(3, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)

In [13]:
epoch_count = 20

for epoch in range(epoch_count + 1) : 
  for batch_idx, datas in enumerate(dataloader) : 
    # print(f'batch_index:{batch_idx}, datas:{datas}\n')
    x_train, y_train = datas
    H = model(x_train)
    cost = F.mse_loss(H, y_train)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print(f'Epoch {epoch:4d}/{epoch_count}, Batch:{batch_idx + 1}/{len(dataloader)}, cost:{cost:.6f}\n')
# 출력의 배치사이즈가 6인 이유 : x_train 데이터는 6개, batch_size = 2 이기 때문에 2개씩 3번 잘려서 batch 값이 3이다.

Epoch    0/20, Batch:1/3, cost:34.675442

Epoch    0/20, Batch:2/3, cost:29.685068

Epoch    0/20, Batch:3/3, cost:58.571098

Epoch    1/20, Batch:1/3, cost:34.598671

Epoch    1/20, Batch:2/3, cost:47.940933

Epoch    1/20, Batch:3/3, cost:39.808578

Epoch    2/20, Batch:1/3, cost:38.851738

Epoch    2/20, Batch:2/3, cost:42.415760

Epoch    2/20, Batch:3/3, cost:42.784081

Epoch    3/20, Batch:1/3, cost:29.660141

Epoch    3/20, Batch:2/3, cost:34.196686

Epoch    3/20, Batch:3/3, cost:57.780212

Epoch    4/20, Batch:1/3, cost:41.568916

Epoch    4/20, Batch:2/3, cost:58.961891

Epoch    4/20, Batch:3/3, cost:20.613035

Epoch    5/20, Batch:1/3, cost:34.256897

Epoch    5/20, Batch:2/3, cost:47.242226

Epoch    5/20, Batch:3/3, cost:39.144848

Epoch    6/20, Batch:1/3, cost:34.181263

Epoch    6/20, Batch:2/3, cost:57.921669

Epoch    6/20, Batch:3/3, cost:27.913214

Epoch    7/20, Batch:1/3, cost:40.088306

Epoch    7/20, Batch:2/3, cost:57.689442

Epoch    7/20, Batch:3/3, cost:24.

In [14]:
var = torch.FloatTensor([[5, 2, 3]])
pred = model(var)
print(f'테스트 : {pred}')

테스트 : tensor([[105.3678]], grad_fn=<AddmmBackward0>)
