### batch
    data의 양이 많아지면 한번에 모든 data에 대해 경사하강법을 수행 할 수 없다.
    계산량이 많아서 느리고, 메모리의 한계로 계산이 불가능 할 수도 있다.
    
    전체 data를 작은 단위로 나누어 해당 단위로 학습을 진행하는데
    
    이 단위를 ""Mini Batch""라고 한다.
    
  ![image.png](attachment:image.png)
    
    batch들이 모두 경사하강법을 1번씩 수행하게 되면 1 epoch이 끝난다.
    
   #### mini batch의 크기를 batch size라고 한다.

### 배치 경사 하강법
    전체 data에 대해 경사하강법을 진행
    가중치 값이 최적에 수렴
    계산량이 너무 많음
    
### 미니 배치 경사 하강법
    1개의 mini batch에 대하여 경사하강법을 진행
    가중치 값이 최적값으로 수렴하기가 조금 어려움
    훈련 속도가 빠름

### iteration
    1개의 mini batch가 network를 통과하는 것을 말함.
    
    data = 2000개
    batch size = 200 ==> 총 10개의 mini batch 생성
    Iteration = 10  ==> 1 Epoch
    
    10 iteration이면 1번 모든 데이터가 network를 통과함. 따라서 1 Epoch이됨
   

In [3]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

torch.manual_seed(1)

<torch._C.Generator at 0x20fb65043d0>

In [8]:
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

In [9]:
dataset = TensorDataset(x_train, y_train)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

### batch를 사용한 결과 

In [35]:
model = nn.Linear(3,1)
optimizer = optim.SGD(model.parameters(), lr=1e-5)

epochs = 2000

for e in range(epochs + 1) :
    for batch_idx, samples in enumerate(dataloader) :
        x_train, y_train = samples
        
        pred = model(x_train)
        
        cost = F.mse_loss(pred, y_train)
        
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()
        
        if e % 100 == 0 :
            print("Epoch : {}/{}, Batch : {}/{} Cost : {:.6f}".format(
            e, epochs, batch_idx, len(dataloader), cost.item()))

Epoch : 0/2000, Batch : 0/3 Cost : 53898.457031
Epoch : 0/2000, Batch : 1/3 Cost : 16657.857422
Epoch : 0/2000, Batch : 2/3 Cost : 6019.574219
Epoch : 100/2000, Batch : 0/3 Cost : 10.442776
Epoch : 100/2000, Batch : 1/3 Cost : 10.869239
Epoch : 100/2000, Batch : 2/3 Cost : 1.065429
Epoch : 200/2000, Batch : 0/3 Cost : 11.368460
Epoch : 200/2000, Batch : 1/3 Cost : 0.884159
Epoch : 200/2000, Batch : 2/3 Cost : 14.768081
Epoch : 300/2000, Batch : 0/3 Cost : 3.938185
Epoch : 300/2000, Batch : 1/3 Cost : 14.543747
Epoch : 300/2000, Batch : 2/3 Cost : 3.477790
Epoch : 400/2000, Batch : 0/3 Cost : 6.273901
Epoch : 400/2000, Batch : 1/3 Cost : 4.376030
Epoch : 400/2000, Batch : 2/3 Cost : 4.533801
Epoch : 500/2000, Batch : 0/3 Cost : 0.358337
Epoch : 500/2000, Batch : 1/3 Cost : 6.242352
Epoch : 500/2000, Batch : 2/3 Cost : 9.174144
Epoch : 600/2000, Batch : 0/3 Cost : 4.252503
Epoch : 600/2000, Batch : 1/3 Cost : 3.157555
Epoch : 600/2000, Batch : 2/3 Cost : 3.577464
Epoch : 700/2000, Batch 

### batch를 사용안한 결과 

In [36]:
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

model_non = nn.Linear(3,1)
optimizer = optim.SGD(model_non.parameters(), lr=1e-5)

epochs = 2000

for e in range(epochs + 1) :
#     for batch_idx, samples in enumerate(dataloader) :
#         x_train, y_train = samples
        
    pred = model_non(x_train)

    cost = F.mse_loss(pred, y_train)

    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    if e % 100 == 0 :
        print("Epoch : {}/{}, Cost : {:.6f}".format(
        e, epochs, cost.item()))

Epoch : 0/2000, Cost : 10432.578125
Epoch : 100/2000, Cost : 2.070087
Epoch : 200/2000, Cost : 1.971632
Epoch : 300/2000, Cost : 1.878373
Epoch : 400/2000, Cost : 1.790006
Epoch : 500/2000, Cost : 1.706278
Epoch : 600/2000, Cost : 1.626997
Epoch : 700/2000, Cost : 1.551881
Epoch : 800/2000, Cost : 1.480720
Epoch : 900/2000, Cost : 1.413303
Epoch : 1000/2000, Cost : 1.349444
Epoch : 1100/2000, Cost : 1.288947
Epoch : 1200/2000, Cost : 1.231628
Epoch : 1300/2000, Cost : 1.177329
Epoch : 1400/2000, Cost : 1.125903
Epoch : 1500/2000, Cost : 1.077176
Epoch : 1600/2000, Cost : 1.031013
Epoch : 1700/2000, Cost : 0.987278
Epoch : 1800/2000, Cost : 0.945842
Epoch : 1900/2000, Cost : 0.906602
Epoch : 2000/2000, Cost : 0.869409


In [37]:
input = torch.FloatTensor([[73, 80, 75]])

pred = model(input)
pred_non = model_non(input)
print("배치를 사용한 결과 : ",pred)
print("배치를 사용안한 결과 : ",pred_non)

배치를 사용한 결과 :  tensor([[151.9353]], grad_fn=<AddmmBackward>)
배치를 사용안한 결과 :  tensor([[152.8214]], grad_fn=<AddmmBackward>)
