## 미니 배치
- 전체 데이터를 하나의 행렬로 선언면, 전체 데이터에 대해서 경사 하강법을 수행하여 학습함
- 방대한 현업 데이터를 하나의 행렬에 저장하면 비용함수 및 경사 하강법은 메모리 부족을 적용할 수 없음

#### 미니 배치란
- 전체 데이터를 작은 단위로 나누어서 단위별로 학습하는 방법
- 미니 배치 학습을 하게되면 미니 배치만큼만 가져가서 미니 배치에 대한 대한 비용(cost)를 계산하고, 경사 하강법을 수행
- 이렇게 모든 미니 배치가 완료되면, 전체 데이터에 대한 학습이 1회 끝나면 1 에포크(Epoch)가 끝나게 됩니다.

배치 경사 하강법은 경사 하강법을 할 때, 전체 데이터를 사용하므로 가중치 값이 최적값에 수렴하는 과정이 매우 안정적이지만, 계산량이 너무 많이 듭니다. 
미니 배치 경사 하강법은 경사 하강법을 할 때, 전체 데이터의 일부만을 보고 수행하므로 최적값으로 수렴하는 과정에서 값이 조금 헤매기도 하지만 훈련 속도가 빠릅니다.

#### 이터레이션(Iteration)
![nn](https://wikidocs.net/images/page/36033/batchandepochiteration.PNG)

## 데이터 로드하기(Data Load)
파이토치에서는 데이터를 다루기 위해 데이터셋(Dataset)과 데이터로더(DataLoader)를 제공합니다. 
- 미니 배치 학습
- 데이터 셔플(shuffle)
- 병렬 처리

#### 사용 방법
- Dataset을 정의
- 정의된 Dataset을 DataLoader에 전달하는 것입니다.

In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [3]:
# TensorDataset과 DataLoader를 임포트합니다.
from torch.utils.data import TensorDataset # 텐서데이터셋
from torch.utils.data import DataLoader # 데이터로더

In [4]:
# TensorDataset은 텐서를 입력 받음
x_train  =  torch.FloatTensor([[73,  80,  75], 
                               [93,  88,  93], 
                               [89,  91,  90], 
                               [96,  98,  100],   
                               [73,  66,  70]])  
y_train  =  torch.FloatTensor([[152],  [185],  [180],  [196],  [142]])

dataset = TensorDataset(x_train, y_train)

In [5]:
# 데이터셋, 
# batch_size: 미니 배치의 크기
# shuffle=True를 선택하면 Epoch마다 데이터셋을 섞어서 데이터가 학습되는 순서를 바꿉니다.
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

In [6]:
# 모델과 옵티마이저
model = nn.Linear(3,1)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-5) 

In [7]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
  for batch_idx, samples in enumerate(dataloader):
    # print(batch_idx)
    # print(samples)
    x_train, y_train = samples
    # H(x) 계산
    prediction = model(x_train)

    # cost 계산
    cost = F.mse_loss(prediction, y_train)

    # cost로 H(x) 계산
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    print('Epoch {:4d}/{} Batch {}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, batch_idx+1, len(dataloader),
        cost.item()
        ))

Epoch    0/20 Batch 1/3 Cost: 22773.062500
Epoch    0/20 Batch 2/3 Cost: 9890.560547
Epoch    0/20 Batch 3/3 Cost: 3286.645020
Epoch    1/20 Batch 1/3 Cost: 531.038208
Epoch    1/20 Batch 2/3 Cost: 362.552063
Epoch    1/20 Batch 3/3 Cost: 63.329159
Epoch    2/20 Batch 1/3 Cost: 21.645264
Epoch    2/20 Batch 2/3 Cost: 9.169369
Epoch    2/20 Batch 3/3 Cost: 0.491278
Epoch    3/20 Batch 1/3 Cost: 1.742851
Epoch    3/20 Batch 2/3 Cost: 2.364782
Epoch    3/20 Batch 3/3 Cost: 0.111393
Epoch    4/20 Batch 1/3 Cost: 1.713829
Epoch    4/20 Batch 2/3 Cost: 0.281997
Epoch    4/20 Batch 3/3 Cost: 2.478357
Epoch    5/20 Batch 1/3 Cost: 0.224336
Epoch    5/20 Batch 2/3 Cost: 1.545010
Epoch    5/20 Batch 3/3 Cost: 3.384408
Epoch    6/20 Batch 1/3 Cost: 0.660739
Epoch    6/20 Batch 2/3 Cost: 1.444978
Epoch    6/20 Batch 3/3 Cost: 3.779374
Epoch    7/20 Batch 1/3 Cost: 0.125499
Epoch    7/20 Batch 2/3 Cost: 2.663284
Epoch    7/20 Batch 3/3 Cost: 2.552749
Epoch    8/20 Batch 1/3 Cost: 0.165278
Epoch    

In [8]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[152.2071]], grad_fn=<AddmmBackward>)
