# Day 4
Multivariate Linear Regression

https://wikidocs.net/53560

엄청난 양의 데이터를 한 번에 학습시킬 수 없다. 그것을 극복하기 위하여 나온 방식이 <br>
### Minibatch Gradient Descent

전체 데이터의 모든 cost를 구한 후에 gradient descent를 하지 않고 

minibatch에 있는 데이터의 cost만 계산한 후에 gradient descent할 수 있기 때문에 컴퓨터에 부하가 덜 걸린다.

이를 통하여 한 번 업데이트 하는데 걸린 시간이 줄어들 수 있다. <br>
그러나 모델의 cost를 계산할 때 전체 데이터를 학습하지 않게 되므로 <br>
모델이 가끔 잘못된 방향으로 학습할 수 있기 때문에 기존 gradient descent처럼 매끄럽게 cost가 줄어들지 않고 좀 더 거칠게 줄어들게 된다.

## Imports

In [84]:
import torch
import numpy as np
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import TensorDataset # pytorch 에서 제공해주는 모듈
from torch.utils.data import DataLoader

In [85]:
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

In [86]:
dataset = TensorDataset(x_train, y_train)

In [87]:
# # torch.utils.data.Dataset 상속
# class CustomDataset(Dataset):
#     def __init__(self):
#         self.x_data = [[73, 80, 75,
#                         93, 88, 93,
#                         89, 91, 90,
#                         96, 98, 100,
#                         73, 66, 70]]
#         self.y_data = [[152,
#                         185,
#                         180,
#                         196,
#                         142]]
    
#     # 이 데이터셋의 총 데이터 수
#     def __len__(self):
#         return len(self.x_data)
    
#     # 어떠한 인덱스 idx를 받았을 때, 그에 상응하는 입출력 데이터 반환
#     def __getitem__(self,idx):
#         x = torch.FloatTensor(self.x_data[idx])
#         y = torch.FloatTensor(self.y_data[idx])

#         return x, y


In [88]:
# dataset = CustomDataset()

In [89]:
# print(dataset)

In [90]:
dataloader = DataLoader(
    dataset,
    batch_size=2, 
    shuffle = True
)


batch_size<br>
    - minibatch의 크기<br>
    - 통상적으로 2의 제곱수로 설정한다.<br>

shuffle=True<br>
    - epoch 마다 데이터셋을 섞어서 데이터가 학습되는 순서를 바꾼다<br>
    - 모델이 순서를 학습하지 못하도록 해주는 역할이므로 반드시 [True]로 설정한다

In [91]:
print(dataloader)

<torch.utils.data.dataloader.DataLoader object at 0x14a58e640>


In [92]:
# class MultivariateLinearRegressionModel(nn.Module):
#     def __init__(self):
#         super().__init__()
#         self.linear = nn.Linear(3, 1)

#     def forward(self, x):
#         return self.linear(x)

In [93]:
# 모델 초기화
model = nn.Linear(3,1)

# optimizer
optimizer = optim.SGD(model.parameters(), lr=1e-5)

In [100]:
nb_epochs = 20

for epoch in range(nb_epochs + 1):
    for batch_idx, samples in enumerate(dataloader):
        print('\n',batch_idx)
        # print(samples)

        x_train, y_train = samples

        # H(x) 계산
        prediction = model(x_train)

        # cost 계산
        cost = F.mse_loss(prediction, y_train)

        # cost로 H(x) 개선
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        print('Epoch{:4d}/{} Batch {}/{} Cost: {:.6f}'
              .format(epoch, nb_epochs, batch_idx+1, len(dataloader), cost.item()))
        
        


 0
Epoch   0/20 Batch 1/3 Cost: 0.870665

 1
Epoch   0/20 Batch 2/3 Cost: 1.108827

 2
Epoch   0/20 Batch 3/3 Cost: 3.092427

 0
Epoch   1/20 Batch 1/3 Cost: 0.835575

 1
Epoch   1/20 Batch 2/3 Cost: 0.873663

 2
Epoch   1/20 Batch 3/3 Cost: 3.286871

 0
Epoch   2/20 Batch 1/3 Cost: 2.202824

 1
Epoch   2/20 Batch 2/3 Cost: 0.734755

 2
Epoch   2/20 Batch 3/3 Cost: 1.485723

 0
Epoch   3/20 Batch 1/3 Cost: 0.185386

 1
Epoch   3/20 Batch 2/3 Cost: 2.483212

 2
Epoch   3/20 Batch 3/3 Cost: 0.543888

 0
Epoch   4/20 Batch 1/3 Cost: 0.561790

 1
Epoch   4/20 Batch 2/3 Cost: 1.310358

 2
Epoch   4/20 Batch 3/3 Cost: 4.128643

 0
Epoch   5/20 Batch 1/3 Cost: 0.522182

 1
Epoch   5/20 Batch 2/3 Cost: 2.399729

 2
Epoch   5/20 Batch 3/3 Cost: 0.004944

 0
Epoch   6/20 Batch 1/3 Cost: 1.512072

 1
Epoch   6/20 Batch 2/3 Cost: 0.742259

 2
Epoch   6/20 Batch 3/3 Cost: 2.534255

 0
Epoch   7/20 Batch 1/3 Cost: 2.332011

 1
Epoch   7/20 Batch 2/3 Cost: 0.681347

 2
Epoch   7/20 Batch 3/3 Cost: 1

In [101]:
# 임의의 입력 [73, 80, 75]를 선언
new_var =  torch.FloatTensor([[73, 80, 75]]) 
# 입력한 값 [73, 80, 75]에 대해서 예측값 y를 리턴받아서 pred_y에 저장
pred_y = model(new_var) 
print("훈련 후 입력이 73, 80, 75일 때의 예측값 :", pred_y) 

훈련 후 입력이 73, 80, 75일 때의 예측값 : tensor([[152.1742]], grad_fn=<AddmmBackward0>)


### enumerate()

In [15]:
# enumerate()
# 인자로 넘어온 목록을 기준으로 인덱스와 원소를 차례대로 접근하게 해주는 반복자 객체를 반환해주는 함수.
for i, letter in enumerate(['A','B','C'], start = 101):
    print(i,letter)

101 A
102 B
103 C


In [24]:
matrix = [['A','B','C'],
          ['D','E','F'],
          ['G','H','I']]

print(np.shape(matrix))

# 행과 열의 인덱스로 데이터를 읽도록 작성할 때
for r in range(len(matrix)):
    for c in range(len(matrix[r])):
        print(r,c,matrix[r][c])

(3, 3)
0 0 A
0 1 B
0 2 C
1 0 D
1 1 E
1 2 F
2 0 G
2 1 H
2 2 I


In [40]:
for r, row in enumerate(matrix):
    print('row: ', row)
    
    for c, letter in enumerate(row):
        print(r,c,letter)

row:  ['A', 'B', 'C']
0 0 A
0 1 B
0 2 C
row:  ['D', 'E', 'F']
1 0 D
1 1 E
1 2 F
row:  ['G', 'H', 'I']
2 0 G
2 1 H
2 2 I


In [43]:
matrix[0]

['A', 'B', 'C']

In [47]:
tmp_mat = [[[1,2,3],
            [4,5,6]],
            
           [[7,8,9],
            [10,11,12]]]
print(np.shape(tmp_mat))

(2, 2, 3)


In [49]:
tmp_mat[0][0]

[1, 2, 3]

In [50]:
for r, row in enumerate(tmp_mat):
    print('row: ', row)
    
    for c, letter in enumerate(row):
        print(r,c,letter)

row:  [[1, 2, 3], [4, 5, 6]]
0 0 [1, 2, 3]
0 1 [4, 5, 6]
row:  [[7, 8, 9], [10, 11, 12]]
1 0 [7, 8, 9]
1 1 [10, 11, 12]


In [52]:
for r, row in enumerate(tmp_mat):
    print('row: ', row)

    for c, mat in enumerate(row):
        print('mat: ', mat)
        
        for c2, letter in enumerate(mat):
            print(r,c,c2,letter)


row:  [[1, 2, 3], [4, 5, 6]]
mat:  [1, 2, 3]
0 0 0 1
0 0 1 2
0 0 2 3
mat:  [4, 5, 6]
0 1 0 4
0 1 1 5
0 1 2 6
row:  [[7, 8, 9], [10, 11, 12]]
mat:  [7, 8, 9]
1 0 0 7
1 0 1 8
1 0 2 9
mat:  [10, 11, 12]
1 1 0 10
1 1 1 11
1 1 2 12


In [53]:
del r, row, c, mat, c2, letter