# ▼ Multivariate Linear Regression

- Simple Linear Regression
- Multivariate Linear Regression 이론 
- Naive Data Representation
- Matrix Data Representation
- Multivariate Linear Regression
- nn.Module 소개
- F.mse_loss 소개

## Simple Linear Regression
- 하나의 정보로부터 하나의 값을 예측하는 모델 
    - ex) 1시간 공부 -> Test socre Prediction: 2점
- H(x) = Wx + b

## Multivariate Linear Regression
- **여러 개의 정보**로부터 **하나의 값**을 예측
    - ex) Quize Scores가 73, 80, 75점 →  
    Final Score Prediction: 152점
- H(x) = Wx + b

## Data


|Quiz 1 (x1)|Quiz 2 (x2)|Quiz 3 (x3)|Final(y)|
|:---:|:---:|:---:|:---:|
|73|80|75|152|
|93|88|93|185|
|89|91|80|180|
|96|98|100|196|
|73|66|70|142|

                                

In [1]:
import torch
from torch import optim

x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

## Hypothesis Function: Naive
- H(x) = Wx + b
    - x라는 vector와 W라는 matrix의 곱
    
    
- H(x) = w1x1 + w2x2 + w3x3 + b
    - 입력변수가 3개면 weight도 3개
    
    
   
- 하지만 x가 길이 1000의 vector라면?  
    - hypothesis가 점점 길어질 것

In [None]:
# H(x) 계산
hypothesis = x1_train * w1 + x2_train * w2 + x3_train * w3 + b

## Hypothesis Function: Matrix

- matmul()로 한 번에 계산
    - a. 더 간결
    - b. x의 길이가 바뀌어도 코드를 바꿀 필요 없음
    - c. 속도가 더 빠름

In [None]:
# H(x) 계산
hypothesis = x_train.matmul(W) + b # or. mm or @

## Cost function: MSE
- 기존 Simple Linear Regression과 동일한 공식


<center><img src="img/cost.png" width="60%" height="60%"></center>


In [None]:
cost = torch.mean((hypothesis - y_train) ** 2)

## Gradient Descent with torch.optim

<center><img src="img/gra.png" width="60%" hight="60%"></center>

In [None]:
# optimizer 설정
optimizer = optim.SGD([W, b], lr=1e-5)

# optimizer 사용법
optimizer.zero_grad()
cost.backward()
optimizer.step()

## Full Code with torch.optim(1)
- 1. 데이터 정의
- 2. 모델 정의
- 3. optimizer 정의

In [2]:
# 데이터
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

print(x_train.shape)
print(y_train.shape)

# 모델 초기화
W = torch.zeros((3, 1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

# optimizer 설정
optimizer = optim.SGD([W, b], lr=1e-5)

torch.Size([5, 3])
torch.Size([5, 1])


## Full Code with torch.optim(2)
- 4. Hypothesis 계산
- 5. Cost 계산 (MSE)
- 6. Gradient descent

In [3]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    
    # H(x) 계산
    hypothesis = x_train.matmul(W) + b  # or .mm or @
    
    # cost 계산
    cost = torch.mean((hypothesis - y_train) ** 2)
    
    # cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    print('Epoch {:4d}/{} hypothesis: {} Cost: {:.6f}'.format(
    epoch, nb_epochs, hypothesis.squeeze().detach(),
    cost.item()
    ))

Epoch    0/20 hypothesis: tensor([0., 0., 0., 0., 0.]) Cost: 29661.800781
Epoch    1/20 hypothesis: tensor([67.2578, 80.8397, 79.6523, 86.7394, 61.6605]) Cost: 9298.520508
Epoch    2/20 hypothesis: tensor([104.9128, 126.0990, 124.2466, 135.3015,  96.1821]) Cost: 2915.712646
Epoch    3/20 hypothesis: tensor([125.9942, 151.4381, 149.2133, 162.4896, 115.5097]) Cost: 915.040527
Epoch    4/20 hypothesis: tensor([137.7968, 165.6247, 163.1911, 177.7112, 126.3307]) Cost: 287.936005
Epoch    5/20 hypothesis: tensor([144.4044, 173.5674, 171.0168, 186.2332, 132.3891]) Cost: 91.371017
Epoch    6/20 hypothesis: tensor([148.1035, 178.0144, 175.3980, 191.0042, 135.7812]) Cost: 29.758139
Epoch    7/20 hypothesis: tensor([150.1744, 180.5042, 177.8508, 193.6753, 137.6805]) Cost: 10.445305
Epoch    8/20 hypothesis: tensor([151.3336, 181.8983, 179.2240, 195.1707, 138.7440]) Cost: 4.391228
Epoch    9/20 hypothesis: tensor([151.9824, 182.6789, 179.9928, 196.0079, 139.3396]) Cost: 2.493135
Epoch   10/20 hypo

## Results
- 점점 작아지는 Cost
- 점점 y에 가까워지는 H(x)
- Learning rate에 따라 발산할 수도 있음

## nn.Module
- nn.Module을 상속해서 모델 생성
- nn.Linear(3, 1)
    - 입력 차원: 3
    - 출력 차원: 1
- Hypothesis 계산은 forward()에서
- Gradient 계산은 PyTorch가 알아서 해줌(backward())

In [None]:
# 모델 초기화
W = torch.zeros((3, 1), requires_grad=True)
b = torch.zeros(1,requires_grad=True)

# H(x) 계산
hypothesis = x_train.matmul(x) + b

# -------------------------------------------------
import torch.nn as nn

class MultivariateLinearRegressionModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = torch.nn.Linear(3, 1)
        
    def forward(self, x):
        return self.linear(x)
    
hypothesis = model(x_train)

## F.mse_loss
- torch.nn.functional에서 제공하는 loss function 사용
- 쉽게 다른 loss와 교체 가능 (l1_loss, smooth_l1_loss 등)
- cost function을 계산하면서 생기는 버그가 없어 디버깅 시 편리함

In [None]:
# cost 계산
cost = torch.mean((hypothesis - y_train) ** 2)

# ---------------------------------------------
import torch.nn.functional as F

cost = F.mse_loss(prediction, y_trian)

## Full Code with torch.optim (1)
- 1. 데이터 정의
- 2. 모델 정의
- 3. optimizer 정의

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F

# 데이터
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 90],
                             [96, 98, 100],
                             [73, 66, 70]])
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]])

# 모델 초기화
model = MultivariateLinearRegressionModel()

# optimizer 설정
optimizer = optim.SGD([W, b], lr=1e-5)

## Full Code with torch.optim (2)
- 4. Hypothesis 계산
- 5. Cost 계산 (MSE)
- 6. Gradient descent

In [None]:
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    
    # H(x) 계산
    Hypothesis = model(x_train)
    
    # cost 계산
    cost = F.mse_loss(prediction, y_train)
    
    # cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    print('Epoch {:4d}/{} hypothesis: {} Cost: {:6f}'.format(
        epoch, nb_epochs, hypothesis.squeez().detach(),
        cost.item()
    ))