# 다중 선형 회귀 ( Multivariable_Linear_Regression )
- [3-1](https://colab.research.google.com/drive/1fLFUt0L3Ydm2G_wrP3F00E9jLpOvdxig)에서 진행한 linear regression은 x가 1개인 단순 선형 회귀 입니다.
- 3-2에서는 여러 개의 x로부터 y를 예측하는 다중 선형 회귀를 다룹니다.
  - 독립변수(y를 예측하기 위한 x)가 여러 개입니다.

## 변수를 3개 선언하여 실행

In [1]:
# Implementing
## 1. setting

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

torch.manual_seed(42)

<torch._C.Generator at 0x7faf0e7a6550>

In [2]:
## 2. variable

X1_train = torch.Tensor([[1],[2],[3],[4],[5]])
X2_train = torch.Tensor([[10],[9],[8],[7],[6]])
X3_train = torch.Tensor([[13],[14],[11],[15],[12]])

Y_train = torch.Tensor([[19],[14],[25],[32],[51]])

In [3]:
## 3. weight & bias
W1 = torch.zeros(1,requires_grad=True)
W2 = torch.zeros(1,requires_grad=True)
W3 = torch.zeros(1,requires_grad=True)
b = torch.zeros(1,requires_grad=True)

In [6]:
## 4. optimizer
opt = optim.SGD([W1,W2,W3,b],lr = 0.0001)

In [9]:
## 5. set epoch & train model
epochs = 1000
for epoch in range(1,epochs+1):
  output = X1_train*W1+X2_train*W2+X3_train*W3 + b
  loss = torch.mean((output-Y_train)**2)
  opt.zero_grad()
  loss.backward()
  opt.step()
  if epoch %100 == 0:
    print(f"epoch {epoch}/{epochs} - loss : {loss.item()}, W1 : {W1.item()}")

#loss와 W1의 nan은 data scale의 문제입니다.

epoch 100/1000 - loss : nan, W1.grad : nan
epoch 200/1000 - loss : nan, W1.grad : nan
epoch 300/1000 - loss : nan, W1.grad : nan
epoch 400/1000 - loss : nan, W1.grad : nan
epoch 500/1000 - loss : nan, W1.grad : nan
epoch 600/1000 - loss : nan, W1.grad : nan
epoch 700/1000 - loss : nan, W1.grad : nan
epoch 800/1000 - loss : nan, W1.grad : nan
epoch 900/1000 - loss : nan, W1.grad : nan
epoch 1000/1000 - loss : nan, W1.grad : nan


## 변수를 행렬로 변환하여 실행
- 변수를 각각 3개 선언하는 경우 scale 문제가 발생합니다.
  - 1000개가 필요한 경우 1000개 선언 불가
- 따라서 벡터의 내적을 이용합니다.
  - 벡터의 내적으로 표현하기
    - H(x) = w1x1 + w2x2 + w3x3 + b 라면 아래와 같이 표현 가능합니다.
      - H(x) = [w1,w2,w3] * [x1,x2,x3]^T + [b1] (b는 내적 결과 행렬의 size를 따라갑니다. 3x1 * 1x3은 1x1이 결과이므로 b 또한 1x1 사이즈를 갖습니다.)

In [13]:
# 1. setting -> Done (above)
# 2. variable
X_train = torch.Tensor([[1,2,3,4,5],
          [6,7,8,9,10],
          [11,12,13,14,15]]) # 3 x 5 행렬 선언
Y_train = torch.Tensor([[15],[40],[65]])

In [20]:
# 3. weight bias
W = torch.zeros((5,1),requires_grad=True)
b = torch.zeros(1,requires_grad=True)

In [21]:
# 4. optimizer
opt = optim.SGD([W,b],lr = 1e-5) # 1e-5 = 0.0001

In [22]:
# 5. set epoch & train
epochs = 3000
for epoch in range(1,epochs+1):
  output = X_train.matmul(W).add(b)
  loss = torch.mean((Y_train.sub(output))**2)
  opt.zero_grad()
  loss.backward()
  opt.step()
  if epoch % 100 == 0 :
    print(f"epoch {epoch}/{epochs} : loss {loss}")

#test를 위한 부분 test 시에는 grad 반영이 되면 안 되므로 no_grad 처리합니다.
with torch.no_grad() :
  new_input = torch.Tensor([[1,6,11,2,7]])
  pred = new_input.matmul(W)+b
  print(f"예측 결과 : {pred}")

epoch 100/3000 : loss 391.88623046875
epoch 200/3000 : loss 75.05513763427734
epoch 300/3000 : loss 14.52582836151123
epoch 400/3000 : loss 2.960533857345581
epoch 500/3000 : loss 0.7494533061981201
epoch 600/3000 : loss 0.32541635632514954
epoch 700/3000 : loss 0.24279622733592987
epoch 800/3000 : loss 0.22541563212871552
epoch 900/3000 : loss 0.22050638496875763
epoch 1000/3000 : loss 0.21799786388874054
epoch 1100/3000 : loss 0.21596068143844604
epoch 1200/3000 : loss 0.21402700245380402
epoch 1300/3000 : loss 0.2121267318725586
epoch 1400/3000 : loss 0.21024741232395172
epoch 1500/3000 : loss 0.20838655531406403
epoch 1600/3000 : loss 0.20654581487178802
epoch 1700/3000 : loss 0.20472244918346405
epoch 1800/3000 : loss 0.20291143655776978
epoch 1900/3000 : loss 0.20111145079135895
epoch 2000/3000 : loss 0.19933219254016876
epoch 2100/3000 : loss 0.19756917655467987
epoch 2200/3000 : loss 0.19581754505634308
epoch 2300/3000 : loss 0.19408388435840607
epoch 2400/3000 : loss 0.1923652