<a href="https://colab.research.google.com/github/Youngmi-Park/pytorch-study/blob/main/%EB%8B%A4%EC%A4%91_%EC%84%A0%ED%98%95_%ED%9A%8C%EA%B7%80(Multivariable_Linear_regression).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 다중 선형 회귀

- 단순 선형 회귀(Simple Linear Regression): x가 1개인 선형 회귀
- 다중 선형 회귀(Multivariable Linear Regression): 다수의 x로 부터 y를 에측

### 1. 데이터에 대한 이해
<p align="center"> <img src="https://wikidocs.net/images/page/54841/%ED%9B%88%EB%A0%A8%EB%8D%B0%EC%9D%B4%ED%84%B0.PNG"></p>

$$H(x) = w_1x_1 + w_2+x_2 + w_3x_3 +b$$


$$
\left(
    \begin{array}{c}
      x_{11}\ x_{12}\ x_{13}\ \\
      x_{21}\ x_{22}\ x_{23}\ \\
      x_{31}\ x_{32}\ x_{33}\ \\
      x_{41}\ x_{42}\ x_{43}\ \\
      x_{51}\ x_{52}\ x_{53}\ \\
    \end{array}
  \right)
\left(
    \begin{array}{c}
      w_{1} \\
      w_{2} \\
      w_{3} \\
    \end{array}
  \right)
+
\left(
    \begin{array}{c}
      b \\
      b \\
      b \\
      b \\
      b \\
    \end{array}
  \right)
 \ =
\left(
    \begin{array}{c}
      x_{11}w_{1}+ x_{12}w_{2}+ x_{13}w_{3} + b\ \\
      x_{21}w_{1}+ x_{22}w_{2}+ x_{23}w_{3} + b\ \\
      x_{31}w_{1}+ x_{32}w_{2}+ x_{33}w_{3} + b\ \\
      x_{41}w_{1}+ x_{42}w_{2}+ x_{43}w_{3} + b\ \\
      x_{51}w_{1}+ x_{52}w_{2}+ x_{53}w_{3} + b\ \\
    \end{array}
  \right)
  $$

### 2. PyTorch로 구현하기

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

torch.manual_seed(1) # 재실행결과를 동일하게 하기 위한 시드 고정

<torch._C.Generator at 0x7fe2c08ea3f0>

In [None]:
from os import W_OK
# 훈련 데이터 선언, 행렬 연산을 고려하여 구현
x_train = torch.FloatTensor([[73, 80, 75],
                             [93, 88, 93],
                             [89, 91, 80],
                             [96, 98, 100],
                             [73, 66, 70]]) # (5, 3) 
y_train = torch.FloatTensor([[152], [185], [180], [196], [142]]) # (5, 1)

# 가중치 w(3개 필요), 편향 b 선언
W = torch.zeros((3, 1), requires_grad=True) # 좌측 행렬의 열의 크기 = 우측 행렬의 행의 크기
b = torch.zeros(1, requires_grad=True)

# 가설, 비용 함수, 옵티마이저를 선언한 후에 경사 하강법을 1,000회 반복합니다.
optimizer = optim.SGD([W, b], lr=1e-5) # optimizer

nb_epochs = 1000
for epoch in range(nb_epochs+1):
  hypothesis = x_train.matmul(W) + b # 가설 H(x), matmul 행렬곱, 편향 b는 브로드캐스팅되어 더해짐
  cost = torch.mean((hypothesis - y_train)**2)# cost 계산, 평균 제곱 오차

  # cost로 H(x)개선
  optimizer.zero_grad() # gradient를 0으로 초기화
  cost.backward() # 비용 함수를 미분하여 gradient 계산
  optimizer.step() # W(w1, w2, w3)와b를 업데이트

  # 100번마다 로그 출력
  if epoch % 100 == 0:
      print('Epoch {:4d}/{} hypothesis: {} W: {} Cost: {:.6f}'.format(
          epoch, nb_epochs, hypothesis.squeeze().detach(), W.squeeze().detach(), cost.item()
      ))

Epoch    0/1000 hypothesis: tensor([0., 0., 0., 0., 0.]) W: tensor([0.2940, 0.2936, 0.2902]) Cost: 29661.800781
Epoch  100/1000 hypothesis: tensor([154.0433, 185.0925, 175.8312, 198.5701, 141.2221]) W: tensor([0.6882, 0.6809, 0.6577]) Cost: 5.754573
Epoch  200/1000 hypothesis: tensor([154.0278, 185.0649, 175.9335, 198.5128, 141.2284]) W: tensor([0.6974, 0.6837, 0.6455]) Cost: 5.512386
Epoch  300/1000 hypothesis: tensor([154.0120, 185.0385, 176.0329, 198.4569, 141.2353]) W: tensor([0.7065, 0.6863, 0.6336]) Cost: 5.281667
Epoch  400/1000 hypothesis: tensor([153.9960, 185.0133, 176.1295, 198.4022, 141.2426]) W: tensor([0.7155, 0.6888, 0.6221]) Cost: 5.061907
Epoch  500/1000 hypothesis: tensor([153.9797, 184.9892, 176.2233, 198.3488, 141.2504]) W: tensor([0.7243, 0.6911, 0.6108]) Cost: 4.852424
Epoch  600/1000 hypothesis: tensor([153.9632, 184.9662, 176.3143, 198.2966, 141.2586]) W: tensor([0.7330, 0.6932, 0.5999]) Cost: 4.652731
Epoch  700/1000 hypothesis: tensor([153.9465, 184.9442, 176.

## nn.Module로 다중선형 회귀 구현하기

nn.Linear()와 nn.functional.mse_loss()로 단순 선형 회귀를 구현할 때 처럼 다중 선형 회귀를 구현할 수 있다.

달라지는 점은 nn.Linear()의 입력 차원과 출력 차원이다.

(자세한 설명은 생략)

In [None]:
# 모델을 선언 및 초기화. 다중 선형 회귀이므로 input_dim=3, output_dim=1.
model = nn.Linear(3,1)