# **선형회귀**

어떤 학생이 1명 있는데 
시험공부를 1시간을 했더니 50점을 맞았다.

학습 데이터셋 : 예측을 위해 사용하는 데이터셋
* 2시간을 공부했더니 70점을 맞았다.
* 3시간을 공부했더니 90점을 맞았다.
* 4시간을 공부했더니 85점을 맞았다.

5시간을 공부했을 때 몇 점을 맞을 수 있을까? : 예측값

In [1]:
# 파이토치를 사용하기 위한 라이브러리를 import 한다.
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
# 학습 데이터셋을 생성한다.
x_train = torch.FloatTensor([[1], [2], [3], [4]]) # 공부한 시간을 xtrain 에 저장
y_train = torch.FloatTensor([[50], [70], [90], [85]]) # 공부한 시간에 대응하는 시험의 성적을 저장

* y = Wx + b,  W(weight) : 기울기, b(bias) : 가중치
* 비용함수(cost function) = 손실함수(loss function) = 오차함수(error function) : 예측한 값과 실제값의 차이

```
y = 20x + 15 일 때
시간   :  1   2   3   4  
실제값 :  50  70  90  85 
예측값 :  35  55  75  95
ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
오차   :  15  15  15 -10

```
만약 오차값이 +30 +30 -30 -30 일 경우, 오차를 모두 더했을 때 0 이 되기 때문에 오차의 크기를 측정할 수 없다. 

따라서, 오차를 그냥 계산하지 않고 제곱하여 평균을 내어준다. 
> mse(Mean Squared Error) : 평균 제곱 오차


이 과정에서
* 옵티마이저 : 비용함수의 값을 최소로 하는 기울기:W 와 절편:b 를 찾는 *최적화 알고리즘
* 학습 : 옵티마이저를 통해 최적의 W 와 b 를 찾아내는 과정

옵티마이저를 통한 학습을 통해 비용함수를 최소로 하는 y = Wx + b 를 찾아낸다.

### **1. 경사하강법**
경사하강법 (Gradient Descent) : 가장 기본적인 옵티마이저 알고리즘으로, 큰 기울기에서부터 기울기를 하강하며 최적의 W 를 찾는다. 
* 비용함수는 y = x^2 의 값을 갖는다.
* 비용함수를 미분한 값이 0이 될 때(접선의 기울기가 0일 때) 가 최적의 W값이다. 
* 현재 비용함수를 미분한 후 접선의 기울기W 를 구하여, 접선의 기울기가 낮은 방향으로 W 의 값을 업데이트 하는 과정을 반복한다.
* 경사하강법에 MSE 가 가장 잘 어울리기 때문에 MSE 를 오차함수로 사용한다.
> 현재 가장 많이 사용되는 빅데이터 학습 알고리즘(옵티마이저)이다.

학습률(Learning rate) : 기울기의 값을 변경할 때 변경할 기울기의 크기를 결정한다.

In [3]:
# python 코드를 재실행하더라도 같은 랜덤 결과가 나오도록 만들어주는 함수 (시드값을 생성)
torch.manual_seed(10)

<torch._C.Generator at 0x7faffab43690>

In [4]:
# x_train 과 y_train 의 shape 를 출력
print(f'x_train : {x_train.shape}, y_train : {y_train.shape}')

x_train : torch.Size([4, 1]), y_train : torch.Size([4, 1])


In [5]:
# 가중치와 bias 를 0 으로 초기화
W = torch.zeros(1, requires_grad=True) 
# requires_grad=True : 학습을 통해 계속 값이 변경되는 변수값임을 선언하는 옵션
print(W)

b = torch.zeros(1, requires_grad=True)
print(b)
# 현재 가설 
H = x_train * W + b

tensor([0.], requires_grad=True)
tensor([0.], requires_grad=True)


In [6]:
# 비용함수 선언
cost = torch.mean((H - y_train) ** 2) # 결과값 (H - 점수)^2
print(cost)

tensor(5681.2500, grad_fn=<MeanBackward0>)


In [7]:
# 경사하강법 옵티마이저를 사용
optimizer = optim.SGD([W, b], lr=0.01) # 옵티마이저 SGD(경사하강법), 파라미터(가중치, bias), 학습률(0.01)

In [8]:
optimizer.zero_grad() # 현재 접선의 기울기(gradient)를 0으로 초기화한다.
cost.backward() # 비용함수를 미분하여 기울기를 계산한다.
optimizer.step() # W 와 b 를 업데이트하여 접선의 기울기(gradient)를 계산한다.

In [9]:
# ****
# 총 epoch 를 2000번, 100 번 마다 로그를 출력하는 함수를 작성

# 데이터
x_train = torch.FloatTensor([[1], [2], [3], [4]])
y_train = torch.FloatTensor([[50], [70], [90], [85]]) 

# W, b 초기화
W = torch.zeros(1, requires_grad=True) 
b = torch.zeros(1, requires_grad=True)

# 옵티마이저 설정
optimizer = optim.SGD([W, b], lr=0.01)

# 에폭 설정
for epoch in range(1, 2001) : 
 
  # gradient 와 cost 를 계산
  H = x_train * W + b
  cost = torch.mean((H - y_train) ** 2)

  # 옵티마이저를 통해 접선의 기울기를 업데이트
  optimizer.zero_grad()
  cost.backward()
  optimizer.step()

  # 출력
  if epoch % 100 == 0 : # 100 번 마다
    print(f'Epoch {epoch:4d}/{2000} \nW : {W.item():.3f}, b : {b.item():.3f}, Cost : {cost:.6f}')

# epoch : 전체 훈련 데이터가 학습에 한 번 사용된 주기 (모든 학습 데이터를 사용하여 학습한 횟수)

Epoch  100/2000 
W : 21.140, b : 17.099, Cost : 155.283264
Epoch  200/2000 
W : 18.901, b : 23.679, Cost : 106.389832
Epoch  300/2000 
W : 17.243, b : 28.555, Cost : 79.547897
Epoch  400/2000 
W : 16.014, b : 32.168, Cost : 64.812042
Epoch  500/2000 
W : 15.104, b : 34.844, Cost : 56.722210
Epoch  600/2000 
W : 14.429, b : 36.828, Cost : 52.280975
Epoch  700/2000 
W : 13.929, b : 38.297, Cost : 49.842865
Epoch  800/2000 
W : 13.559, b : 39.386, Cost : 48.504280
Epoch  900/2000 
W : 13.285, b : 40.193, Cost : 47.769455
Epoch 1000/2000 
W : 13.081, b : 40.790, Cost : 47.366051
Epoch 1100/2000 
W : 12.931, b : 41.233, Cost : 47.144569
Epoch 1200/2000 
W : 12.819, b : 41.561, Cost : 47.023003
Epoch 1300/2000 
W : 12.737, b : 41.805, Cost : 46.956245
Epoch 1400/2000 
W : 12.675, b : 41.985, Cost : 46.919601
Epoch 1500/2000 
W : 12.630, b : 42.118, Cost : 46.899479
Epoch 1600/2000 
W : 12.596, b : 42.217, Cost : 46.888451
Epoch 1700/2000 
W : 12.571, b : 42.290, Cost : 46.882359
Epoch 1800/2