# Lab-02 Linear regression

### Compute Hypothesis

선형회귀는 학습데이터와 가장 잘 맞는 하나의 직선을 만드는 것이므로 $y=Wx+b$ 라는 식을 통해 Hypothesis식을 나타낼 수 있다.

(x는 input, y는 output을 뜻한다)


In [1]:
# torch와 torch에서 optimizer가 내장되어있는 optim을 부른다.
import torch
from torch import optim

In [3]:
# data와 label을 불러온다.
x_train = torch.FloatTensor([[1],[2],[3]])
y_train = torch.FloatTensor([[2],[4],[6]])

# Weight와 Bias를 초기화 하고 requires_grad = True로 해준다.
# 학습을 할 것이라는 뜻
W = torch.zeros(1, requires_grad = True)
b = torch.zeros(1, requires_grad = True)

# hypothesis를 이렇게 쉽게 표현할 수 있다.
hypothesis = x_train * W + b


### Compute loss

Linear regression에서는 loss값을 Mean Squared Error(MSE)를 사용하여 계산하게 되며,
MSE는 단순히 hypothesis와 real target값의 차이의 제곱의 평균이다. 

식으로 보면 $$Cost(W,b) = \frac{1}{m}\sum_{i=1}^{m}\left( H(x^{(i)})-y^{(i)} \right)^{2}$$ 이러하다. $m$은 data의 갯수, $H(x)$는 위의 hypothesis 값을 의미한다.


In [4]:
cost = torch.mean((hypothesis - y_train)**2)

### Stochastic Gradient Descent(SGD)

이후 Stochastic Gradient Descent(SGD)를 이용하여 최적화를 해줍니다.
Gradient Descent의 cost가 최소값을 가지게 하는 $W$와 $b$를 찾는 것이 목적이다. 

그렇기 때문에 미분을 통해 최소값을 향해 움직이게 된다. 식은 다음과 같다. $$ cost(W) = \frac{1}{m}\sum_{i=1}^{m}\left(Wx^{(i)}-y^{(i)}\right)^2 $$
$$ \nabla W= \frac{\partial cost}{\partial W} = \frac{2}{m}\sum_{i=1}^{m}\left(Wx^{(i)}-y^{(i)}\right)x^{(i)}$$
$$ W : = W-\alpha\nabla W$$ 여기서 $\alpha$는 learning rate를 뜻한다.

In [5]:
optimizer = optim.SGD([W, b], lr = 0.01)
optimizer.zero_grad() ## gradient를 0 으로 초기화
cost.backward() ## gradient 계산
optimizer.step() ## gradient descent

### 이를 한번에 한 코드 입니다.

In [9]:
x_train = torch.FloatTensor([[1],[2],[3]])
y_train = torch.FloatTensor([[2],[4],[6]])

W = torch.zeros(1, requires_grad = True)
b = torch.zeros(1, requires_grad = True)

optimizer = optim.SGD([W, b], lr = 0.01)

epochs = 1000
for epoch in range(1,epochs+1):
    hypothesis = x_train * W + b
    cost = torch.mean((hypothesis - y_train)**2)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch %100 ==0:
        print('Epoch {:4d}/{}, W: {:.3f}, Cost:{:.6f}'.format(
        epoch,epochs,W.item(),cost.item()))

Epoch  100/1000, W: 1.745, Cost:0.048403
Epoch  200/1000, W: 1.800, Cost:0.029910
Epoch  300/1000, W: 1.842, Cost:0.018483
Epoch  400/1000, W: 1.876, Cost:0.011421
Epoch  500/1000, W: 1.903, Cost:0.007058
Epoch  600/1000, W: 1.923, Cost:0.004361
Epoch  700/1000, W: 1.940, Cost:0.002695
Epoch  800/1000, W: 1.953, Cost:0.001665
Epoch  900/1000, W: 1.963, Cost:0.001029
Epoch 1000/1000, W: 1.971, Cost:0.000636
