# Part 1.2. Linear Regression

In [0]:
import torch

## 1. Data Definition
시간에 따른 내 점수는 어떨까에 대해 한 번 예측해보자. 이 때 시간(입력)이 `x`이며, 점수(출력)가 `y`이다.

![2-1.png](img/2-1.png)

In [0]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

## 2. Hypothesis
시간과 점수의 관계가 $y = Wx + b$로 표현된다고 할 때 $W$는 `weight`, $b$는 `bias`라고 한다. 학습하기 전에 다음을 꼭 해줘야 한다.
* `weight`와 `bias`를 0으로 초기화
* `requires_grad=True`로 하여 해당 매개변수는 **꼭 학습을 해야함**을 표시

In [6]:
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)
hypothesis = x_train * W + b

print(hypothesis)

tensor([[0.],
        [0.],
        [0.]], grad_fn=<AddBackward0>)


## 3. Training

### 3.1. Compute Loss
MSE(Mean Squared Error)를 통해 실제값($y^i$)과 예측값($H(x^i)$) 간의 오차 제곱의 평균을 구한다.

$$cost(W, b) = \frac{1}{m} \sum_{i=1}^m (H(x^i) - y^i)^2$$

In [7]:
cost = torch.mean((hypothesis - y_train) ** 2)

print(cost)

tensor(18.6667, grad_fn=<MeanBackward0>)


### 3.2. Gradient Descent
`torch.optim` 라이브러리를 사용해 경사하강법(Gradient Descent)로 매개변수 $W$와 $b$를 업데이트 시켜준다. 다음 과정은 경사하강법 시 꼭 거쳐가는 과정이다.
* `zero_grad()` : 기울기를 초기화
* `backward()` : 기울기를 계산
* `step()` : 매개변수를 업데이트

In [0]:
optimizer = torch.optim.SGD([W, b], lr=0.01)

optimizer.zero_grad()
cost.backward()
optimizer.step()

### 3.3. Iteration Training
위의 과정을 반복하면서 매개변수를 업데이트 시킨다.

In [0]:
nb_epochs = 1000
for epoch in range(1, nb_epochs+1):
  hypothesis = x_train * W + b
  cost = torch.mean((hypothesis - y_train) ** 2)

  optimizer.zero_grad()
  cost.backward()
  optimizer.step()

In [11]:
print(W, b)
print(W*7 + b)

tensor([1.9709], requires_grad=True) tensor([0.0663], requires_grad=True)
tensor([13.8622], grad_fn=<AddBackward0>)
