# ▼ 주제
- Data definition
- Hypothesis
- Compute loss
- Gradient descent

## Data definition
- 학습시키기 위한 데이터는 torch.tensor의 형태
- 입력과 출력을 각기 다른 tensor에 저장
    - 입력: x_train
    - 출력: y_train
    - 입출력은 x, y로 구분

In [1]:
import torch
from torch import optim

x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])
print(x_train)
print(y_train)

tensor([[1.],
        [2.],
        [3.]])
tensor([[2.],
        [4.],
        [6.]])


## Hypothesis

- Linear regression: 학습 데이터와 가장 잘 맞는 하나의 직선을 찾는 것


- y = Wx + b
    - W: Weight
    - b: Bias
    
- Weight와 Bias를 0으로 초기화
    - 즉, 처음에 어떤 입력을 받아도 항상 출력 0을 예측함
- requires_grad=True
    - W와 b를 학습시키는 것이 우리의 목표
    - PyTorch에게 W와 b를 학습시킬 것이라고 명시

In [2]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [3]:
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)
hypothesis = x_train * W + b

## Compute loss

- Linear regression 에서는 **Mean Squared Error(MSE)** 함수로 loss를 계산
    - cost(W, b)
- torch.mean 으로 평균을 계산



- 학습을 하려면, 우선 우리의 모델이 얼마나 정답과 가까운지 알아야 함
    - 이 숫자를 **cost** 또는 **loss**라고 부름


In [4]:
cost = torch.mean((hypothesis - y_train) ** 2)

## Gradient descent
- torch.optim 라이브러리 사용
    - [W, b]: 학습할 tensor들
    - lr=0.01: learning rate
    
    ㅡ
- 항상 붙어 다니는 3줄
    - zero_grad():  gradient 초기화
    - backward(): gradient 계산
    - step(): 계산된 gradient를 이용해 방향대로 W와 b 개선

In [5]:
optimizer = optim.SGD([W, b], lr=0.01)

optimizer.zero_grad()
cost.backward()
optimizer.step()

## Full training code


- 한 번만
    - 1. 데이터 정의
    - 2. Hypothesis 초기화
    - 3. Optimizer 정의
    
    
- 반복
    - 1. Hypothesis 예측
    - 2. Cost 계산
    - 3. Optimizer로 학습

In [6]:
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)

optimizer = optim.SGD([W, b], lr=0.01)

nb_epochs = 1000
for epoch in range(1, nb_epochs + 1):
    hypothesis = x_train * W + b
    cost = torch.mean((hypothesis - y_train) ** 2)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()