
# 이론
머신러닝 기술들은 아래 세 가지 작업 중 하나에 해당된다.
- 지도 학습: 레이블이 존재. 분류, 회귀.
- 비지도 학습: 레이블이 없음. 주로 데이터를 그룹화.
- 강화 학습: 보상 시스템
#### 선형 회귀
데이터와 레이블의 관계를 선형으로 가정하고 문제 해결.   
가설: 머신러닝에서 데이터와 레이블 사이의 관계에 대해 가정한 사실들.   
선형 회귀에서는 **y=Wx+b**와 같은 가설을 수립한다.
- W: 가중치(weight)
- b: 편향(bias)   

**선형 회귀의 목표는, 최적의 W, b를 찾아내는 것이다.**   
MSE, Mean Squred Error는 가장 간단하고 널리 쓰이는 손실 함수이다.   
**경사하강법**이라는 최적화 기법을 주로 활용한다. 이는 W, b 값을 조금씩 변경하며 손실이 더 적은 값을 찾아가는 방식이다. 변경 방향은 미분을 통해 알 수 있으며, **학습률**을 통해 한번에 변경하는 값의 양을 결정한다.

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as f
import torch.optim as optim

x_train = torch.FloatTensor([[1], [2], [3]]).view(-1, 1)
y_train = torch.FloatTensor([[2], [4], [6]]).view(-1, 1)

데이터셋을 생성한다.   
토치에서 데이터셋을 나타내는 텐서는, 첫번째 차원을 데이터의 순번을 나타내기 위한 차원으로 사용한다.

In [None]:
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)
#가설 수립
hypo = x_train * W + b
print(hypo)

가중치와 편향을 생성한다.
- requires_grad=True 옵션으로 autograd를 위한 변수임을 나타낸다.
  - False로 입력하면 손수 미분값을 다뤄야한다.

In [2]:
#비용함수 선언
cost = torch.mean((hypo - y_train) ** 2)
print (cost)

tensor(18.6667, grad_fn=<MeanBackward0>)


In [None]:
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)
optimizer = optim.SGD([W, b], lr=0.01)
nb_epochs = 1000

for e in range(nb_epochs + 1):
  hypo = x_train * W + b
  cost = torch.mean((hypo - y_train) ** 2)

  optimizer.zero_grad()
  cost.backward()
  optimizer.step()

  if e % 100 == 0:
    print('Epoch {:4d}/{} W: {:.3f} b: {:.3f} Cost: {:.6f}'.format(e, nb_epochs, W.item(), b.item(), cost.item()))

경사하강법과 학습 진행 코드의 구현이다.
- 경사하강법은 optim.SGD를 활용한다.
- 학습률은 0.01이다.   

주어진 손실함수에 대한 미분값을 구하는 과정은 .backword()로 이루어지며 step()을 통해 W, b값이 조금씩 바뀌게 된다.