# Part 1.3. Deep Look at GD

In [0]:
import torch

## 1. Gradient Descent
cost function이 모델의 성능을 나타내는 지표이다. 해당 지표가 작을수록 즉, 에러가 작을수록 모델의 성능은 좋다고 할 수 있다. 그럼 이것을 가지고 어떻게 매개변수를 업데이트 할까?

바로 cost function에 대한 각 매개변수의 기울기를 가지고 매개변수를 업데이트한다. 왜냐하면 해당 기울기는 cost function이 작아지는 쪽 방향을 가리키기 때문이다.

$$cost(W) = \frac{1}{m}\sum_{i=1}^m(Wx^i-y^i)^2$$
$$\triangledown W=\frac{\partial cost}{\partial W} = \frac{2}{m}\sum_{i=1}^m(Wx^i-y^i)x^i$$
$$W := W - \alpha\triangledown W$$

In [2]:
# 데이터
x_train = torch.FloatTensor([[1],[2],[3]])
y_train = torch.FloatTensor([[1],[2],[3]])

# 매개변수 초기화
W = torch.zeros(1)

# 하이퍼 파라미터 설정
lr = 0.1
nb_epochs = 10

# 학습
for epoch in range(nb_epochs+1):
  hypothesis = x_train * W
  cost = torch.mean((hypothesis - y_train) ** 2)
  gradient = torch.sum((W*x_train - y_train) * x_train)

  print("Epoch {:4d}/{} W: {:.3f}, Cost: {:.6f}".format(epoch, nb_epochs, W.item(), cost.item()))

  # 매개변수 업데이트
  W -= lr*gradient

Epoch    0/10 W: 0.000, Cost: 4.666667
Epoch    1/10 W: 1.400, Cost: 0.746666
Epoch    2/10 W: 0.840, Cost: 0.119467
Epoch    3/10 W: 1.064, Cost: 0.019115
Epoch    4/10 W: 0.974, Cost: 0.003058
Epoch    5/10 W: 1.010, Cost: 0.000489
Epoch    6/10 W: 0.996, Cost: 0.000078
Epoch    7/10 W: 1.002, Cost: 0.000013
Epoch    8/10 W: 0.999, Cost: 0.000002
Epoch    9/10 W: 1.000, Cost: 0.000000
Epoch   10/10 W: 1.000, Cost: 0.000000


## 2. Pytorch Gradient Descent
Pytorch에서는 경사하강법 알고리즘을 `optim`이라는 라이브러리에서 제공하고 있다. 꼭 다음과 같은 순서로 경사하강법을 해야 한다.
* `optimizer` 정의
* `optimizer.zero_grad()`로 기울기 0으로 초기화
* `cost.backward()`로 기울기 계산
* `optimizer.step()`로 매개변수 업데이트

In [4]:
# 데이터
x_train = torch.FloatTensor([[1],[2],[3]])
y_train = torch.FloatTensor([[1],[2],[3]])

# 매개변수 초기화
W = torch.zeros(1, requires_grad=True)

# optimizer 정의
optimizer = torch.optim.SGD([W], lr=0.15)

# 하이퍼 파라미터 설정
nb_epochs = 10

# 학습
for epoch in range(nb_epochs+1):
  hypothesis = x_train * W
  cost = torch.mean((hypothesis - y_train) ** 2)
  gradient = torch.sum((W*x_train - y_train) * x_train)

  print("Epoch {:4d}/{} W: {:.3f}, Cost: {:.6f}".format(epoch, nb_epochs, W.item(), cost.item()))

  # 매개변수 업데이트
  optimizer.zero_grad()
  cost.backward()
  optimizer.step()

Epoch    0/10 W: 0.000, Cost: 4.666667
Epoch    1/10 W: 1.400, Cost: 0.746667
Epoch    2/10 W: 0.840, Cost: 0.119467
Epoch    3/10 W: 1.064, Cost: 0.019115
Epoch    4/10 W: 0.974, Cost: 0.003058
Epoch    5/10 W: 1.010, Cost: 0.000489
Epoch    6/10 W: 0.996, Cost: 0.000078
Epoch    7/10 W: 1.002, Cost: 0.000013
Epoch    8/10 W: 0.999, Cost: 0.000002
Epoch    9/10 W: 1.000, Cost: 0.000000
Epoch   10/10 W: 1.000, Cost: 0.000000
