## numpy로 해보는 예제

In [5]:
# -*- coding: utf-8 -*-
import numpy as np
import math

# 무작위 입력값과 결과값 생겅하기
x = np.linspace(-math.pi, math.pi, 2000)
y = np.sin(x)

# 가중치 무작위로 초기화하기
a = np.random.randn()
b = np.random.randn()
c = np.random.randn()
d = np.random.randn()

learning_rate = 1e-6
for t in range(2000):
    # 순전파 : 예측된 y 계산하기
    # y = a + b x + x^2 + d x^3
    y_pred = a + b * x + c * x ** 2 + d * x ** 3
    
    # 손실 계산하고 추력하기
    loss = np.square(y_pred - y).sum()
    if t % 100 == 99:
        print(t, loss)
        
    # 손실에 대한 a, b, c, d의 변화도를 계산하기 위한 역전파
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()
    
    # 가중치 갱신하기
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d
    
print(f'Result: y = {a} + {b} x + {c} x^2 + {d} x^3')

99 18.282095936890578
199 15.116185333405806
299 13.011354731451542
399 11.611068330803906
499 10.679137168216949
599 10.058657607965193
699 9.645365008323594
799 9.369951979794374
899 9.186332562902013
999 9.063850941819748
1099 8.982107537684339
1199 8.927522252208611
1299 8.891050936500744
1399 8.866667638921374
1499 8.850355495073135
1599 8.839435564284436
1699 8.832120270319798
1799 8.827216166305806
1899 8.823926009718896
1999 8.821716909103438
Result: y = -0.0011767703999088347 + 0.8585108731851401 x + 0.00020301247552825217 x^2 + -0.09358216041038138 x^3


In [6]:
# -*- coding: utf-8 -*-

import torch
import numpy
import math

dtype = torch.float
device = torch.device("cpu")

# 무작위 입력과 출력 데이터 생성하기
a = torch.randn((), device=device, dtype=dtype)
b = torch.randn((), device=device, dtype=dtype)
c = torch.randn((), device=device, dtype=dtype)
d = torch.randn((), device=device, dtype=dtype)

learning_rate = 1e-6
for t in range(2000):
    # 순전파 : 예측된 y 계산하기
    y_pred = a + b * x + c * x ** 2 + d * x ** 3
    
    # 손실을 계산하고 추력하기
    loss = (y_pred - y).pow(2).sum().item()
    if t % 100 == 99:
        print(t, loss)
        
    # 손실에 대한 a, b, c, d의 변화도를 계산하기 위한 역전파
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()
    
    # 경사 하강법을 사용해서 가중치 갱신하기
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d
    
print(f'Result: y = {a.item()} + {b.item()} x + {c.item()} x^2 + {d.item()} x^3')

99 514.7458326362853
199 358.9427324918988
299 251.36324143264983
399 177.00298826590648
499 125.5514041638483
599 89.91473573839187
699 65.20793329477203
799 48.062169222691146
899 36.15249675393885
999 27.872482902954758
1099 22.110846970320942
1199 18.098258344314083
1299 15.30150549876831
1399 13.350634420374654
1499 11.988803181468679
1599 11.037457029378015
1699 10.372412485792532
1799 9.90718808410562
1899 9.581549339353684
1999 9.353474361307548
Result: y = 0.022961338981986046 + 0.8646226525306702 x + -0.00396121246740222 x^2 + -0.09445150941610336 x^3


# 자동 미분

In [8]:
# -*- coding: utf-8 -*-
import torch
import math

dtype = torch.float
device = torch.device("cpu")
# device = torch.device("cuda:0")  # Uncomment this to run on GPU

# 입력과 추력을 갖기 위한 Tensor 생성하기
# 기본값으로 requires_grad=False를 합니다.
# 이는 역전파 동안 Tensor에 관한 변화도를 계산하지 않는다는 의미입니다.
x = torch.linspace(-math.pi, math.pi, 2000, device=device, dtype=dtype)
y = torch.sin(x)

# 가중치에 대한 무작위 Tensor를 생성합니다.
# 3차 polynomial에서 4개의 가중치가 필요합니다.
# y = a + b x + c x^2 + d x^3
# 역전파 동안 Tensor에 대한 변화도를 계산하는 것을 나타내는
# requires_grad=True로 설정합니다.
a = torch.randn((), device=device, dtype=dtype, requires_grad=True)
b = torch.randn((), device=device, dtype=dtype, requires_grad=True)
c = torch.randn((), device=device, dtype=dtype, requires_grad=True)
d = torch.randn((), device=device, dtype=dtype, requires_grad=True)

learning_rate = 1e-6
for t in range(2000):
    # 순전파 : Tensor 연산을 사용해서 Y를 예측합니다.
    y_pred = a + b * x + c * x ** 2 + d * x ** 3
    
    # Tensor 연산을 사용해서 손실을 계산하고 출력합니다.
    # 이제 손실은 (1,) 형태의 Tensor입니다.
    # loss.item()은 손실이 갖고 있는 scalar 값을 얻습니다.
    loss = (y_pred - y).pow(2).sum()
    if t % 100 == 99:
        print(t, loss.item())
        
    # 역전파를 계산하기 위해 자동미분을 사용합니다.
    # 이는 requires_grad=True인 모든 Tensor에 대한 변화도를 계산합니다.
    # 이것을 호출한 뒤에 a.grad, b.grad, c.grad, d.grad는 각각의 a,b,c,d에 대한
    # 손실의 변화도를 갖고 있는 Tensor입니다.
    loss.backward()
    
    # 경사 하강법을 사용해서 수동으로 가중치를 갱신합니다.
    # torch.no_grad()로 감싸는 이유는 가중치는 requires_True를 갖고 있지만,
    # 자동미분은 이것을 추적할 필요가 없기 때문입니다.
    with torch.no_grad():
        a -= learning_rate * a.grad
        b -= learning_rate * b.grad
        c -= learning_rate * c.grad
        d -= learning_rate * d.grad
        
        # 가중치를 갱신한 후에 수동으로 변화도를 0으로 만듭니다.
        a.grad.zero_()
        b.grad.zero_()
        c.grad.zero_()
        d.grad.zero_()
        
print(f'Result: y = {a.item()} + {b.item()} x + {c.item()} x^2 + {d.item()} x^3')

99 4321.177734375
199 2873.645751953125
299 1912.5865478515625
399 1274.3370361328125
499 850.3496704101562
599 568.6118774414062
699 381.3389587402344
799 256.8153991699219
899 173.98658752441406
999 118.87081909179688
1099 82.18128967285156
1199 57.74747848510742
1299 41.468318939208984
1399 30.617164611816406
1499 23.380714416503906
1599 18.552227020263672
1699 15.328710556030273
1799 13.175467491149902
1899 11.736275672912598
1999 10.773741722106934
Result: y = -0.02120058424770832 + 0.8184030652046204 x + 0.0036574529949575663 x^2 + -0.08787716925144196 x^3
