# Tensor 
## 준비 운동 : numpy를 사용한 신경망 구성


In [34]:
# -*- coding: utf-8 -*-

In [35]:
import numpy as np
import math

In [50]:

# 무작위로 입력과 출력 데이터를 생성합니다
x = np.linspace(-math.pi, math.pi, 2000)
y = np.sin(x)

# 무작위로 가중치를 초기화합니다
a = np.random.randn()
b = np.random.randn()
c = np.random.randn()
d = np.random.randn()

learning_rate = 1e-6
for t in range(10000):
    # 순전파 단계: 예측값 y를 계산합니다
    # y = a + b x + c x^2 + d x^3
    y_pred = a + b * x + c * x ** 2 + d * x ** 3

    # 손실(loss)을 계산하고 출력합니다
    loss = np.square(y_pred - y).sum()
    if t % 100 == 99:
        print(t, loss)

    # 손실에 따른 a, b, c, d의 변화도(gradient)를 계산하고 역전파합니다.
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()

    # 가중치를 갱신합니다.
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d

print(f'Result: y = {a} + {b} x + {c} x^2 + {d} x^3')


99 2723.0228651421253
199 1817.5730331481852
299 1214.756204251254
399 813.2495448539973
499 545.7053052303097
599 367.34243656211174
699 248.37443399983312
799 168.98110698489702
899 115.96870209968027
999 80.55082271311235
1099 56.873570526555895
1199 41.03499402909029
1299 30.432947268421067
1399 23.33120670525244
1499 18.570687346517943
1599 15.377154997397025
1699 13.233135227044366
1799 11.792547442667766
1899 10.823785567283188
1999 10.171746761020028
2099 9.732486998641882
2199 9.436295125049224
2299 9.236382435522241
2399 9.101320059429197
2499 9.00997901964166
2599 8.948142481730734
2699 8.906235977823387
2799 8.877805552270864
2899 8.85849659963829
2999 8.845368122707624
3099 8.836431856205717
3199 8.83034225494934
3299 8.826187778076585
3399 8.823350242971095
3499 8.821409959953424
3599 8.820081684173037
3699 8.819171330810482
3799 8.818546692773712
3899 8.81811761055977
3999 8.817822528949435
4099 8.817619373652509
4199 8.817479352920444
4299 8.817382741697052
4399 8.81731

# Pytorch를 통한 신경망 구성


In [40]:
import torch
import math

In [43]:
dtype = torch.float
device ='cuda' if torch.cuda.is_available() else 'cpu'



tensor([-3.1416, -3.1384, -3.1353,  ...,  3.1353,  3.1384,  3.1416],
       device='cuda:0')


In [52]:
x = torch.linspace(-math.pi, math.pi, 2000, device=device, dtype=dtype)
y = torch.sin(x)

# 무작위로 가중치를 초기화합니다
a = torch.randn((), device=device, dtype=dtype)
b = torch.randn((), device=device, dtype=dtype)
c = torch.randn((), device=device, dtype=dtype)
d = torch.randn((), device=device, dtype=dtype)

learning_rate = 1e-6
for t in range(2000):
    # 순전파 단계: 예측값 y를 계산합니다
    y_pred = a + b * x + c * x ** 2 + d * x ** 3

    # 손실(loss)을 계산하고 출력합니다
    loss = (y_pred - y).pow(2).sum().item()
    if t % 100 == 99:
        print(t, loss)

    # 손실에 따른 a, b, c, d의 변화도(gradient)를 계산하고 역전파합니다.
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()

    # 가중치를 갱신합니다.
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d


print(f'Result: y = {a.item()} + {b.item()} x + {c.item()} x^2 + {d.item()} x^3')

99 4139.5185546875
199 2819.70263671875
299 1923.748291015625
399 1314.858642578125
499 900.5971069335938
599 618.4334716796875
699 426.0282287597656
799 294.67730712890625
899 204.90383911132812
999 143.47671508789062
1099 101.39714050292969
1199 72.5380859375
1299 52.723487854003906
1399 39.10346221923828
1499 29.730819702148438
1599 23.273841857910156
1699 18.820777893066406
1799 15.746333122253418
1899 13.62146282196045
1999 12.151385307312012
Result: y = -0.05185488611459732 + 0.8864530920982361 x + 0.008945831097662449 x^2 + -0.0975566953420639 x^3


# AutoGrad를 사용한 역전파 단계

In [53]:
# -*- coding: utf-8 -*-
import torch
import math

dtype = torch.float
device = 'cuda' if torch.cuda.is_available() else 'cpu'

In [57]:
x = torch.linspace (-torch.pi, torch.pi,2000,device=device , dtype=dtype)
y= torch.sin(x)

a = torch.randn((), device=device, dtype=dtype,requires_grad=True)
b = torch.randn((), device=device, dtype=dtype,requires_grad=True)
c = torch.randn((), device=device, dtype=dtype,requires_grad=True)
d = torch.randn((), device=device, dtype=dtype,requires_grad=True)

learning_rate = 1e-6

for t in range(2000):
    # 3차 다항식에는 가중치 4개
    y_pred = a + b * x + c * x ** 2 + d * x ** 3

    loss = (y_pred - y).pow(2).sum()
    if t % 100 == 99:
        print(t, loss.item())
    # autograd를 사용하여 역전파 단계를 계산합니다.
    # 모든 텐서들에 대한 손실의 변화도를 계산 
    loss.backward()
    # 경사 하강법을 사용하여 가중치를 직접 갱신
    # torch.no_grad() : 가중치들이 requires_grad = True 지만 autograd에서는 이를 추적하지 않게하기 위해서
    with torch.no_grad():
        a -= learning_rate * grad_a
        b -= learning_rate * grad_b
        c -= learning_rate * grad_c
        d -= learning_rate * grad_d

        # 가중치 갱신 후에는 변화도를 직접 0으로 만듬
        a.grad =None
        b.grad =None
        c.grad =None
        d.grad =None

print(f'Result: y = {a.item()} + {b.item()} x + {c.item()} x^2 + {d.item()} x^3')

99 1923612.0
199 1923637.5
299 1923663.125
399 1923689.0
499 1923715.25
599 1923741.625
699 1923768.375
799 1923795.25
899 1923822.125
999 1923849.375
1099 1923877.0
1199 1923904.75
1299 1923932.625
1399 1923960.75
1499 1923989.25
1599 1924017.75
1699 1924046.5
1799 1924075.75
1899 1924105.0
1999 1924134.5
Result: y = 1.4728765487670898 + -0.6047661304473877 x + -1.081460952758789 x^2 + -2.5073742866516113 x^3


# Pytorch nn Module  (keras 와 유사함)

## 연산 그래프와 autograd는 복잡한 연산자를 정의하고 도함수를 자동으로 계산하는 매우 강력한 패러다임
## 하지만 대규모 신경망에서는 autograd 만으로는 매우 저수준

## 파이토치에서 nn 패키지는 layer와 거의 비슷한 Module의 집합을 정의
## Module은 입력 텐서를 받고 출력 텐서를 계산하는 한편, 학습 가능한 매개변수를 갖는 텐서들을 내부 상태로 갖음
## nn 패키지는 또한 신경망을 학습시킬 때 주로 사용하는 유용한 loss function 제공

In [70]:
import torch
import math

x = torch.linspace (-torch.pi, torch.pi, 2000 )
y = torch.sin(x)


p=torch.tensor([1,2,3])
# unsqueeze : 1인 차원을 생성하는 함수
# (2000, 1)의 shape를, p는 (3, )의 shape를 가지므로 이 경우 broadcast를 적용하여 (2000,3)의 shpae를 갖는 tensor를 얻음
xx = x.unsqueeze(-1).pow(p)
print("xx: ", xx)

# nn 패키지를 사용하여 모델을 순차적 계층으로 정의
# nn.Sequential은 다른 Module을 포함하는 Module로, 포함되는 Module들을 순차적으로 적용하여 출력을 생성
model = torch.nn.Sequential(
    torch.nn.Linear(3,1),
    torch.nn.Flatten(0,1)
)

# MSE ; Mean Squared Error 평균 제곱 오차 
loss_fn  = torch.nn.MSELoss(reduction='sum')

learning_rate = 1e-3

optimizer = torch.optim.Adam(model.parameters(), lr = learning_rate)

for t in range(2000):
    y_pred = model(xx)

    loss = loss_fn(y_pred,y)

    if t% 100 ==99:
        print(t, loss.item())

    model.zero_grad()

    loss.backward()


    
    optimizer.step()

    with torch.no_grad():
        for param in model.parameters():
            param -= learning_rate * param.grad

    
linear_layer = model[0]

print(f'Result: y = {linear_layer.bias.item()} + {linear_layer.weight[:, 0].item()} x + {linear_layer.weight[:, 1].item()} x^2 + {linear_layer.weight[:, 2].item()} x^3')


xx:  tensor([[ -3.1416,   9.8696, -31.0063],
        [ -3.1384,   9.8499, -30.9133],
        [ -3.1353,   9.8301, -30.8205],
        ...,
        [  3.1353,   9.8301,  30.8205],
        [  3.1384,   9.8499,  30.9133],
        [  3.1416,   9.8696,  31.0063]])
99 nan
199 nan
299 nan
399 nan
499 nan
599 nan
699 nan
799 nan
899 nan
999 nan
1099 nan
1199 nan
1299 nan
1399 nan
1499 nan
1599 nan
1699 nan
1799 nan
1899 nan
1999 nan
Result: y = nan + nan x + nan x^2 + nan x^3
