In [3]:
import torch
import numpy as np
import matplotlib.pyplot as plt

# get_data() 
- param in : None 
- param out (=return) : train data의 x, y  (input x, GT y)
- description
    - 학습 데이터를 가지고 오는 함수
    - np.array를 사용해서 tensor로 변경한 후 return

In [8]:
def get_data():
    train_x = np.array([3.3, 4.4, 5.5, 6.71, 6.93, 4.168, 9.779, 6.182, 7.59, 2.167,
                         7.042, 10.791, 5.313, 7.997, 5.654, 9.27, 3.1])
    train_y = np.array([1.7, 2.76, 2.09, 3.19, 1.694, 1.573, 3.366, 2.596, 2.53, 1.221,
                         2.827, 3.465, 1.65, 2.904, 2.42, 2.94, 1.3])
    
    x = torch.from_numpy(train_x).view(17, 1)  # shape [17] -> [17, 1] : elementwise 연산 가능하도록 하기 위해
    y = torch.from_numpy(train_y)
    
    return x, y

In [9]:
get_data()

(tensor([[ 3.3000],
         [ 4.4000],
         [ 5.5000],
         [ 6.7100],
         [ 6.9300],
         [ 4.1680],
         [ 9.7790],
         [ 6.1820],
         [ 7.5900],
         [ 2.1670],
         [ 7.0420],
         [10.7910],
         [ 5.3130],
         [ 7.9970],
         [ 5.6540],
         [ 9.2700],
         [ 3.1000]], dtype=torch.float64),
 tensor([1.7000, 2.7600, 2.0900, 3.1900, 1.6940, 1.5730, 3.3660, 2.5960, 2.5300,
         1.2210, 2.8270, 3.4650, 1.6500, 2.9040, 2.4200, 2.9400, 1.3000],
        dtype=torch.float64))

# get_weights()
- param in : None
- param out : random weight and bias values
- desctription
    - weight, bias는 random normal한 값으로 셋팅 = ```randn()```
    - randn() VS rand()
        - randn() : 정규분포를 기준으로 랜덤한 값 생성
        - rand() : 0~1 사이의 랜덤한 값을 반환(균등하게 나누어서 반환)
    - w, b는 항상 미분되어야 하므로(=최적값을 찾기 위해, loss,cost,error값을 최소화) ```requires_grad=True```로 셋팅

In [10]:
def get_weights():
    w = torch.randn(1)  # -1~1 사이의 값 중 정규분포 가운데 부분
    w.requires_grad = True  # 미분할 것을 명시, grad 계산해야 한다고 명시
    b = torch.randn(1)
    b.requires_grad = True  # 미분할 것을 명시, grad 계산해야 한다고 명시
    
    return w, b

# 가설 함수 simple_network() or hypothesis_function() 
- param in : x (train하기 위한 입력 데이터)
- param out : $wx+b$ 예측값 
- description
    - $wx+b$ 예측

In [11]:
def simple_network(x):
    y_pred = torch.matmul(x, w) + b
    return y_pred

# 손실 함수 loss_fn()
- param in : y, y_pred
- param out : loss 값
- description
    - MSE : 오차(찐-예측값)의 제곱에 대한 평균
    - 최적화하기 위해서 Gradient Descent 알고리즘 사용 -> loss function 자체는 convex한, 유의미한 형태를 지녀야 함
    - $w = w - alpha * (loss function의 기울기)$

In [13]:
def loss_fn(y, y_pred):
    # MSE 수식을 함수로 표현
    loss = torch.mean((y_pred - y).pow(2).sum())  # pow:제곱, 승수
    
    for param in [w, b]:
        if not param.grad is None:
            param.grad.data.zero_()  # 값이 있으면 0으로 초기화
        loss.backward()  # backword 호출 : MSE의 기울기를 계산
        
    return loss.data

# TRY

In [14]:
X = [1, 2, 3]
Y = [1, 2, 3]

### loss function을 간결화하기 위해 b term은 제거

In [None]:
# 그래프를 그리기 위해 w, cost 값을 넣을 빈 리스트 작성
w_val = []
cost_val = []

for i in range(-30, 50):
    weight = i * 0.1
    w_val.append(weight)
    curr_cost = # MSE 수식
    cost_val.append(curr_cost)

# show the cost_function
plt.plot(w_val, cost_val)
plt.show()

# optimize
- param in : learning_rate
- param out : None
- description
    - w, b를 업데이트해주는 함수

In [15]:
def optimize(lr):
    w.data = w.data - lr * w.grad.data
    b.data -= lr * b.grad.data