In [1]:
# 지도학습 Linear Regression
# 트레이닝 데이터의 특성을 가장 잘 표현할 수 있는 가중치 W(기울기), 바이어스 b(y절편)을 찾는 것이 중요
# 손실함수: 최소제곱법인듯 (오차제곱의 합이 최소)
# 경사하강법: 손실함수가 최소가 되는 지점을 찾기
# 경사하강 W값 구하기: 편미분값이 양수일 때에는 왼쪽으로 이동시켜야(기울기를 감소시켜야) 최소값 찾음, 음수일 때는 반대

In [3]:
# 파이썬에서 구현하는 순서
# 1. 슬라이싱 또는 list comprehension 등을 이용하여 입력 x와 정답 t를 numpy 데이터형으로 분리
# 2. y = Wx + b : W= numpy.random.rand(...) , b = numpy.random.rand(...)
# 3. 손실함수: def loss_func(...): y = numpy.dot(X, W) + b return(numpy.sum((t-y)**2))/(len(x))
# 4. 학습률 a : learngin_rate = 1e-3, 1e-4, 1e-5 ...
# 5. 가중치 W, 바이어스 b: f = lambda x: loss_func(...)
#                          for step in range(6000): (6000은 임의값) W -=learning_rate*numerical_derivative(f,W) b -= learning_rate*numerical_derivative(f, b)


In [20]:
import numpy as np

x_data = np.array([1,2,3,4,5]).reshape(5,1) # 입력데이터
t_data = np.array([2,3,4,5,6]).reshape(5,1) # 정답데이터

# raw_data = [[1,2],[2,3],[3,4],[4,5],[5,6]]
# x_data = [x[0] for x in raw_data]

W = np.random.rand(1,1) # W.shape = (1,1) 0~1 사이의 랜덤값은 똑같은데, 형태가 다름
b = np.random.rand(1) # b.shape = (1,)

def loss_func(x, t):
    y = np.dot(x,W) + b
    
    return (np.sum((t-y)**2))/(len(x))

def numerical_derivative(f, x):
    delta_x = 1e-4
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)
        
        grad[idx] = (fx1-fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it. iternext()
    
    return grad

# 손실함수 값 계산 함수
# 입력변수 x, t 는 np type
def error_val(x, t):
    y = np.dot(x,W) + b
    
    return (np.sum((t-y)**2))/(len(x))

# 학습률 초기화 및 손실함수가 최소가 될 때까지 W, B 업데이트
learning_rate = 1e-2
f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)
print("init error val = ", error_val(x_data, t_data), "init W = ", W, "\n", ", b = ", b)

for step in range(8001):
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step%400 == 0):
        print("step = ", step, "error_val = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)

# 학습을 마친 후 임의의 데이터에 대해 미래값 예측하는 함수
# 입력변수 x: np type
def predict(x):
    y = np.dot(x,W) + b
    return y

init error val =  0.5464844110101867 init W =  [[0.81081383]] 
 , b =  [0.87842747]
step =  0 error_val =  0.3218838512608027 W =  [[0.85972914]] , b =  [0.88927517]
step =  400 error_val =  6.685404585592941e-05 W =  [[1.00530958]] , b =  [0.98083541]
step =  800 error_val =  4.265683364911467e-06 W =  [[1.00134119]] , b =  [0.99515906]
step =  1200 error_val =  2.721758172855031e-07 W =  [[1.00033878]] , b =  [0.99877719]
step =  1600 error_val =  1.73664262388718e-08 W =  [[1.00008558]] , b =  [0.99969112]
step =  2000 error_val =  1.1080806638921059e-09 W =  [[1.00002162]] , b =  [0.99992198]
step =  2400 error_val =  7.07020972967071e-11 W =  [[1.00000546]] , b =  [0.99998029]
step =  2800 error_val =  4.51121179621456e-12 W =  [[1.00000138]] , b =  [0.99999502]
step =  3200 error_val =  2.878419828286536e-13 W =  [[1.00000035]] , b =  [0.99999874]
step =  3600 error_val =  1.836602024455449e-14 W =  [[1.00000009]] , b =  [0.99999968]
step =  4000 error_val =  1.1718606882513085e-

In [21]:
predict(43)

array([[44.]])

In [38]:
# multi-variable regression

import numpy as np

loaded_data = np.loadtxt('./test_score.txt', delimiter = ',', dtype = np.float32)
x_data = loaded_data[:, 0:-1]
# 다른방법?
# x_data2 = [ x[0:-1] for x in loaded_data]
# print(x_data2)
t_data = loaded_data[:, [-1]]

W = np.random.rand(3,1) # 3x1 행렬
b = np.random.rand(1)

def loss_func(x, t):
    y = np.dot(x,W) + b
    
    return (np.sum((t-y)**2))/(len(x))

def numerical_derivative(f, x):
    delta_x = 1e-4
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)
        
        grad[idx] = (fx1-fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it. iternext()
    
    return grad

# 손실함수 값 계산 함수
# 입력변수 x, t 는 np type
def error_val(x, t):
    y = np.dot(x,W) + b
    
    return (np.sum((t-y)**2))/(len(x))

# 학습률 초기화 및 손실함수가 최소가 될 때까지 W, B 업데이트
learning_rate = 1e-5 # 1e-2로 했을 때 오류 발생(값이 이상했음..) 이는 손실함수 값이 발산하기 때문
f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)
print("init error val = ", error_val(x_data, t_data), "init W = ", W, "\n", ", b = ", b)

for step in range(8001):
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step%400 == 0):
        print("step = ", step, "error_val = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)

# 학습을 마친 후 임의의 데이터에 대해 미래값 예측하는 함수
# 입력변수 x: np type
def predict(x):
    y = np.dot(x,W) + b
    return y

init error val =  7414.706218746868 init W =  [[0.27812434]
 [0.03656099]
 [0.63612446]] 
 , b =  [0.18933524]
step =  0 error_val =  2746.2279148488437 W =  [[0.41558402]
 [0.17488004]
 [0.77766738]] , b =  [0.19037002]
step =  400 error_val =  7.2650393926551216 W =  [[0.60296615]
 [0.40248978]
 [1.00968813]] , b =  [0.19143187]
step =  800 error_val =  7.059799704019952 W =  [[0.57945984]
 [0.41436566]
 [1.0209345 ]] , b =  [0.19087149]
step =  1200 error_val =  6.891744676561907 W =  [[0.55819172]
 [0.42515061]
 [1.03107191]] , b =  [0.19029781]
step =  1600 error_val =  6.754130984540842 W =  [[0.5389485 ]
 [0.43494212]
 [1.04021234]] , b =  [0.18971216]
step =  2000 error_val =  6.641438883953415 W =  [[0.52153726]
 [0.44382943]
 [1.04845604]] , b =  [0.18911571]
step =  2400 error_val =  6.549149983694576 W =  [[0.5057835 ]
 [0.45189416]
 [1.05589287]] , b =  [0.18850953]
step =  2800 error_val =  6.473565440727598 W =  [[0.49152933]
 [0.45921087]
 [1.06260338]] , b =  [0.187894

In [39]:
test_data = np.array([100,98,81])
predict(test_data)

array([179.28054374])