회귀(Regression)
- Training Data를 이용하여 데이터의 특성과 상관관계 등을 파악하고, 그 결과를 바탕으로 Training Data에 없는 미지의 데이터가 주어졌을 경우에, 그 결과를 연속적인 (숫자) 값으로 예측하는 것 ex) 공부시간과 시험성적 관계, 집 평수와 집 가격 관계 등

In [25]:
# 1) 학습데이터(Training Data) 준비

import numpy as np

x_data = np.array([1, 2, 3, 4, 5]).reshape(5,1)
t_data = np.array([2, 3, 4, 5, 6]).reshape(5,1)

# raw_data = [ [1, 2], [2, 3], [3, 4] [4, 5], [5, 6]]

# 2) 임의의 직선 y = Wx + b 정의 (임의의 값으로 가중치 W, 바이어스 b 초기화)
W = np.random.rand(1,1)
b = np.random.rand(1)
print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

# 3) 손실함수 E(W, b) 정의
def loss_func(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum( ( t - y)**2 ) ) / ( len(x) )


# 4) 수치미분 numerical_derivative 및 utility 함수 정의
def numerical_derivative(f,x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type

def error_val(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum((t-y)**2)) / (len(x))

# 학습을 마친 후, 임의의 데이터에 대해 미래값 예측 함수
# 입력변수 x: numpy type
def predict(x):
    y = np.dot(x, W) + b
    
    return y

# 5) 학습율 (learning rate) 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트

learning_rate = 1e-2 # 발산하는 경우, 1e-3 ~ 1e-6 등으로 바꾸어서 실행

f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)

print("initial error value = ", error_val(x_data, t_data), "initial W =", W, "\n", ", b = ", b )

for step in range(8001):
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0): # 400번째마다 손실함수값, 가중치 W, bias b의  현재값을 보여주는 코드, 머싱러닝에서 디버깅용으로 많이 사용
        print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)
        

W =  [[0.96175499]] , W.shape =  (1, 1) , b =  [0.10507992] , b.shape =  (1,)
initial error value =  1.0223287910231302 initial W = [[0.96175499]] 
 , b =  [0.10507992]
step =  0 error value =  0.6521640325229414 W =  [[1.0238641]] , b =  [0.12154648]
step =  400 error value =  0.008072445249440322 W =  [[1.05834441]] , b =  [0.78940971]
step =  800 error value =  0.0005150697309913574 W =  [[1.0147377]] , b =  [0.94680525]
step =  1200 error value =  3.2864493915507556e-05 W =  [[1.00372272]] , b =  [0.98656309]
step =  1600 error value =  2.096949005804038e-06 W =  [[1.00094035]] , b =  [0.99660586]
step =  2000 error value =  1.3379774367576475e-07 W =  [[1.00023753]] , b =  [0.99914265]
step =  2400 error value =  8.537087055181934e-09 W =  [[1.00006]] , b =  [0.99978343]
step =  2800 error value =  5.44716625170824e-10 W =  [[1.00001516]] , b =  [0.9999453]
step =  3200 error value =  3.4756141036224934e-11 W =  [[1.00000383]] , b =  [0.99998618]
step =  3600 error value =  2.2176

In [24]:
predict(43) # 43에 대한 미래값 예측

array([[57.48660748]])

In [19]:
# multi-variable regression example

# 1) 학습데이터(Training Data) 준비

import numpy as np

loaded_data = np.loadtxt('./data-01-test-score.csv', delimiter = ',', dtype = np.float32)

x_data = loaded_data[ :, 0:-1] # 모든 행에 대하여 1열부터 3열까지의 데이터를 입력데이터로
t_data = loaded_data[ :, [-1]] # 모든 행에 대하여 마지막 1열(4열) 데이터

# 2) 임의의 직선 y =  W1x1 + W2x2 + W3x3 + b 정의

W = np.random.rand(3,1) # 3X1 행령
b = np.random.rand(1)

print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

# 손실함수 E(W, b) 정의
def loss_func(x, t):
    y = np.dot(x, W) + b
    
    return( np.sum( (t - y) **2 ) ) / (len(x))

# 4) 수치미분 numerical_derivative 및 utility 함수 정의
def numerical_derivative(f,x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type

def error_val(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum((t-y)**2)) / (len(x))

# 학습을 마친 후, 임의의 데이터에 대해 미래값 예측 함수
# 입력변수 x: numpy type
def predict(x):
    y = np.dot(x, W) + b
    
    return y

# 5) 학습율 (learning rate) 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트

learning_rate = 1e-5 # 1e-2~1e-4 은 손실함수 값 발산(손실함수의 최솟값을 지나 엄청나게 커짐)

f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)

print("initial error value = ", error_val(x_data, t_data), "initial W =", W, "\n", ", b = ", b )

for step in range(10001):
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0): # 400번째마다 손실함수값, 가중치 W, bias b의  현재값을 보여주는 코드, 머싱러닝에서 디버깅용으로 많이 사용
        print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)

W =  [[0.20488841]
 [0.47251166]
 [0.07669246]] , W.shape =  (3, 1) , b =  [0.79878771] , b.shape =  (1,)
initial error value =  10479.830776468289 initial W = [[0.20488841]
 [0.47251166]
 [0.07669246]] 
 , b =  [0.79878771]
step =  0 error value =  3886.319921206669 W =  [[0.36825737]
 [0.63666612]
 [0.24511799]] , b =  [0.80001891]
step =  400 error value =  14.82482125154867 W =  [[0.59454523]
 [0.82389701]
 [0.59871989]] , b =  [0.80180877]
step =  800 error value =  12.357852979589818 W =  [[0.57018768]
 [0.768012  ]
 [0.67700595]] , b =  [0.80158753]
step =  1200 error value =  10.611033531867132 W =  [[0.54841857]
 [0.72196423]
 [0.74316442]] , b =  [0.80128114]
step =  1600 error value =  9.372110410690546 W =  [[0.52894744]
 [0.68408134]
 [0.79911164]] , b =  [0.80090274]
step =  2000 error value =  8.49176366099731 W =  [[0.51151867]
 [0.65297006]
 [0.84645745]] , b =  [0.8004634]
step =  2400 error value =  7.864877564435639 W =  [[0.49590699]
 [0.62747011]
 [0.88655447]] , 

In [20]:
test_data = np.array([100, 98, 81])

predict(test_data)

array([179.17879965])