# 10_Linear Regression

Simple regression - concept
- 오차를 계산하기 위해서는 training data의 모든 입력 x에 대해 각각의 y = Wx + b 계산해야 함
- => 이때 입력 x, 정답 t, 가중치 W 모두를 행렬로 나타낸 후에, 행렬 곱(dot product)를 이용하면 계산 값 y 또한 행렬로 표시되어 모든 입력 데이터에 대해 한 번에 쉽게 계산되는 것을 알 수 있음.

Simple regression - example

In [50]:
# [1] 학습데이터 (training data) 준비
import numpy as np

x_data = np.array([1, 2, 3, 4, 5]).reshape(5, 1)
t_data = np.array([2, 3, 4, 5, 6]).reshape(5, 1)

# raw_data = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]

In [51]:
# [2] 임의의 직선 y = Wx + b 정의 (임의의 값으로 가중치 W, 바이어스 b 초기화)
W = np.random.rand(1, 1)
b = np.random.rand(1)
print("W =", W, ", W.shape = ", W.shape, ", b =", b, ", b.shape = ", b.shape)

W = [[0.96898711]] , W.shape =  (1, 1) , b = [0.55352237] , b.shape =  (1,)


In [52]:
# [3] 손실함수 E(W, b) 정의
def loss_func(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum((t- y) ** 2)) / (len(x))

In [53]:
# [4] 수치미분 numerical_derivative 및 utillity 함수 정의
def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags = ['multi_index'], op_flags = ['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
    
    return grad

In [54]:
# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type
def error_val(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum((t - y) ** 2)) / (len(x))

# 학습을 마친 후, 임의의 데이터에 대해 미래 값 예측 함수
# 입력변수 x : numpy type
def predict(x):
    y = np.dot(x, W) + b
    
    return y

In [55]:
# [5] 학습율(learning rate) 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트
learning_rate = 1e-2 # 발산하는 경우, 1e-3 ~ 1e-6 등으로 바꾸어서 실행

f = lambda x : loss_func(x_data, t_data)

print("Initial error value = ", error_val(x_data, t_data), "Initial W = ", W, "\n", ", b = ", b)

for step in range(8001):
    
    W -= learning_rate * numerical_derivative(f, W)
    
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0):
        print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)

Initial error value =  0.2930014378717692 Initial W =  [[0.96898711]] 
 , b =  [0.55352237]
step =  0 error value =  0.1848345520630945 W =  [[1.0025986]] , b =  [0.562296]
step =  400 error value =  0.0019859028286503626 W =  [[1.02893848]] , b =  [0.89554847]
step =  800 error value =  0.00012671234107143337 W =  [[1.00730981]] , b =  [0.97361572]
step =  1200 error value =  8.084996480273595e-06 W =  [[1.00184645]] , b =  [0.99333538]
step =  1600 error value =  5.15870573720786e-07 W =  [[1.00046641]] , b =  [0.99831653]
step =  2000 error value =  3.291559241626644e-08 W =  [[1.00011781]] , b =  [0.99957476]
step =  2400 error value =  2.1002093922381656e-09 W =  [[1.00002976]] , b =  [0.99989258]
step =  2800 error value =  1.3400577560852812e-10 W =  [[1.00000752]] , b =  [0.99997287]
step =  3200 error value =  8.55036072176764e-12 W =  [[1.0000019]] , b =  [0.99999315]
step =  3600 error value =  5.455635636971998e-13 W =  [[1.00000048]] , b =  [0.99999827]
step =  4000 error 

In [56]:
predict(43)

array([[44.]])

Multi-variable regression - example

In [57]:
# [1] 학습데이터 (training data) 준비
import numpy as np

loaded_data = np.loadtxt('./data-01-test-score.csv', delimiter = ',', dtype = np.float32)

x_data = loaded_data[:, 0:-1]
t_data = loaded_data[:, [-1]]

In [58]:
# [2] 임의의 직선 y = W1x1 + W2x2 + W3x3 + b 정의
W = np.random.rand(3, 1) # 3 X 1 행렬
b = np.random.rand(1)
print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

W =  [[0.35900956]
 [0.59684684]
 [0.28862415]] , W.shape =  (3, 1) , b =  [0.48711817] , b.shape =  (1,)


In [59]:
# [3] 손실함수 E(W, b) 정의
def loss_func(x, t):
    y = np.dot(x, W) + b
    
    return(np.sum((t - y) ** 2)) / (len (x))

In [60]:
# [4] 수치미분 numerical_derivative 및 utility 함수 정의
def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags = ['multi_index'], op_flags = ['readwrite'])
    
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x + delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x) # f(x - delta_x)
        grad[idx] = (fx1 - fx2) / (2 * delta_x)
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

In [61]:
# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type
def error_val(x, t):
    y = np.dot(x, W) + b
    
    return(np.sum((t - y) ** 2)) / (len(x))

# 학습을 마친 후, 임의의 데이터에 대해 미래 값 예측 함수
# 입력변수 x : numpy
def predict(x):
    y = np.dot(x, W) + b
    
    return y

In [62]:
# [5] 학습율 (learning rate) 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트
learning_rate = 1e-5 # 1e-2, 1e-3 은 손실함수 값 발산

f = lambda x : loss_func(x_data, t_data)

print("Initial error value = ", error_val(x_data, t_data), "Initial W = ", W, "/n", ", b = ", b)

for step in range(10001):
    
    W -= learning_rate * numerical_derivative(f, W)
    
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0):
        print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ", b)

Initial error value =  3968.3908143965473 Initial W =  [[0.35900956]
 [0.59684684]
 [0.28862415]] /n , b =  [0.48711817]
step =  0 error value =  1477.6402868151001 W =  [[0.45939362]
 [0.69768504]
 [0.39221982]] , b =  [0.48787482]
step =  400 error value =  13.513010204877647 W =  [[0.58875276]
 [0.79301903]
 [0.63829101]] , b =  [0.48892964]
step =  800 error value =  11.417182438577829 W =  [[0.56508335]
 [0.74244323]
 [0.71071999]] , b =  [0.4887171]
step =  1200 error value =  9.931055960269928 W =  [[0.54391452]
 [0.70082677]
 [0.77196458]] , b =  [0.4884257]
step =  1600 error value =  8.875321795518788 W =  [[0.52496782]
 [0.66664153]
 [0.82378851]] , b =  [0.48806759]
step =  2000 error value =  8.123763889473718 W =  [[0.50799791]
 [0.63861489]
 [0.86767374]] , b =  [0.48765298]
step =  2400 error value =  7.587472161784555 W =  [[0.4927883 ]
 [0.61568745]
 [0.90486578]] , b =  [0.48719049]
step =  2800 error value =  7.20376187765781 W =  [[0.47914774]
 [0.59697776]
 [0.936

In [63]:
# [6] 학습 결과 및 입력 [100, 98, 81]에 대한 미래 값 예측
test_data = np.array([100, 98, 81])

predict(test_data)

array([179.17416783])