# Linear Regression

## simple regression

#### - 학습 데이터(training data) 준비

In [1]:
import numpy as np

In [2]:
x_data = np.array([1,2,3,4,5]).reshape(5,1)
t_data = np.array([2,3,4,5,6]).reshape(5,1)

# raw_data = [[1,2],[2,3],[3,4],[4,5],[5,6]] 과 같이 입력과 결과값이 
# 같이 있는 데이터라면 입력값과 결과값을 slicing, list comprehension 등을
# 이용해서 분리해줘야함

#### - 임의의 직선 y=Wx+b 정의 (임의의 값으로 가중치 W, 바이어스 b초기화)

In [3]:
W = np.random.rand(1,1)
b = np.random.rand(1)
print("W= ",W, ", W shape = ", W.shape, ", b = ",b, ", b.shape =", b.shape)

W=  [[0.34520951]] , W shape =  (1, 1) , b =  [0.15000346] , b.shape = (1,)


#### - 손실함수 E(W,b) 정의

In [4]:
def loss_func(x,t):
    y = np.dot(x,W)+b
    return (np.sum((t-y)**2))/(len(x))

#### - 수치미분 numerical_derivative 및 utility 함수 정의

In [6]:
# 수치미분 구현
def numerical_derivative(f,x): # x에 변수가 여러개
    delta_x = 1e-4
    grad = np.zeros_like(x)
    # 주어진 어레이와 같은 형태와 타입을 갖는 0으로 채워진 어레이를 반환
    # grad는 계산된 수치미분 값을 저장할 변수
    it = np.nditer(x,flags=['multi_index'],op_flags=['readwrite'])
    #  op_flags를 이용하면 기본값은 읽기 전용이지만 읽기/쓰기 또는 
    # 쓰기 전용 모드로 설정할 수 있다
    # multi_index는 뭐지..?
    while not it.finished:
        idx = it.multi_index
        
        tmp_val = x[idx]
        # x의 원본값이 변화되는 것을 막고자 임시변수 tmp_val 이라는 곳에
        # 원본값을 저장해두고 있다
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_X)
        
        x[idx]=tmp_val - delta_x
        fx2 = f(x) # f(x-delta_X)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
    
    return grad

In [7]:
# 손실함수 값 계산 함수
def error_val(x,t):
    y = np.dot(x,W)+b
    return (np.sum((t-y)**2))/(len(x)) 

# 학습을 모두 마친 후, 임의의 데이터에 대해 미래 값 예측 함수
def predict(x):
    y=np.dot(x,W)+b
    return y

#### - 학습율(learning rate) 초기화 및 손실함수가 최소가 될 때까지 W,b 업데이트

In [10]:
learning_rate = 1e-2 #발산하는 경우, 1e-3, 1e-6 등으로 바꿔서 실행

f = lambda x : loss_func(x_data,t_data)
print("Initial erorr value = ", error_val(x_data,t_data))
print("Initial W = ",W)
print("Initial b = ",b)

for step in range(8001):
    W = W - learning_rate * numerical_derivative(f,W)
    b = b - learning_rate * numerical_derivative(f,b)
    if(step % 400 == 0):
        print("step = ", step )
        print("error_value = ", error_val(x_data,t_data))
        print("W = ",W)
        print("b = ",b)

Initial erorr value =  8.778168481691937
Initial W =  [[0.34520951]]
Initial b =  [0.15000346]
step =  0
error_value =  5.195292492705254
W =  [[0.54026321]]
b =  [0.1945876]
step =  400
error_value =  0.005154307810315621
W =  [[1.04662103]]
b =  [0.83172447]
step =  800
error_value =  0.0003288753104258289
W =  [[1.01177639]]
b =  [0.95749388]
step =  1200
error_value =  2.0984189107070373e-05
W =  [[1.0029747]]
b =  [0.98926303]
step =  1600
error_value =  1.3389153229867645e-06
W =  [[1.0007514]]
b =  [0.99728786]
step =  2000
error_value =  8.543071323756072e-08
W =  [[1.0001898]]
b =  [0.99931492]
step =  2400
error_value =  5.4509845686133426e-09
W =  [[1.00004794]]
b =  [0.99982695]
step =  2800
error_value =  3.478050415582435e-10
W =  [[1.00001211]]
b =  [0.99995629]
step =  3200
error_value =  2.2192017868295632e-11
W =  [[1.00000306]]
b =  [0.99998896]
step =  3600
error_value =  1.4159819377951313e-12
W =  [[1.00000077]]
b =  [0.99999721]
step =  4000
error_value =  9.0348

In [11]:
predict(100)

array([[101.]])

## Multi Variable regression

#### -학습 데이터 (training data) 준비

In [13]:
loaded_data = np.loadtxt('./data-01-test-score.csv',delimiter=',',dtype=np.float32)

x_data = loaded_data[:,0:-1]
t_data = loaded_data[:,[-1]]

#### - 임의의 직선 y=Wx+b 정의 (임의의 값으로 가중치 W, 바이어스 b초기화)

In [16]:
W = np.random.rand(3,1) #3X1 행렬
b = np.random.rand(1)
print("W= ",W, ", W shape = ", W.shape, ", b = ",b, ", b.shape =", b.shape)

W=  [[0.46665824]
 [0.10741838]
 [0.84510498]] , W shape =  (3, 1) , b =  [0.16857499] , b.shape = (1,)


이 아래부터는 single variable과 마찬가지로 진행

#### - 손실함수 E(W,b) 정의

#### - 수치미분 numerical_derivative 및 utility 함수 정의

#### - 학습율(learning rate) 초기화 및 손실함수가 최소가 될 때까지 W,b 업데이트

In [20]:
learning_rate = 1e-5 #1e-2, 1e-3 은 손실함수 값 발산

f = lambda x : loss_func(x_data,t_data)
print("Initial erorr value = ", error_val(x_data,t_data))
print("Initial W = ",W)
print("Initial b = ",b)

for step in range(10001):
    W = W - learning_rate * numerical_derivative(f,W)
    b = b - learning_rate * numerical_derivative(f,b)
    if(step % 400 == 0):
        print("step = ", step )
        print("error_value = ", error_val(x_data,t_data))
        print("W = ",W)
        print("b = ",b)

Initial erorr value =  2326.4299138009055
Initial W =  [[0.46665824]
 [0.10741838]
 [0.84510498]]
Initial b =  [0.16857499]
step =  0
error_value =  865.2651269298793
W =  [[0.54352234]
 [0.18484989]
 [0.9242803 ]]
b =  [0.16915318]
step =  400
error_value =  7.7140554671142505
W =  [[0.63394234]
 [0.33037119]
 [1.05032306]]
b =  [0.16945901]
step =  800
error_value =  7.4128961636229915
W =  [[0.60770978]
 [0.35277737]
 [1.05392914]]
b =  [0.16886053]
step =  1200
error_value =  7.170451309573304
W =  [[0.58393884]
 [0.37249391]
 [1.05777127]]
b =  [0.16825678]
step =  1600
error_value =  6.974834460053713
W =  [[0.56240084]
 [0.38986767]
 [1.06173274]]
b =  [0.16764766]
step =  2000
error_value =  6.816686425010574
W =  [[0.54288798]
 [0.40519765]
 [1.06572332]]
b =  [0.16703315]
step =  2400
error_value =  6.68860554511898
W =  [[0.52521145]
 [0.41874204]
 [1.06967421]]
b =  [0.16641334]
step =  2800
error_value =  6.584714662881695
W =  [[0.50919979]
 [0.43072406]
 [1.0735339 ]]
b 

In [21]:
test_data = np.array([100,98,81])
predict(test_data)

array([179.13566394])