# Linear Regression

## 회귀(Regression)
- Training Data를 이용하여 데이터의 특성과 상관관계를 파악하고 미지의 데이터가 주어졌을 때 값을 예측하는 것

### 학습의 개념
- step1: analyze training data (ex. y=Wx + b)
- step2: find weight(W) and bias(b)
- 오차(error = t-y) 값을 최소한으로 하는 값을 찾는 것

### 손실함수(loss function)
- training data의 정답(t)과 입력(x)에 대한 계산 값 y의 차이를 모두 더해 수식으로 나타낸 것
- 손실함수에서 오차를 계산할 때는 (t-y)^2처럼 제곱으로 하여 구함 
- 모든 데이터에 대한 평균 오차값을 구함
- 손실함수가 최소값을 갖는다 => 미지의 데이터에 대해 결과를 더 잘 예측한다

### linear regression 목표
- training data 특성 및 분포를 가장 잘 나타내는 직선을 계산하는 것

## gradient decent algorithm (경사하강법)
### 경사하강법 원리
- 임의의 가중치 W 선택 
- W에서의 직선의 기울기를 나타내는 미분값에서의 미분을 구함
- 미분 값이 작아지는 방향으로 진행하여 손실함수의 최소값을 찾음



In [9]:
import numpy as np

# 학습 데이터 준비
x_data = np.array([1,2,3,4,5]).reshape(5,1)
t_data = np.array([2,3,4,5,6]).reshape(5,1)

# 임의의 직선 y= Wx + b 정의 (임의의 값으로 가중치 W, 바이어스 b 초기화)
W = np.random.rand(1,1)
b = np.random.rand(1)
print("W =", W,", W,shape =", W.shape, ",b =", b, ", b.shape =", b.shape)

# 손실함수 E(W, b) 정의
def loss_func(x,t):
    y = np.dot(x,W) + b  # 행렬 곱을 이용
    
    return (np.sum( (t-y)**2) ) / (len(x))

#  수치미분 numerical_derivative 및 utility 함수 정의
def numerical_derivative(f, x):
    delta_x = 1e-4
    grad = np.zeros_like(x) # 입력 파라미터 x와 동일한 크기를 가짐 (0으로 초기화하여 나중에 저장)
    
    # 순차적으로 데이터 읽기
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:  # 변수의 개수만큼 반복
        idx = it.multi_index
        
        tmp_val = x[idx]   # 원본값을 저장하는 임시변수가 반드시 필요!
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)  # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)  # f(x=delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type
def error_val(x,t):
    y = np.dot(x,W) + b
    
    return (np.sum( (t-y)**2) ) / (len(x))

# 학습을 마친 후 임의의 데이터에 대해 미래 값 예측 함수
# 입력변수 x : numpy type
def predict(x):
    y = np.dot(x,W) + b
    
    return y

# 학습율 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트 
learning_rate = 1e-2  ## 발산하는 경우 1e-3, 1e-6 등ㅇ로 바꾸어서 진행
f = lambda x : loss_func(x_data, t_data)

print("Initial error value = ", error_val(x_data, t_data), "Intial W = ", W, "\n", "b = " ,b)

for step in range(8001):
    W -= learning_rate * numerical_derivative(f, W)
    
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0):
        print("step =", step, "error value =", error_val(x_data, t_data), "W =", W, "b =", b)

W = [[0.98983275]] , W,shape = (1, 1) ,b = [0.29555057] , b.shape = (1,)
Initial error value =  0.5403599700756971 Intial W =  [[0.98983275]] 
 b =  [0.29555057]
step = 0 error value = 0.3497634286636342 W = [[1.03433651]] b = [0.30757937]
step = 400 error value = 0.005063861089792227 W = [[1.04621018]] b = [0.83320743]
step = 800 error value = 0.00032310427493797923 W = [[1.01167261]] b = [0.95786848]
step = 1200 error value = 2.0615962924739075e-05 W = [[1.00294848]] b = [0.98935765]
step = 1600 error value = 1.3154203156120199e-06 W = [[1.00074478]] b = [0.99731176]
step = 2000 error value = 8.393159286514225e-08 W = [[1.00018813]] b = [0.99932096]
step = 2400 error value = 5.355331826077453e-09 W = [[1.00004752]] b = [0.99982847]
step = 2800 error value = 3.417018310846148e-10 W = [[1.000012]] b = [0.99995667]
step = 3200 error value = 2.180259695410923e-11 W = [[1.00000303]] b = [0.99998906]
step = 3600 error value = 1.3911345829859225e-12 W = [[1.00000077]] b = [0.99999724]
step 

In [10]:
# 43의 값을 예측
predict(43)  

array([[44.]])

## multi-varible regression 
- y = x1W1 + x2W2 + x3W3 + b

In [44]:
# 학습데이터 준비
import numpy as np

loaded_data = np.loadtxt('./dataset/data-01-test-score.csv', delimiter=',', dtype=np.float32)
#print(loaded_data)

x_data = loaded_data[:, 0:-1]
t_data = loaded_data[:, [-1]]

# 데이터 차원 및 shape 확인
print("x_data.ndim = ", x_data.ndim, ", x_data.shape = ", x_data.shape)
print("t_data.ndim = ", t_data.ndim, ", t_data.shape = ", t_data.shape) 

# 임의의 직선 y= W1x1 + W2x2 + W3x3 + b 정의
W = np.random.rand(3, 1)  # 3X1 행렬
b = np.random.rand(1)
print("W =", W,", W.shape =", W.shape, "b =", b,", b.shape =", b.shape)

x_data.ndim =  2 , x_data.shape =  (25, 3)
t_data.ndim =  2 , t_data.shape =  (25, 1)
W = [[0.9614944 ]
 [0.84774051]
 [0.36491205]] , W.shape = (3, 1) b = [0.56783013] , b.shape = (1,)


### 손실함수 E(W, b) 정의

In [2]:
def loss_func(x, t):
    y = np.dot(x, W) + b
    
    return ( np.sum( (t- y)**2) ) / ( len(x) )

### 수치미분 numerical_derivative 및 utility 함수 정의

In [46]:
def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x 
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val 
        it.iternext()   
        
    return grad

### 손실함수 값 계산 및 예측 함수

In [47]:
# 입력변수 x, t : numpy type
def error_val(x, t):
    y = np.dot(x, W) + b
    
    return ( np.sum( (t - y)**2 ) ) / ( len(x) )

# 학습을 마친 후 임의의 데이터에 대해 미래 값 예측 함수
# 입력변수 x : numpy type
def predict(x):
    y = np.dot(x, W) + b
    
    return y

In [48]:
# 학습율 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트 
learning_rate = 1e-5  # 1e-2, 1e-3 은 손실함수 값 발산

f = lambda x : loss_func(x_data,t_data)

print("Initial error value = ", error_val(x_data, t_data), "Initial W = ", W, "\n", ", b = ", b )

for step in  range(10001):  
    
    W -= learning_rate * numerical_derivative(f, W)
    
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0):
        print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ", b = ",b )

Initial error value =  163.9902124855351 Initial W =  [[0.9614944 ]
 [0.84774051]
 [0.36491205]] 
 , b =  [0.56783013]
step =  0 error value =  76.50450739034585 W =  [[0.94252371]
 [0.82863747]
 [0.34585405]] , b =  [0.56768883]
step =  400 error value =  20.110549386809385 W =  [[0.85807239]
 [0.73634716]
 [0.43098293]] , b =  [0.5676072]
step =  800 error value =  16.441596464366807 W =  [[0.80844529]
 [0.68546827]
 [0.52893263]] , b =  [0.56761911]
step =  1200 error value =  13.781256348722625 W =  [[0.76384332]
 [0.64450169]
 [0.61231352]] , b =  [0.56752334]
step =  1600 error value =  11.843855940552627 W =  [[0.72373885]
 [0.61167809]
 [0.68336717]] , b =  [0.56733577]
step =  2000 error value =  10.426289415684833 W =  [[0.68766255]
 [0.58553113]
 [0.7439825 ]] , b =  [0.56706988]
step =  2400 error value =  9.383837146188803 W =  [[0.65519646]
 [0.56484662]
 [0.79575206]] , b =  [0.56673707]
step =  2800 error value =  8.613125878538252 W =  [[0.62596808]
 [0.54862024]
 [0.8

In [49]:
test_data = np.array([100, 98, 81])

predict(test_data)

array([179.4664992])