<a href="https://colab.research.google.com/github/dlwodud04/ai-mathematics/blob/main/23-05-23/Linear_Regression.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**선형회귀 모델**
- 트레이닝 데이터를 이옹하여 데이터의 특성과 상관관계 등을 학습하고, 학습 결과를 바탕으로 트레이닝 데이터에 없는 미지의 데이터에 대한 결과를 연속적이나 (숫자)값으로 예측하는 것입니다.

**손실함수**
- 머신러닝에서 손실함수 또는 비용함수라고 부르는 이 함수는 직선 
y = Wx + b함수의 계산 값 y와 정답 t의 차이를 모두 더해서 수식으로 나타낸 것입니다.

**경사하강법**
- 머신러닝에는 손실함수의 최솟값을 찾기 위한 다양한 방법이 있지만, 경사하강법이 가장 일반적이며 많이 쓰이는 방법입니다.


In [None]:
# simple regression

import numpy as np

# Step 1 . 학습데이터 준비
x_data = np.array([1,2,3,4,5]).reshape(5,1) 
t_data = np.array([3,5,7,9,11]).reshape(5,1)

# Step 2. 임의의 직선 y = W+b 정의(임의의 값으로 가중치 w, 바이어스 b 초기화)
W = np.random.rand(1,1)
b = np.random.rand(1)

# Step 3 . 손실함수 t(W,b) 정의
def loss_func(x,t):
    y = np.dot(x,W) + b
    return(np.sum((t-y)**2))/(len(x))

# Step 4.  수치미분 numerical_derivative및 utility 함수 정의
def numerical_derivative(f,x):
    delta_x = 1e-5 #0.00001
    grad = np.zeros_like(x)

    it = np.nditer(x, flags = ['multi_index'], op_flags=['readwrite'])

    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx] 
        x[idx] = float(tmp_val) + delta_x 
        fx1 = f(x) 

        x[idx] = tmp_val - delta_x
        fx2 = f(x) 
        grad[idx] = (fx1-fx2) / (2*delta_x)

        x[idx] = tmp_val
        it.iternext()
    
    return grad 

def loss_val(x,t):
    y = np.dot(x,W) + b
    return (np.sum((t-y)**2/len(x)))

def predict(x):
    y = np.dot(x,W) + b
    return y

# Step 5. 학습률 초기화 및 손실함수가 최소가 될 떄까지 W, b 업데이트
learning_rate = 1e-2

f = lambda x : loss_func(x_data, t_data)
print(loss_val(x_data, t_data),W,b)

for step in range(8001):
    W -= learning_rate * numerical_derivative(f,W)
    b -= learning_rate * numerical_derivative(f,b)

    if(step % 400 == 0):
        print(step, loss_val(x_data, t_data), W,b)

20.16386727097963 [[0.91851296]] [0.02253753]
0 11.896023107802018 [[1.21508786]] [0.08918151]
400 0.005680055607345394 [[2.04894102]] [0.82335063]
800 0.0003624211280863195 [[2.01236242]] [0.95537867]
1200 2.3124610595941837e-05 [[2.00312273]] [0.98872873]
1600 1.4754868681000294e-06 [[2.0007888]] [0.9971529]
2000 9.41447852250811e-08 [[2.00019925]] [0.99928083]
2400 6.006993878830571e-09 [[2.00005033]] [0.99981834]
2800 3.8328172266063725e-10 [[2.00001271]] [0.99995411]
3200 2.4455639859585344e-11 [[2.00000321]] [0.99998841]
3600 1.560414404551732e-12 [[2.00000081]] [0.99999707]
4000 9.956366409788292e-14 [[2.0000002]] [0.99999926]
4400 6.352750337430288e-15 [[2.00000005]] [0.99999981]
4800 4.0534303591340675e-16 [[2.00000001]] [0.99999995]
5200 2.5863281154551174e-17 [[2.]] [0.99999999]
5600 1.6502305681798824e-18 [[2.]] [1.]
6000 1.0529434562171054e-19 [[2.]] [1.]
6400 6.718493716696574e-21 [[2.]] [1.]
6800 4.2867345619697105e-22 [[2.]] [1.]
7200 2.735678379654171e-23 [[2.]] [1.]
7

In [None]:
print(predict(7))

[[15.]]


In [None]:
import numpy as np

# Step 1. 학습데이터 준비 
loaded_data = np.loadtxt('score.csv', delimiter = ',', dtype = np.float32)

x_data = loaded_data[:, 0: -1]
t_data = loaded_data[:, [-1]]

# Step 2 , y = W_1x1+W_2x_2 + W_3x_3+b
W = np.random.rand(3,1)
b = np.random.rand(1)

# Step 3. 손실함수 t(W,b) 정의
def loss_func(x,t):
    y = np.dot(x,W) + b
    return(np.sum((t-y)**2))/(len(x))

# Step 4.  수치미분 numerical_derivative및 utility 함수 정의
def numerical_derivative(f,x):
    delta_x = 1e-4 #0.00001
    grad = np.zeros_like(x)

    it = np.nditer(x, flags = ['multi_index'], op_flags=['readwrite'])

    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx] 
        x[idx] = float(tmp_val) + delta_x 
        fx1 = f(x) 

        x[idx] = tmp_val - delta_x
        fx2 = f(x) 
        grad[idx] = (fx1-fx2) / (2*delta_x)

        x[idx] = tmp_val
        it.iternext()
    
    return grad 

def loss_val(x,t):
    y = np.dot(x,W) + b
    return (np.sum((t-y)**2/len(x)))

def predict(x):
    y = np.dot(x,W) + b
    return y

# Step 5. 학습률 초기화 및 손실함수가 최소가 될 떄까지 W, b 업데이트
learning_rate = 1e-2

f = lambda x : loss_func(x_data, t_data)
print(loss_val(x_data, t_data),W,b)

for step in range(10001):
    W -= learning_rate * numerical_derivative(f,W)
    b -= learning_rate * numerical_derivative(f,b)

    if(step % 400 == 0):
        print(step, loss_val(x_data, t_data), W,b)

2550.159774718336 [[0.74839059]
 [0.97504824]
 [0.91884261]] [0.42894313]
0 372891052.2185758 [[-79.81270009]
 [-80.10220449]
 [-81.75290098]] [390.38406738]
400 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
800 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
1200 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
1600 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
2000 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
2400 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
2800 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
3200 1.8037322634031636e+29 [[-1.74030942e+12]
 [-1.74028450e+12]
 [-1.77373312e+12]] [-2.67865043e+10]
3600 1.80373