### 예측 함수

$$
Y = Wx + b
$$

x는 특성, y는 예측 값이다. 
W는 기울기, b는 y절편을 뜻하지만 W는 가중치(weight), b는 offset으로 부를 수도 있다.
선형 회귀에서는 여러 샘플의 특성 값과 예측 값을 활용해 가장 적절한 w와 b를 구하는 것이 목적이다.
### 평균 제곱 오차 (Mean Square Error)
선형 회귀에서는 Coast 함수(또는 비용 함수)로 평균 제곱 오차를 사용한다. 
여기서 Coast 함수란 샘플 데이터와 타깃과의 유사도를 의미하며 Coast 함수가 최소가 되도록 
파라미터를 학습시킨다. 
$$
   \frac{1}{n}\sum(pred_i - y_i)^2
$$

In [1]:
# Mean Square Error는 예측을 정량화된 숫자로 할 때만 쓸 수 있음.
# Classification일 때는 못 씀

In [2]:
import numpy as np

X = np.array([1., 2., 3., 4., 5., 6.])
y = np.array([9., 16., 23., 30., 37., 44.])

In [3]:
w = 0.0
b = 0.0

In [4]:
n_data = len(X)
n_data

6

In [5]:
epochs = 5000 #전체 데이터가 한번 다 도는 게 1 epoch
learning_rate = 0.01 # 학습속도

In [6]:
for i in range(epochs):
    y_predict = X * w + b #먼저 예측부터 해야 함
    
    # 현재 오차를 구한다
    loss = np.sum((y_predict-y)**2) / n_data #.mean()과 똑같음
    
    w -= learning_rate * ((y_predict-y) * X).mean()
    b -= learning_rate * (y_predict-y).mean()
    
    if i % 100 == 0: #100번 주기로
        print('Epoch ({:10d}/{:10d}) loss :{:.3f}, w:{:.3f}, b:{:.3f}'.format(i, epochs, loss, w, b))

Epoch (         0/      5000) loss :845.167, w:1.132, b:0.265
Epoch (       100/      5000) loss :0.016, w:7.067, b:1.712
Epoch (       200/      5000) loss :0.011, w:7.056, b:1.760
Epoch (       300/      5000) loss :0.008, w:7.047, b:1.800
Epoch (       400/      5000) loss :0.005, w:7.039, b:1.834
Epoch (       500/      5000) loss :0.004, w:7.032, b:1.861
Epoch (       600/      5000) loss :0.003, w:7.027, b:1.885
Epoch (       700/      5000) loss :0.002, w:7.022, b:1.904
Epoch (       800/      5000) loss :0.001, w:7.019, b:1.920
Epoch (       900/      5000) loss :0.001, w:7.016, b:1.933
Epoch (      1000/      5000) loss :0.001, w:7.013, b:1.944
Epoch (      1100/      5000) loss :0.000, w:7.011, b:1.954
Epoch (      1200/      5000) loss :0.000, w:7.009, b:1.961
Epoch (      1300/      5000) loss :0.000, w:7.008, b:1.968
Epoch (      1400/      5000) loss :0.000, w:7.006, b:1.973
Epoch (      1500/      5000) loss :0.000, w:7.005, b:1.978
Epoch (      1600/      5000) loss :0.

In [7]:
print('W : {:.5f}'.format(w))
print('b : {:.3f}'.format(b))
print('Result', X * w + b)

W : 7.00001
b : 2.000
Result [ 8.99997131 15.99998006 22.9999888  29.99999754 37.00000628 44.00001503]
