# Supervised Learning

## 1) Regression

### 1-1) Linear Regression from scratch

In [None]:
import numpy as np
from matplotlib import pyplot as plt
import plotly.graph_objects as go
%matplotlib inline

# Step 1. Synthetic data Creation

In [None]:
# The number of data to be created
m = 100

In [None]:
# 독립변수입력) x1, x2 => 종속변수(정답) y 
x1 = np.random.randn(m, 1)
x2 = np.random.randn(m, 1)
y = x1 + x2 + np.random.rand(m, 1)

fig = go.Figure(data=[go.Scatter3d(x=x1[:,0], y=x2[:,0], z=y[:,0],
                                   mode='markers',
                                   marker=dict(  size=8,
                                                colorscale='blues',   # choose a colorscale
                                                opacity=0.8
                                            ))])
fig.update_layout(scene = dict(
                    xaxis_title='X1',
                    yaxis_title='X2',
                    zaxis_title='Y (Answer)'),
                    width=700,
                    margin=dict(r=20, b=10, l=10, t=10))

fig.show()

In [None]:
# 프로그래밍, 디버깅 과정에서 항상 데이터의 Shape을 보는 습관을 들입시다.
# 데이터의 수치는 보는 것은 코스트가 높은 행위이고, 생각보다 적은 정보를 준다.
x = np.concatenate([x1,x2], axis=-1)
print (x.shape)
print (y.shape)

# Step 2. Model definition

In [None]:
# initialization of weights and bias
w = np.array([1, 0])
b = 0

print("before", w.shape)

#항상 shape을 맞춰주는 것이 안전합니다.
w = w[np.newaxis, :]
print("after", w.shape)

In [None]:
# Linear model : y = w*x + b
def hypothesis(x, w, b):
    pred = np.multiply(w, x) + b
    return pred

In [None]:
hypothesis(x,w,b)[:10]

In [None]:
# prediction의 shape이 (100,2) 로 나옵니다. 정상적이라면 y의 shape은 (100, 1)이 되야 합니다.
hypothesis(x,w,b).shape

In [None]:
# Linear model : y = w*x + b
def hypothesis(x, w, b):
    pred = np.matmul(x, w.T) + b # matmul [100,2] * [2.1] => [100,1]
    return pred

In [None]:
hypothesis(x,w,b)[:10]

In [None]:
hypothesis(x,w,b).shape

In [None]:
# 비용함수를 정의해봅시다! 학습에는 사용되지 않지만 학습과정에서 loss가 줄어드는지 확인해볼 수 있겠군요.

loss = (1/2)*(hypothesis(x, w, b) - y)**2 # 1/2 * (h(x) - y)^2
print("loss's shape? : ", loss.shape) #중간중간 정상적인 shape인지를 확인해줍시다.

In [None]:
# 모든 데이터에 대한 loss를 위해 총합을 구해봅시다.
total_loss = (1/m)*np.sum(loss)
print("loss's shape? : ", total_loss.shape)
print("value of loss : ", total_loss)

In [None]:
def cost(x, w, b, y):
    loss = 1/2*(hypothesis(x, w, b) - y)**2 # loss = 1/2(h(x) - y)^2
    total_loss = (1/m)*np.sum(loss)
    return total_loss

In [None]:
cost(x, w, b, y)

In [None]:
# 실제 학습에서는 gradient가 사용되죠?
# 각 파라미터에 대한 gradient를 구해봅시다.
# 자료에 gradient에 대한 수식이 있습니다.
# d(cost)/dw =  (h(x) - y)(h(x))' = (h(x) - y)*x
# d(cost)/db = (h(x) - y)(h(x))' = (h(x) -y)

#shape 변화를 잘 트래킹하는 것이 요령입니다.
print((hypothesis(x, w, b) - y).shape) # shape of (h(x) -y)
print(x.shape) # shape of x
print(((hypothesis(x, w, b) - y)*x).shape) # (h(x)-y)*x

In [None]:
# derivative가 2개만 나오는군요?
def derivative(x, w, b, y):
    dw = np.sum(((hypothesis(x, w, b) - y)*x))
    db = np.sum(((hypothesis(x, w, b) - y)))
    return dw, db

derivative(x,w,b,y)

In [None]:
def derivative(x, w, b, y):
    dw = np.sum(((hypothesis(x, w, b) - y)*x), axis=0)
    db = np.sum(((hypothesis(x, w, b) - y)))
    return dw, db

derivative(x,w,b,y)

In [None]:
def update(x, w, b, y, alpha):
    dw, db = derivative(x, w, b, y)
    
    w = w - alpha*dw # w := w + alpha * dw
    b = b - alpha*db # b := b + alpha * db
    return w, b

# Step 3. Training model

In [None]:
# initialization of weights and bias
w = np.array([0, 0])
w = w[np.newaxis, :]
b = 0

In [None]:
# 10번만 돌려봅시다.

for i in range(10):
    w, b = update(x,w,b,y, 0.0001)
    loss = cost(x, w, b, y)
    print("w b : ", w, b)
    print("loss : ", loss)

In [None]:
# 100번 더 학습해봅시다.
losses = []
for i in range(500):
    w, b = update(x,w,b,y, 0.0001)
    loss = cost(x, w, b, y)
    if (i+1)%100:
        print("w b : ", w, b)
        print("loss : ", loss)
        losses.append(loss)

In [None]:
plt.plot(losses)