In [1]:
import numpy as np

loaded_data = np.loadtxt(
    '/content/drive/MyDrive/Colab Notebooks/AI/ML_DL_NeoWizard_Youtube/lecture_file/data-01-test-score.csv',
    delimiter=',', dtype=np.float32)

x_data = loaded_data[ : , 0:-1]
t_data = loaded_data[ : , [-1]]

print("x_data.ndim = ", x_data.ndim, "x_data.shape = ", x_data.shape)
print("t_data.ndim = ", t_data.ndim, "t_data.shape = ", t_data.shape)

x_data.ndim =  2 x_data.shape =  (25, 3)
t_data.ndim =  2 t_data.shape =  (25, 1)


In [2]:
# 가중치 W는 정답을 만드는 입력 데이터의 개수만큼 생성되어 입력 데이터 각각에 변화를 주어야 한다.
# 입력데이터가 3개면, 가중치도 3개가 필요하며, 입력데이터 784개이면, 가중치 또한 784개.

W = np.random.rand(3, 1)
b = np.random.rand(1)

print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

W =  [[0.03185731]
 [0.24738843]
 [0.45370165]] , W.shape =  (3, 1) , b =  [0.2266752] , b.shape =  (1,)


In [3]:
def loss_func(x, t) :
  y = np.dot(x, W) + b

  return (np.sum( (t-y)**2 )) / len(x)

In [4]:
def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)

    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])

    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)

        x[idx] = tmp_val - delta_x
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)

        x[idx] = tmp_val
        it.iternext()

    return grad

In [5]:
def error_val(x, t) :
  y = np.dot(x, W) + b

  return ( np.sum( (t-y)**2 )) / len(x)

def predict(x) :
  y = np.dot(x, W) + b

  return y

In [6]:
# 학습률이나 반복 횟수 등을 하이퍼 파라미터 Hyper Parameter라고 하는데, 이러한 하이퍼 파라미터 값을 설정하는 특별한 규칙은 없고, 트레이닝 데이터와 실행 환경에 맞게 최적해준다.

learning_rate = 1e-5

f = lambda x : loss_func(x_data, t_data)

print("Initial error value = ", error_val(x_data, t_data), ", Initial W = ", W, "\n", ", b = ", b)

for step in range(10001) :

  W -= learning_rate * numerical_derivative(f, W)
  b -= learning_rate * numerical_derivative(f, b)

  if (step % 400 == 0) :
    print("step = ", step, "error value = ", error_val(x_data, t_data), ", W = ", W, ", b= ", b)


Initial error value =  10774.926455144678 , Initial W =  [[0.03185731]
 [0.24738843]
 [0.45370165]] 
 , b =  [0.2266752]
step =  0 error value =  3988.8910471562745 , W =  [[0.1976406 ]
 [0.4140385 ]
 [0.62441007]] , b=  [0.22792334]
step =  400 error value =  7.416040229153614 , W =  [[0.44470242]
 [0.64625195]
 [0.92483457]] , b=  [0.22941522]
step =  800 error value =  7.047744302614762 , W =  [[0.43561823]
 [0.62441767]
 [0.9550056 ]] , b=  [0.22893032]
step =  1200 error value =  6.787154005997521 , W =  [[0.42750332]
 [0.60641193]
 [0.98049374]] , b=  [0.22841267]
step =  1600 error value =  6.602483333584738 , W =  [[0.42024835]
 [0.59158517]
 [1.00203994]] , b=  [0.22786737]
step =  2000 error value =  6.471378414565601 , W =  [[0.41375719]
 [0.57939616]
 [1.02026649]] , b=  [0.22729868]
step =  2400 error value =  6.378109176389793 , W =  [[0.40794516]
 [0.56939403]
 [1.03569622]] , b=  [0.2267102]
step =  2800 error value =  6.311598894652975 , W =  [[0.40273761]
 [0.56120339

In [7]:
test_data = np.array([100, 98, 81])

predict(test_data)

array([178.98598277])