In [1]:
import numpy as np

##### 미분 값 계산

In [2]:
def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    
    while not it.finished:
        idx = it.multi_index        
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)
        
        x[idx] = tmp_val - delta_x 
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val 
        it.iternext()   
        
    return grad

##### x값, y값 대입

In [3]:
x_data = np.array([1, 2, 3, 4, 5]).reshape(5, 1)
t_data = np.array([2, 3, 4, 5, 6]).reshape(5, 1)

print("x_data.shape = ", x_data.shape, ", t_data.shape = ", t_data.shape)

x_data.shape =  (5, 1) , t_data.shape =  (5, 1)


##### W, b에 랜덤 값 대입

In [4]:
W = np.random.rand(1, 1)
b = np.random.rand(1)

print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

W =  [[0.26017995]] , W.shape =  (1, 1) , b =  [0.98033821] , b.shape =  (1,)


##### 손실 함수 정의

In [5]:
def loss_func(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum((t - y)**2)) / (len(x))

##### 손실 함수 값 계산
입력 변수: x, t -> numpy type

In [6]:
def loss_val(x, t):
    y = np.dot(x, W) + b
    
    return (np.sum((t - y)**2)) / (len(x))

##### 학습 마친 후, 임의의 데이터에 대해 미래 값 예측
입력 변수: x -> numpy type

In [7]:
def predict(x):
    y = np.dot(x, W) + b
    
    return y

##### learning 과정

learning_rate를 변경해 보고, 반복 횟수를 변경 했을 때에도 변화가 없다면 learning_rate를 다시 다른 값으로 바꿔서 해봐야 함

일반적으로 소수점 자리 수를 우선 바꿔보고, 미세한 조절을 진행함

In [8]:
learning_rate = 1e-2  # hyper-parameter, 변경 해 보기

f = lambda x : loss_func(x_data, t_data)

print("Initial loss value = ", loss_val(x_data, t_data), "Initial W = ", W, "\n", ", b = ", b )

for step in range(8001):  # hyper-parameter, 변경 해 보기
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 400 == 0):
        print("step = ", step, "loss value = ", loss_val(x_data, t_data), "W = ", W, ", b = ",b )

Initial loss value =  6.108334544010178 Initial W =  [[0.26017995]] 
 , b =  [0.98033821]
step =  0 loss value =  3.595436972145413 W =  [[0.42412006]] , b =  [1.01528424]
step =  400 loss value =  0.0002018718588192883 W =  [[0.99077355]] , b =  [1.03330226]
step =  800 loss value =  1.2880618053615777e-05 W =  [[0.99766941]] , b =  [1.00841209]
step =  1200 loss value =  8.218595816843564e-07 W =  [[0.9994113]] , b =  [1.00212488]
step =  1600 loss value =  5.243950012306926e-08 W =  [[0.99985129]] , b =  [1.00053674]
step =  2000 loss value =  3.3459501288206005e-09 W =  [[0.99996244]] , b =  [1.00013558]
step =  2400 loss value =  2.1349139937340317e-10 W =  [[0.99999051]] , b =  [1.00003425]
step =  2800 loss value =  1.3622013434431829e-11 W =  [[0.9999976]] , b =  [1.00000865]
step =  3200 loss value =  8.691649921513939e-13 W =  [[0.99999939]] , b =  [1.00000219]
step =  3600 loss value =  5.545786480533967e-14 W =  [[0.99999985]] , b =  [1.00000055]
step =  4000 loss value =  

##### 임의의 값 대입하여 예측

In [9]:
predict(np.array([43]))

array([44.])

머신러닝 -> 리눅스를 사용하는게 맞음!  
윈도우의 경우 백그라운드 프로세스를 제어할 수 없으나(소스코드를 변경하거나 접근 불가능 하기 때문)  
리눅스의 경우 /etc/inittab 에서 원하는 프로세스만 실행할 수 있도록 제어할 수 있음  
대부분의 머신러닝 서버는 리눅스로 구성되어 있음 (Google의 경우 모든 것이 리눅스)  
그 이유는 프로세스가 돌아가는 것에 따라 컴퓨터 환경이 달라지기 때문에 그 때마다 parameter 값이 변할 수 있기 때문에..

리눅스의 부팅 서비스나 메모리 관련된 부분을 꼭 공부해두기  
윈도우 에서 virtual box를 사용하는 것도 윈도우 위에서 올리는 것이기 때문에  
'docker'를 사용하면 됨!