In [1]:
import numpy as np

loaded_data = np.loadtxt('./c_data.csv', delimiter = ',', dtype = np.float32)
# print(type(loaded_data)) # ndarray type
# print(loaded_data)

In [2]:
# x_data : 예습시간, y_data : 복습시간
# t_data : 1(Pass), 0(Fail)
x_data = loaded_data[:, :-1]
t_data = loaded_data[:, -1:]

# 데이터 차원 및 shape 확인
print("x_data.ndim = ", x_data.ndim, ", x_data.shape", x_data.shape)
print("t_data.ndim = ", t_data.ndim, ", t_data.shape", t_data.shape)

x_data.ndim =  2 , x_data.shape (9, 2)
t_data.ndim =  2 , t_data.shape (9, 1)


In [3]:
W = np.random.rand(2, 1) # 2행 1열
b = np.random.rand(1) # 값 하나

print("W = ", W.tolist(), ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

W =  [[0.4745548854281727], [0.44316903670283436]] , W.shape =  (2, 1) , b =  [0.78294031] , b.shape =  (1,)


In [4]:
# 최종 출력은 y = sigmoid(Wx+b)이며, 손실함수는 cross-entropy로 나타냄
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def loss_func(x, t):
    delta = 1e-7 # log 무한대 발산 방지
    z = np.dot(x, W) + b
    y = sigmoid(z)
    
    # cross-entropy
    return -np.sum(t*np.log(y+delta) + (1-t)*np.log((1-y)+delta))

def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001(미세하게 변하는 x값)
    grad = np.zeros_like(x) # x와 같은 모양을 만듦, 값은 모두 0
    
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite']) # iterator
    
    while not it.finished:
        idx = it.multi_index # 위치값을 가져와서 idx에 저장
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x + delta_x)
        x[idx] = float(tmp_val) - delta_x
        fx2 = f(x) # f(x - delta_x)
        grad[idx] = (fx1 - fx2) / (2 * delta_x)
        
        x[idx] = tmp_val
        it.iternext()
        
    return grad

# 손실함수 값 계산 함수
# 입력변수 x, t : numpy type
def error_val(x, t):
    delta = 1e-7 # log 무한대 발산 방지
    z = np.dot(x, W) + b
    y = sigmoid(z)
    
    # cross-entropy
    return -np.sum(t*np.log(y+delta) + (1-t)*np.log((1-y)+delta))

# 학습을 마친 후, 임의의 데이터에 대해 미래 값 예측 함수
# 입력변수 x : numpy type
def predict(x):
    z = np.dot(x, W) + b
    y = sigmoid(z)
    
    if y >= 0.5:
        result = 1 # True
    else:
        result = 0 # False
    
    return y, result

In [5]:
learning_rate = 1e-2 # 발산하는 경우, 1e-3~1e-6 등으로 바꾸어서 실행
f = lambda x: loss_func(x_data, t_data)
print("Initial error value = ", error_val(x_data, t_data), '\n', ", Initial W = ", W.tolist(), ", Initial b = ", b)

for step in range(100001):
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    if(step%500 == 0): # 결과 출력
        print("step = ", step, ", error value = ", error_val(x_data, t_data), '\n', ", W = ", W.tolist(), ", b = ", b)

Initial error value =  24.178285056372097 
 , Initial W =  [[0.4745548854281727], [0.44316903670283436]] , Initial b =  [0.78294031]
step =  0 , error value =  13.496794966627032 
 , W =  [[0.2754089190441993], [0.18460575273314161]] , b =  [0.74488278]
step =  500 , error value =  2.075117969285442 
 , W =  [[0.44721276846095104], [-0.07093729441737773]] , b =  [-3.02491472]
step =  1000 , error value =  1.4259736315505525 
 , W =  [[0.5783670098139886], [-0.008544098700174696]] , b =  [-4.80939805]
step =  1500 , error value =  1.1439265152197797 
 , W =  [[0.6741823690009234], [0.02741865516566222]] , b =  [-5.99182566]
step =  2000 , error value =  0.9814459011811364 
 , W =  [[0.7504093305863029], [0.05343366770956848]] , b =  [-6.89050327]
step =  2500 , error value =  0.8730190167517022 
 , W =  [[0.814051977687628], [0.07472689422304313]] , b =  [-7.62494678]
step =  3000 , error value =  0.7938831692317347 
 , W =  [[0.8688315184238387], [0.0935255618024603]] , b =  [-8.252483

In [6]:
test_data = np.array([3, 17])
predict(test_data)

(array([0.15439481]), 0)

In [7]:
test_data = np.array([10, 10])
predict(test_data)

(array([0.99917533]), 1)