In [1]:
import numpy as np

x_data=np.array([2,4,6,8,10,12,14,16,18,20]).reshape(10,1)
t_data=np.array([0,0,0,0,0,0,1,1,1,1,]).reshape(10,1)

print("x_data.shape = ", x_data.shape, ", t_data.shape = ", t_data.shape)

x_data.shape =  (10, 1) , t_data.shape =  (10, 1)


In [2]:
W=np.random.rand(1,1)
b=np.random.rand(1)
print("W = ", W, ", W.shape = ", W.shape, "b = ", b, ", b.shape = ", b.shape,)

W =  [[0.10762703]] , W.shape =  (1, 1) b =  [0.2878086] , b.shape =  (1,)


In [3]:
# 최종출력은 y=sigmoid(Wx+b) 이며, 손실함수는 cross-entropy 로 나타냄

def sigmoid(x):
    return 1/(1+np.exp(-x))

In [4]:
def loss_func(x,t):
    delta=1e-7 # log 무한대 발산 방지
    
    z=np.dot(x,W)+b
    y=sigmoid(z)
    
    # cross-entropy
    return -np.sum(t*np.log(y+delta) + (1-t)*np.log((1-y)+delta))

In [5]:
def numerical_derivative(f,x):
    delta_x= 1e-4
    grad=np.zeros_like(x) 
    # 수치미분 결과를 grad에 저장
    # x와 똑같은 shape을 가진 배열(혹은 행렬) 생성 (요소값은 0임)
    
    it=np.nditer(x,flags=['multi_index'],op_flags=['readwrite'])
    #모든 입력변수에 대해 편미분하기 위해 iterator 획득
    # iterator 하나 생성. 플래그는 멀티 인덱스 설정
    # 멀티 인덱스를 설정하면 다차원 배열이라도 
    # 순차적으로 interator 생성 후 값을 꺼낼 수 있음
    
    while not it.finished:
        idx=it.multi_index
        
        tmp_val=x[idx] 
        # 임시 변수로 x[idx] 의 원값을 저장
        # numpy 타입은 mutable 이므로 원래 값 보관
        
        x[idx]=float(tmp_val)+delta_x # 전향 차분
        fx1=f(x) #f(x+delta_x) # 첫번째 인자로 들어온 함수를 대입
        
        x[idx]=tmp_val-delta_x # 후향 차분
        fx2=f(x) #f(x-delta_x) # 첫번째 인자로 들어온 함수를 다시 대입
        
        grad[idx]=(fx1-fx2)/(2*delta_x) # 미분 결과를 grad에...
        
        x[idx]=tmp_val
        it.iternext()
        
    return grad

In [6]:
def error_val(x,t):
    delta=1e-7 # log 무한대 발산 방지
    
    z=np.dot(x,W)+b
    y=sigmoid(z)
    
    return -np.sum(t*np.log(y+delta) + (1-t)*np.log((1-y)+delta))

In [7]:
def predict(x):
    
    z=np.dot(x,W)+b
    y=sigmoid(z)
    
    if y>=0.5:
        result=1 #True
    else:
        result=0 #False
    return y, result

In [8]:
learning_rate=1e-2 # 발산할 때 1e-3~1e-6 값 바꿔 시도

f=lambda x: loss_func(x_data,t_data)
print("Initial error value = ", error_val(x_data,t_data), "Initial W = ", W, "\n", ",b=",b)

for step in range(10001):
    W -= learning_rate * numerical_derivative(f,W)
    b -= learning_rate * numerical_derivative(f,b)
    
    if(step % 400 == 0):
        print("step = ", step, "error value = ", error_val(x_data, t_data), "W = ", W, ",b = ", b)

Initial error value =  8.604865620619433 Initial W =  [[0.10762703]] 
 ,b= [0.2878086]
step =  0 error value =  11.524139638707236 W =  [[-0.14223057]] ,b =  [0.30310087]
step =  400 error value =  2.6956262366308006 W =  [[0.29001918]] ,b =  [-4.21208802]
step =  800 error value =  1.7664503844483672 W =  [[0.45776647]] ,b =  [-5.69978424]
step =  1200 error value =  1.5079540201781607 W =  [[0.53405854]] ,b =  [-6.7155086]
step =  1600 error value =  1.3457040783241603 W =  [[0.59472265]] ,b =  [-7.52098492]
step =  2000 error value =  1.2310058603937537 W =  [[0.64585227]] ,b =  [-8.19839719]
step =  2400 error value =  1.1439390285152264 W =  [[0.69048014]] ,b =  [-8.78862882]
step =  2800 error value =  1.0746403341282422 W =  [[0.73035162]] ,b =  [-9.31518688]
step =  3200 error value =  1.0175897720937837 W =  [[0.7665706]] ,b =  [-9.79292342]
step =  3600 error value =  0.9694214712730984 W =  [[0.79988338]] ,b =  [-10.2318677]
step =  4000 error value =  0.9279484112271119 W =

In [9]:
(real_val, logical_val)=predict(3)
print(real_val,logical_val)

[[1.11142679e-05]] 0


In [10]:
(real_val, logical_val)=predict(17)
print(real_val,logical_val)

[[0.99131298]] 1
