# Logistic Regression 알고리즘은 Training Data 특성과 분포를 나타내는 최적의 직선을 찾고(Linear Regression), 이 직선을 기준으로 데이터를 위아래로 뷴류해주는 알고리즘

## 딥러닝에서 기본 component로 사용

## 출력 값 y가 0 또는 1만을 가져야만 하는 분류(classification) 시스템에서, 함수 값으로 0-1 사이의 값을 가지는 sigmoid 함수를 사용할 수 있음

## 즉, linear regression  출력 Wx + b 가 어떤 값을 갖더라도, 출력 함수로 sigmoid를 사용해서 1) sigmoid 계산 값이 0.5보다 크면 결과로 1이 나올 확률이 높다는 것이기 때문에 출력 값 y는 1로 정의하고 2) 1) sigmoid 계산 값이 0.5보다 작으면 결과로 0이 나올 확률이 높다는 것이기 때문에 출력 값 y는 0로 정의한다

## sigmoid 함수의 실제 계산 값 sigmoid(z)는 결과가 나타날 확률을 의미함

## classification에서는 손실 함수가 다름

## 최종 출력 값 y가 sigmoid 함수에 의해 0 또는 1만으로 도출되기 때문에 손실 함수가 다를 수 밖에 없음


In [18]:
# simple logistic regression(classification) - example

import numpy as np

# 1. 학습 데이터
x_data = np.array([2, 4, 6, 8, 10, 12, 14, 16, 18, 20]).reshape(10, 1)
t_data = np.array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1]).reshape(10, 1)

print("x_data.shape = ", x_data.shape, ", t_data.sahpe = ", t_data.shape)

x_data.shape =  (10, 1) , t_data.sahpe =  (10, 1)


In [30]:
# 2. 회귀선 정의 / 변수별 랜덤값 부여
W = np.random.rand(1, 1)
b = np.random.rand(1)

print("W = ", W, ", W.shape =", W.shape, ", b =", b,", b.shape = ", b.shape)

W =  [[0.28856658]] , W.shape = (1, 1) , b = [0.7140796] , b.shape =  (1,)


In [None]:
# 3. 손실함수 E(W, b) 정의
# 최종출력은 y = sigmoid(Wx+b)이며, 손실 함수는 cross-entropy로 나타냄

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def loss_func(x, t):
    
    delta = 1e-7 # log 무한대 발산 방지 / y가 0이나 1인 경우 무한대가 되어 버리기 때문에 이를 방지
    
    z = np.dot(x, W) + b
    y = sigmoid(z)
    
    #cross-entropy
    
    return -np.sum(t*np.log(y + delta) + (1-t)*np.log((1 - y) + delta))

In [None]:
# 4. 수치미분 numerical_derivative 및 utility 함수 정의

def numerical_derivative(f, x): #x는 모든 변수를 포함하고 있는 numpy객체(배열, 행렬...)
    delta_x = 1e-4 #0.0001
    grad = np.zeros_like(x)

    it = np.nditer(x, flags = ['multi_index'], op_flags=['readwrite']) #모든 입력변수에 대해 편미분하기 위해 iterator 사용
    
    while not it.finished: 
        idx = it.multi_index
        
        tmp_val = x[idx] 
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) #f(x+delta_x)
        
        x[idx] = tmp_val - delta_x
        fx2 = f(x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)
        
        x[idx] = tmp_val
        it.iternext()
    
    return grad

def error_val(x, t):
    delta = 1e-7 #log 무한대 발산 방지
    
    z = np.dot(x,W) + b
    y = sigmoid(z)
    
    #cross-entropy
    return -np.sum(t*np.log(y + delta) + (1-t)*np.log((1 - y) + delta))

def predict(x):
    
    z = np.dot(x,W) + b
    y = sigmoid(z)
    
    if y >= 0.5:
        result = 1 #True
    else:
        result = 0 #False
    
    return y, result

In [35]:
# 5. 학습율(learning rate) 초기화 및 손실함수가 최소가 될 때까지 W, b 업데이트

learning_rate = 1e-2 #발산하는 경우, 1e-3 ~ 1e-6 등으로 바꿔 실행

f = lambda x : loss_func(x_data, t_data) # f(x) = loss_func(x_data, t_data)

print("initial error value =", error_val(x_data, t_data), "initial W =", W, "\n", ", b =", b)

for step in range(100001):
    W -= learning_rate * numerical_derivative(f, W)
    b -= learning_rate * numerical_derivative(f, b)
    
    if (step % 10000 == 0):
        print("step =", step, "error value =", error_val(x_data, t_data), "W =", W, ", b = ", b)

initial error value = 0.21321849715061209 initial W = [[2.20191028]] 
 , b = [-28.53735537]
step = 0 error value = 0.21321594754557846 W = [[2.20191877]] , b =  [-28.53751493]
step = 10000 error value = 0.1904582143893488 W = [[2.31754161]] , b =  [-30.04213644]
step = 20000 error value = 0.17209804539624768 W = [[2.42141908]] , b =  [-31.39363323]
step = 30000 error value = 0.15695800105382196 W = [[2.51575923]] , b =  [-32.62091976]
step = 40000 error value = 0.14425261054378072 W = [[2.6021889]] , b =  [-33.74520772]
step = 50000 error value = 0.13343550919491973 W = [[2.68194257]] , b =  [-34.78258708]
step = 60000 error value = 0.12411382418426127 W = [[2.75598189]] , b =  [-35.74558757]
step = 70000 error value = 0.11599729127358764 W = [[2.82507199]] , b =  [-36.6441762]
step = 80000 error value = 0.10886654700111599 W = [[2.88983246]] , b =  [-37.48642226]
step = 90000 error value = 0.10255259005194856 W = [[2.95077252]] , b =  [-38.27895662]
step = 100000 error value = 0.09692

In [32]:
#3시간 입력 미래값 예측

(real_val, logical_val) = predict(3)
print(real_val, logical_val)

#17시간 입력 미래값 예측

(real_val, logical_val) = predict(17)
print(real_val, logical_val)

[[1.11982369e-05]] 0
[[0.99128774]] 1
