* **로지스틱 회귀 Logistic(Linear) Regression** : 데이터의 특성과 분포를 가장 잘 나타내는
직선을 먼저 찾고, 이 직선을 기준으로 데이터를 위아래 또는 왼쪽이나 오른쪽 등으로 분류하는 방법. 이 알고리즘은 분류 알고리즘 중에서도 정확도가 상당히 높아, 딥러닝에서도 기본적인 컴포넌트로 사용. **(Regression → Classification)**


* **시그모이드(Sigmoid) 함수**
 > 모든 입력 값에 대한 함수의 출력이 0과 1 사이의 값이 되는 함수

 > 출력 값이 0.5 이상일때 논리적인 결과 값을 True(1) 상태로 정의하고, 출력 값이 0,5 미만일 때 논리적인 결과 값을 False(0)의 상태로 정의하면, 데이터의 특성은 True(1) 또는 False(0)만으로 분류됨

 > 0과 1 사이의 값으로 계산되기 때문에 시그모이드 함수의 결과를 확률로 해석하기도 함

 > **(Regression - Wx+b → Classification - sigmoid)**

* **크로스 엔트로피(Corss Entropy)** : 최종 출력 값은 시그모이드 함수에 의해서 0과 1 사이의 값으로 표시되며, 이러한 출력 값은 확률로 해석될 수 있기 때문에, 분류 시스템의 오차 값을 나타내는 손실함수를 로그(log)가 포함한 수식으로 표현한 것

In [1]:
import numpy as np

x_data = np.array([2, 4, 6, 8, 10, 12, 14, 16, 18, 20]).reshape(10, 1)
t_data = np.array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1]).reshape(10, 1)

print("x_data.shape = ", x_data.shape, ", t_data.shape = ", t_data.shape)


x_data.shape =  (10, 1) , t_data.shape =  (10, 1)


In [2]:
W = np.random.rand(1,1)
b = np.random.rand(1)

print("W = ", W, ", W.shape = ", W.shape, ", b = ", b, ", b.shape = ", b.shape)

W =  [[0.59465557]] , W.shape =  (1, 1) , b =  [0.38529457] , b.shape =  (1,)


In [3]:
def sigmoid(x) :
  return 1 / (1 + np.exp(-x))

def loss_func(x, t) :
  delta = 1e-7

  z = np.dot(x, W) + b
  y = sigmoid(z)

  return -np.sum( t*np.log(y+delta) + (1-t)*np.log((1-y)+delta) )

  # 크로스 엔트로피의 로그(log)부분이 마이너스 무한대(-∞)로 발산되는 것을
  # 방지하기 위하여 delta와 같은 작은 값을 log인자에 더해 줌

In [4]:
def numerical_derivative(f, x):
    delta_x = 1e-4 # 0.0001
    grad = np.zeros_like(x)

    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])

    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x) # f(x+delta_x)

        x[idx] = tmp_val - delta_x
        fx2 = f(x) # f(x-delta_x)
        grad[idx] = (fx1 - fx2) / (2*delta_x)

        x[idx] = tmp_val
        it.iternext()

    return grad

In [5]:
def error_val(x, t) :
  delta = 1e-7

  z = np.dot(x, W) + b
  y = sigmoid(z)

  return -np.sum( t*np.log(y+delta) + (1-t)*np.log((1-y)+delta) )

def predict(x) :

  z = np.dot(x, W) + b
  y = sigmoid(z)

  if y >= 0.5 :
    result = 1
  else :
    result = 0

  return y, result


In [6]:
learning_rate = 1e-2

f = lambda x : loss_func(x_data, t_data)

print("Initial error value = ", error_val(x_data, t_data), ", Initial W =", W, "\n", ", Initial b = ", b)

for step in range(10001) :

  W -= learning_rate * numerical_derivative(f, W)
  b -= learning_rate * numerical_derivative(f, b)

  if step % 400 == 0 :
    print("step = ", step, ", error value = ", error_val(x_data, t_data), ", W = ", W, ", b= ", b)

Initial error value =  27.56377367557694 , Initial W = [[0.59465557]] 
 , Initial b =  [0.38529457]
step =  0 , error value =  11.071185513820424 , W =  [[0.18236041]] , b=  [0.3371722]
step =  400 , error value =  3.003767039937482 , W =  [[0.43332795]] , b=  [-4.20566317]
step =  800 , error value =  1.7692406750124952 , W =  [[0.45704909]] , b=  [-5.69021897]
step =  1200 , error value =  1.5095716491002913 , W =  [[0.53351105]] , b=  [-6.7082304]
step =  1600 , error value =  1.346797237780576 , W =  [[0.5942717]] , b=  [-7.5150044]
step =  2000 , error value =  1.2318120375797403 , W =  [[0.64546438]] , b=  [-8.19326294]
step =  2400 , error value =  1.1445679472005643 , W =  [[0.69013708]] , b=  [-8.7840951]
step =  2800 , error value =  1.0751505396146577 , W =  [[0.73004227]] , b=  [-9.31110419]
step =  3200 , error value =  1.0180157360458144 , W =  [[0.76628767]] , b=  [-9.78919356]
step =  3600 , error value =  0.9697850008696255 , W =  [[0.79962179]] , b=  [-10.22842247]
st

In [7]:
real_val, logical_val = predict(3)

print(real_val, logical_val)

[[1.11293452e-05]] 0


In [8]:
real_val, logical_val = predict(17)

print(real_val, logical_val)

[[0.99130844]] 1
