# 단일 입력 로지스틱 회귀 모델
1개의 입력을 받아 0 또는 1을 출력하는 로지스틱 회귀 모델을 케라스로 구현해보도록 하겠습니다.

In [1]:
from keras.models import Sequential
from keras.layers import Dense, Activation
import numpy as np

Using TensorFlow backend.


sigmoid(wx+b)의 형태를 갖는 간단한 로지스틱 회귀를 케라스로 구현합니다.  
첫번째 Dense는 선형회귀 레이어입니다.  
input_dim=1은 입력값이 1개를 의미하며, units = 1은 출력값이 1개임을 의미합니다.  
선형 회귀에 이어서 로지스틱(시그모이드) 함수를 붙여서, 선형회귀의 출력값을 0부터 1의 값으로 정규화합니다.  
학습 과정 시, 경사하강법(sgd)을 사용하여 cross entropy를 최소값을 갖는 w와 b를 찾습니다. 
binary_accuracy는 모델의 출력값이 0.5 이상일 경우는 출력값을 1로 판단하고,  
0.5 이하일 경우 0으로 판단하여, y값과 비교하여, 모델의 정확도를 계산합니다.

In [2]:
model = Sequential()
model.add(Dense(input_dim=1, units = 1))
model.add(Activation('sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['binary_accuracy'])

모델을 학습시키기 위한 데이터를 생성합니다.

In [3]:
X = np.array([-2, -1.5, -1, 1.25, 1.62, 2]) 
Y = np.array([0, 0, 0, 1, 1, 1])

모델 학습을 진행합니다.  
1000번의 반복 학습을 통해 최적의 w와 b를 찾아냅니다.

In [4]:
model.fit(X, Y, epochs=300, verbose=0)

<keras.callbacks.History at 0x114474710>

학습 데이터에 따른 실제 모델의 출력값을 확인해봅니다.  
-2, -1.5, -1에 해당하는 값은 0.5보다 작고, 나머지 값들은 0.5보다 큰 것을 확인할 수 있습니다.

In [5]:
model.predict([-2, -1.5, -1, 1.25, 1.62, 2])

array([[0.104971  ],
       [0.1664175 ],
       [0.25363967],
       [0.7882539 ],
       [0.8465854 ],
       [0.8920969 ]], dtype=float32)

시그모이드의 특성상 왼쪽 극한의 값은 0으로 수렴하며, 오른쪽 극한의 값은 1로 확인하는 것을 확인합니다.

In [6]:
model.predict([-1000, 1000])

array([[0.],
       [1.]], dtype=float32)

아래 model.summary() 명령어를 사용하여, 모델의 구성이 어떻게 이뤄졌는 지 확인합니다.  
단일 입력 로지스틱 모델은 단 한개의 w와 b가 첫번째 레이어에 존재하며, 학습 과정을 통해  
최적의 w와 bias값이 지정됩니다.
dense_1 레이어에 2개의 param이 있는 것을 확인하실 수 있으며, 이 2개의 param이 w와 b입니다.
dense_1 레이어를 선형 회귀 레이어라고 보실 수 있습니다.  
선형 회귀 레이어의 출력값은 activation_1 레이어의 입력값으로 들어갑니다.  
activation_1 레이어는 시그모이드 함수로 우리가 설정했으며, 특별히 학습되는 param은 존재하지 않습니다.

In [7]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 1)                 2         
_________________________________________________________________
activation_1 (Activation)    (None, 1)                 0         
Total params: 2
Trainable params: 2
Non-trainable params: 0
_________________________________________________________________


첫번째 레이어에 존재하는 w와 b는 아래의 명령어로 확인하실 수 있습니다.

In [8]:
model.layers[0].weights

[<tf.Variable 'dense_1/kernel:0' shape=(1, 1) dtype=float32_ref>,
 <tf.Variable 'dense_1/bias:0' shape=(1,) dtype=float32_ref>]

학습을 통해 얻어진 최적의 w와 b는 get_weights() 함수로 확인 가능합니다.

In [9]:
model.layers[0].get_weights()

[array([[1.0638782]], dtype=float32), array([-0.01541571], dtype=float32)]