# 로지스틱 회귀분석
### 참과 거짓 중에 하나를 선택하게 하는 알고리즘
공부 시간과 성적 사이의 관계는 좌표로 나타냈을 때 좌표의 형태가 직선으로 해결되는 선형회귀를 사용하기 적합하다. <br/>
공부시간에 따른 점수가 아닌 합격 여부로 발표되는 시험이 있을 경우 직선으로 해결하기 어렵다.

In [3]:
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()
import numpy as np

In [4]:
# x, y 데이터 값 -> [공부 시간, 합격 여부]
data = [[2,0],[4,0],[8,1],[10,1],[12,1],[14,1]]
xData = [i[0] for i in data] # 공부 시간
yData = [i[1] for i in data] # 합격 시간
print("공부 시간 :{}, 합격 여부 : {}".format(xData, yData))

공부 시간 :[2, 4, 8, 10, 12, 14], 합격 여부 : [0, 0, 1, 1, 1, 1]


In [5]:
# 기울기(a)와 y절편(b) 값을 랜덤한 값으로 정한다.
a = tf.Variable(tf.random_normal([1], dtype=tf.float64, seed=0))
b = tf.Variable(tf.random_normal([1], dtype=tf.float64, seed=0))
sess = tf.Session()
sess.run(tf.global_variables_initializer())
print("a = {}, b = {}".format(sess.run(a), sess.run(b)))

a = [-0.63436665], b = [-0.63436665]


In [6]:
# 시그모이드 방정식
# np.e : numpy에서 지수값을 의미하는 상수
y = 1 / (1+np.e ** -(a*xData+b))

# 시그모이드 방정식의 오차를 계산하는 수식을 만든다.
# 시그모이드 함수의 특징은 예측값(y)이 항상 0 아니면 1이다.
# http://taewan.kim/post/sigmoid_diff/
loss = -tf.reduce_mean(np.array(yData)*tf.log(y)+(1-np.array(yData))*tf.log(1-y))

# 오차를 최소로 하는 값을 찾는다.
gradient_descent = tf.train.GradientDescentOptimizer(0.25).minimize(loss)

In [9]:
# 학습을 시킨다.
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for i in range(120001):
        sess.run(gradient_descent)
        if i % 6000 == 0:
            print("count:%5d, loss:%.4f, a:%.4f, b:%.4f" %(i, sess.run(loss), sess.run(a), sess.run(b)))

count:    0, loss:1.0474, a:1.1798, b:-0.4750
count: 6000, loss:0.0058, a:2.0626, b:-12.0277
count:12000, loss:0.0030, a:2.3920, b:-14.0097
count:18000, loss:0.0020, a:2.5882, b:-15.1890
count:24000, loss:0.0015, a:2.7286, b:-16.0321
count:30000, loss:0.0012, a:2.8380, b:-16.6890
count:36000, loss:0.0010, a:2.9276, b:-17.2272
count:42000, loss:0.0009, a:3.0036, b:-17.6833
count:48000, loss:0.0008, a:3.0695, b:-18.0790
count:54000, loss:0.0007, a:3.1277, b:-18.4284
count:60000, loss:0.0006, a:3.1798, b:-18.7413
count:66000, loss:0.0006, a:3.2270, b:-19.0246
count:72000, loss:0.0005, a:3.2701, b:-19.2834
count:78000, loss:0.0005, a:3.3098, b:-19.5216
count:84000, loss:0.0004, a:3.3466, b:-19.7423
count:90000, loss:0.0004, a:3.3808, b:-19.9478
count:96000, loss:0.0004, a:3.4129, b:-20.1401
count:102000, loss:0.0004, a:3.4430, b:-20.3209
count:108000, loss:0.0003, a:3.4714, b:-20.4913
count:114000, loss:0.0003, a:3.4983, b:-20.6526
count:120000, loss:0.0003, a:3.5238, b:-20.8056
