## 로지스틱 회귀

  

### 공부시간에 따른 합격여부 예제
|공부시간   	|   2	|  4 	| 6  	| 8  	|10  	|12  	|14  	|
|---	|---	|---	|---	|---	|---	|---	|---	|
|합격여부   	| 불합격  	| 불합격  	| 불합격  	| 합격  	| 합격  	| 합격  	| 합격  	|

### Sigmoid Function

$y = \frac{1}{1+e^{(-ax+b)}}$

In [12]:
import numpy as np

def sigmoid(x):
  return 1 / (1 +np.exp(-x))

In [11]:
sigmoid(0.2)

0.549833997312478

In [42]:
import tensorflow as tf
import numpy as np


# x,y의 데이터값
data = [[2, 0],[4, 0],[6, 0],[8, 1],[10, 1],[12, 1],[14, 1]]
x_data = [x_row[0] for x_row in data]
y_data = [y_row[1] for y_row in data]


# a와 b의 값을 임의로 정한다.
a = tf.Variable(tf.random_normal([1], dtype=tf.float64, seed=0 ))
b = tf.Variable(tf.random_normal([1], dtype=tf.float64, seed=0 ))

# y 시그모이드 함수의 방정식
y = 1/(1+np.e**(-a*x_data+b))

# Loss를 구하는 함수 

loss = -tf.reduce_mean(np.array(y_data)*tf.log(y)+(1-np.array(y_data)) * tf.log(1-y))

# 학습률 값
learning_rate = 0.5

# loss를 최소로 하는 값 찾기
gradient_decent = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

#학습

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for i in range(60001):
        sess.run(gradient_decent)
        if i % 6000 == 0:
            print("Epoch: %.f, loss= %.4f, 기울기 a = %.4f, y절편=%.4f" %(i, sess.run(loss), sess.run(a), sess.run(b)))




Epoch: 0, loss= 4.4835, 기울기 a = 2.3946, y절편=-0.8820
Epoch: 6000, loss= 0.0152, 기울기 a = 2.9209, y절편=20.2966
Epoch: 12000, loss= 0.0081, 기울기 a = 3.5636, y절편=24.8002
Epoch: 18000, loss= 0.0055, 기울기 a = 3.9556, y절편=27.5458
Epoch: 24000, loss= 0.0041, 기울기 a = 4.2380, y절편=29.5227
Epoch: 30000, loss= 0.0033, 기울기 a = 4.4585, y절편=31.0672
Epoch: 36000, loss= 0.0028, 기울기 a = 4.6395, y절편=32.3343
Epoch: 42000, loss= 0.0024, 기울기 a = 4.7929, y절편=33.4084
Epoch: 48000, loss= 0.0021, 기울기 a = 4.9261, y절편=34.3404
Epoch: 54000, loss= 0.0019, 기울기 a = 5.0436, y절편=35.1634
Epoch: 60000, loss= 0.0017, 기울기 a = 5.1489, y절편=35.9003


### 다중 로지스틱 회귀

In [89]:
import tensorflow as tf
import numpy as np

# 실행할때마다 같은 결과를 출력하기 우한 seed값 출력
seed=0
np.random.seed(seed)
tf.set_random_seed(seed)



# x,y의 데이터값
x_data = np.array([[2, 3],[4, 3],[6, 4],[8, 6],[10, 7],[12, 8],[14, 9]])
y_data = np.array([0,0,0,1,1,1,1]).reshape(7,1)


# 입력 값을 플레이스 홀더에 저장
X = tf.placeholder(tf.float64, shape=[None,2]) 
Y = tf.placeholder(tf.float64, shape=[None,1])


# a와 b의 값을 임의로 정한다.
a = tf.Variable(tf.random_normal([2,1], dtype=tf.float64))
b = tf.Variable(tf.random_normal([1], dtype=tf.float64))

# y 시그모이드 함수의 방정식
y = tf.sigmoid(tf.matmul(X,a)+b)

# Loss를 구하는 함수 

loss = -tf.reduce_mean(Y*tf.log(y) + (1-Y)*tf.log(1-y))

# 학습률 값
learning_rate = 0.1

# loss를 최소로 하는 값 찾기
gradient_decent = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)


predicted = tf.cast(y > 0.5, dtype=tf.float64)
accuracy = tf.reduce_mean(tf.cast(tf.equal(predicted, Y), dtype=tf.float64))


# 학습
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    for i in range(3001):
        a_, b_, loss_, _ = sess.run([a, b, loss, gradient_decent], feed_dict={X: x_data, Y: y_data})
        if (i + 1) % 300 == 0:
            print("step=%d, a1=%.4f, a2=%.4f, b=%.4f, loss=%.4f" % (i + 1, a_[0], a_[1], b_, loss_))
            
# 어떻게 활용하는가
    new_x = np.array([7,6.]).reshape(1,2)
    new_y = sess.run(y, feed_dict={X: new_x})
    
    print('공부한 시간:%d, 과외 수업횟수:%d' %(new_x[:,0], new_x[:,1]))
    print('합격 가능성:%6.2f %%' % (new_y*100))

step=300, a1=0.9689, a2=-0.8142, b=-2.1882, loss=0.2829
step=600, a1=0.9237, a2=-0.4732, b=-3.6931, loss=0.2024
step=900, a1=0.8099, a2=-0.1065, b=-4.7890, loss=0.1571
step=1200, a1=0.6901, a2=0.2272, b=-5.6552, loss=0.1278
step=1500, a1=0.5793, a2=0.5205, b=-6.3719, loss=0.1073
step=1800, a1=0.4810, a2=0.7766, b=-6.9833, loss=0.0923
step=2100, a1=0.3947, a2=1.0011, b=-7.5165, loss=0.0809
step=2400, a1=0.3191, a2=1.1990, b=-7.9893, loss=0.0719
step=2700, a1=0.2528, a2=1.3748, b=-8.4140, loss=0.0647
step=3000, a1=0.1942, a2=1.5323, b=-8.7996, loss=0.0588
공부한 시간:7, 과외 수업횟수:6
합격 가능성: 85.24 %
