# Logistic Regression

In [1]:
import tensorflow as tf
import numpy as np

learning_rate = 0.01
training_cnt = 10000
display_step = 1000

X = np.array([[2, 3], [4, 3], [4, 2], [2, 5], [6, 3], [5, 4] ], dtype= np.float32)
Y = np.array([[0], [0], [0], [1], [1], [1]])

W = tf.Variable(tf.random.normal([2, 1]), name='weight') 
b = tf.Variable(tf.random.normal([1]), name='bias')  

for epoch in range(training_cnt):
    with tf.GradientTape() as tape:
      pred = tf.sigmoid(tf.matmul(X ,W) + b)
      cost = -tf.reduce_mean(Y * tf.math.log(pred) + (1 - Y) * tf.math.log(1 - pred) )
      predicted = tf.cast(pred > 0.5, dtype=tf.float32)
      accuracy = tf.reduce_mean(tf.cast(tf.equal(predicted, Y), dtype=tf.float32))
    if (epoch+1) % display_step == 0:
      print("\nRun_count : [%04d], Train_cost =[%.4f], W =[%.4f %.4f], b =[%.4f], \
               \npred =[%.4f %.4f %.4f %.4f %.4f %.4f], \
               \npred_Y = [%d %d %d %d %d %d ], \
               \ntrue_Y=  [%d %d %d %d %d %d ], \
               \naccuracy = [%.2f%%] " 
              % (epoch+1, cost, W[0], W[1], b, 
                 pred[0], pred[1], pred[2], pred[3], pred[4], pred[5],
                 predicted[0], predicted[1], predicted[2], predicted[3], predicted[4], predicted[5],
                 Y[0], Y[1], Y[2], Y[3], Y[4],Y[5],
                 accuracy*100))
    W_grad, b_grad = tape.gradient(cost, [W, b])
    W.assign_sub(learning_rate * W_grad)
    b.assign_sub(learning_rate * b_grad)

print("Optimization Finished!") 


Run_count : [1000], Train_cost =[0.7159], W =[-0.1279 0.0908], b =[0.5313],                
pred =[0.6337 0.5726 0.5502 0.6747 0.5091 0.5635],                
pred_Y = [1 1 1 1 1 1 ],                
true_Y=  [0 0 0 1 1 1 ],                
accuracy = [50.00%] 

Run_count : [2000], Train_cost =[0.6470], W =[-0.0607 0.2504], b =[-0.2800],                
pred =[0.5866 0.5568 0.4945 0.7007 0.5267 0.6030],                
pred_Y = [1 1 0 1 1 1 ],                
true_Y=  [0 0 0 1 1 1 ],                
accuracy = [66.67%] 

Run_count : [3000], Train_cost =[0.5883], W =[0.0111 0.3866], b =[-1.0303],                
pred =[0.5379 0.5434 0.4470 0.7160 0.5489 0.6392],                
pred_Y = [1 1 0 1 1 1 ],                
true_Y=  [0 0 0 1 1 1 ],                
accuracy = [66.67%] 

Run_count : [4000], Train_cost =[0.5382], W =[0.0772 0.5131], b =[-1.7231],                
pred =[0.4927 0.5312 0.4042 0.7305 0.5694 0.6716],                
pred_Y = [0 1 0 1 1 1 ],                
true_Y=  

### 1) 파라메터 값 설정
- 머신러닝을 위한 기초 파라메터
- learning_rate :  값이 너무 적으면 Train 되지 않을 수 있고     
  값이 너무 크면 overshooting이 발생할 수 있다.
- training_cnt : data set에 대한 training 반복 횟수


In [3]:
# 파라메터값 설정
learning_rate = 0.01
training_cnt = 10000
display_step = 100  # 원하는 출력 위치 조정

### 2) 트레이닝 데이터 변수 선언
- 입력으로 들어가는 x data(input 2개), y data(output 1개) 설정
- numpy array를 사용 

In [4]:
X = np.array([[2, 3], [4, 3], [4, 2], [2, 5], [6, 3], [5, 4] ], dtype=np.float32)
Y = np.array([[0], [0], [0], [1], [1], [1]])

### 3) tf.random.normal
- bias, weight 초기값을 난수로 생성

In [5]:
W = tf.Variable(tf.random.normal([2, 1]), name='weight')
b = tf.Variable(tf.random.normal([1]), name='bias')

### 4) sigmoid 함수 사용
- 기존 pred 계산에 sigmoid 함수를 적용해 0~1사이의 값으로 변환
- sigmoid function => H(X) = 1/(1+𝑒^−z )
- z = XW + b


In [6]:
pred = tf.sigmoid(tf.matmul(X ,W) + b)

### 5) cost function
- 0~1사이의 값을 근사화 하기 위해서 log함수를 사용
- 𝐶(𝐻(𝑥),𝑦)=1/𝑚 ∑(𝑦𝑙𝑜𝑔(𝐻(𝑥)) −(1 −𝑦)log⁡(1 −𝐻(𝑥)) 

In [7]:
cost = -tf.reduce_mean(Y * tf.math.log(pred) + (1 - Y) * tf.math.log(1 - pred) )

### 6) 학습
- gradient decent 함수 사용(경사 하강법) 
-  파라미터 $W$, $b$ 에 대해 손실을 미분하는 과정으로, 파라미터를 증가시킬 때 손실이 얼마나 변화하는지를 알아본다. 
- with tf.GradientTape() as tape: 안에서 계산을 하면 tape에 계산 과정을 기록해두었다가 tape.gradient를 이용해서 미분을 자동으로 구할 수 있다


In [8]:
with tf.GradientTape() as tape:
  pred = tf.sigmoid(tf.matmul(X ,W) + b)
  cost = -tf.reduce_mean(Y * tf.math.log(pred) + (1 - Y) * tf.math.log(1 - pred))
W_grad, b_grad = tape.gradient(cost, [W, b])

- $w←w−η∂w$ 의 식으로 파라미터를 수정
- $η$ 는 학습률
- 경사(미분)을 따라 손실을 줄여나가기 때문에 경사하강법이라고 부름
- a.assign_sub(b)는 a = a - b 와 같다

In [9]:
W.assign_sub(learning_rate * W_grad)
b.assign_sub(learning_rate * b_grad)

<tf.Variable 'UnreadVariable' shape=(1,) dtype=float32, numpy=array([0.15444584], dtype=float32)>

### 7) 학습된 예측값을 0과 1로 변환
- 0~1사이로 학습된 예측값을 0과 1로 나누어 분류할 수 있도록 만듬

In [10]:
predicted = tf.cast(pred > 0.5, dtype=tf.float32)

### 9) 정확도
- accuracy를 계산하여 분류가 정확한지 확인
- 예측값과 실제 데이터의 일치 여부 계산 
- 아래 코드는 평균을 이용한 정확도 계산

In [11]:
accuracy = tf.reduce_mean(tf.cast(tf.equal(predicted, Y), dtype=tf.float32))

## (2) 모델 실행(run/update)
- pred는 sigmoid 함수를 통해 0~1사이의 값으로 나온다
- predicted는 pred에서 나온 값을 0과 1로 변환 시킨 값이다
- accuracy는 예측한 Y값이 실제 Y값과 얼마나 일치하는가

In [12]:
for epoch in range(training_cnt):
    with tf.GradientTape() as tape:
      pred = tf.sigmoid(tf.matmul(X ,W) + b)
      cost = -tf.reduce_mean(Y * tf.math.log(pred) + (1 - Y) * tf.math.log(1 - pred) )
      predicted = tf.cast(pred > 0.5, dtype=tf.float32)
      accuracy = tf.reduce_mean(tf.cast(tf.equal(predicted, Y), dtype=tf.float32))
    if (epoch+1) % display_step == 0:
      print("\nRun_count : [%04d], Train_cost =[%.4f], W =[%.4f %.4f], b =[%.4f], \
              \npred =[%.4f %.4f %.4f %.4f %.4f %.4f], \
              \npred_Y = [%d %d %d %d %d %d ], \
              \ntrue_Y=  [%d %d %d %d %d %d ], \
              \naccuracy = [%.2f%%] " 
              % (epoch+1, cost, W[0], W[1], b, 
                 pred[0], pred[1], pred[2], pred[3], pred[4], pred[5],
                 predicted[0], predicted[1], predicted[2], predicted[3], predicted[4], predicted[5],
                 Y[0], Y[1], Y[2], Y[3], Y[4],Y[5],
                 accuracy*100))
    W_grad, b_grad = tape.gradient(cost, [W, b])
    W.assign_sub(learning_rate * W_grad)
    b.assign_sub(learning_rate * b_grad)

print("Optimization Finished!")


Run_count : [0100], Train_cost =[0.7015], W =[-0.3124 0.4486], b =[0.1309],               
pred =[0.7010 0.5566 0.4449 0.8519 0.4019 0.5899],               
pred_Y = [1 1 0 1 0 1 ],               
true_Y=  [0 0 0 1 1 1 ],               
accuracy = [50.00%] 

Run_count : [0200], Train_cost =[0.6830], W =[-0.2381 0.3794], b =[0.0411],               
pred =[0.6689 0.5565 0.4620 0.8118 0.4380 0.5910],               
pred_Y = [1 1 0 1 0 1 ],               
true_Y=  [0 0 0 1 1 1 ],               
accuracy = [50.00%] 

Run_count : [0300], Train_cost =[0.6704], W =[-0.1830 0.3343], b =[-0.0453],               
pred =[0.6437 0.5562 0.4729 0.7791 0.4650 0.5931],               
pred_Y = [1 1 0 1 0 1 ],               
true_Y=  [0 0 0 1 1 1 ],               
accuracy = [50.00%] 

Run_count : [0400], Train_cost =[0.6610], W =[-0.1423 0.3077], b =[-0.1291],               
pred =[0.6247 0.5559 0.4793 0.7549 0.4850 0.5963],               
pred_Y = [1 1 0 1 0 1 ],               
true_Y=  [0 0 0 1 1 1 ]