# การบ้านเสริม: การถดถอยโลจิสติก (Logistic Regression)
ในงานปฏิบัติ (lab) นี้ (ซึ่งไม่มีคะแนน) คุณจะได้:
- ศึกษาฟังก์ชันซิกมอยด์ (sigmoid function)
- ศึกษาการถดถอยโลจิสติก (logistic regression) ซึ่งใช้ฟังก์ชันซิกมอยด์

In [None]:
from google.colab import output
output.enable_custom_widget_manager()
try:
  %matplotlib widget
  print("widget is already installed")
except:
  print("widget is not been installed, install now..")
  !pip install ipympl

In [None]:
# prompt: import requsts and download from this github link : https://raw.githubusercontent.com/Smith-WeStrideTH/Machine_Learning_Course/main/work/deeplearning.mplstyle

import requests
from pathlib import Path

url = 'https://raw.githubusercontent.com/Smith-WeStrideTH/Machine_Learning_Course/main/work/deeplearning.mplstyle'
url2 = 'https://raw.githubusercontent.com/Smith-WeStrideTH/Machine_Learning_Course/main/work/lab_utils_common_c3.py'
url3 = 'https://raw.githubusercontent.com/Smith-WeStrideTH/Machine_Learning_Course/main/work/plt_one_addpt_onclick.py'

response = requests.get(url)
with open('deeplearning.mplstyle', 'wb') as f:
  f.write(response.content)

response = requests.get(url2)
with open('lab_utils_common.py', 'wb') as f:
  f.write(response.content)

response = requests.get(url3)
with open('plt_one_addpt_onclick.py', 'wb') as f:
  f.write(response.content)

In [None]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from plt_one_addpt_onclick import plt_one_addpt_onclick
from lab_utils_common import draw_vthresh
plt.style.use('./deeplearning.mplstyle')

## Sigmoid or Logistic Function
<img align="left" src="./images/C1_W3_LogisticRegression_left_v1.png"     style=" width:300px; padding: 10px; " >ฟังก์ชันซิกมอยด์ (Sigmoid Function) สำหรับการจำแนกประเภท
ตามที่กล่าวไว้ในวิดีโอการบรรยาย สำหรับงานการจำแนกประเภท (classification task) เราสามารถเริ่มต้นด้วยการใช้โมเดลการถดถอยเชิงเส้น (linear regression model) ของเรา $f_{\mathbf{w},b}(\mathbf{x}^{(i)}) = \mathbf{w} \cdot  \mathbf{x}^{(i)} + b$, เพื่อทำนาย $y$ จาก $x$. 
- อย่างไรก็ตาม เราต้องการให้การทำนายของโมเดลการจำแนกประเภทของเรามีค่าอยู่ระหว่าง 0 ถึง 1 เนื่องจากตัวแปรผลลัพธ์ $y$ ของเรามีค่าเป็น 0 หรือ 1
- สามารถทำได้โดยใช้ "ฟังก์ชันซิกมอยด์ (sigmoid function)" ซึ่งทำการแมปค่าอินพุตทั้งหมดให้เป็นค่าระหว่าง 0 ถึง 1 


มาลองใช้งานฟังก์ชันซิกมอยด์ใน Python

## สูตรของฟังก์ชันซิกมอยด์
สูตรของฟังก์ชันซิกมอยด์มีดังนี้:

$g(z) = \frac{1}{1+e^{-z}}\tag{1}$

ในกรณีของการถดถอยโลจิสติก (logistic regression) $z$ (อินพุตของฟังก์ชันซิกมอยด์) คือผลลัพธ์ของโมเดลการถดถอยเชิงเส้น
- ในกรณีของตัวอย่างเดียว $z$ เป็นสเกลาร์ (scalar).
- ในกรณีของตัวอย่างหลายตัว $z$ อาจเป็นเวกเตอร์ (vector) ที่ประกอบด้วย $m$ ค่า ค่าหนึ่งสำหรับแต่ละตัวอย่าง
- การใช้งานฟังก์ชันซิกมอยด์ควรครอบคลุมทั้งสองรูปแบบของอินพุตที่เป็นไปได้ มาลองใช้งานใน Python





NumPy มีฟังก์ชันชื่อ [`exp()`](https://numpy.org/doc/stable/reference/generated/numpy.exp.html), ซึ่งเป็นวิธีที่สะดวกในการคำนวณเลข e ยกกำลัง (exponential) ( $e^{z}$)  ของทุกองค์ประกอบในอาเรย์อินพุต (`z`).
 
ฟังก์ชันนี้ยังสามารถใช้กับตัวเลขเพียงตัวเดียวเป็นอินพุตได้อีกด้วย ดังตัวอย่างด้านล่าง

In [None]:
# Input is an array. 
input_array = np.array([1,2,3])
exp_array = np.exp(input_array)

print("Input to exp:", input_array)
print("Output of exp:", exp_array)

# Input is a single number
input_val = 1  
exp_val = np.exp(input_val)

print("Input to exp:", input_val)
print("Output of exp:", exp_val)

ฟังก์ชัน `sigmoid` ใน Python สามารถเขียนได้ดังนี้

In [None]:
def sigmoid(z):
    """
    Compute the sigmoid of z

    Args:
        z (ndarray): A scalar, numpy array of any size.

    Returns:
        g (ndarray): sigmoid(z), with the same shape as z
         
    """

    g = 1/(1+np.exp(-z))
   
    return g

มาดูผลลัพธ์ของฟังก์ชันนี้สำหรับค่า `z` ที่ต่างกัน

In [None]:
# Generate an array of evenly spaced values between -10 and 10
z_tmp = np.arange(-10,11)

# Use the function implemented above to get the sigmoid values
y = sigmoid(z_tmp)

# Code for pretty printing the two arrays next to each other
np.set_printoptions(precision=3) 
print("Input (z), Output (sigmoid(z))")
print(np.c_[z_tmp, y])

ค่าในคอลัมน์ซ้ายคือ z และค่าในคอลัมน์ขวาคือ `sigmoid(z)`
ดังที่คุณเห็น ค่าอินพุตของซิกมอยด์ `(sigmoid)` อยู่ในช่วง -10 ถึง 10 และค่าเอาต์พุตอยู่ในช่วง 0 ถึง 1

ตอนนี้ ลองมาพล็อตฟังก์ชันนี้โดยใช้ไลบรารี `matplotlib`

In [None]:
# Plot z vs sigmoid(z)
fig,ax = plt.subplots(1,1,figsize=(5,3))
ax.plot(z_tmp, y, c="b")

ax.set_title("Sigmoid function")
ax.set_ylabel('sigmoid(z)')
ax.set_xlabel('z')
draw_vthresh(ax,0)


ฟังก์ชันซิกมอยด์ (Sigmoid Function)
ฟังก์ชันซิกมอยด์ เป็นฟังก์ชันทางคณิตศาสตร์ที่มีรูปร่างคล้ายตัว S

คุณสมบัติของฟังก์ชันซิกมอยด์:

เมื่อค่า z มีค่าลบมากขึ้นเรื่อยๆ ค่าของฟังก์ชันซิกมอยด์จะเข้าใกล้ 0
เมื่อค่า z มีค่าบวกมากขึ้นเรื่อยๆ ค่าของฟังก์ชันซิกมอยด์จะเข้าใกล้ 1


## Logistic Regression
<img align="left" src="./images/C1_W3_LogisticRegression_right_v1.png"     style=" width:300px; padding: 10px; " > การถดถอยโลจิสติก (Logistic Regression): นำฟังก์ชันซิกมอยด์มาใช้กับแบบจำลองการถดถอยเชิงเส้น

$$ f_{\mathbf{w},b}(\mathbf{x}^{(i)}) = g(\mathbf{w} \cdot \mathbf{x}^{(i)} + b ) \tag{2} $$ 

  โดย

  $g(z) = \frac{1}{1+e^{-z}}\tag{3}$


มาประยุกต์ใช้ Logistic Regression กับตัวอย่างข้อมูลเชิงประเภท (categorical data) สำหรับการจำแนกเนื้องอกกัน

ขั้นแรก โหลดตัวอย่างข้อมูลและค่าเริ่มต้นของพารามิเตอร์

In [None]:
x_train = np.array([0., 1, 2, 3, 4, 5])
y_train = np.array([0,  0, 0, 1, 1, 1])

w_in = np.zeros((1))
b_in = 0

ขั้นตอนการทดลอง:
- คลิก "Run Logistic Regression" เพื่อค้นหาโมเดลโลจิสติก Regression ที่ดีที่สุดสำหรับข้อมูลการฝึกที่กำหนด

     - สังเกตว่าโมเดลที่ได้นั้นพอดีกับข้อมูลค่อนข้างดี
     - สังเกตว่าเส้นสีส้มคือ '$z$' หรือ $\mathbf{w} \cdot \mathbf{x}^{(i)} + b$  ซึ่งอยู่ด้านบน เส้นนี้ไม่ตรงกับเส้นในโมเดล Linear Regression
ปรับปรุงผลลัพธ์เพิ่มเติมโดยใช้ threshold

- ทำเครื่องหมายที่ช่อง "Toggle 0.5 threshold" เพื่อแสดงการทำนายหากใช้ threshold

    - การทำนายเหล่านี้ดูดี การทำนายตรงกับข้อมูล
    - ตอนนี้ เพิ่มจุดข้อมูลเพิ่มเติมในช่วงขนาดเนื้องร้ายขนาดใหญ่ (ใกล้ 10) และรัน Logistic Regression อีกครั้ง
     - ไม่เหมือนกับโมเดล Linear Regression โมเดลนี้ยังคงทำนายได้ถูกต้อง

In [None]:
plt.close('all') 
addpt = plt_one_addpt_onclick( x_train,y_train, w_in, b_in, logistic=True)

## ยินดีด้วย!
คุณได้สำรวจการใช้ฟังก์ชันซิกมอยด์ (sigmoid function) ในการถดถอยโลจิสติก (logistic regression) แล้ว
