# Phòng thí nghiệm tùy chọn: Hồi quy hậu cần

Trong phòng thí nghiệm chưa được phân loại này, bạn sẽ

- khám phá hàm sigmoid (còn được gọi là hàm logistic)

- khám phá hồi quy logistic; sử dụng hàm sigma

In [1]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from plt_one_addpt_onclick import plt_one_addpt_onclick
from lab_utils_common import draw_vthresh
plt.style.use('./deeplearning.mplstyle')

ModuleNotFoundError: No module named 'ipympl'

## Hàm Sigmoid hoặc Logistic

<img align="left" src="./images/C1_W3_LogisticRegression_left.png" style=" width:300px; padding: 10px; " >Như đã thảo luận trong các video bài giảng, đối với một nhiệm vụ phân loại, chúng ta có thể bắt đầu bằng cách sử dụng mô hình hồi quy tuyến tính của mình, $f_{\mathbf{w},b}(\mathbf{x}^{(i)}) = \mathbf{w} \cdot \mathbf{x}^{(i)} + b$, để dự đoán $y$ cho $x$.

- Tuy nhiên, chúng tôi muốn các dự đoán của mô hình phân loại của chúng tôi nằm trong khoảng từ 0 đến 1 vì biến đầu ra $y$ của chúng tôi là 0 hoặc 1.

- Điều này có thể được thực hiện bằng cách sử dụng "hàm sigma" ánh xạ tất cả các giá trị đầu vào đến các giá trị từ 0 đến 1.

Hãy thực hiện chức năng sigma và tự mình xem điều này.

## Công thức cho hàm Sigmoid

Công thức cho một hàm sigma như sau -

$g(z) = \frac{1}{1+e^{-z}}\tag{1}$

Trong trường hợp hồi quy logistic, z (đầu vào cho hàm sigmoid), là đầu ra của mô hình hồi quy tuyến tính.

- Trong trường hợp của một ví dụ duy nhất, $z$ là vô hướng.

- trong trường hợp có nhiều ví dụ, $z$ có thể là một vectơ bao gồm các giá trị $m$, một cho mỗi ví dụ.

- Việc triển khai chức năng sigmoid nên bao gồm cả hai định dạng đầu vào tiềm năng này.

Hãy triển khai điều này bằng Python.

NumPy có một hàm được gọi là [`exp()`](https://numpy.org/doc/stable/reference/generated/numpy.exp.html), cung cấp một cách thuận tiện để tính toán hàm mũ ( $e^{z}$) của tất cả các phần tử trong mảng đầu vào (`z`).

Nó cũng hoạt động với một số duy nhất làm đầu vào, như được hiển thị bên dưới.

In [2]:
# Input is an array. 
input_array = np.array([1,2,3])
exp_array = np.exp(input_array)

print("Input to exp:", input_array)
print("Output of exp:", exp_array)

# Input is a single number
input_val = 1  
exp_val = np.exp(input_val)

print("Input to exp:", input_val)
print("Output of exp:", exp_val)

Input to exp: [1 2 3]
Output of exp: [ 2.72  7.39 20.09]
Input to exp: 1
Output of exp: 2.718281828459045


Chức năng `sigmaid` được triển khai trong python như thể hiện trong ô bên dưới.

In [3]:
def sigmoid(z):
    """
    Compute the sigmoid of z

    Args:
        z (ndarray): A scalar, numpy array of any size.

    Returns:
        g (ndarray): sigmoid(z), with the same shape as z
         
    """

    g = 1/(1+np.exp(-z))
   
    return g

Let's see what the output of this function is for various value of `z`

In [4]:
# Generate an array of evenly spaced values between -10 and 10
z_tmp = np.arange(-10,11)

# Use the function implemented above to get the sigmoid values
y = sigmoid(z_tmp)

# Code for pretty printing the two arrays next to each other
np.set_printoptions(precision=3) 
print("Input (z), Output (sigmoid(z))")
print(np.c_[z_tmp, y])

Input (z), Output (sigmoid(z))
[[-1.000e+01  4.540e-05]
 [-9.000e+00  1.234e-04]
 [-8.000e+00  3.354e-04]
 [-7.000e+00  9.111e-04]
 [-6.000e+00  2.473e-03]
 [-5.000e+00  6.693e-03]
 [-4.000e+00  1.799e-02]
 [-3.000e+00  4.743e-02]
 [-2.000e+00  1.192e-01]
 [-1.000e+00  2.689e-01]
 [ 0.000e+00  5.000e-01]
 [ 1.000e+00  7.311e-01]
 [ 2.000e+00  8.808e-01]
 [ 3.000e+00  9.526e-01]
 [ 4.000e+00  9.820e-01]
 [ 5.000e+00  9.933e-01]
 [ 6.000e+00  9.975e-01]
 [ 7.000e+00  9.991e-01]
 [ 8.000e+00  9.997e-01]
 [ 9.000e+00  9.999e-01]
 [ 1.000e+01  1.000e+00]]


Các giá trị trong cột bên trái là `z`, và các giá trị trong cột bên phải là `sigma(z)`. Như bạn có thể thấy, các giá trị đầu vào cho sigmoid nằm trong khoảng từ -10 đến 10 và các giá trị đầu ra nằm trong khoảng từ 0 đến 1.

Bây giờ, hãy thử vẽ hàm này bằng cách sử dụng thư viện `matplotlib`.

In [5]:
# Plot z vs sigmoid(z)
fig,ax = plt.subplots(1,1,figsize=(5,3))
ax.plot(z_tmp, y, c="b")

ax.set_title("Sigmoid function")
ax.set_ylabel('sigmoid(z)')
ax.set_xlabel('z')
draw_vthresh(ax,0)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

Như bạn có thể thấy, hàm sigma tiếp cận `0` khi `z` đi đến các giá trị âm lớn và tiếp cận `1` khi `z` đi đến các giá trị dương lớn.

## Logistic Regression
<img align="left" src="./images/C1_W3_LogisticRegression_right.png"     style=" width:300px; padding: 10px; " > A logistic regression model applies the sigmoid to the familiar linear regression model as shown below:

$$ f_{\mathbf{w},b}(\mathbf{x}^{(i)}) = g(\mathbf{w} \cdot \mathbf{x}^{(i)} + b ) \tag{2} $$ 

  where

  $g(z) = \frac{1}{1+e^{-z}}\tag{3}$


  
Let's apply logistic regression to the categorical data example of tumor classification.  
First, load the examples and initial values for the parameters.
  


In [6]:
x_train = np.array([0., 1, 2, 3, 4, 5])
y_train = np.array([0,  0, 0, 1, 1, 1])

w_in = np.zeros((1))
b_in = 0

Hãy thử các bước sau:

- Nhấp vào 'Chạy hồi quy hậu cần' để tìm mô hình hồi quy logistic tốt nhất cho dữ liệu đào tạo đã cho

- Lưu ý rằng mô hình kết quả phù hợp với dữ liệu khá tốt.

- Lưu ý, dòng màu cam là '$z$' hoặc $\mathbf{w} \cdot \mathbf{x}^{(i)} + b$ ở trên. Nó không khớp với dòng trong mô hình hồi quy tuyến tính.

Cải thiện hơn nữa những kết quả này bằng cách áp dụng *ngưỡng*.

- Đánh dấu vào ô 'Toggle 0.5 threshold' để hiển thị các dự đoán nếu một ngưỡng được áp dụng.

- Những dự đoán này có vẻ tốt. Các dự đoán khớp với dữ liệu

- Bây giờ, thêm các điểm dữ liệu khác trong phạm vi kích thước khối u lớn (gần 10) và chạy lại hồi quy logistic.

- không giống như mô hình hồi quy tuyến tính, mô hình này tiếp tục đưa ra các dự đoán chính xác

In [7]:
plt.close('all') 
addpt = plt_one_addpt_onclick( x_train,y_train, w_in, b_in, logistic=True)

Canvas(toolbar=Toolbar(toolitems=[('Home', 'Reset original view', 'home', 'home'), ('Back', 'Back to previous …

## Congratulations!
You have explored the use of the sigmoid function in logistic regression.