# 可选实验：逻辑回归

在这个未评分的实验室中，您将

- 探索Sigmoid函数（也称为逻辑函数）
- 探索逻辑回归；它使用Sigmoid函数

In [1]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from Classification.Concept.plt_one_addpt_onclick import plt_one_addpt_onclick
from Classification.Concept.lab_utils_common import draw_vthresh

plt.style.use('deeplearning.mplstyle')

## Sigmoid或Logistic函数

<img align="left" src="../../images/C1_W3_LogisticRegression_left.png" style=" width:300px; padding: 10px;" >

正如讲座视频中所讨论的，对于分类任务，我们可以使用我们的线性回归模型，$f_{\mathbf{w},b}(\mathbf{x}^{(i)})=\mathbf{w}\cdot\mathbf{x}^{(i)}+b$，给定$x$来预测$y$。

- 但是，我们希望分类模型的预测介于0和1之间，因为我们的输出变量$y$为0或1。
- 这可以通过使用“sigmoid函数”来实现，该函数将所有输入值映射到0到1之间的值。

让我们实现Sigmoid函数并亲眼看看。

## Sigmoid函数的公式

Sigmoid函数的公式如下——

$g(z)=\frac{1}{1+e^{-z}}\tag{1}$

在逻辑回归中，z（Sigmoid函数的输入）是线性回归模型的输出。

- 在单个示例的情况下，$z$是标量。
- 在有多个示例的情况下，$z$可以是由$m$值组成的向量，每个示例一个。
- Sigmoid函数的实现应该涵盖这两种潜在的输入格式。

让我们用Python来实现它。

NumPy有一个名为[`exp()`](https://numpy.org/doc/stable/reference/generated/numpy.exp.html)的函数，它提供了一种计算指数的便捷方法（$e^{z}$）输入数组（`z`）中的所有元素。
 
它还可以使用单个数字作为输入，如下所示。

In [2]:
input_array = np.array([1, 2, 3])
exp_array = np.exp(input_array)
print("Input to exp:", input_array)
print("Output of exp:", exp_array)
input_val = 1
exp_val = np.exp(input_val)
print("Input to exp:", input_val)
print("Output of exp:", exp_val)

`sigmoid`函数在Python中实现，如下面的单元格所示。

In [3]:
def sigmoid(z):
    g = 1 / (1 + np.exp(-z))
    return g

让我们看看这个函数的输出对于不同的`z`值是什么

In [4]:
z_tmp = np.arange(-10, 11)
y = sigmoid(z_tmp)
np.set_printoptions(precision=3)
print("Input (z), Output (sigmoid(z))")
print(np.c_[z_tmp, y])

左列中的值为`z`，右列中的值为`sigmoid(z)`。如您所见，Sigmoid的输入值范围为-10到10，输出值范围为0到1。

现在，让我们尝试使用`matplotlib`库来绘制该函数。

In [5]:
fig, ax = plt.subplots(1, 1, figsize=(5, 3))
ax.plot(z_tmp, y, c="b")
ax.set_title("Sigmoid function")
ax.set_ylabel('sigmoid(z)')
ax.set_xlabel('z')
draw_vthresh(ax, 0)

正如您所看到的，当`z`变为较大的负值时，Sigmoid函数接近`0`，而当`z`变为较大的正值时，Sigmoid函数接近`1`。

## 逻辑回归

<img align="left" src="../../images/C1_W3_LogisticRegression_right.png" style="width:300px; padding: 10px;" >

逻辑回归模型将Sigmoid应用于熟悉的线性回归模型，如下所示：

$$f_{\mathbf{w},b}(\mathbf{x}^{(i)})=g(\mathbf{w}\cdot\mathbf{x}^{(i)}+b)\tag{2}$$

在哪里

$g(z)=\frac{1}{1+e^{-z}}\tag{3}$

让我们将逻辑回归应用于肿瘤分类的分类数据示例。

首先，加载示例和参数的初始值。

In [6]:
x_train = np.array([0., 1, 2, 3, 4, 5])
y_train = np.array([0, 0, 0, 1, 1, 1])
w_in = np.zeros(1)
b_in = 0

请尝试以下步骤：

- 单击“Run Logistic Regression”以查找给定训练数据的最佳逻辑回归模型
    - 请注意，生成的模型非常适合数据。
    - 注意，橙色线是上面的“$z$”或$\mathbf{w}\cdot\mathbf{x}^{(i)}+b$。它与线性回归模型中的线不匹配。
      通过应用*阈值*进一步改善这些结果。
- 勾选“Toggle 0.5 threshold”框以显示应用阈值时的预测。
    - 这些预测看起来不错。预测与数据相符
    - 现在，在大肿瘤尺寸范围（接近 10）中添加更多数据点，并重新运行线性回归。
    - 与线性回归模型不同，该模型持续做出正确的预测

In [7]:
plt.close('all')
addpt = plt_one_addpt_onclick(x_train, y_train, w_in, b_in, logistic=True)

## 恭喜！

您已经探索了Sigmoid函数在逻辑回归中的使用。