# 可选实验室：逻辑回归、决策边界

## 目标

在本实验室中，您将：

- 绘制逻辑回归模型的决策边界。这将使您更好地了解模型的预测内容。

In [1]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from Classification.Concept.lab_utils_common import plot_data, sigmoid, draw_vthresh

plt.style.use('deeplearning.mplstyle')

## 数据集

假设您有以下训练数据集
- 输入变量`X`是一个NumPy数组，它有6个训练示例，每个示例有两个特征
- 输出变量`y`也是一个包含6个示例的NumPy数组，`y`可以是`0`或`1`

In [2]:
X = np.array([[0.5, 1.5], [1, 1], [1.5, 0.5], [3, 0.5], [2, 2], [1, 2.5]])
y = np.array([0, 0, 0, 1, 1, 1]).reshape(-1, 1)

### 绘制数据

让我们使用辅助函数来绘制这些数据。标签$y=1$的数据点显示为红色十字，而标签$y=0$的数据点显示为蓝色圆圈。

In [3]:
fig, ax = plt.subplots(1, 1, figsize=(4, 4))
plot_data(X, y, ax)
ax.axis([0, 4, 0, 3.5])
ax.set_ylabel('$x_1$')
ax.set_xlabel('$x_0$')
plt.show()

## 逻辑回归模型

* 假设您想在此数据上训练逻辑回归模型，其形式为

  $f(x)=g(w_0x_0+w_1x_1+b)$

  其中 $g(z) = \frac{1}{1+e^{-z}}$，这是Sigmoid函数
* 假设您训练了模型并获得参数为$b=-3,w_0=1,w_1=1$。那是，

  $f(x)=g(x_0+x_1-3)$

  （您将在课程中进一步学习如何将这些参数与数据相匹配）

让我们尝试通过绘制决策边界来了解这个训练模型的预测内容

### 回顾逻辑回归和决策边界

* 回想一下，对于逻辑回归，模型表示为$f_{\mathbf{w},b}(\mathbf{x}^{(i)})=g(\mathbf{w}\cdot\mathbf{x}^{(i)}+b)\tag{1}$

  其中$g(z)$称为Sigmoid函数，它将所有输入值映射到0到1之间的值：

  $g(z)=\frac{1}{1+e^{-z}}\tag{2}$

  $\mathbf{w}\cdot\mathbf{x}$是向量点积：$\mathbf{w}\cdot\mathbf{x}=w_0x_0+w_1x_1$
    * 我们将模型的输出（$f_{\mathbf{w},b}(x)$) 解释为给定$x$并由$w$和$b$参数化的$y=1$的概率。
* 因此，要从逻辑回归模型获得最终预测（$y=0$或$y=1$），我们可以使用以下启发式——

  如果$f_{\mathbf{w},b}(x)>=0.5$，则预测$y=1$

  如果$f_{\mathbf{w},b}(x)<0.5$，则预测$y=0$
* 让我们绘制Sigmoid函数来看看$g(z) >= 0.5$在哪里

In [5]:
z = np.arange(-10, 11)
fig, ax = plt.subplots(1, 1, figsize=(5, 3))
ax.plot(z, sigmoid(z), c="b")
ax.set_title("Sigmoid function")
ax.set_ylabel('sigmoid(z)')
ax.set_xlabel('z')
draw_vthresh(ax, 0)

* 如您所见，$g(z)>=0.5$对于$z>=0$
* 对于逻辑回归模型，$z=\mathbf{w}\cdot\mathbf{x}+b$。所以，

  如果$\mathbf{w}\cdot\mathbf{x}+b>=0$，则模型预测$y=1$
  
  如果$\mathbf{w}\cdot\mathbf{x}+b<0$，则模型预测$y=0$

### 绘制决策边界

现在，让我们回到我们的示例，了解逻辑回归模型如何进行预测。

* 我们的逻辑回归模型具有以下形式

  $f(x) = g(-3 + x_0+x_1)$
* 从上面学到的内容中，您可以看到，如果$-3+x_0+x_1>= 0$，则该模型预测$y=1$

让我们看看它在图形上是什么样子的。我们首先绘制$-3+x_0+x_1=0$，这相当于$x_1=3-x_0$。

In [6]:
x0 = np.arange(0, 6)
x1 = 3 - x0
fig, ax = plt.subplots(1, 1, figsize=(5, 4))
ax.plot(x0, x1, c="b")
ax.axis([0, 4, 0, 3.5])
ax.fill_between(x0, x1, alpha=0.2)
plot_data(X, y, ax)
ax.set_ylabel(r'$x_1$')
ax.set_xlabel(r'$x_0$')
plt.show()

* 在上图中，蓝线代表$x_0+x_1-3=0$线，它应该在3处与x1轴相交（如果我们设置$x_1=3$，$x_0=0$）和x0轴为3（如果我们设置$x_1=0$，$x_0=3$）。
* 阴影区域代表$-3+x_0+x_1<0$。该线上方的区域为$-3+x_0+x_1>0$。
* 阴影区域（线下方）中的任何点都被归类为 $y=0$。线上或线上的任何点都被分类为$y=1$。这条线被称为“决策边界”。

正如我们在讲座中所看到的，通过使用高阶多项式项（例如：$f(x)=g(x_0^2+x_1-1)$，我们可以得出更复杂的非线性边界。

## 恭喜！

您已经在逻辑回归的背景下探索了决策边界。