# 分类 Classification

## Motivation
- 分类是机器学习中的一种监督学习任务，旨在将输入数据分配到预定义的类别或标签中。分类任务广泛应用于各种领域，如垃圾邮件检测、图像识别、情感分析等。
- 但是线性回归无法很好地处理分类问题，因为它可能会输出超出0和1范围的值，这在概率解释上是不合理的。因此，我们需要使用专门的分类算法来解决这些问题。

## 逻辑回归 Logistic Regression
- 逻辑回归是一种广泛使用的分类算法，适用于二分类。
- 逻辑函数（Logistic Function）或称为Sigmoid函数，将线性组合的输入映射到0和1之间的概率值。
$$
\sigma(z) = \frac{1}{1 + \mathrm{e}^{-z}}
$$
- 显然：
    - 当 $ z \to +\infty $ 时，$ \sigma(z) \to 1 $
    - 当 $z \to -\infty$ 时，$\sigma(z) \to 0$
    - 这样就保证了$\sigma(z)$ 的输出在0和1之间。
- 构建逻辑回归模型：
    - 首先，我们计算线性组合：
    $$
    z = \mathbf{w}^\mathsf{T} \mathbf{x} + b
    $$
    - 然后，将其输入到逻辑函数中，得到逻辑回归表达式：
    $$
    \hat{y} = f_{\mathbf{w},b}(\mathbf{x}) = \sigma(z) = \frac{1}{1 + \mathrm{e}^{-(\mathbf{w}^\mathsf{T} \mathbf{x} + b)}}
    $$
- 对$f_{\mathbf{w},b}(\mathbf{x})$的理解：概率
    - 逻辑回归模型的输出$\hat{y}$可以解释为输入样本$\mathbf{x}$属于正类（标签为1）的概率，即：
    $$
    \hat{y} = P(y=1|\mathbf{x}; \mathbf{w}, b)
    $$

## 决策边界 Decision Boundary
- 在逻辑回归中，决策边界是将不同类别分开的边界。
- 对于二分类问题，通常选择0.5作为阈值来决定类别：
    - 如果$\hat{y} \geq 0.5$，则预测类别为1（正类）。
    - 如果$\hat{y} < 0.5$，则预测类别为0（负类）。
- 当$\hat{y} \geq 0.5$时，此时有：
$$
z = \mathbf{w}^\mathsf{T} \mathbf{x} + b \geq 0
$$
- 反之：
$$
\hat{y}<0.5 \Leftrightarrow z = \mathbf{w}^\mathsf{T} \mathbf{x} + b < 0
$$
- 因此，决策边界可以通过以下方程表示：
$$
z =\mathbf{w}^\mathsf{T} \mathbf{x} + b= 0
$$
- 这个方程定义了一个超平面，将特征空间划分为两个区域，每个区域对应一个类别。
- 对于$z$不是线性函数的分类模型，决策边界的形状可能更加复杂，但决策边界仍然是$z=0$。
- 由于逻辑回归的决策边界可以是多种形式的，因此它可以适应更复杂的数据分布情况。

## 损失函数 Loss Function
- 由于逻辑回归的逻辑函数不是线性的，有很多的局部极小值，在逻辑回归中，我们使用对数损失函数（Log Loss）来衡量模型预测与实际标签之间的差异。
- 对数损失函数定义如下：
$$
L(f_{\mathbf{w}, b}(\mathbf{x}^{(i)}),y^{(i)}) = \begin{cases}
-\log(\hat{y}^{(i)}) = -\log(f_{\mathbf{w},b}(\mathbf{x}^{(i)})) & \text{if } y^{(i)}=1 \\
-\log(1 - \hat{y}^{(i)}) = -\log(1-f_{\mathbf{w},b}(\mathbf{x}^{(i)})) & \text{if } y^{(i)}=0
\end{cases}
$$
- 其中，$\hat{y}^{(i)} = f_{\mathbf{w},b}(\mathbf{x}^{(i)})$是第$i$组样例的预测概率，$y^{(i)}$是实际标签（0或1）。
- 损失函数的意义：