# 逻辑回归

## 🧠 一、逻辑回归到底是什么？

逻辑回归是一种用于 **二分类**（也可以扩展到多分类）的问题的 **监督学习模型**。尽管名字叫“回归”，但它其实是一个**分类算法**。

> **用途：** 用来预测一个样本属于某个类别的概率，例如：
> - 邮件是否是垃圾邮件？
> - 一个人是否会点击广告？
> - 病人是否患病？

---

## ⚙️ 二、逻辑回归的数学原理

### ✅ 1. 假设函数（sigmoid 函数）

逻辑回归不是直接预测 $ y $，而是预测它为正类的概率：

$$
P(y=1 \mid x) = \sigma(z) = \frac{1}{1 + e^{-z}}, \quad z = \theta^T x
$$

其中：

- $ x $：特征向量
- $ \theta $：模型参数
- $ \sigma(z) $：**sigmoid 函数**，把任意实数压缩到 (0,1) 区间

> 直观理解：sigmoid 像一个 S 型函数，可以把线性模型输出转换成“概率感”。

---

### ✅ 2. 决策边界

预测时，如果：

$$
P(y=1 \mid x) \geq 0.5 \Rightarrow \text{预测为正类}
$$
$$
P(y=1 \mid x) < 0.5 \Rightarrow \text{预测为负类}
$$

所以 $ \theta^T x = 0 $ 就是分类的“分界线”（或者超平面） → **决策边界**

---

### ✅ 3. 损失函数（交叉熵）

逻辑回归的损失函数不是 MSE，而是**对数似然损失**（也叫交叉熵损失）：

$$
J(\theta) = -\frac{1}{n} \sum_{i=1}^{n} \left[ y^{(i)} \log(\hat{y}^{(i)}) + (1 - y^{(i)}) \log(1 - \hat{y}^{(i)}) \right]
$$

其中：

- $ \hat{y}^{(i)} = \sigma(\theta^T x^{(i)}) $
- 目标是最小化 $ J(\theta) $

这个函数是 **凸函数**，所以可以用梯度下降求解。

---

## 🔢 三、逻辑回归训练过程

1. 初始化参数 $ \theta $
2. 通过训练集计算预测值 $ \hat{y} $
3. 使用交叉熵计算损失
4. 使用梯度下降（或其他优化方法）更新参数
5. 重复迭代直到收敛

---

## 📈 四、逻辑回归的优点

✅ 简单、可解释性强
✅ 训练速度快
✅ 可以输出概率
✅ 对线性可分数据效果好
✅ 可扩展到多分类（One-vs-Rest）

---

## 🧱 五、常见限制

❌ 无法处理非线性决策边界（除非加特征变换）
❌ 对离群值敏感
❌ 需要特征标准化以加速收敛

---

## 🧠 如果用一句话总结逻辑回归：

> **逻辑回归是一种使用 sigmoid 函数将线性模型输出映射为概率的二分类模型，训练过程使用交叉熵损失，通过梯度下降拟合最优参数。**