# 机器学习的三要素

# 1、模型-->学什么？

### 1.1、模型的类型与适用范围

| 模型类型 | 代表模型                    | 适用任务       | 特点/优势          |
| ---- | ----------------------- | ---------- | -------------- |
| 线性模型 | 线性回归、逻辑回归               | 分类、回归      | 简单、快、可解释       |
| 树模型  | 决策树、随机森林、XGBoost        | 分类、回归      | 非线性、强大鲁棒性      |
| SVM  | 支持向量分类/回归               | 分类、回归      | 高维、边界清晰任务      |
| KNN  | 最近邻分类                   | 分类、回归      | 简单但计算慢         |
| 神经网络 | ANN、CNN、RNN、Transformer | 图像、文本、语音   | 拟合能力强，需大量数据    |
| 聚类   | K-Means、DBSCAN          | 聚类         | 发现自然分组         |
| 降维   | PCA、t-SNE、UMAP          | 降维、可视化     | 压缩高维数据，辅助建模    |
| 强化学习 | DQN、PPO、A3C             | 决策、控制      | 与环境交互，适合长期策略学习 |
| 生成模型 | GAN、VAE、Diffusion       | 图像/文本/音频生成 | 生成逼真样本         |


### 1.2、常见的模型和用途

#### 🔷 一、监督学习算法（Supervised Learning）
✅ 特点：输入数据有明确的标签（label）
✅ 应用：分类、回归、评分、预测等

| 算法名称                                      | 类型    | 常见用途                    |
| ----------------------------------------- | ----- | ----------------------- |
| **线性回归**                                  | 回归    | 房价预测、股价预测、广告点击率预测       |
| **逻辑回归**                                  | 分类    | 二分类任务，如垃圾邮件检测、疾病预测      |
| **决策树**                                   | 分类/回归 | 客户流失预测、风险评估、医疗诊断        |
| **随机森林**                                  | 分类/回归 | 信贷审批、商品推荐、信用评分          |
| **支持向量机（SVM）**                            | 分类/回归 | 图像识别、人脸识别、小样本分类         |
| **K 近邻（KNN）**                             | 分类/回归 | 推荐系统、文本分类、图像去重          |
| **梯度提升树（GBDT/XGBoost/LightGBM/CatBoost）** | 分类/回归 | Kaggle竞赛、CTR预估、反欺诈、信用评估 |
| **朴素贝叶斯**                                 | 分类    | 文本分类、垃圾邮件过滤、情感分析        |
| **神经网络（MLP）**                             | 分类/回归 | 表格数据建模、图像/文本处理          |


#### 🔷 二、无监督学习算法（Unsupervised Learning）
✅ 特点：数据没有标签

✅ 应用：聚类、降维、可视化、异常检测

| 算法名称                   | 类型      | 常见用途             |
| ---------------------- | ------- | ---------------- |
| **K-Means**            | 聚类      | 客户分群、市场细分、图像压缩   |
| **层次聚类（Hierarchical）** | 聚类      | 基因序列分析、客户画像      |
| **DBSCAN**             | 聚类      | 空间聚类、异常检测（任意形状簇） |
| **主成分分析（PCA）**         | 降维      | 特征压缩、可视化、高维数据预处理 |
| **t-SNE / UMAP**       | 可视化     | 图像、文本嵌入后的可视化     |
| **自编码器（AutoEncoder）**  | 降维/异常检测 | 图像压缩、数据去噪、异常检测   |


#### 🔷 三、半监督学习算法（Semi-supervised Learning）
✅ 特点：数据中只有部分样本有标签

✅ 应用：医学图像、语音识别、标注成本高的场景

| 方法名称               | 常见用途       |
| ------------------ | ---------- |
| 伪标签（Pseudo Label）  | 图像/文本分类任务  |
| 一致性训练（Consistency） | NLP、语音建模   |
| 图神经网络（GNN）         | 推荐系统、社交图建模 |


#### 🔷 四、强化学习算法（Reinforcement Learning）
✅ 特点：智能体与环境交互，通过“奖励”学习行为策略
✅ 应用：游戏AI、自动驾驶、机器人控制、智能推荐

| 算法名称                              | 常见用途          |
| --------------------------------- | ------------- |
| Q-learning                        | 网格世界导航、简单游戏策略 |
| Deep Q-Network（DQN）               | Atari 游戏、迷宫导航 |
| Policy Gradient（PG）               | 连续控制问题        |
| Proximal Policy Optimization（PPO） | 自动驾驶、机械臂控制    |


#### 🔷 五、深度学习算法（Deep Learning）
✅ 特点：多层神经网络，适合处理高维、复杂数据
✅ 应用：图像识别、自然语言处理、语音识别、生成式AI

| 算法/模型                | 常见用途                             |
| -------------------- | -------------------------------- |
| **多层感知机（MLP）**       | 表格数据建模、结构化数据分析                   |
| **卷积神经网络（CNN）**      | 图像分类、目标检测、图像分割                   |
| **循环神经网络（RNN）**      | 时间序列预测、语音识别、文本生成                 |
| **LSTM / GRU**       | 长文本建模、机器翻译、序列标注                  |
| **Transformer**      | 语言模型（如BERT、GPT）、代码生成、翻译          |
| **GAN（生成对抗网络）**      | 图像生成、图像修复、人脸合成                   |
| **VAE（变分自编码器）**      | 图像生成、数据压缩                        |
| **Diffusion Models** | 高质量图像/音频/视频生成（如Stable Diffusion） |


#### 🔷 六、推荐系统常用算法

| 算法类型            | 应用场景                   |
| --------------- | ---------------------- |
| 协同过滤（CF）        | 用户/物品推荐，Netflix、淘宝、抖音等 |
| 矩阵分解（SVD、ALS）   | 隐式评分建模，商品评分预测          |
| Embedding + DNN | 大规模推荐、广告点击率预测（CTR 模型）  |
| 图神经网络（GNN）      | 社交网络推荐、知识图谱补全          |


#### 🔷 七、自然语言处理（NLP）相关算法

| 算法/模型            | 应用               |
| ---------------- | ---------------- |
| TF-IDF           | 文本向量化、关键词提取      |
| Word2Vec / GloVe | 词向量生成、语义理解       |
| RNN / LSTM       | 情感分析、机器翻译、摘要     |
| Transformer      | 机器翻译、文本生成、摘要提取   |
| BERT             | 文本分类、问答系统、命名实体识别 |
| GPT系列（GPT-2/3/4） | 大语言模型、对话系统、代码生成  |


### ✅ 总结：用途与算法速查表

| 用途        | 推荐算法                    |
| --------- | ----------------------- |
| 回归预测      | 线性回归、随机森林、XGBoost       |
| 二/多分类     | 逻辑回归、SVM、神经网络           |
| 图像识别      | CNN、ResNet、EfficientNet |
| 文本分类      | BERT、RNN、Transformer    |
| 推荐系统      | CF、矩阵分解、DeepFM          |
| 聚类分析      | K-Means、DBSCAN、层次聚类     |
| 降维与可视化    | PCA、t-SNE、AutoEncoder   |
| 序列建模      | RNN、LSTM、Transformer    |
| 强化学习      | Q-Learning、DQN、PPO      |
| 生成内容（图/文） | GAN、VAE、Diffusion、GPT   |


# 2、策略-->怎么判断模型的好坏？

### 2.1、不同任务 损失函数 与 评估指标的选择

### 🔷 一、分类任务（Classification）
1️⃣ 常用损失函数

| 损失函数                             | 说明                     | 使用模型               |
| -------------------------------- | ---------------------- | ------------------ |
| Binary Cross-Entropy（对数损失）       | 用于二分类                  | 逻辑回归、神经网络（Sigmoid） |
| Categorical Cross-Entropy        | 多分类，标签独热编码（one-hot）    | 多分类神经网络（Softmax）   |
| Sparse Categorical Cross-Entropy | 多分类，标签为整数编号（非 one-hot） | CNN/RNN 分类任务       |
| Focal Loss                       | 解决样本不均衡，对困难样本权重更大      | 医疗、目标检测等样本极不均衡场景   |


| 指标名            | 说明               | 适用场景      |
| -------------- | ---------------- | --------- |
| Accuracy（准确率）  | 预测正确的比例          | 类别均衡      |
| Precision（精确率） | 真阳性 / 预测为正的样本数   | 重视“假阳性”控制 |
| Recall（召回率）    | 真阳性 / 实际正样本数     | 重视“假阴性”控制 |
| F1 Score       | 精确率与召回率的调和平均数    | 样本不均衡时常用  |
| AUC-ROC        | 衡量模型区分正负样本能力     | 二分类模型评估   |
| Log Loss(交叉熵)       | 概率预测的损失（和损失函数相同） | 分类 + 概率输出 |


                                📌 示例：
                                
                                垃圾邮件识别 → 更关注 Recall（漏掉垃圾邮件代价高）
                                
                                金融欺诈检测 → 更关注 Precision（误伤正常用户代价高）

### 🔷 二、回归任务（Regression）
1️⃣ 常用损失函数

| 损失函数          | 说明                | 特点         |
| ------------- | ----------------- | ---------- |
| MSE（均方误差）     | 对偏差平方后求平均（对离群值敏感） | 平滑、常用      |
| MAE（平均绝对误差）   | 对偏差绝对值求平均（对离群值鲁棒） | 更抗异常值      |
| Huber Loss    | 综合 MSE 和 MAE 的优点  | 可调节的鲁棒损失函数 |
| Log-Cosh Loss | 类似 MSE 但对异常值更稳定   | 平滑近似 MAE   |


| 指标名           | 说明                    |
| ------------- | --------------------- |
| MSE（均方误差）     | 衡量预测值与实际值的平方差（越小越好）   |
| RMSE（均方根误差）   | MSE 开平方后（更接近原始误差单位）   |
| MAE（平均绝对误差）   | 误差绝对值平均               |
| R²（决定系数）      | 衡量模型对数据变异的解释能力（0\~1）  |
| MAPE（平均百分比误差） | 用百分比表达误差，适用于价格、销售额预测等 |


                                📌 一般来说：
                                
                                MSE / RMSE 更适用于希望惩罚大误差的场景
                                
                                MAE 更适用于对离群值不敏感的业务，如收入预测

### 🔷 三、其他任务的常用损失 & 指标


### 🔶 损失函数 vs 评估指标的选择策略

| 项目      | 建议                                             |
| ------- | ---------------------------------------------- |
| 模型训练    | 损失函数需要**可导、连续**，能用于**反向传播**                    |
| 模型评估    | 评估指标需要**可解释、贴近业务需求**                           |
| 分类任务    | 损失函数选交叉熵，评估指标结合准确率、F1、AUC 等                    |
| 回归任务    | 损失函数选 MSE / MAE，评估指标选 RMSE / R² / MAPE         |
| 样本不平衡场景 | 损失函数用 Focal Loss，评估指标用 Precision / Recall / F1 |
| 多目标优化   | 可将多个指标合成一个多目标损失（如加权组合）                         |


# 3、算法--> 怎么找到最优的模型？

## ✅ 常见模型 vs 训练算法 vs 损失函数 vs 学习类型

| 模型 / 方法         | 训练算法或优化方法                    | 常用损失函数                    | 学习类型        |
| --------------- | ---------------------------- | ------------------------- | ----------- |
| **线性回归**        | 最小二乘法 / 梯度下降                 | 均方误差（MSE）                 | 监督学习（回归）    |
| **逻辑回归**        | 梯度下降 / SGD                   | 交叉熵（Binary Cross Entropy） | 监督学习（分类）    |
| **支持向量机（SVM）**  | SMO / 二次规划                   | Hinge Loss（合页损失）          | 监督学习（分类）    |
| **决策树**         | 贪心分裂算法（信息增益/基尼系数）            | 无损失函数（基于纯度指标）             | 监督学习（分类/回归） |
| **随机森林**        | 多棵树 + Bagging                | 同决策树（信息增益/Gini）           | 监督学习（分类/回归） |
| **梯度提升树（GBDT）** | Boosting + 梯度优化              | 可自定义（MSE / 交叉熵等）          | 监督学习（分类/回归） |
| **K近邻（KNN）**    | 无需训练（懒惰学习）                   | 不使用损失函数                   | 监督学习（分类/回归） |
| **朴素贝叶斯**       | 概率估计 / 最大似然估计                | 对数似然（log-loss）            | 监督学习（分类）    |
| **K-Means 聚类**  | 迭代优化（重心更新）                   | 类内平方误差（WCSS）              | 无监督学习（聚类）   |
| **高斯混合模型（GMM）** | EM（期望最大化）                    | 对数似然函数                    | 无监督学习（聚类）   |
| **主成分分析（PCA）**  | 奇异值分解 / 特征值分解                | 重建误差 / 方差最大化              | 无监督学习（降维）   |
| **神经网络（MLP）**   | 反向传播 + SGD / Adam / RMSprop  | 交叉熵 / MSE                 | 监督学习（分类/回归） |
| **卷积神经网络（CNN）** | 同上 + 卷积优化结构                  | 交叉熵 / MSE                 | 监督学习（图像类）   |
| **循环神经网络（RNN）** | BPTT（时间反向传播）+ Adam           | 交叉熵 / MSE                 | 监督学习（序列类）   |
| **自编码器（AE）**    | SGD / Adam                   | 重建误差（MSE）                 | 无监督学习（特征学习） |
| **强化学习（DQN）**   | Q-learning / Policy Gradient | 强化信号（回报）                  | 强化学习        |


📌 说明：

训练算法 指的是模型内部参数如何被更新，如使用梯度下降还是其他优化方式。

损失函数 用于衡量模型预测值与真实值的差距，指导参数更新。

学习类型 按是否有标签、目标和学习方式分类为：

监督学习：有标签数据（分类/回归）

无监督学习：无标签数据（聚类/降维等）

强化学习：基于奖励和状态进行决策
