在 PyTorch 中，**损失函数（Loss Function）** 是衡量模型预测输出与真实标签之间差异的重要工具。它是训练神经网络时进行反向传播优化的基础。

---

## 🔢 一、PyTorch 常见的 **分类任务** 损失函数

| 损失函数 | 类型 | 适用场景 | 公式/说明 |
|----------|------|-----------|-------------|
| `nn.CrossEntropyLoss()` | 分类 | 多分类任务（如 MNIST 手写识别） | 包含 Softmax + NLLLoss，不需要手动加 Softmax |
| `nn.NLLLoss()` | 分类 | 已经使用 LogSoftmax 后的输出计算负对数似然 | 常用于语言模型等 |
| `nn.BCELoss()` | 分类 | 二分类问题，输出是概率值（0~1），需要 sigmoid 输出 |
| `nn.BCEWithLogitsLoss()` | 分类 | 二分类，包含 Sigmoid 层，更稳定，推荐使用 |
| `nn.MultiLabelMarginLoss()` | 分类 | 多标签分类（多个类别同时为真） | 输入是原始输出，不经过 softmax |

---

## 📈 二、常见的 **回归任务** 损失函数

| 损失函数 | 类型 | 适用场景 | 公式/说明 |
|----------|------|-----------|-------------|
| `nn.MSELoss()` | 回归 | 均方误差（Mean Squared Error） | 计算预测值与目标值之间的平方差平均值 |
| `nn.L1Loss()` | 回归 | 平均绝对误差（Mean Absolute Error） | 对异常值更鲁棒 |
| `nn.SmoothL1Loss()` | 回归 | MSE 与 MAE 的折中，对小误差用 MSE，大误差用 MAE | 在目标检测中常用 |
| `nn.HuberLoss()` | 回归 | 和 SmoothL1 类似，PyTorch 1.10+ 支持 | 可指定 delta 参数控制转折点 |

---

## 🧠 三、其他特殊用途的损失函数

| 损失函数 | 类型 | 用途说明 |
|----------|------|----------|
| `nn.KLDivLoss()` | 概率分布 | 计算两个分布之间的 KL 散度 |
| `nn.MarginRankingLoss()` | 排序 | 用于排序任务，比如推荐系统中的排序学习 |
| `nn.CosineEmbeddingLoss()` | 嵌入 | 衡量两个输入之间的余弦相似性是否符合要求 |
| `nn.TripletMarginLoss()` | 嵌入 | 用于 triplet loss，人脸识别、特征嵌入优化中常用 |

---

## ✅ 如何选择损失函数？

| 任务类型 | 推荐损失函数 |
|----------|----------------|
| 二分类 | `BCEWithLogitsLoss` |
| 多分类 | `CrossEntropyLoss` |
| 多标签分类 | `BCEWithLogitsLoss` |
| 回归任务 | `MSELoss` 或 `SmoothL1Loss` |
| 特征嵌入学习 | `CosineEmbeddingLoss`, `TripletMarginLoss` |

---

## 📌 示例代码片段

### 分类任务（推荐）
```python
import torch
import torch.nn as nn

# 示例：多分类任务
loss_fn = nn.CrossEntropyLoss()
logits = torch.randn(3, 5)  # batch_size=3, num_classes=5
targets = torch.tensor([1, 0, 3])
loss = loss_fn(logits, targets)
```

### 回归任务
```python
loss_fn = nn.MSELoss()
preds = torch.randn(3, 1)
targets = torch.randn(3, 1)
loss = loss_fn(preds, targets)
```

---

如果你告诉我你正在做什么任务（例如图像分类、文本生成、目标检测等），我可以为你推荐最合适的损失函数 😊