在二分类任务中，最常用的损失函数是 **二元交叉熵损失函数（Binary Cross-Entropy Loss）**，也称为 **对数损失（log loss）**。其数学表达式如下：

---

### 🎯 **Binary Cross-Entropy Loss（简写为 BCE）**：

假设：

- $ y $ 是真实标签（0 或 1）；
- $ \hat{y} $ 是模型预测的属于类别1的概率（在0到1之间）；

损失函数定义为：

$$
\mathcal{L}_{BCE} = - \left[ y \cdot \log(\hat{y}) + (1 - y) \cdot \log(1 - \hat{y}) \right]
$$

---

### ✅ 说明：
- 如果 $ y = 1 $，只保留第一项 $ -\log(\hat{y}) $，也就是希望模型预测的 $ \hat{y} $ 越接近1越好；
- 如果 $ y = 0 $，只保留第二项 $ -\log(1 - \hat{y}) $，希望模型预测的 $ \hat{y} $ 越接近0越好；
- 如果预测和真实标签越接近，损失越小。

In [2]:
import torch
import torch.nn as nn

y_true = torch.tensor(data=[0, 1, 0], dtype=torch.float32)
y_pred = torch.tensor(data=[0.6901, 0.5459, 0.2469], requires_grad=True, dtype=torch.float32)

loss_fn = nn.BCELoss()
loss = loss_fn(y_pred, y_true)

print(loss)

tensor(0.6868, grad_fn=<BinaryCrossEntropyBackward0>)


In [5]:

# 简单模型：2维输入 -> 1维输出
model = nn.Linear(2, 1)

# 损失函数（自动加 sigmoid）
criterion = nn.BCEWithLogitsLoss()

# 输入样本（batch_size=2）
x = torch.tensor([[1.0, 2.0], [2.0, 1.0]])  # shape: [2, 2]
y = torch.tensor([[1.0], [0.0]])           # shape: [2, 1]

# 前向传播：得到 logits
logits = model(x)
print(logits)

# 计算损失
loss = criterion(logits, y)

print(f"loss = {loss.item():.4f}")


tensor([[ 0.6219],
        [-0.4922]], grad_fn=<AddmmBackward0>)
loss = 0.4534


In [6]:
torch.sigmoid(input=logits)

tensor([[0.6506],
        [0.3794]], grad_fn=<SigmoidBackward0>)