## 多任务学习（Multi-Task Learning, MTL）
<div align="center">
<img width="400" height="250" alt="image" src="https://github.com/user-attachments/assets/4dd18183-6e9e-4418-ab2b-b0f9e8edb4bb" />
</div>

# 定义  
多任务学习（Multi-Task Learning, MTL）是一种机器学习训练范式，核心思想是：一个模型同时学习多个相关任务，而不是像传统方法那样为每个任务单独训练模型。模型共享大部分参数，每个任务有特定输出头，联合优化多个目标。  

---

# 多任务学习的数学描述

## 1. 单任务学习的基本形式

给定数据集：

$$
\mathcal{D} = \{(x_i, y_i)\}_{i=1}^N,
$$

* $x_i \in \mathcal{X}$：第 $i$ 个样本的输入特征。  
* $y_i \in \mathcal{Y}$：第 $i$ 个样本对应的监督信号（标签）。  
* $N$：训练样本数量。  

我们训练一个参数为 $\theta$ 的模型：

$$
f_\theta : \mathcal{X} \to \mathcal{Y},
$$

目标是最小化期望损失：

$$
\min_\theta \ \mathbb{E}_{(x,y)\sim \mathcal{D}} \left[ \mathcal{L}(f_\theta(x), y) \right].
$$

---

## 2. 多任务学习的扩展形式

假设有 $T$ 个任务，每个任务 $t$ 的数据集为：

$$
\mathcal{D}_t = \{(x_i^t, y_i^t)\}_{i=1}^{N_t},
$$

* $x_i^t$：任务 $t$ 的输入。  
* $y_i^t$：任务 $t$ 的标签。  
* $N_t$：任务 $t$ 的样本数量。  

每个任务对应损失函数 $\mathcal{L}_t$。多任务学习优化目标是：

$$
\min_\theta \ \sum_{t=1}^T \lambda_t \, \mathbb{E}_{(x,y)\sim \mathcal{D}_t} \Big[ \mathcal{L}_t(f_\theta(x), y) \Big].
$$

* $\lambda_t$：任务权重，控制不同任务在整体目标中的重要性。  

---

## 3. 参数共享的结构化表示

实际中常用 **共享表示层 + 任务专用输出层**：

1. **共享表示层**：

$$
h = \phi_{\theta_s}(x),
$$

2. **任务专用输出层**：

$$
\hat{y}^t = f^t_{\theta_t}(h),
$$

整体优化目标：

$$
\min_{\theta_s, \{\theta_t\}_{t=1}^T} \ \sum_{t=1}^T \lambda_t \, \mathbb{E}_{(x,y)\sim \mathcal{D}_t} \left[ \mathcal{L}_t(f^t_{\theta_t}(\phi_{\theta_s}(x)), y) \right].
$$

---

## 4. 矩阵/正则化视角

### (a) 低秩约束

$$
\min_W \ \sum_{t=1}^T \mathcal{L}_t(W_t) + \lambda \|W\|_*
$$

### (b) 图正则化

$$
\min_W \ \sum_{t=1}^T \mathcal{L}_t(W_t) + \gamma \sum_{(i,j)\in E} \|W_i - W_j\|^2
$$

---

## 5. 贝叶斯视角

$$
p(\theta_1, \dots, \theta_T | \alpha) = \prod_{t=1}^T p(\theta_t | \alpha)
$$

---

## 总结

多任务学习的数学建模有三种主要思路：

1. **加权损失函数**；  
2. **参数共享**；  
3. **正则化 / 概率建模**。  

一个基于PyTorch的最简单Multi-Task Learning（MTL）示例，使用真实数据集（UCI Wine Quality数据集），实现两个任务：预测葡萄酒质量（回归任务）和预测葡萄酒是否优质（分类任务，质量≥6为优质）。结果将通过可视化和评估指标来展示。


In [None]:
... 你的 PyTorch 代码保持不变 ...