# TOPSIS 学习笔记（仅 Markdown）

**学习目标**
- 理解如何从原始决策矩阵 $X=[x_{ij}]$ 出发，得到归一化矩阵 $N=[n_{ij}]$，并完成加权、求最优/最劣解、距离与贴近度计算，得到最终排序。
- 能够区分并处理不同类型的指标（极大型、极小型、区间型、中值型）的“正向化”思想。
- 掌握并保持符号一致（如 $m^+$, $m^-$, $t^+$, $t^-$, $s_i$, $n_{ij}$）。


## 1. 方法核心

TOPSIS（Technique for Order Preference by Similarity to Ideal Solution）即逼近理想解排序法。TOPSIS 将问题拆解为方案层和指标层。考虑所有方案，将所有方案在各个指标上的得分进行归一化。对所有指标而言，都有最佳和最劣值，得到最佳值向量和最劣值向量。对指标进行权重分配，得到加权指标向量。高维向量可以看作高维空间中的点，求解向量之间的距离，与最佳值点距离越小，与最劣值点距离越小，越接近理想解。择优即可。

TOPSIS 适用于方案选择和方案评价的问题。


## 2. 记号与定义

为保证后续 LaTeX 公式可读，先统一符号（先定义再使用）：

- 方案（Alternative）数量：$n$。指标（Criterion）数量：$m$。
- 原始决策矩阵：$X=[x_{ij}]\in\mathbb{R}^{n\times m}$，其中 $x_{ij}$ 表示方案 $i$ 在指标 $j$ 上的得分。
- 归一化矩阵：$N=[n_{ij}]\in\mathbb{R}^{n\times m}$，其中 $n_{ij}$ 表示方案 $i$ 在指标 $j$ 上的得分归一化值。
- 对某一指标 $k$ 的得分向量：$s^{(k)} = [s^{(k)}_i]_{i=1}^n$，其中 $s^{(k)}_i$ 为方案 $i$ 在指标 $k$ 上的（经过必要预处理后的）得分。
- 最优解与最劣解（未加权）：$m^+$ 表示最优解向量，$m^-$ 表示最劣解向量；$s_i$ 表示方案 $i$ 的（归一化后）得分向量。
- 权重向量：$w=[w_j]_{j=1}^m$，$w_j\ge 0$，且 $\sum_{j=1}^m w_j=1$。
- 加权后的最优/最劣解向量：$t^+$ 表示最优解，$t^-$ 表示最劣解；加权归一化得分：$v_{ij}=w_j n_{ij}$。
- 距离：$D_i^+$ 表示方案 $i$ 到 $t^+$ 的距离，$D_i^-$ 表示方案 $i$ 到 $t^-$ 的距离。
- 贴近度：$C_i$。


## 3. 数学图景：构建与归一化

- 构建原始决策矩阵 $X = [x_{ij}]$。$x_{ij}$ 表示方案 $i$ 在指标 $j$ 上的得分。
- 构建归一化矩阵 $N = [n_{ij}]$。$n_{ij}$ 表示方案 $i$ 在指标 $j$ 上的得分归一化值。

**归一化步骤 1：标准化（用于消除量纲差异）**。这里用向量范数标准化（使不同指标可比）：
$n_{ij} = \frac{x_{ij}}{\sqrt{\sum_{i=1}^{n} x_{ij}^{2}}},\quad i=1,2,\ldots,n;\; j=1,2,\ldots,m.$
其中 $\sum_{i=1}^{n} x_{ij}^{2}$ 表示对第 $j$ 个指标在所有方案上的平方和。


## 4. 指标分数正向化

**归一化步骤 2：指标分数正向化**。

说人话就是，绩效指标可能需要最高分，失误率指标可能需要最小值，血压指标则偏好中间的某个范围，中值型指标偏好某个确定的中间值。它们不一定好在坐标轴上标定。这些不同的指标类型并不总能直接统一表示为某个维度上的正向线性距离，因此需要正向化。

下面以某一指标 $k$ 的得分向量 $s^{(k)}=[s^{(k)}_i]_{i=1}^n$ 为对象，得到正向化后的分数 $\tilde{s}^{(k)}_i$。

**2.1 极大型指标（越大越好）**：
$\tilde{s}^{(k)}_i = s^{(k)}_i.$

**2.2 极小型指标（越小越好）**（线性正向化）：
令 $s^{(k)}_{\max}=\max_{1\le i\le n}s^{(k)}_i$，$s^{(k)}_{\min}=\min_{1\le i\le n}s^{(k)}_i$，则
$\tilde{s}^{(k)}_i = \frac{s^{(k)}_{\max}-s^{(k)}_i}{s^{(k)}_{\max}-s^{(k)}_{\min}}.$

**2.3 区间型指标（偏好区间 $[a,b]$）**（区间内最好，越偏离越差；用距离归一化到 $[0,1]$）：
令
$d_i =\begin{cases}0, & s^{(k)}_i\in [a,b],\\a - s^{(k)}_i, & s^{(k)}_i < a,\\s^{(k)}_i - b, & s^{(k)}_i > b,\end{cases}\quad d_{\max}=\max_{1\le i\le n} d_i,$
则
$\tilde{s}^{(k)}_i = 1 - \frac{d_i}{d_{\max}}.$

**2.4 中值型指标（偏好某个中值 $t$）**（越接近 $t$ 越好；用距离归一化到 $[0,1]$）：
令
$d_i = \lvert s^{(k)}_i - t\rvert,\quad d_{\max}=\max_{1\le i\le n} d_i,$
则
$\tilde{s}^{(k)}_i = 1 - \frac{d_i}{d_{\max}}.$

上述处理方法的前提假设是，指标得分向量在分布上是线性的。若指标在分布域上呈现明显的特征（如指数特征、对数特征），则应考虑使用非线性处理方法。

最终我们得到优劣解向量和各方案的归一化得分向量。$m^+$ 表示最优解，$m^-$ 表示最劣解，$s_i$ 表示第 $i$ 个方案的得分向量。


## 5. 指标权重分配与加权矩阵

**归一化步骤 3：指标权重分配**。

将所有指标的权重点乘分配给各个指标，得到加权优劣解向量和加权方案评价矩阵。用 $V=[v_{ij}]$ 表示加权归一化矩阵：
$v_{ij} = w_j\, n_{ij},\quad i=1,2,\ldots,n;\; j=1,2,\ldots,m.$
加权最优解向量 $t^+$ 与加权最劣解向量 $t^-$：
$t_j^+ = \max_{1\le i\le n} v_{ij},\qquad t_j^- = \min_{1\le i\le n} v_{ij},\quad j=1,2,\ldots,m.$

当未给出权重时，采用等权：
$w_j = \frac{1}{m},\quad j=1,2,\ldots,m.$


## 6. 距离与贴近度

**距离计算**：把每个方案 $i$ 的加权归一化向量 $v_i=[v_{ij}]_{j=1}^m$ 看作高维空间中的点，计算其到 $t^+$ 与 $t^-$ 的距离（欧氏距离）：
$D_i^+ = \sqrt{\sum_{j=1}^{m} \left(v_{ij}-t_j^+\right)^2},\qquad D_i^- = \sqrt{\sum_{j=1}^{m} \left(v_{ij}-t_j^-\right)^2}.$

**贴近度**：定义贴近度 $C_i$：
$C_i = \frac{D_i^-}{D_i^+ + D_i^-},\quad 0\le C_i\le 1.$
得到最终得分向量 $[C_i]_{i=1}^n$，随后择优即可。


## 7. TOPSIS 过程（编号步骤）

1. 构建原始决策矩阵 $X=[x_{ij}]$。
2. 对各指标进行标准化，得到归一化矩阵 $N=[n_{ij}]$。
3. 若指标类型不同（极大型/极小型/区间型/中值型），先对指标得分向量做正向化，使其可统一为“越大越好”。
4. 分配指标权重 $w$，并将权重作用到归一化得分上，得到加权评价矩阵 $V=[v_{ij}]$。
5. 对每个指标取加权最优解 $t^+$ 与加权最劣解 $t^-$。
6. 计算各方案到 $t^+$ 与 $t^-$ 的距离 $D_i^+, D_i^-$。
7. 计算贴近度 $C_i$，得到最终得分向量并排序。


## 8. Worked example（示例演练）

下面给出一个用于演练的示例决策矩阵（4 个方案、3 个指标），并按前述公式走完整流程。示例中未给出权重，因此使用等权 $w_j=\frac{1}{3}$。

**原始决策矩阵 $X=[x_{ij}]$**（数值仅用于示例演练）：

| 方案 | $x_{i1}$（极大型） | $x_{i2}$（极小型） | $x_{i3}$（中值型，目标 $t=115$） |
