# Lecture 13: Sign Test and Wilcoxon Test

## Sign Test

符号检验是一种非参数检验方法，用于检验单个样本或两个相关样本的中位数是否等于某个特定值或是否相等。它基于样本数据的符号（正号或负号）来进行统计推断。

零假设为$H_0:m = m_0$，备择假设为$H_1:m \neq m_0$（或$H_1:m > m_0$，$H_1:m < m_0$）。其中$m$为总体中位数，$m_0$为假设的中位数值。

令$W = \sum_{i=1}^{n} \mathbf{1}_{X_i < m_0}$，即样本中小于$m_0$的观测值个数。则在零假设下，$W$服从参数为$n$的二项分布，即$W \sim Binomial(n, 0.5)$。
- 如果出现恰好等于$m_0$的观测值，则将其从样本中剔除，并相应地调整样本大小$n$。

1. 当$H_1:m < m_0$时，*p*-值为$P(W \ge w_{obs})$，其中$w_{obs}$为实际观测到的小于$m_0$的样本个数。
2. 当$H_1:m > m_0$时，*p*-值为$P(W \le w_{obs})$。
3. 当$H_1:m \neq m_0$时，*p*-值为$2 \min\{P(W \le w_{obs}), P(W \ge w_{obs})\}$。

将*p*-值与显著性水平$\alpha$进行比较，若*p*-值小于$\alpha$，则拒绝零假设；否则，不拒绝零假设。  
第一类错误概率为$\alpha$，即在零假设为真的情况下，错误地拒绝零假设的概率。

## Wilcoxon Signed-Rank Test

Wilcoxon符号秩检验是一种非参数检验方法，用于比较两个相关样本的中位数差异。它基于样本数据的符号和秩次来进行统计推断，可以看作是*t*-test的非参数替代方法。

零假设为$H_0:m = m_0$，备择假设为$H_1:m \neq m_0$。其中$m$为总体中位数，$m_0$为假设的中位数值。

令$R_k$为第$k$个样本的秩次（即按绝对值$|X_k - m_0|$排序后的排名，绝对值最小的秩次为1），并构建统计量：$$ W := \sum_{k=1}^{n} \text{sgn}(X_k - m_0) \cdot R_k$$ 其中$\text{sgn}(x) = \begin{cases} 1, & x > 0 \\ 0, & x = 0 \\ -1, & x < 0 \end{cases}$。

首先引入Lyapounov中心极限定理：
设$X_1, X_2, \ldots, X_n$为独立随机变量，满足$\mathbb{E}[X_i] = \mu_i$，$\text{Var}(X_i) = \sigma_i^2$，且存在$\delta > 0$使得$$ \lim_{n \to \infty} \frac{1}{s_n^{2 + \delta}} \sum_{i=1}^{n} \mathbb{E}[|X_i - \mu_i|^{2 + \delta}] = 0 $$其中$s_n^2 = \sum_{i=1}^{n} \sigma_i^2$。则当$n \to \infty$时，$$ \frac{\sum_{i=1}^{n} (X_i - \mu_i)}{s_n} \xrightarrow{d} N(0, 1) $$

由此可以得到：当样本量$n$较大时，统计量$W$近似服从正态分布，$$ W \sim N\left(0, \frac{n(n+1)(2n+1)}{6}\right) $$ $$\frac{W}{\sqrt{\frac{n(n+1)(2n+1)}{6}}} \xrightarrow{d} N(0, 1) $$ 这里$W$的步长为2（因为符号秩检验中，$W$的取值为奇数或偶数），因此在进行正态近似时，需要进行连续性校正（由半单位修正变为1个单位修正），最终得到：$$ \text{Pr}(W \le k) \approx \Phi\left(\frac{k+1}{\sqrt{\frac{n(n+1)(2n+1)}{6}}}\right) $$

### Handling Ties

在实际应用中，可能会遇到数据中存在相同值（ties）的情况。处理方法如下：
1. 对于每一组相同值，计算它们的平均秩次，并将这些值的秩次替换为该平均值。
2. 计算统计量$W$时，使用调整后的秩次进行计算。

例如，假设有5个观测值，其中两个观测值相同，分别为3和3。它们的秩次分别为2和3，平均秩次为2.5。因此，在计算$W$时，这两个观测值的秩次都应使用2.5。

### *p*-Value Calculation

在进行Wilcoxon符号秩检验时，可以通过计算*P*-值来评估观察到的统计量$W$在零假设下的显著性。具体步骤如下：
1. 计算观察到的统计量$W$。
2. 根据正态近似，计算对应的标准化值$Z$：$$ Z = \frac{W - \mu_W}{\sigma_W} $$其中$\mu_W = 0$，$\sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{6}}$。
3. 使用标准正态分布表或计算机软件，计算*P*-值：
   - 对于双尾检验，*P*-值为$2 \cdot \text{Pr}(Z \ge |z|)$。
   - 对于单尾检验，*P*-值为$\text{Pr}(Z \ge z)$或$\text{Pr}(Z \le z)$，$H_1:m > m_0 \rightarrow \text{Pr}(Z \ge z)$；$H_1:m < m_0 \rightarrow \text{Pr}(Z \le z)$。