# Lecture 14: Goodness-of-Fit Tests

## Motivation

掷一个均匀骰子多次，并记录每个数字出现的次数。为检验骰子是否均匀，我们可以使用卡方拟合优度检验。

之前的课程中，只能检验某个数字出现的概率是否为$1/6$，但现在我们想检验所有数字的概率是否均为$1/6$。  
即$H_0: p_1 = p_2 = p_3 = p_4 = p_5 = p_6 = \frac{1}{6}$；$H_1$: 概率不全为$\frac{1}{6}$。

为构造检验统计量，须将每个数字对应的检验统计量相加，即$$Q = \sum_{i=1}^{6} \frac{(O_i - E_i)^2}{E_i} = \sum_{i=1}^{6} \frac{(O_i - np_i)^2}{np_i}$$其中$O_i$为数字$i$的观察频数，$E_i$为数字$i$的期望频数。

## Goodness-of-Fit Test Procedure

假设一个实验有 $k$ 个不同的可能结果，例如 $A_1, A_2, \ldots, A_k$。 $p_i = \text{Pr}(A_i)$：$A_i$ 发生的概率，对于 $i = 1, 2, \ldots, k$，且 $\sum_{i=1}^{k} p_i = 1.$

零假设$H_0: p_i = p_{i0}, i = 1, 2, \ldots, k,$ 备择假设$H_1: \text{any } p_i \neq p_{i0},$ 其中 $p_{i0}, i = 1, 2, \ldots, k$ 是一些固定常数，且 $\sum_{i=1}^{k} p_{i0} = 1.$

令 $\mathbf{Y} = (Y_1, Y_2, \dots, Y_k)^T$ 为一个随机向量，满足 $0 \le Y_i \le n$ 且对于某个正整数 $n$，有 $\sum_{i=1}^k Y_i = n$。如果 $\mathbf{Y}$ 的 PMF 由以下给出，则称 $\mathbf{Y}$ 服从参数为 $n$ 和 $\mathbf{p} = (p_1, p_2, \dots, p_k)^T$ 的**多项分布**，其中 $p_i \ge 0$, $i = 1, 2, \dots, k$ 且 $\sum_{i=1}^k p_i = 1$： $$ \text{Pr}(Y_1 = y_1, Y_2 = y_2, \dots, Y_k = y_k) $$ $$ = \frac{n!}{y_1! y_2! \dots y_k!} p_1^{y_1} p_2^{y_2} \dots p_k^{y_k} $$ 也记作 $\mathbf{Y} \sim \text{Multinomial}(n, p_1, \dots, p_k)$。

据此，可以构建卡方拟合优度检验统计量： $$ Q = \sum_{i=1}^{k} \frac{(Y_i - n p_{i0})^2}{n p_{i0}} \sim \chi^2 (k-1) $$  经过观察，得到：$$q = \sum_{i=1}^{k} \frac{(y_i - n p_{i0})^2}{n p_{i0}} = \sum_{i=1}^{k} \frac{(O_i - E_{i})^2}{E_{i}}$$  其中 $O_i = y_i$ 为第 $i$ 类的观察频数，$E_i = n p_{i0}$ 为第 $i$ 类的期望频数。

拒绝域：$\mathcal{C} = \{ q \geq \chi^2_{1-\alpha}(k-1) \}$，其中 $\chi^2_{1-\alpha}(k-1)$ 为卡方分布 $\chi^2 (k-1)$ 的 $1-\alpha$ 分位点。

*p*-value 计算：$$ p\text{-value} = P(Q \geq q_0 | H_0) = 1 - F_{\chi^2 (k-1)}(q_0) $$  其中 $q_0$ 为观察到的检验统计量值，$F_{\chi^2 (k-1)}(\cdot)$ 为卡方分布 $\chi^2 (k-1)$ 的累积分布函数。

## Goodness-of-Fit Test for Continuous Distributions

对于连续分布的拟合优度检验，首先将数据划分为 $k$ 个区间 $(a_0, a_1], (a_1, a_2], \ldots, (a_{k-1}, a_k]$，其中 $a_0 = -\infty$ 且 $a_k = \infty$。然后，计算每个区间的观察频数 $O_i$ 和期望频数 $E_i$，其中 $E_i = n [F_X(a_i) - F_X(a_{i-1})]$，$F_X(\cdot)$ 为假设分布的累积分布函数。其它步骤与离散分布的拟合优度检验相同。

## Goodness-of-Fit Test with Unknown Parameters

当零假设 $H_0$ 中的分布包含未知参数时，例如 $H_0: X \sim \text{Bernoulli}(p)$，其中 $p$ 未知，我们可以使用极大似然估计（MLE）来估计这些参数。设 $\hat{p}$ 为 $p$ 的 MLE，则在计算期望频数时，我们使用 $\hat{p}$ 代替 $p$。因此，期望频数变为 $E_i = n p_i(\hat{p})$，其中 $p_i(\hat{p})$ 是使用估计参数计算的概率。检验统计量和拒绝域的构建与之前相同，但自由度需要调整为 $k - 1 - m$，其中 $m$ 是估计的参数数量。