# 均值向量和协方差阵的检验

## 均值向量的检验

### 一元情形下的均值检验

在一元统计理论中，判断$\mu_{0}$是否为正态总体均值$\mu$的假设检验问题为

$$H_{0} : \mu=\mu_{0}, \quad H_{1}, \mu \neq \mu_{0}$$

那么，合理的检验统计量为

$$t=\frac{\left(\overline{X}-\mu_{0}\right)}{s / \sqrt{n}}$$

其中$\overline{X}=\frac{1}{n} \sum_{j=1}^{n} X$，$s^{2}=\frac{1}{n-1} \sum_{j=1}^{n}\left(X_{j}-\overline{X}\right)^{2}$

对于$t$的平方

$$t^{2}=\frac{\left(\overline{X}-\mu_{0}\right)^{2}}{s^{2} / n}=n\left(\overline{X}-\mu_{0}\right)\left(s^{2}\right)^{-1}\left(\overline{X}-\mu_{0}\right)$$

它其实是样本均值$\overline{X}$到检验值$\mu_{0}$的距离的平方，距离的单位用$s / \sqrt{n}$来表示。

一个简单的例子，参见[此处](https://courses.lumenlearning.com/wmopen-concepts-statistics/chapter/hypothesis-test-for-a-population-mean-5-of-5/)

### 多元均值检验

#### 霍特林$T^{2}$统计量

考虑对一给定的$p \times 1$向量$\mu_{0}$，判断它是否为多元正态分布均值的假设检验问题，可以使用一元情况下平方距离的推广形式，即

$$T^{2}=\left(\overline{\boldsymbol{X}}-\mu_{0}\right)^{\prime}\left(\frac{1}{n} \boldsymbol{S}\right)^{-1}\left(\overline{\boldsymbol{X}}-\mu_{0}\right)=n\left(\overline{\boldsymbol{X}}-\mu_{0}\right)^{\prime} \boldsymbol{S}^{-1}\left(\overline{\boldsymbol{X}}-\mu_{0}\right)$$

其中

$$\underset{(p \times 1)}{\overline{\boldsymbol{X}}}=\frac{1}{n} \sum_{j=1}^{n} \boldsymbol{X}_{j}, \quad \underset{(p \times p)}{\boldsymbol{S}}=\frac{1}{n-1} \sum_{j=1}^{n}\left(\boldsymbol{X}_{j}-\overline{\boldsymbol{X}}\right)\left(\boldsymbol{X}_{j}-\overline{\boldsymbol{X}}\right)^{\prime}$$

统计量$T^{2}$的分布最早是由多元分析的先驱霍特林（Hotelling）得出的，因为该统计量称为霍特林$T^{2}$统计量。

对于大样本，$T^{2}$近似服从$\chi^{2}$分布，可以基于它构建如下F统计量

$$F=\frac{n-p}{p(n-1)} T^{2} \sim F_{p, n-p}$$

我们可以用上述F统计量进行假设检验。

<br>

**习题**

设一个$n=3$的随机样本取自二维正态总体，其数据矩阵为

$$\mathbf{X}=\left[\begin{array}{cc}{6} & {9} \\ {10} & {6} \\ {8} & {3}\end{array}\right]$$

试对$\mu_{0}^{\prime}=[9,5]$计算$T^{2}$。

<br>

**思考**

“门当户对”的统计学检验

### 一元情形下两总体均值的比较

假设两个样本满足如下假设

- 样本总体服从正态分布
- 两个样本来自于独立的总体
- 两个总体的标准差相等

检验如下假设

$$H_{0} : \mu_{1}=\mu_{2}, \quad H_{1}, \mu_{1} \neq \mu_{2}$$

使用如下$t$检验

$$t=\frac{\bar{x}_{1}-\bar{x}_{2}}{\sqrt{s_{p}^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}} \sim t_{n_{1}+n_{2}-2}$$

其中

$$s_{p}^{2}=\frac{\left(n_{1}-1\right) s_{1}^{2}+\left(n_{2}-1\right) s_{2}^{2}}{n_{1}+n_{2}-2}$$

<br>

**习题**

欧文草坪护理有限公司生产和组装割草机。现在存在下列两个不同的发动机装配到割草机的框架工序的提议，问题是两个工序花费的平均时间是否不同，即平均组装时间是否有差异？

$$\begin{array}{ll}{\text { Welles }} & {\text { Atkins }} \\ \hline \text { (minutes) } & {\text { (minutes) }} \\ \hline 2 & {3} \\ {4} & {7} \\ {9} & {5} \\ {3} & {8} \\ {2} & {4} \\  & {3}\end{array}$$

### 多元情形下两总体均值向量的比较

考虑两个随机样本，样本1（ $\boldsymbol{X}_{11}, \boldsymbol{X}_{12}, \cdots, \boldsymbol{X}_{1 n_{1}}$）来自总体1，样本容量为$n_{1}$；样本2（$\boldsymbol{X}_{21}, \boldsymbol{X}_{22}, \cdots, \boldsymbol{X}_{2 n_{2}}$）来自总体2，样本容量为$n_{2}$

关于数据结构的基本假定

- $\boldsymbol{X}_{11}, \boldsymbol{X}_{12}, \cdots, \boldsymbol{X}_{1 n_{1}}$为来自均值向量为$\mu_{1}$，协方差矩阵为$\boldsymbol{\Sigma}_{1}$的$p$维总体的随机样本
- $\boldsymbol{X}_{21}, \boldsymbol{X}_{22}, \cdots, \boldsymbol{X}_{2 n_{2}}$为来自均值向量为$\mu_{2}$，协方差矩阵为$\boldsymbol{\Sigma}_{2}$的$p$维总体的随机样本
- 样本$\boldsymbol{X}_{11}, \boldsymbol{X}_{12}, \cdots, \boldsymbol{X}_{1 n_{1}}$与样本$\boldsymbol{X}_{21}, \boldsymbol{X}_{22}, \cdots, \boldsymbol{X}_{2 n_{2}}$相互独立
- 两总体均服从多元正态分布
- 协方差相等，即$\boldsymbol{\Sigma}_{1}=\boldsymbol{\Sigma}_{2}$

可得

$$\begin{aligned} S_{p} &=\frac{\sum_{j=1}^{n_{1}}\left(x_{1 j}-\bar{x}_{1}\right)\left(x_{1 j}-\bar{x}_{1}\right)^{\prime}+\sum_{j=1}^{n_{2}}\left(x_{2 j}-\bar{x}_{2}\right)\left(x_{2 j}-\bar{x}_{2}\right)^{\prime}}{n_{1}+n_{2}-2} \\ &=\frac{n_{1}-1}{n_{1}+n_{2}-2} S_{1}+\frac{n_{2}-1}{n_{1}+n_{2}-2} S_{2} \end{aligned}$$

对于如下假设

$$H_{0}: \boldsymbol{\mu}_{1}=\boldsymbol{\mu}_{2} \text { against } \boldsymbol{\mu}_{1} \neq \boldsymbol{\mu}_{2}$$

即

$$H_{0}:\left(\begin{array}{c}{\mu_{11}} \\ {\mu_{12}} \\ {\vdots} \\ {\mu_{1 p}}\end{array}\right)=\left(\begin{array}{c}{\mu_{21}} \\ {\mu_{22}} \\ {\vdots} \\ {\mu_{2 p}}\end{array}\right) \text { against } H_{a}:\left(\begin{array}{c}{\mu_{11}} \\ {\mu_{12}} \\ {\vdots} \\ {\mu_{1 p}}\end{array}\right) \neq\left(\begin{array}{c}{\mu_{21}} \\ {\mu_{22}} \\ {\vdots} \\ {\mu_{2 p}}\end{array}\right)$$

进行检验，可以使用$T^{2}$统计量

$$T^{2}=\left[\overline{\boldsymbol{X}}_{1}-\overline{\boldsymbol{X}}_{2}-\left(\mu_{1}-\mu_{2}\right)\right]^{\prime}\left[\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right) \boldsymbol{S}_{\mathrm{p}}\right]^{-1}\left[\overline{\boldsymbol{X}}_{1}-\overline{\boldsymbol{X}}_{2}-\left(\mu_{1}-\mu_{2}\right)\right]$$

In [2]:
library(DT)
library(ICSNP)
data(pulmonary)

DT::datatable(pulmonary)

In [18]:
HotellingsT2(pulmonary, mu = c(0,0,0), test = "chi")


	Hotelling's one sample T2-test

data:  pulmonary
T.2 = 14.018, df = 3, p-value = 0.00288
alternative hypothesis: true location is not equal to c(0,0,0)


In [17]:
set.seed(123456)
X <- rmvnorm(20, c(0, 0, 0, 0), diag(1:4))
Y <- rmvnorm(30, c(0.5, 0.5, 0.5, 0.5), diag(1:4))
Z <- rbind(X, Y)
g <- factor(rep(c(1,2),c(20,30)))

HotellingsT2(X, Y)
HotellingsT2(Z ~ g, mu = rep(0,4))


	Hotelling's two sample T2-test

data:  X and Y
T.2 = 2.6152, df1 = 4, df2 = 45, p-value = 0.04756
alternative hypothesis: true location difference is not equal to c(0,0,0,0)



	Hotelling's two sample T2-test

data:  Z by g
T.2 = 2.6152, df1 = 4, df2 = 45, p-value = 0.04756
alternative hypothesis: true location difference is not equal to c(0,0,0,0)


### 多个多元总体均值向量的比较（单因子多元方差分析）

**案例**

<img src="./pic/anova01.png" width = 65% height = 65% />

其中

- $\mu_{1}$ —— 使用装配方法A每周生产商品的数量
- $\mu_{2}$ —— 使用装配方法B每周生产商品的数量
- $\mu_{3}$ —— 使用装配方法C每周生产商品的数量

我们试图用样本均值来检验下面的假设

$\mathrm{H}_{0}: \mu_{1}=\mu_{2}=\mu_{3}$

$\mathrm{H}_{a}: 总体均值不全相等$

<br>

我们使用**方差分析**进行上述案例的检验。

基本假设：

- 对每个总体，变量服从正态分布
- 每个总体方差相等
- 观测值必须是独立的

<img src="./pic/anova02.png" width = 35% height = 35% />

<img src="./pic/anova03.png" width = 50% height = 50% />

<br>

**一元方差分析概述**

在一元情形下的假设为：$X_{l 1}, X_{l 2}, \cdots, X_{l n_{l}}$为来自总体$N\left(\mu_{l}, \sigma^{2}\right), l=1,2, \cdots, g$的随机样本，而且来自不同总体的样本相互独立。

根据方程

$$\mu_{l} = \mu + \tau_{l}$$

均值相等性假设可以用另一种方式进行表述

$$H_{0}: \tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$$

则$X_{lj}$可表示为如下形式

$$X_{lj} = \mu + \tau_{l} + e_{ij}$$

方差分析可在对观测值进行类似分解的基础上进行

$$x_{lj} = \bar{x} + (\bar{x}_{l} - \bar{x}) + (x_{lj} - \bar{x}_{l})$$

两边减去$\bar{x}$，然后取平方，得到

$$\left(x_{l j}-\bar{x}\right)^{2}=\left(\bar{x}_{l}-\bar{x}\right)^{2}+\left(x_{l j}-\bar{x}_{l}\right)^{2}+2\left(\bar{x}_{l}-\bar{x}\right)\left(x_{l j}-\bar{x}_{l}\right)$$

两边对$j$求和，有

$$\sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}\right)^{2}=n_{l}\left(\bar{x}_{l}-\bar{x}\right)^{2}+\sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}_{l}\right)^{2}$$

然后，两边再对$l$求和，可得

$$\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}\right)^{2}=\sum_{l=1}^{g} n_{l}\left(\bar{x}_{l}-\bar{x}\right)^{2}+\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}_{l}\right)^{2}$$

即

$$\sum_{l=1}^{g} \sum_{j=1}^{n_{l}} x_{l j}^{2}=\left(n_{1}+n_{2}+\cdots+n_{g}\right) \bar{x}^{2}+\sum_{l=1}^{g} n_{l}\left(\bar{x}_{l}-\bar{x}\right)^{2}+\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}_{l}\right)^{2}$$

得到

<img src="./pic/anova04.png" width = 90% height = 90% />

若$F = \frac{\operatorname{SS}_{处理} /(g-1)}{\operatorname{SS}_{残差} /\left(\sum_{l=1}^{g} n_{l}-g\right)}>F_{g-1 \cdot \sum n_{l}-g}(\alpha)$，则在显著性水平$\alpha$下拒绝$H_{0}: \tau_{1}=\tau_{2}=\cdots=\tau_{g}=0$。

<br>

**案例**

考虑如下独立样本
- 总体1：9, 6, 9
- 总体2：0, 2
- 总体3：3, 1, 2

对其进行一元ANOVA进行平方和分解

A:

对观测值进行分解，得到

$$\left(\begin{array}{lll}{9} & {6} & {9} \\ {0} & {2} & {} \\ {3} & {1} & {2}\end{array}\right)=\left(\begin{array}{lll}{4} & {4} & {4} \\ {4} & {4} & {} \\ {4} & {4} & {4}\end{array}\right)+\left(\begin{array}{lll}{4} & {4} & {4} \\ {-3} & {-3} & {} \\ {-2} & {-2} & {-2}\end{array}\right)+\left(\begin{array}{rrr}{1} & {-2} & {1} \\ {-1} & {1} & {} \\ {1} & {-1} & {0}\end{array}\right)$$

计算平方和

$$\mathrm{SS}_{\mathrm{观测}}=9^{2}+6^{2}+9^{2}+0^{2}+2^{2}+3^{2}+1^{2}+2^{2}=216$$

$$\mathrm{SS}_{均值}=4^{2}+4^{2}+4^{2}+4^{2}+4^{2}+4^{2}+4^{2}+4^{2}+4^{2}=8 \times 4^{2}=128$$

$$\begin{aligned} \mathrm{SS}_{处理} &=4^{2}+4^{2}+4^{2}+(-3)^{2}+(-3)^{2}+(-2)^{2}+(-2)^{2}+(-2)^{2} \\ &=3 \times 4^{2}+2 \times(-3)^{2}+3 \times(-2)^{2}=78 \end{aligned}$$

$$\mathrm{SS}_{残差}=1^{2}+(-2)^{2}+1^{2}+(-1)^{2}+1^{2}+1^{2}+(-1)^{2}+0^{2}=10$$

平方和满足

$$\mathrm{SS}_{观测} = \mathrm{SS}_{均值} + \mathrm{SS}_{处理} + \mathrm{SS}_{残差}$$

<img src="./pic/anova05.png" width = 90% height = 90% />

于是

$$F=\frac{\operatorname{SS}_{处理} /(g-1)}{\operatorname{SS}_{残差} /\left(\sum n_{l}-g\right)}=\frac{78 / 2}{10 / 5}=19.5$$

所以在$0.01$显著性水平下，我们拒绝$H_{0}: \tau_{1}=\tau_{2}=\tau_{3}=0$。

### 多元方差分析（MANOVA）

类似的，可以写出方程

$$\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}\right)\left(x_{l j}-\bar{x}\right)^{\prime}=\sum_{l=1}^{g} n_{l}\left(\bar{x}_{l}-\bar{x}\right)\left(\bar{x}_{l}-\bar{x}\right)^{\prime}+\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(x_{l j}-\bar{x}_{l}\right)\left(x_{l j}-\bar{x}_{}\right)^{\prime}$$

<img src="./pic/anova06.png" width = 90% height = 90% />

假设$H_{0}: \boldsymbol{\tau}_{1}=\boldsymbol{\tau}_{2}=\cdots=\boldsymbol{\tau}_{k}=\mathbf{0}$的一个检验涉及广义方差比，若

$$\Lambda^{*}=\frac{|\boldsymbol{W}|}{|\boldsymbol{B}+\boldsymbol{W}|}=\frac{\left|\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(\boldsymbol{x}_{l j}-\overline{\boldsymbol{x}}_{l}\right)\left(\boldsymbol{x}_{l j}-\overline{\boldsymbol{x}}_{l}\right)^{\prime}\right|}{\left|\sum_{l=1}^{g} \sum_{j=1}^{n_{l}}\left(\boldsymbol{x}_{l j}-\overline{\boldsymbol{x}}\right)\left(\boldsymbol{x}_{l j}-\overline{\boldsymbol{x}}\right)^{\prime}\right|}$$

过小，则拒绝$H_{0}$。

<img src="./pic/anova07.png" width = 90% height = 90% />

<br>

**习题**

检验三个均值向量相等性的MANOVA表及威尔克斯$\lambda$统计量。样本容量分别为$n_{1}=3$，$n_{2}=2$和$n_{3}=3$，将各对观测值$x_{lj}$排列成行，得到

$$\left(\begin{array}{c}{\left[\begin{array}{c}{9} \\ {3}\end{array}\right]} & {\left[\begin{array}{c}{6} \\ {2}\end{array}\right]} & {\left[\begin{array}{c}{9} \\ {7}\end{array}\right]} \\ {\left[\begin{array}{c}{0} \\ {4}\end{array}\right]} & {\left[\begin{array}{c}{2} \\ {0}\end{array}\right]} \\ {\left[\begin{array}{c}{3} \\ {8}\end{array}\right]} & {\left[\begin{array}{c}{1} \\ {9}\end{array}\right]} & {\left[\begin{array}{c}{2} \\ {7}\end{array}\right]}\end{array}\right)$$

其中

$$\bar{x}_{1}=\left[\begin{array}{c}{8} \\ {4}\end{array}\right], \bar{x}_{2}=\left[\begin{array}{l}{1} \\ {2}\end{array}\right], \bar{x}_{3}=\left[\begin{array}{c}{2} \\ {8}\end{array}\right], \bar{x}=\left[\begin{array}{c}{4} \\ {5}\end{array}\right]$$