# 假设检验的理论

## 1 假设检验的基本理论

### 1.1 总体均值的假设检验
我们想知道一个总体均值是否等于（或大于等于、小于等于）某个常数$\mu_0$，可以使用$Z$检验或$t$检验。

三种假设检验的原假设和备择假设如下：

$H_0: \mu=\mu_0$，$H_\alpha:\mu\ne\mu_0$ 

$H_0: \mu\ge\mu_0$，$H_\alpha:\mu\lt\mu_0$

$H_0: \mu\le\mu_0$，$H_\alpha:\mu\gt\mu_0$

下表告诉我们什么时候使用$t$检验，什么时候使用$Z$检验，这个取决于样本数$n$。

||正态总体，n<30|n>=30|
|---|---|---|
|已知总体方差|$Z$检验|$Z$检验|
|未知总体方差|$t$检验|$t$检验或$Z$检验|

### 1.2 基于统计量的决策规则
计算检验统计量之后，怎样判断是拒绝原假设还是不拒绝原假设呢？以双尾$Z$检验，首先画出$Z$分布(标准正态分布)，在两边画出黑色的拒绝区域。

拒绝区域的面积之和应等于显著性水平。以显著性水平$\alpha=0.05$为例，左右两块拒绝区域的面积之和应等于$0.05$，查找正态分布的概率数值表，可知，交界处的数值为$\pm1.96$。


![n-25](image/norm-25.jpg)

如果从样本数据中计算得出的检验统计量落在拒绝区域，也就是小于1.96，或者大于1.96，就拒绝原假设；如果检验统计量没有落在拒绝区域，也就是在-1.96和1.96之间，就不能拒绝原假设。

### 1.3 基于p值和显著性检验的决策规则

在统计软件工具中，往往给出的是p值，然后与给定的显著性水平进行比较，以决定拒绝还是不拒绝原假设，这个是基于p值和显著水平的假设检验。

首先看p值是什么。对于双尾检验，有两个检验统计量，两个统计量左右两边的面积之和就是p值。因此每一边的面积是p/2。

计算p值的目的，就是和显著水平做比较。
- 如果p值小于显著水平，说明检验统计量落在拒绝区域，因此拒绝原假设。
- 如果p值大于等于显著水平，说明检验统计量没有落在拒绝区域，因此不能拒绝原假设。

![norm_p.jpg](image/norm-p.jpg)



在做出判断后，我们需要陈述结论。

如果不能拒绝原假设，我们不能说接受原假设，只能说不能拒绝原假设$H_0$。

## 2. 假设检验的应用：系数$\beta_1$是否显著不为0？
对于一元回归分析方程，如何检验其系数$\beta_1$是否有效呢？
$$
Y_i = \beta_0+\beta_1X_i+u_i 
$$
$$
i是第i次观测，i=1,2,...,n;Y_i是被解释变量，\beta_0是截距；\beta_1是总体回归线的斜率，u_i是误差项
$$


在数理统计课中，我们了解过假设检验的基本知识。这里我们应用假设检验来检验系数$\beta_1$是否有效。

### 2.1 假设检验的流程


**第一步，建立原假设和备择假设**


原假设：总体斜率$\beta_1$的真值等于某个特定值$\beta_{1,0}$，双边备择假设假设为$\beta_1$不等于$\beta_{1,0}$。即原假设和备择假设分别为：

$$
H_0: \beta_1=\beta_{1,0} 
$$
$$
H_1:\beta_1\neq\beta_{1,0}
$$

通常我们检验回归系数是否显著，也就是显著不为0，我们令$\beta_{1,0}= 0$，那么原假设和备择假设为：
$$
H_0: \beta_1=0 
$$
$$
H_1:\beta_1\neq 0
$$


**第二步，计算$\hat{\beta_1}$的标准误差$SE(\hat{\beta_1})$**

它是$\hat{\beta_1}$抽样分布的标准差$\sigma_\hat{\beta_1}$的估计量。

$$
SE(\hat{\beta_1}) = \sqrt{\sigma_\hat{\beta_1}^2}
$$





**第三步，计算$t$统计量**

对于多元回归分析的系数检验，我们通常并不知道总体的方差是多少，所以选择$t$检验，$t$统计量计算如下：

$$
t=\frac{\hat{\beta_1}-0}{SE(\hat{\beta}_1)}
$$



**第四步，计算p值**

可以通过查表（教材的附录部分），来得到对应的p值

$$
p值=Pr_{H_0}(|t|>|t^{act}|)
$$


如果使用编程工具，那么标准误差、检验$\beta_1=0$的$t$统计量和$p$值都可以通过回归软件自动计算得到。




**最后，结论如下：**
- 如果$p$值小于$0.05$，则在$5\%$的显著性水平下拒绝原假设，也就是拒绝$H_0:\beta_1=0$的假设，换句话说，接受备择假设$H_1:\beta_1\neq0$。
- 如果$p$值大于$0.05$，则在$5\%$的显著性水平下不能拒绝原假设，也就是不能拒绝$H_0:\beta_1=0$的假设，换句话说，拒绝备择假设$H_1:\beta_1\neq0$。





### 2.2 如何解释上述结论？

（一）

分析对于多元回归分析，我们想要的结论是第一种，也就是$p<0.05$和拒绝$H_0:\beta_1=0$的假设。

我们不希望估计量$\hat{\beta_1}$的真值$\beta_1$等于或者接近0值, 所以假设检验计算的$p$值应该尽可能的小于$0.05$,或者说尽可能接近于0。


（二）

如果得到的结论是第二种，也就是$p>0.05$和不能拒绝$H_0:\beta_1=0$的假设，

那么，估计出来的估计量$\hat{\beta_1}$的真值$\beta_1$在给定置信水平$\alpha$下极有可能是0，所以我们应该主动删去原始回归表达式中的$\beta_1$，然后重新进行$OLS$回归。

上述对于回归系数的假设检验的目的就在于此。