# 假设检验

# 假设检验的基本原理

## 怎样提出假设

**假设检验**(hypothesis test)就是在对总体参数提出假设的基础上，利用样本信息来判断是否成立的统计方法。

**原假设**(零假设, null hypothesis)时研究者想收集证据以推理的假设，用$H_0$表示。

**备选假设**(alternative hypothesis)时研究者想收集证据以支持的假设，用$H_1$。

如果备选假设没有特定方向，并含有$\ne$，则称其为**双侧/双尾检验**(two-tailed test)。

如果备选假设具有特定的方向性，含有> 或 < ，则称其为**单向检验**。

以总体均值是否等于10为例
$$
H_0:\mu=10; \ H_1:\mu\ne 10
$$

原假设和备选假设是一个完备事件组，且相互对立。

## 怎样作出决策

### 两类错误

- 第I类错误($\alpha$错误)

原假设**正确**却**拒绝**了原假设

- 第II类错误($\beta$错误)

原假设**错误**却**没有拒绝**原假设

### 显著性水平(level of significance)

犯**第I类错误**的概率为**显著性水平**，记为$\alpha$。
一般取0.1, 0.05, 0.01

### 依据什么做出决策

#### 统计量决策

对于总体均值和总体比例的检验，在原假设$H_0$的条件下，根据**点估计量**的抽样分布可以得到**标准化统计量**

$$
标准化检验统计量=\frac{点估计量-假设值}{点估计量标准差}
$$
---
建立决策准则

根据事先给定的$\alpha$, 可以在统计量分布找到相应的**临界值**(critical value)，由$\alpha$相应的临界值围城一个区域为**拒绝域**(rejection region)。

如果统计量的值落在了拒绝域内就拒绝原假设，否则就不拒绝原假设。拒绝域的大小与给定$\alpha$有关。当样本量固定时，随$\alpha$减小二减小。

决策准则：

- 双侧检验：|统计量|>临界值，拒绝原假设
- 左侧检验：统计量<-临界值，拒绝原假设
- 右侧检验：统计量>临界值，拒绝原假设

#### p值决策

犯第I类错误的真实概率是**p值**。

如果p<$\alpha$,拒绝$H_0$; 如果p>$\alpha$, 不拒绝$H_0$

p值越小，拒绝原假设的理由越充分。

p<0.1: 有“一些证据”不利于原假设

p<0.05: 有“适度证据”不利于原假设

p<0.01: 有“很强证据”不利于原假设


In [1]:
import numpy as np 
import pandas as pd 
from scipy import stats
from statsmodels.stats import weightstats


# 一个总体参数的检验

## 总体均值

大样本(n$\ge$30), 总体方差已知

$$
z=\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}
$$


大样本(n$\ge$30), 总体方差未知

样本方差s代替$\sigma$

$$
z=\frac{\bar{x}-\mu_0}{s/\sqrt{n}}
$$

统计量计算
```py

z=(x_bar-mu)/(5/np.sqrt(n))
```

p值计算
```py
1-stats.norm.cdf(z) # 单侧检验
(1-stats.norm.cdf(z))*2 # 双侧检验
```

In [2]:
# H_0:mu=255; H_1:mu!=255
# x_bar=255.8; sigma=5; n=40
alpha=0.05
mu=255
x_bar=255.8
sigma=5
n=40

z=(x_bar-mu)/(5/np.sqrt(n))

print('z: ',z)
print('z critical value: ',stats.norm.ppf(1-alpha))
print('z<crictial value, null hypothesis cannot be rejected')

print('p-value: ',(1-stats.norm.cdf(z))*2)


z:  1.0119288512538958
z critical value:  1.6448536269514722
z<crictial value, null hypothesis cannot be rejected
p-value:  0.3115720733144016


小样本，总体方差未知

$$
t=\frac{\bar{x}-\mu_0}{s/\sqrt{n}}
$$

In [2]:
df_6_7:pd.DataFrame=pd.read_spss(
    'data/6-7.sav'
)
# ttest_1samp直接计算t值和p值
stats.ttest_1samp(df_6_7,popmean=12)


Ttest_1sampResult(statistic=array([-0.70532789]), pvalue=array([0.49845324]))

In [None]:
alpha=0.05
x_bar=np.mean(df_6_7.values.flatten())
mu=12
s=np.std(df_6_7.values.flatten(),ddof=1)
n=10
t=(x_bar-mu)/(s/np.sqrt(n))
p_value=stats.t.cdf(t,df=n-1)*2
print(t)
print('critical value: ',stats.t.ppf(1-alpha,df=n-1))
print('p value: ',p_value)

## 总体比例的检验

检验统计量(大样本)
$$
z=\frac{p-\pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}
$$

## 总体方差

检验统计量

$$
\chi^2=\frac{(n-1)s^2}{\sigma^2_0}
$$

# 两个总体参数检验

### 总体均值之差

大样本，方差已知
$$
z=\frac{(\bar{x_1}-\bar{x_2})-(\mu_1-\mu_2)}{\frac{\sigma^2_1}{n_1}+\frac{\sigma_2^2}{n_2}}
$$

独立小样本

### 总体比例

方差相等

$$
s^2_p=\frac{(n_1-1)s^2_2+(n_2-1)s_2^2}{n_1+n_2-2}
$$

$$
t=\frac{(\bar{x_1}-\bar{x_2})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}
$$

方差不相等
$$
t=\frac{(\bar{x_1}-\bar{x_2})-(\mu_1-\mu_2)}{\sqrt{\frac{s^2_1}{n_1}+\frac{s^2_2}{n_2}}}

$$
自由度v的确认
$$
v=\frac{(\frac{s^2_1}{n_1}+\frac{s^2_2}{n_2})^2}{\frac{(\frac{s^2_1}{n_1})^2}{n_1-1}+\frac{(\frac{s^2_2}{n_2})^2}{n_2-1}}
$$

### 配对样本的检验

$$
t=\frac{\bar{d}-(\mu_1-\mu_2)}{s_d/\sqrt{n}}
$$


### 总体比例之差

$$
z=\frac{(p_1-p_2)-d_0}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}
$$

### 总体方差之比

$$
F=\frac{s^2_1}{s^2_2}
$$
