# 学习T检验

https://blog.csdn.net/m0_37777649/article/details/74937242

# 什么是T检验？
T检验是假设检验的一种，又叫student t检验（Student’s t test），主要用于样本含量较小（例如n<30），总体标准差σ未知的正态分布资料。
T检验用于检验两个总体的均值差异是否显著。

# 一个例子
例1：
“超级引擎”工厂是一家专门生产汽车引擎的工厂，根据政府发布的新排放要求，引擎排放平均值应低于20ppm，如何证明生产的引擎是否达标呢？（排放量的均值小于20ppm）

思路1
一个直接的想法就是，把这个工厂所有的引擎都测试一下，然后求一下排放平均值就好了。比如工厂生产了10个引擎，排放水平如下：
15.6 16.2 22.5 20.5 16.4
19.4 16.6 17.9 12.7 13.9
排放平均值为
(15.6+16.2+22.5+20.5+16.4+19.4+16.6+17.9+12.7+13.9)/10=17.17(15.6+16.2+22.5+20.5+16.4+19.4+16.6+17.9+12.7+13.9)/10=17.17
小于政府规定的20ppm，合格！

这也太简单了！

然而，随着“超级引擎”工厂规模逐渐增大，每天可以生产出10万个引擎，如果把每个引擎都测试一遍，估计要累死人了……
有没有更好的方法？

In [2]:
a=[15.6, 16.2, 22.5, 20.5, 16.4, 19.4 ,16.6 ,17.9 ,12.7 ,13.9,]

# 思路二
由于引擎数量太多，把所有引擎测试一遍太麻烦了，“智多星”有一个好想法：
可不可以采用“反证法”？先假设所有引擎排放量的均值为μμ，然后随机抽取10个引擎，看看这10个引擎的排放量均值与假设是否相符，如果相符，则认为假设是正确的，反之认为假设是错误的。这样，就可以通过一小部分数据推测数据的总体，真是太棒了！

具体怎么操作呢？

先建立两个假设，分别为:
* H0:μ⩾20  (原假设)
* H1:μ<20  (备择假设)
【μ代表总体(所有引擎的排放量)均值】

在原假设成立的基础上，求出”取得样本均值或者更极端的均值”的概率，如果概率很大，就倾向于认为原假设$H_0$是正确的，如果概率很小，就倾向于认为原假设$H_0$是错误的，从而接受备择假设$H_1$。

那么如何求这个概率p呢？
这就需要引入一个概念——统计量
简单的讲，统计量就类似于用样本已知的信息(如样本均值，样本标准差)构建的一个“标准得分”，这个“标准得分”可以让我们求出概率p

由于样本服从正态分布，且样本数量较小(10)，所以这里要用到的统计量为t统计量，公式如下：
$$t=\frac{\overline{x}-\mu}{\frac{S}{\sqrt{n}}} ~ t(n-1)$$

* $\overline{x}$：样本均值，观测到的均值
* $\mu$：总体均值
* $S$：样本标准差
* $n$：样本个数

统计量t服从自由度为n-1的t分布

In [4]:
# $\overline{x}$
import numpy  as np
mean_a=np.mean(a)
mean_a

17.169999999999998

In [9]:
# ddof表示自由度需要减去几
S=np.std(a,ddof=1)
S

2.9814426038413018

In [10]:
# 期望值是20
t=(mean_a-20)/(S/np.sqrt(len(a)))
t

-3.001649525885985

# p值
通过查询t分位数表(见附录)，我们可知，当自由度为9时，t统计量小于-2.821的概率为1%，而我们求得的t统计量为-3.00，所以t统计量小于-3.00的概率比1%还要小(因为-3.00在-2.81的左边，所以阴影面积更小)。
这个概率值通常被称作“p值”，即在原假设成立的前提下，取得“像样本这样，或比样本更加极端的数据”的概率。

到这里，我们可以总结出如下结论：
在$μ=20$成立(所有引擎排放均值为20ppm)的前提下，从所有引擎中随机选出10个引擎，这10个引擎排放均值小于17.17的概率小于1%

再考虑$μ>20$ 的情况:
由t统计量的公式可以看出，当$μ$增大，其他变量均保持不变时，t统计量的值会变小，因此求概率时阴影面积也会变小，总结来看，我们得出如下结论：
在μ⩾20μ⩾20成立的前提下，从所有引擎中随机选出10个引擎，这10个引擎排放均值小于17.17的概率小于1%

由于1%的概率很小，所以我们更倾向于认为，原假设$H_0:μ⩾20$是错误的，从而接受备择假设$H_1$。

综上，我们认为，所有引擎的排放量均值小于20ppm，工厂生产的引擎符合标准。

# 第一类错误和第二类错误
在例1中，我们认为1%的概率很小，所以更倾向于认为原假设是错误的，从而接受了备择假设。但这样的判断是准确的吗？为了探讨这个问题，我们考虑以下四种情况：

|事实(右)/判断(下)|	$H_0$成立|	$H_1$成立|
|---|---|---|
|$H_0$成立|	判断正确|	第二类错误|
|$H_1$成立|	第一类错误|	判断正确|

即：
如果事实为$H_0$成立，而我们做出了接受备择假设$H_1$的判断，则犯了第一类错误——拒真
如果事实为$H_1$成立，而我们做出了接受原假设$H_0$的判断，则犯了第二类错误——取伪

所以用另外一种角度来看上面的例子：
在$μ⩾20$成立的前提下，从所有引擎中随机选出10个引擎，这10个引擎排放均值小于17.17的概率小于1%，当我们据此做出“拒绝原假设H0H0，接受备择假设H1H1”的结论时，有小于1%的概率犯第一类错误，因为H0H0仍有小于1%的概率是成立的，虽然这个概率很小。

# $α$值
所以利用t检验做出的结论并不是百分之百正确的，仍有很小的几率会犯错误。对于上面的例子，有些人会认为1%的概率已经很小了，可以拒绝原假设，还有些人会认为1%的概率虽然很小，但不足以拒绝原假设。为了解决这个问题，统计学家们提出了一个阈值，如果犯第一类错误的概率小于这个阈值，就认为可以拒绝原假设，否则认为不足以拒绝原假设。这个阈值就叫$α$。

# 另一种流程
现在，让我们尝试引入$\alpha$，用另一种流程解决例1：

1. 建立原假设和备择假设  
 * $H_0$:μ⩾20
 * $H_1$:μ<20

2. 确定$\alpha$
令$\alpha=0.05$($\alpha$的值通常为0.01,0.05,0.1，视具体问题而定)

3. 确定用于决策的拒绝域  
在确定了αα和t统计量自由度(根据样本容量可以求出，在这个例子中，自由度为[样本容量-1]）的前提下，我们可以通过查询t分位数表，找出“拒绝域”，如果t统计量落入拒绝域内，就拒绝原假设，否则接收原假设。
根据t分位数表，我们查出当自由度为9时，$t\le−1.833$的概率为0.05，因此，拒绝域为${t|t⩽−1.833}$

4. 查看样本结果是否位于拒绝域内  
将样本均值和样本标准差带入t统计量计算公式，得出t=-3.00，落入拒绝域内

5. 做出决策
拒绝原假设$H_0$，接受备择假设$H_1$，认为样本均值与总体均值差异显著，认为所有的引擎排放量平均值小于20ppm

以上就是t检验的标准化流程。


# 假设形式与拒绝域的推广
在例1中，我们的假设形式为：
* $H0:μ\ge x0$ 
* $H1:μ\lt x0$ (x_0为某一常数)   
拒绝域的形式为${t|t⩽ct|t⩽c}$ (c为某一常数)


假设的形式与拒绝域的形式有没有什么联系呢？
为了进一步讨论，我们将假设的形式做如下分类： 
* 类别1：备择假设中包含≠
  1.1 H0:μ=x0 vs H1:μ≠x0 
* 类别2：备择假设中包含`>`或`<>`或`<`
  1. $H_0:μ=x0$  vs $H_1:μ>x0 $
  2. $H_0:μ=x0 $ vs $H_1:μ<x0 $
  3. $H_0:\mu \ge x_0 $ vs $H1:μ<x0 $
  4. $H_0:\mu \le x_0 $ vs $H1:μ>x0 $
  
注意：原假设和备择假设不一定将数轴全部覆盖，在实际生活中，形如2.1和2.2的问题是存在的

类别1称为双尾检验，由于备择假设中包含≠，拒绝域分布在两侧。

类别2称为单尾检验，备择假设中包含>的情形，拒绝域在数轴右侧；备择假设中包含<的情形，拒绝域在数轴左侧。

# 两类t检验

## 单总体t检验
检验一个样本平均数与一个已知的总体平均数差异是否显著。  
适用条件：
1. 总体服从正态分布
2. 样本量小于30（当样本量大于30时，用Z统计量)

统计量：
$$t=\frac{\overline{x}-\mu}{\frac{S}{\sqrt{n}}}  \sim t(n-1)$$

* $\overline{x}$ 观测到的样本均值
* $\mu$ 总体均值
* $S$ 样本标准差
* $n$ 样本个数

上面的例子就是单总体t检验

## 双总体t检验
检验两个样本各自所代表的总体的均值差异是否显著，包括独立样本t检验和配对样本t检验。

### 独立样本t检验
检验两个独立样本所代表的总体均值差异是否显著。  
适用条件：
1. 两样本均来自于正态总体
2. 两样本相互独立
3. 满足方差齐性（两总体方差相等）

两类样本方差相等，判断均值的差异。

统计量：
$$t=\frac{\overline{x}-\overline{y}}{S_w\sqrt{\frac{1}{m}+\frac{1}{n}}}\sim t(m+n-2)$$

其中：
$$S_w=\frac{(m-1)S_1^2+(n-1)S_2^2}{m+n-1}$$


* $\overline{x}$ 第一个样本均值
* $\overline{y}$ 第二个样本均值
* $m$第一个样本容量
* $n$第二个样本容量
* $S_1^2$第一个样本方差
* $S_2^2$第二个样本方差


### 配对样本t检验
检验两个配对样本所代表的总体均值差异是否显著。  
配对样本主要包含以下两种情形： 
1. 同源配对,也就是同质的对象分别接受两种不同的处理。例如：为了验证某种记忆方法对改善儿童对词汇的记忆是否有效，先随机抽取40名学生，再随机分为两组。一组使用该训练方法，一组不使用，三个月后对这两组的学生进行词汇测验，得到数据。问该训练方法是否对提高词汇记忆量有效？
2. 自身配对。某组同质对象接受两种不同的处理。例如：某公司推广了一种新的促销方式，实施前和实施后分别统计了员工的业务量，得到数据。试问这种促销方式是否有效？

适用条件：每对数据的差值必须服从正态分布
统计量：
$$t=\frac{\overline{x_d}}{\frac{S_d}{\sqrt{n}}}$$

两配对样本对应元素做差后形成的新样本
* $\overline{x_d}$新样本均值
* $S_d$新样本标准差
* $n$新样本容量

In [22]:
# 单侧t分布表
from scipy import stats
import pandas as pd
row=[0.75,0.80,0.85,0.90,0.95,0.975,0.99,0.995,0.999,0.9995]
free=list(range(1,10))
a=np.empty((len(free),len(row)))
for i in range(len(free)):
    for j  in range(len(row)):
        a[i,j]=stats.t.ppf(row[j],df=free[i])
pd.DataFrame(a,columns=row,index=free)

Unnamed: 0,0.7500,0.8000,0.8500,0.9000,0.9500,0.9750,0.9900,0.9950,0.9990,0.9995
1,1.0,1.376382,1.962611,3.077684,6.313752,12.706205,31.820516,63.656741,318.308839,636.619249
2,0.816497,1.06066,1.386207,1.885618,2.919986,4.302653,6.964557,9.924843,22.327125,31.599055
3,0.764892,0.978472,1.249778,1.637744,2.353363,3.182446,4.540703,5.840909,10.214532,12.923979
4,0.740697,0.940965,1.189567,1.533206,2.131847,2.776445,3.746947,4.604095,7.173182,8.610302
5,0.726687,0.919544,1.155767,1.475884,2.015048,2.570582,3.36493,4.032143,5.89343,6.868827
6,0.717558,0.905703,1.134157,1.439756,1.94318,2.446912,3.142668,3.707428,5.207626,5.958816
7,0.711142,0.89603,1.119159,1.414924,1.894579,2.364624,2.997952,3.499483,4.78529,5.407883
8,0.706387,0.88889,1.108145,1.396815,1.859548,2.306004,2.896459,3.355387,4.500791,5.041305
9,0.702722,0.883404,1.099716,1.383029,1.833113,2.262157,2.821438,3.249836,4.296806,4.780913


单侧t分布表是指t分布的概率密度函数中，`{x|x<0}`的时候对应的区间面积为p。  
双侧t分布表示指t分布的概率密度函数中，`[-x,x]`这个区间的面积为p。

$$1-p_单=0.5-\frac{p_双}{2}$$  

$$2p_单-p_双=1$$