In [1]:
import numpy as np
import scipy.stats as ss
import statsmodels.stats as sm

In [26]:
def t_test(mean, mu, sigma, n, typ):
    '''
    1. this functions has 5 parameters. According to Z test formula. 
    mean 样本均值
    mu 总体均值
    sigma 总体标准
    S为样本的标准差
    n 样本大小
    2. when typ is 1, p is one side.
    3. when typ is left, p is two sides.
    4. else, 为右侧单边检验。
    '''
    # 计算z统计量. 分子其实就是标准误， z统计量，就是标准分。
    t = (mean-mu)/(sigma/np.sqrt(n)) 
    if typ == 2:
        # 求出z的概率
        # 1. 因为目的是检验样本的均值与总体的均值是否相等 = 。 因此使用双边检验。要先使用1-cdf，并且✖️2.
        p = (1-ss.t.cdf(np.abs(t), df = n-1))*2
    elif typ == "left":
        # 2. 如果要检验样本均值是否 < 或 > 总体均值，则需要单边p。
        p = ss.t.cdf(t,df = n-1)
    else:
        p = 1 - ss.t.cdf(t,df = n-1)
    return p

## 2.3 $\sigma^2$ 未知小样本

- 假定条件
  - 总体不一定服从正态分布——样本均值也可能不服从正态分布
  - $\sigma^2$未知小样本—样本均值极有可能不服从正态分布
  
### 那服从什么分布?
——t分布

注意:

t分布跟样本容量大小(n)有关

t分布在样本容量较大时近似正态分布


因此,这个时候应该使用t统计量,也就是t检验

${ \Large t=\frac{\bar{X}-\mu}{S/\sqrt{n}} \backsim t(n-1)}$



- 例4:

某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好，随机抽取10块肥皂为样本，测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著水平检验机器性能良好的假设.

做出假设:

$H_0:μ=5$ # 双边检验

$H_1:μ≠5$

确定统计量:

$df=n-1=10-1=9$

$使用{ \Large t=\frac{\bar{X}-\mu}{S/\sqrt{n}}}$

规定显著性水平:

α=0.05

In [20]:
mu = 5
n = 10 #df = n-1
S = 0.3
mean = 5.3
t_test(mean, mu,S, n, typ=2)

0.011507985165943646

In [7]:
# p < α, 拒绝原假设，即机器性能不好。

- 例5:

一个汽车轮胎制造商声称，某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验，测得平均值为41000公里，标准差为5000公里。已知轮胎寿命的公里数服从正态分布，我们能否根据这些数据作出结论，该制造商的产品同他所说的标准相符？(α=0.05)

1. 提出假设

$H_0: μ >= 41000$ # 左侧单边检验。

$H_1: μ < 41000$

2. 确定统计量
3. 规定显著水平

In [27]:
n = 20
mean = 41000
S = 5000
mu = 40000
t_test(mean, mu, S, n, typ="left")

0.8088579323162846