In [113]:
import numpy as np
from scipy.stats import ttest_ind
 
# 定义数据
data1 = np.random.normal(0, 1, 1000)
data2 = np.random.normal(1, 1, 1000)


### 如果P值小于0.05，则我们认为两组数据的差异显著。如果P值大于0.05，则我们认为两组数据的差异不显著。

In [114]:
 
# 检验两组数据的差异性
t, p = ttest_ind(data1, data2)
 
# 设定显著性水平，通常为0.05
alpha = 0.05

H = {
    0:"两组数据差异不显著"
    ,1:"两组数据差异明显"
} 
# 判断是否拒绝原假设
if p >= alpha:
    print(f"p值为【{p}】,{H[0]}")
elif p < alpha:
    print(f"p值为：【{p}】拒绝原假设,{H[1]}")
    

p值为：【3.2419149146812036e-91】拒绝原假设,两组数据差异明显


#### 另一种检验方法
### $u=\frac{\bar{X}-\mu_0}{S_{\bar{X}}}=\frac{\bar{X}-\mu_0}{S / \sqrt{n}} \quad(n$ 较大时 $)$

### $u=\frac{\bar{X}-\mu_0}{\sigma_{\bar{X}}}=\frac{\bar{X}-\mu_0}{\sigma_0 / \sqrt{n}} \quad\left(\sigma_0\right.$ 已知时)

### $ \bar{X}: 抽样的均值 $
### $ \mu_0: 样本原本应该的均值 $
### $ sigma_0:样本原本应该的标准差 $


In [122]:


def u(sigma_0,mu_0,bar_x_mu,n):
    """计算u值

    Args:
        sigma_0 (_type_): 标准差
        mu_0 (_type_): 均值
        bar_x_mu (_type_): 待比较样本均值
        n (_type_): 待比较样本数量

    Returns:
        _type_: _description_
    """
    #print(f"sigma_0:{sigma_0},\nmu_0:{mu_0},\nbar_x_mu:{bar_x_mu},\nn:{n}")
    u = (bar_x_mu-mu_0)/(sigma_0/np.sqrt(n))
    return u

def p_value_test(data1,data2):
    """P值检验

    Args:
        data1 (_type_): 数据1
        data2 (_type_): 数据2

    Returns:
        _type_: _description_
    """
    sigma_0 = np.std(data1)
    mu_0 = np.mean(data1) 
    bar_x_mu = np.mean(data2)
    n = data2.size
    u_value = u(sigma_0,mu_0,bar_x_mu,n)
    if u_value <= 1.96:
        return f"P值大于等于0.5,u={u_value},两组数据差异并不显著"
    elif u_value > 2.58:
        return f"p<0.01 ,u={u_value},两组数据具有显著不同"
    elif u_value > 1.96:
        return f"P值<0.05,u={u_value},两组数据具有显著不同"
    

p_value_test(data1,data2)


'p<0.01 ,u=30.436658588271882,两组数据具有显著不同'