<img src = "img/z-test1.jpeg">
<img src = "img/z_test1.png">

In [1]:
import numpy as np
import scipy.stats as ss
import statsmodels.stats as sm

# 1. 正态总体检验
## 1.1 总体均值检验

In [71]:
def z_test(mean, mu, sigma, n, typ):
    '''
    1. this functions has 5 parameters. According to Z test formula. 
    mean 样本均值
    mu 总体均值
    sigma 总体标准
    S为样本的标准差
    n 样本大小
    2. when typ is left, p is one side left.
    3. when typ is 2, p is two sides.
    4. else, p is one side from right.
    '''
    # 计算z统计量. 分子其实就是标准误， z统计量，就是标准分。
    z = (mean-mu)/(sigma/np.sqrt(n)) 
    if typ == 2:
        # 求出z的概率
        # 1. 因为目的是检验样本的均值与总体的均值是否相等 = 。 因此使用双边检验。要先使用1-cdf，并且✖️2.
        p = (1-ss.norm.cdf(np.abs(z)))*2
    elif typ == "left":
        p = ss.norm.cdf(np.abs(z))
    else:
        # 2. 如果要检验样本均值是否 < 或 > 总体均值，则需要单边p。
        p = 1-ss.norm.cdf(np.abs(z))
    return p

- 已知总体均值

例1:某机床厂加工一种零件，根据经验知道，该厂加工零件的椭圆度近似服从正态分布，其总体均值为μ=0.081mm,总体标准差为σ=0.025,今换一种新机床进行加工，抽取n=200个零件进行检验，得到的椭圆度均值为0.076mm,试问新机床加工零件的椭圆度的均值与以前有无显著差异？(α=0.05)

做出假设:

$H_0:μ=0.081$ # 双边检验

$H_1:μ≠0.081$

确定统计量:

n=200,

$\sigma=0.025$

规定显著性水平:

α=0.05

In [65]:
mu= 0.081 #总体的均值
sigma = 0.025#总体体标准差
n = 200  # 样本容量
mean = 0.076 # 样本均值
z_test(mean, mu, sigma, n, typ=2)

0.004677734981047177

In [66]:
# 结论，rfa = 0.05 > p = 0.46 拒绝原假设。
# 因为是双边检测，结论可以是 α/2 = 0.25 > p/2 0.23 拒绝原假设。

例2:根据过去大量资料，某厂生产的灯泡的使用寿命服从正态分布$N~(1020,100^2)$,现从最近生产的一批产品中随机抽取16只,测得样本的平均寿命为1080小时,试在0.05的显著水平下判断这批产品的使用寿命是否有显著提高.(α=0.05)

1. 提出假设

$H_0:μ⩽1020 原假设为<= 单侧右侧检验。$

$H_1:μ>1020 $ 

2. 确定统计量

n = 16

mean = 1080

sigma = 100

mu = 1020

3. 规定显著水平 (α=0.05)

In [67]:
n = 16
mean = 1080
sigma = 100
mu = 1020
z_test(mean, mu, sigma, n, typ=1)

0.008197535924596155

In [68]:
# 结论 p < α, 接受原假设

- 总体的标准差未知 大样本

例3:某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证，随机抽取了100件作为样本，测得平均使用寿命1245小时,标准差300小时,能否说该厂生产的电子元件质量显著地高于规定标准？(α=0.05)

做出假设:

$H_0:μ⩽1200$  # 单边右侧检验

$H_1:μ>1200$

确定统计量:

$ n=100,σ未知,使用{ \Large z=\frac{\bar{X}-\mu}{S/\sqrt{n}}}$

规定显著性水平:

α=0.05

In [70]:
mu = 1200
n = 100
mean = 1245
S = 300 #sigma 总体标准差未知，因此使用样本的标准差。
z_test(mean, mu,S, n,typ=0)

0.06680720126885809

In [61]:
# p>α 接受原假设。