# 单样本Z检验（One-sample Z test）

## 基本概念
**单样本Z检验**用于判断**单个样本均值**是否与**已知总体均值**存在统计学差异，要求总体标准差σ已知或样本量足够大（n≥30）。

单样本Z检验的核心思想是通过计算标准正态分布的Z统计量，评估样本均值与总体均值的偏离程度。

## z检验的适用场景
**适用于大样本**：
- Z检验适用于样本量较大（通常大于30）的情况
- 对于小样本数据（尤其是样本量小于30的情况），Z检验的准确性较低，此时应使用 t 检验

## 零假设与备择假设
- 单尾检验：
    - 右尾检验：
        - 零假设（$H_0$）：样本均值小于等于总体均值，即 $\mu <= \mu_0$。
        - 备择假设（$H_1$）：样本均值大于总体均值，即$\mu > \mu_0$。
    - 左尾检验：
        - 零假设（$H_0$）：样本均值大于等于总体均值，即 $\mu >= \mu_0$。
        - 备择假设（$H_1$）：样本均值小于总体均值，即$\mu < \mu_0$。
- 双尾检验：
    - 零假设（$H_0$）：样本均值等于总体均值，即 $\mu = \mu_0$。
    - 备择假设（$H_1$）：样本均值不等于总体均值，即$\mu \ne \mu_0$。

## 检验统计量
检验统计量 $Z$ 的计算公式为：
$$Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}$$
其中：
- $\bar{X}$：样本均值
- $\mu_0$：总体均值
- $\sigma$：总体标准差
- $n$：样本量

## 步骤

Z检验基于标准正态分布（均值为0，标准差为1），通过将样本均值转化为$Z$统计量，衡量样本均值偏离总体均值的程度。$Z$统计量表示的是样本均值与总体均值之间的标准差单位数，从而帮助判断样本数据是否支持假设。
假设检验的基本步骤包括：
- **提出假设**：零假设（$H_0$）和备择假设（$H_1$）。
- **计算$Z$统计量**：通过样本数据计算出$Z$统计量，$Z$统计量用来衡量样本均值与总体均值之间的差异。
- **确定P值**：根据计算得到的Z统计量，我们可以使用标准正态分布表或统计软件来确定P值。P值是在零假设为真的情况下，观察到的样本结果或更极端结果出现的概率。
- **做出决策**：
    - 如果P值小于或等于显著性水平（α），我们拒绝零假设。
    - 如果P值大于显著性水平（α），我们不能拒绝零假设。

# 单样本 Z 检验实际案例

## 单尾检验

### 案例背景
某内容平台对文章详情页进行了布局优化（新版UI），希望验证 ​​新版页面的用户平均停留时间是否显著长于​​ 历史基准值 ​​120秒​​（单尾检验）。

- 历史基准均值（μ₀）: 120秒
- 新版本实验数据: `sample = [141.2, 120.7, 135.5, 155.3, 116.8, 125.9, 134.6, 102.3, 145.8, 130.1,
 119.4, 108.7, 132.2, 153.9, 124.5, 139.7, 111.2, 128.6, 147.3, 118.9,
 122.4, 136.8, 143.1, 95.8, 129.5, 142.7, 115.3, 131.9, 149.2, 107.6,
 126.3, 138.4, 152.1, 113.7, 127.8, 144.6, 121.5, 133.2, 104.9, 137.5]`

### 确定假设
- **零假设（$H_0$）**：新版停留时间 ≤ 120秒，即$\mu <= 120$
- **备择假设（$H_1$）**：新版停留时间 > 120秒，即$\mu > 120$

### 计算检验统计量
采用单样本 Z 检验：
$$Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}} = \frac{\bar{X} - \mu_0}{s/\sqrt{n-1}}$$

### 代码实现

#### 手工计算

In [6]:
import numpy as np
from scipy.stats import norm

sample = [141.2, 120.7, 135.5, 155.3, 116.8, 125.9, 134.6, 102.3, 145.8, 130.1,
 119.4, 108.7, 132.2, 153.9, 124.5, 139.7, 111.2, 128.6, 147.3, 118.9,
 122.4, 136.8, 143.1, 95.8, 129.5, 142.7, 115.3, 131.9, 149.2, 107.6,
 126.3, 138.4, 152.1, 113.7, 127.8, 144.6, 121.5, 133.2, 104.9, 137.5]

# 输入数据
mu_0 = 120       # 历史基准均值（秒）
x_bar = np.mean(sample)      # 样本均值（秒）
sigma = np.std(sample)      # 总体标准差（秒），使用样本标准差近似（n>30大样本情况下可以这样操作）
n = len(sample)          # 样本量

# Z 统计量计算
z_score = (x_bar - mu_0) / (sigma / np.sqrt(n-1))

# 单尾 p 值（右尾检验）
p_value = 1 - norm.cdf(z_score)

# 输出结果
print(f"样本均值: {x_bar:.4f}")
print(f"Z 值: {z_score:.3f}")
print(f"单尾 p 值: {p_value:.4f}")

# 显著性判断
alpha = 0.05
if p_value < alpha:
    print("结论：新版停留时间 > 120秒，拒绝原假设")
else:
    print("结论：新版停留时间 ≤ 120秒，无法拒绝原假设")

样本均值: 129.1725
Z 值: 3.895
单尾 p 值: 0.0000
结论：新版停留时间 > 120秒，拒绝原假设


#### `ztest`实现

`ztest()`
   - `x1`: 第一个样本的数据
       - 如果是单样本检验，只需提供 x1
   - `x2`: 第二个样本的数据(用于双样本检验)
   - `value`: 检验的假设值
       - 单样本检验：检验均值是否等于 value
       - 双样本检验：检验 x1均值 - x2均值 是否等于 value
   - `alternative`: 备择假设的类型
       - `two-sided`：双尾检验（默认）
       - `larger`：右尾检验（备择假设中检验参数是否显著大于某个值）
       - `smaller`：左尾检验（备择假设中检验参数是否显著小于某个值）
   - `usevar`: 如何计算方差
       - `pooled (默认)`: 使用合并方差
       - `unequal`: 使用不等方差
   - `ddof`: 自由度的调整值。默认值1.0(样本标准差的无偏估计)
       

In [8]:
from statsmodels.stats.proportion import proportions_ztest
from statsmodels.stats.weightstats import ztest

# 使用statsmodels进行单样本Z检验
# alternative='two-sided'表示双尾检验
z_stat, p_value = ztest(sample, value=120, alternative='larger')

print(f"样本均值: {x_bar:.4f}")
print(f"Z 值: {z_stat:.3f}")
print(f"单尾 p 值: {p_value:.4f}")

# 显著性判断
alpha = 0.05
if p_value < alpha:
    print("结论：新版停留时间 > 120秒，拒绝原假设")
else:
    print("结论：新版停留时间 ≤ 120秒，无法拒绝原假设")

样本均值: 129.1725
Z 值: 3.895
单尾 p 值: 0.0000
结论：新版停留时间 > 120秒，拒绝原假设


## 双尾检验

### 案例背景

某电商平台优化了商品详情页的服务器配置，希望验证新配置的页面加载时间是否与历史基准2.5秒存在显著差异（双尾检验）。

- 历史基准加载时间: 2.5 秒
- 新配置实验数据:
`sample = [
    2.3, 2.4, 2.2, 2.5, 2.6, 2.3, 2.1, 2.4, 2.5, 2.3,
    2.2, 2.6, 2.4, 2.3, 2.5, 2.3, 2.4, 2.6, 2.2, 2.1,
    2.3, 2.5, 2.4, 2.2, 2.6, 2.4, 2.3, 2.2, 2.5, 2.3,
    2.4, 2.6, 2.3, 2.2, 2.5, 2.3, 2.4, 2.1, 2.3, 2.4
]`

### 确定假设
- **零假设（$H_0$）**：新配置加载时间 = 2.5秒，即$\mu = 2.5$
- **备择假设（$H_1$）**：新配置加载时间 ≠ 2.5秒，即$\mu \ne 2.5$

### 计算检验统计量
采用单样本比例 Z 检验：
$$Z = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}} = \frac{\bar{X} - \mu_0}{s/\sqrt{n-1}}$$

### 代码实现

#### 手工计算

In [9]:
import numpy as np
from scipy.stats import norm
sample = [
    2.3, 2.4, 2.2, 2.5, 2.6, 2.3, 2.1, 2.4, 2.5, 2.3,
    2.2, 2.6, 2.4, 2.3, 2.5, 2.3, 2.4, 2.6, 2.2, 2.1,
    2.3, 2.5, 2.4, 2.2, 2.6, 2.4, 2.3, 2.2, 2.5, 2.3,
    2.4, 2.6, 2.3, 2.2, 2.5, 2.3, 2.4, 2.1, 2.3, 2.4
]

# 输入数据
mu_0 = 2.5       # 历史基准均值（秒）
x_bar = np.mean(sample)      # 样本均值（秒）
sigma = np.std(sample)      # 总体标准差（秒），使用样本标准差近似（n>30大样本情况下可以这样操作）
n = len(sample)          # 样本量

# 计算Z统计量
z_score = (x_bar - mu_0) / (sigma / np.sqrt(n-1))

# 计算双尾P值
p_value = 2 * norm.sf(np.abs(z_score))

# 输出结果
print(f"样本均值: {x_bar:.4f}")
print(f"Z统计量: {z_score:.4f}")
print(f"P值: {p_value:.4f}")

# 显著性判断（α=0.05）
alpha = 0.05
if p_value < alpha:
    print("结论：页面加载时间与历史基准有显著差异（拒绝H₀）")
else:
    print("结论：无显著差异（无法拒绝H₀）")

样本均值: 2.3600
Z统计量: -6.1213
P值: 0.0000
结论：页面加载时间与历史基准有显著差异（拒绝H₀）


#### `ztest`实现

In [10]:
import numpy as np
from statsmodels.stats.weightstats import ztest

# 使用statsmodels进行单样本Z检验
# value参数指定原假设的均值（μ₀=2.5）
# alternative='two-sided'表示双尾检验
z_stat, p_value = ztest(sample, value=2.5, alternative='two-sided', ddof=1)

# 输出结果
print(f"Z统计量: {z_stat:.4f}")
print(f"P值: {p_value:.4f}")

# 显著性判断（α=0.05）
alpha = 0.05
if p_value < alpha:
    print("结论：页面加载时间与历史基准有显著差异（拒绝H₀）")
else:
    print("结论：无显著差异（无法拒绝H₀）")

Z统计量: -6.1213
P值: 0.0000
结论：页面加载时间与历史基准有显著差异（拒绝H₀）
