# 实验12-统计推断

这一章是讲如何从样本推断总体,以及如何评价从样本推断整体的可信程度.

- 怎样由样本数据估计总体的一些参数
- 估计的可靠程度如何
- 怎样根据样本数据去肯定或否定一个事先提出的假设

## 参数估计

假定总体的概率分布的类型(如正态分布\指数分布)已知,由样本估计分布的参数(如$\mu,\sigma$)的值.
> 本节只讨论正态分布的参数估计
> 本节只讨论期望和方差的估计

### 点估计

通常取$$\hat{\mu}=\bar{x},\hat{\sigma}=\bar{s}$$

#### 将总体分布的参数用样本统计量估计

- 样本($x_1,x_2,\cdots,x_n$)的样本均值$\bar{x}=\frac{1}{n}\sum_{i=1}^n x_i$称为`一阶矩`
- `二阶矩`是样本的方差$A_2=\frac{1}{n-1}\sum_{i=1}^n(x_i-\bar{x})^2$
- 可以用样本`一阶矩`和`二阶矩`对总体$\mu,\sigma^2$进行估计,记作
  - $\hat{\mu}=\bar{x}$
  - $\hat{\sigma}^2=A_2$

#### 极大似然估计

极大似然估计是一种常用的参数估计方法,其基本思想是:在所有可能的参数值中,选择使得观察到的样本数据出现的概率最大的参数值作为估计值.
设总体的概率密度函数为$f(x;\theta)$,其中$\theta$是待估参数,样本为$x_1,x_2,\cdots,x_n$,则样本的联合概率密度函数为
$$
L(\theta)=f(x_1;\theta)f(x_2;\theta)\cdots f(x_n;\theta)
$$
称为似然函数,取对数得到
$$
\ln L(\theta)=\ln f(x_1;\theta)+\ln f(x_2;\theta)+\cdots+\ln f(x_n;\theta)
$$
对$\theta$求导,令导数为0,解出$\theta$的值,即为极大似然估计值.

#### 点估计的评价标准

- 无偏性: 估计量的数学期望等于被估计参数的真值
  - `一阶矩`是无偏的
  - `二阶矩`是有偏的,其无偏估计量是$\frac{n-1}{n}A_2=s^2=\frac{n-1}{n}\sum_{i=1}^n(x_i-\bar{x})^2$
- 有效性: 估计量的方差小
  - 对固定的n,某个$\hat{\theta}$的方差更小,则称$\hat{\theta}$是更有效的
- 一致性: 当样本容量增大时,估计值收敛于被估计参数的真值

### 区间估计



#### 置信区间

置信区间是指用样本统计量估计总体参数时,给出的一个区间,该区间包含真值的概率为$1-\alpha$,其中$\alpha$称为`显著性水平`,常取0.05,0.01等.$1-\alpha$称为置信概率
形式上来说:
$$
P(\theta_1<\theta<\theta_2)=1-\alpha
$$
其中$\theta_1,\theta_2$是样本统计量($x_i$)的函数,称为置信区间的下限和上限.

#### 总体均值的区间估计

- 总体方差已知
  - 对$\bar{x}$标准化得到$Z=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)$
  - 给定置信水平$1-\alpha$,寻找两个常数$L,U$,使得$P(L<z<U)=1-\alpha$
  - 总体均值的置信区间为$\bar{x}\pm u_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}$
  - 其中$z_{\alpha/2}$是标准正态分布的上侧$\alpha/2$分位数
  - 由于总体方差已知,所以可以直接计算


In [19]:
import numpy as np
from scipy.stats import norm

def estimate_population_mean_known_variance(sample, sigma, confidence_level=0.95):
    sample_mean = np.mean(sample)
    n = len(sample)
    alpha = 1 - confidence_level
    z_value = norm.ppf(1 - alpha / 2)
    margin_of_error = z_value * (sigma / np.sqrt(n))
    conf_interval = (sample_mean - margin_of_error, sample_mean + margin_of_error)
    return conf_interval

# 示例
sample = np.array([172, 171, 166, 160, 155, 173, 166, 170, 167, 173, 178, 173, 163, 165, 170, 163, 172, 182, 171, 177])
sigma = 10
confidence_level = 0.95

conf_interval_known = estimate_population_mean_known_variance(sample, sigma, confidence_level)
print(f"方差已知的情况下，总体均值的置信区间: {conf_interval_known}")

方差已知的情况下，总体均值的置信区间: (164.96738729711709, 173.7326127028829)


- 总体方差未知
  - 总体均值的置信区间为$\bar{x}\pm t_{1-\alpha/2}\frac{s}{\sqrt{n}}$
  - 其中$t_{\alpha/2}$是自由度为$n-1$的t分布的上侧$\alpha/2$分位数
  - 由于总体方差未知,所以用样本方差代替总体方差


In [20]:
import numpy as np
from scipy import stats

def estimate_population_mean_unknown_variance(sample, confidence_level=0.95):
    sample_mean = np.mean(sample)
    sample_std = np.std(sample, ddof=1)
    n = len(sample)
    alpha = 1 - confidence_level
    t_value = stats.t.ppf(1 - alpha / 2, df=n-1)
    margin_of_error = t_value * (sample_std / np.sqrt(n))
    conf_interval = (sample_mean - margin_of_error, sample_mean + margin_of_error)
    return conf_interval

# 示例
sample = np.array([172, 171, 166, 160, 155, 173, 166, 170, 167, 173, 178, 173, 163, 165, 170, 163, 172, 182, 171, 177])
confidence_level = 0.95

conf_interval_unknown = estimate_population_mean_unknown_variance(sample, confidence_level)
print(f"方差未知的情况下，总体均值的置信区间: {conf_interval_unknown}")

方差未知的情况下，总体均值的置信区间: (166.36181727721933, 172.33818272278066)



#### 总体方差的区间估计

在置信水平$1-\alpha$下,总体方差$\sigma^2$的置信区间为
$$
\left[\frac{(n-1)s^2}{\chi^2_{1-\alpha/2}},\frac{(n-1)s^2}{\chi^2_{\alpha/2}}\right]
$$


In [21]:
import numpy as np
from scipy.stats import chi2

def estimate_population_variance_confidence_interval(sample, confidence_level=0.95):
    n = len(sample)
    sample_variance = np.var(sample, ddof=1)
    alpha = 1 - confidence_level

    chi2_lower = chi2.ppf(alpha / 2, df=n-1)
    chi2_upper = chi2.ppf(1 - alpha / 2, df=n-1)

    lower_bound = (n - 1) * sample_variance / chi2_upper
    upper_bound = (n - 1) * sample_variance / chi2_lower

    return (lower_bound, upper_bound)

# 示例
sample = np.array([172, 171, 166, 160, 155, 173, 166, 170, 167, 173, 178, 173, 163, 165, 170, 163, 172, 182, 171, 177])
confidence_level = 0.95

conf_interval_variance = estimate_population_variance_confidence_interval(sample, confidence_level)
print(f"总体方差的置信区间: {conf_interval_variance}")


总体方差的置信区间: (23.57671659788239, 86.96441550031433)


#### 两样本均值差值的区间估计

In [22]:
dataset ={
    'jan': [119, 117, 115, 116, 112, 121, 115, 122, 116, 118, 109, 112, 119, 112, 117, 113, 114, 109, 109, 118],
    'feb': [118, 119, 115, 122, 118, 121, 120, 122, 128, 116, 120, 123, 121, 119, 117, 119, 128, 126, 118, 125],
}

mu0 = 115
alpha = 0.05

# Convert the lists to numpy arrays for easier calculations
jan_prices = np.array(dataset['jan'])
feb_prices = np.array(dataset['feb'])

mean_jan = np.mean(jan_prices)
mean_feb = np.mean(feb_prices)
mean_diff = mean_jan - mean_feb

# 标准误差计算
std_err_jan = np.std(jan_prices, ddof=1) / np.sqrt(len(jan_prices))
std_err_feb = np.std(feb_prices, ddof=1) / np.sqrt(len(feb_prices))
std_err_diff = np.sqrt(std_err_jan**2 + std_err_feb**2)

# 自由度计算（可以使用近似公式）
df = len(jan_prices) + len(feb_prices) - 2

# 置信区间计算
t_critical = stats.t.ppf(1 - alpha/2, df)
margin_of_error = t_critical * std_err_diff
conf_int_diff = (mean_diff - margin_of_error, mean_diff + margin_of_error)

print(f"1月和2月价格差在α=0.05显著性水平下的置信区间: {conf_int_diff}")

1月和2月价格差在α=0.05显著性水平下的置信区间: (-8.027274417173235, -3.172725582826754)





## 假设检验

假设检验是指在给定显著性水平$\alpha$下,根据样本数据对总体参数提出的某种假设进行检验.

### 基本概念

- 原假设$H_0$: 对总体参数提出的某种假设
- 备择假设$H_1$: 对原假设的否定

当然可以！以下是每个问题的应用示例和相应的Python代码。

### 1. 总体均值的假设检验

**应用示例**：一个公司想知道其员工的平均工资是否为5000元。假设工资服从正态分布。

**Python求解**：


In [23]:
import numpy as np
from scipy.stats import ttest_1samp

# 假设我们有一组员工的工资样本
salaries = np.array([4800, 5200, 5000, 5100, 4900, 5300, 4700, 5100])

# 进行单样本t检验
t_stat, p_value = ttest_1samp(salaries, 5000)

print(f"T统计量: {t_stat}, p值: {p_value}")

# 判断是否拒绝原假设
alpha = 0.05
if p_value < alpha:
    print("拒绝原假设: 员工的平均工资显著不同于5000元")
else:
    print("不拒绝原假设: 没有证据表明员工的平均工资不同于5000元")


T统计量: 0.17407765595569782, p值: 0.8667318497550079
不拒绝原假设: 没有证据表明员工的平均工资不同于5000元



### 2. 总体方差的假设检验

**应用示例**：一个工厂想知道其生产的零件直径的方差是否为0.01平方厘米。

**Python求解**：


In [24]:

import numpy as np
from scipy.stats import chi2

# 假设我们有一组零件直径的样本数据
diameters = np.array([2.99, 3.01, 2.98, 3.02, 3.00, 3.03, 2.97, 3.01])

# 计算样本方差
sample_variance = np.var(diameters, ddof=1)

# 样本大小
n = len(diameters)

# 计算卡方统计量
chi2_stat = (n - 1) * sample_variance / 0.01

# 计算p值
p_value = 1 - chi2.cdf(chi2_stat, df=n-1)

print(f"卡方统计量: {chi2_stat}, p值: {p_value}")

# 判断是否拒绝原假设
alpha = 0.05
if p_value < alpha:
    print("拒绝原假设: 零件直径的方差显著不同于0.01平方厘米")
else:
    print("不拒绝原假设: 没有证据表明零件直径的方差不同于0.01平方厘米")



卡方统计量: 0.28874999999999656, p值: 0.9999121071598152
不拒绝原假设: 没有证据表明零件直径的方差不同于0.01平方厘米




### 3. 两总体均值的假设检验

**应用示例**：两种不同肥料的效果是否有显著差异。我们测量了使用两种肥料的植物生长高度。

**Python求解**：


In [25]:

import numpy as np
from scipy.stats import ttest_ind

# 假设我们有两组植物生长高度的样本数据
fertilizer_A = np.array([22, 24, 21, 23, 25, 20, 22, 23])
fertilizer_B = np.array([27, 28, 26, 29, 30, 27, 28, 29])

# 进行独立样本t检验
t_stat, p_value = ttest_ind(fertilizer_A, fertilizer_B)

print(f"T统计量: {t_stat}, p值: {p_value}")

# 判断是否拒绝原假设
alpha = 0.05
if p_value < alpha:
    print("拒绝原假设: 两种肥料的效果显著不同")
else:
    print("不拒绝原假设: 没有证据表明两种肥料的效果不同")



T统计量: -7.514430561703706, p值: 2.816546758109079e-06
拒绝原假设: 两种肥料的效果显著不同



### 4. 0-1分布总体均值的假设检验

**应用示例**：一个公司想知道新产品的购买率是否为20%。

**Python求解**：


In [26]:
import numpy as np
from statsmodels.stats.proportion import proportions_ztest

# 假设我们有一组购买行为的样本数据 (1表示购买，0表示未购买)
purchases = np.array([1, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0])

# 计算样本中购买的数量和样本总数
count = np.sum(purchases)
nobs = len(purchases)

# 进行比例检验
stat, p_value = proportions_ztest(count, nobs, value=0.2)

print(f"Z统计量: {stat}, p值: {p_value}")

# 判断是否拒绝原假设
alpha = 0.05
if p_value < alpha:
    print("拒绝原假设: 购买率显著不同于20%")
else:
    print("不拒绝原假设: 没有证据表明购买率不同于20%")

Z统计量: 2.0701966780270626, p值: 0.03843393023678171
拒绝原假设: 购买率显著不同于20%



### 5. 总体正态性检验

**应用示例**：验证某个产品的重量是否服从正态分布。

**Python求解**：


In [27]:
import numpy as np
from scipy.stats import shapiro

# 假设我们有一组产品重量的样本数据
weights = np.array([50.1, 49.8, 50.3, 49.9, 50.0, 50.2, 49.7, 50.4])

# 进行Shapiro-Wilk正态性检验
stat, p_value = shapiro(weights)

print(f"Shapiro-Wilk统计量: {stat}, p值: {p_value}")

# 判断是否拒绝原假设
alpha = 0.05
if p_value < alpha:
    print("拒绝原假设: 样本数据不服从正态分布")
else:
    print("不拒绝原假设: 没有证据表明样本数据不服从正态分布")

Shapiro-Wilk统计量: 0.9748582563729307, p值: 0.9331651921064827
不拒绝原假设: 没有证据表明样本数据不服从正态分布


### 6.单边检验

In [28]:
import numpy as np
from scipy.stats import ttest_1samp

# 假设我们有一组员工的工资样本
salaries = np.array([4800, 5200, 5000, 5100, 4900, 5300, 4700, 5100])

# 进行单样本t检验
t_stat, p_value = ttest_1samp(salaries, 5000)

# 单边检验，只关心平均工资是否大于5000元
p_value_one_sided = p_value / 2 if t_stat > 0 else 1 - p_value / 2

print(f"T统计量: {t_stat}, 单边p值: {p_value_one_sided}")

# 判断是否拒绝原假设
alpha = 0.05
if p_value_one_sided < alpha:
    print("拒绝原假设: 员工的平均工资显著大于5000元")
else:
    print("不拒绝原假设: 没有证据表明员工的平均工资大于5000元")

T统计量: 0.17407765595569782, 单边p值: 0.43336592487750397
不拒绝原假设: 没有证据表明员工的平均工资大于5000元


: 