```{=typst}
#set text(
  font: ("Times New Roman", "LXGW WenKai"),
  size: 11pt,
)

= 题目

#h(2em) 据说某地汽油的价格是 115 美分/gal，为了验证这种说法，一位司机开车随机选择了一些加油站，得到某年 1 月和 2 月的数据如下：

1 月 119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118

2 月 118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125

#h(2em) （1）分别用两个月的数据验证这种说法的可靠性；

#h(2em) （2）分别给出1月和2月汽油价格的置信区间（$a=0.05$）；

#h(2em) （3）如何给出1月和2月汽油价格差的置信区间（$a=0.05$）。

= 思路

#h(2em) 本题是关于均值的假设检验和置信区间的问题。对于两个总体均值的差的置信区间，可以使用两个总体均值的差的置信区间的方法。

#h(2em) 下面是代码实现：
```


In [None]:
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

In [None]:
# 导入数据
N = 20
target = 115
x1 = np.array([119, 117, 115, 116, 112, 121, 115, 122, 116, 118, 109, 112, 119, 112, 117, 113, 114, 109, 109, 118])
x2 = np.array([118, 119, 115, 122, 118, 121, 120, 122, 128, 116, 120, 123, 121, 119, 117, 119, 128, 126, 118, 125])

# 数据可视化
plt.hist(x1, bins=10, alpha=0.5, label='x1')
plt.hist(x2, bins=10, alpha=0.5, label='x2')
plt.legend(loc='upper right')
plt.show()

# 数据预处理
df = N - 1
x1_mean = np.mean(x1)
x2_mean = np.mean(x2)
x1_std = np.std(x1)
x2_std = np.std(x2)

In [None]:
# 检验
t1, p1 = stats.ttest_1samp(x1, target)
print('t1: ', t1)
print('p1: ', p1)

t2, p2 = stats.ttest_1samp(x2, target)
print('t2: ', t2)
print('p2: ', p2)

```{=typst}
$
"p1" = 0.86 approx 1 \
"p2" = 1.32 times 10^(-6) approx 0
$

根据一月的数据判断，这一说法可靠；根据二月的数据判断，这种说法不可靠。
```

In [None]:
alpha = 0.05

ci1 = stats.t.interval(1 - alpha, df, x1_mean, stats.sem(x1))
print('ci1: ', ci1)

ci2 = stats.t.interval(1 - alpha, df, x2_mean, stats.sem(x2))
print('ci2: ', ci2)

一月汽油价格的置信区间为: (113.33881957294425, 116.96118042705577)

二月汽油价格的置信区间为: (119.01289621559044, 122.48710378440956)

In [None]:
dfn = 2 * (N - 1)

tc, pc = stats.ttest_ind(x1, x2)
print('tc: ', tc)
print('pc: ', pc)

cic = stats.t.interval(1 - alpha, dfn, x1_mean - x2_mean, np.sqrt((x1_std**2 + x2_std**2) / N))
print('cic: ', cic)

一月和二月汽油价格差的置信区间为: (-7.965814456260355, -3.234185543739634)