In [62]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats

## 枢轴量

1. 构造一个样本和 $\theta$ 的函数 $G=G(x_1,...,x_n,\theta)$ 使得 $G$ 的分布不依赖于未知参数，并称它为枢轴量(pivot)。
    (即 $G$ 是一個樣本的函數且遵從一個與 $\theta$ 有關的分佈)
2. 选择常数 $c,d$ ，使得对于给定的 $\alpha$，有 $P(c\leq G\leq d)=1-\alpha$
3. 将式子 $c\leq G\leq d$ 进行变形，得到 $\hat{\theta_L}\leq \theta \leq \hat{\theta_U}$，即 $P(\hat{\theta_L}\leq \theta \leq \hat{\theta_U})=1-\alpha$，那么这就是一个符合条件的置信区间。

> Example 2:  
> 设 $X_1,...,X_n$ 为独立同分布(iid)的样本，$X_1 \sim N(\mu,\sigma^2)$ ，求 $\sigma^2,\sigma$ 的水平为 $1-\alpha$ 的置信区间。

$S^2=\frac{\sum (X_i-\bar{X})^2}{n-1}$, by sampling theorem. $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$  
$P\{\chi^2(n-1,\frac{\alpha}{2}) \leq \frac{(n-1)S^2}{\sigma^2} \leq \chi^2(n-1,1-\frac{\alpha}{2})\}=1-\alpha$  
we have  
$\frac{(n-1)S^2}{\chi^2(n-1,1-\frac{\alpha}{2})} \leq \sigma^2 $ and $\sigma^2 \leq \frac{(n-1)S^2}{\chi^2(n-1,\frac{\alpha}{2})}$

> The sampling distribution (sample size = n) of the sample variance is the chi-squared distribution with df = n-1

## Test simulation  
$\mu=2.5, \sigma^2=1.2^2$

In [63]:
sample_size = 10000
mean_population = 2.5
var_population = 1.2**2

In [64]:
x_sample = np.random.normal(loc=mean_population, scale=var_population**0.5, size=sample_size)
x_mean = np.mean(x_sample)
x_s = np.var(x_sample,ddof=1)

In [65]:
x_mean,x_s

(2.4917427008874298, 1.446902713317581)

In [66]:
var_upper = x_s/scipy.stats.chi2.ppf(q=0.025,df=sample_size-1)*(sample_size-1)
var_lower = x_s/scipy.stats.chi2.ppf(q=1-0.025,df=sample_size-1)*(sample_size-1)

In [67]:
var_lower,var_upper

(1.4076183063862415, 1.4878628779378829)