標本分散を使って母分散を推定する

ステップ

標本平均$x_{ave}$, 標本分散$s^{2}$, 統計量$W$, 母分散$\sigma^{2}$

$$
x_{ave} = \displaystyle \frac{1}{N} \sum^{i} x_{i} \\
s^{2} = \frac{1}{N} \sum^{i} \left( x_{i} - x_{ave} \right)^{2} \\
W = \frac{1}{\sigma^{2}} \sum^{i} \left( x_{i} - x_{ave} \right)^{2} 
$$

$s^{2}$と$W$の形が似ているので整理できる

$$ W = \displaystyle\frac{Ns^{2}}{\sigma^{2}} $$

ただし，$W$はN-1の自由度のχ2乗分布に従う

In [25]:
# 蝶の体長のサンプル
x = [76, 85, 82, 80, 77]
dof = len(x)

# 標本平均
x_ave = float(sum(x)) / len(x)
print('x_ave: {}'.format(x_ave))

# 標本分散
s2 = sum([(x_i - x_ave)**2 for x_i in x]) / len(x)
print('s2: {}'.format(s2))

print('Wは自由度{}のchi2分布に従う'.format(dof - 1))

# データを引っ張ってくる

x_ave: 80.0
s2: 10.8
Wは自由度4のchi2分布に従う


In [36]:
# データを引っ張ってくる
import pandas as pd

chi2_table = pd.read_csv('../data/chi2_table.csv', header=0, index_col=0)
chi2_series = chi2_table['dof_{}'.format(dof - 1)]

print('下限は0.48({})'.format(chi2_series[0.975 < chi2_series]['base_value_0.48']))
print('上限は11.1({})'.format(chi2_series[chi2_series < 0.025]['base_value_11.1']))

下限は0.48(0.9754004138073096)
上限は11.1(0.0249875928402995)


つまり，

$$
\begin{array} \\
0.48 <= W <= 11.4 \\
0.48 <= \displaystyle\frac{Ns^{2}}{\sigma^{2}} <= 11.4 \\
0.48 <= \displaystyle\frac{54}{\sigma^{2}} <= 11.4 \\
\\
4.85 <= \sigma^{2} <= 111.48 \\
2.2 <= \sigma <= 10.6
\end{array}
$$