In [84]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as sts
%matplotlib inline

Считаем наши данные:

In [85]:
data = np.load('9-1.npy')

Для начала воспользуемся ЦПТ. Для $Exp(\theta)$, $EX_1 = \frac{1}{\theta}, DX_1 = \frac{1}{\theta^2}$, откуда:
$$\sqrt{n} \left(\overline{X} - \frac{1}{\theta}\right) \xrightarrow{d_{\theta}} N\left(0, \frac{1}{\theta^2}\right)$$
$$\sqrt{n} \left(\theta \overline{X} - 1\right) \xrightarrow{d_{\theta}} N\left(0, 1\right)$$
Откуда получим критерий для проверки $H_0 : \theta = \theta_0$ vs $H_1: \theta \neq \theta_0$: 
$$S = \left\{\sqrt{n} \left|\theta_0 \overline{X} - 1\right| > u_{1 - \frac{\alpha}{2}}\right\},$$
где $u_{1 - \frac{\alpha}{2}}$ - квантиль $N(0, 1)$. Возьмем $\alpha = 0.05$, тогда $u_{1 - \frac{\alpha}{2}} = 1.96$. Данный критерий является состоятельным в силу ЦПТ и УЗБЧ и асимптотическим (аналогично критерию Вальда).

Используем данный критерий для каждого $\theta \in \{0.9, 1, 1.1\}$

# $H_0 : \theta = 0.9$ vs $H_1: \theta \neq 0.9$

In [86]:
theta = 0.9
np.sqrt(len(data)) * np.abs(theta * np.mean(data) - 1) > 1.96

False

Таким образом мы отвергаем гипотезу $H_0$.

# $H_0 : \theta = 1$ vs $H_1: \theta \neq 1$

In [87]:
theta = 1
np.sqrt(len(data)) * np.abs(theta * np.mean(data) - 1) > 1.96

False

Таким образом мы отвергаем гипотезу $H_0$.

# $H_0 : \theta = 1.1$ vs $H_1: \theta \neq 1.1$

In [88]:
theta = 1.1
np.sqrt(len(data)) * np.abs(theta * np.mean(data) - 1) > 1.96

True

Таким образом мы отвергаем гипотезу, что $\theta = 1.1$

Далее для оставшихся $\theta \in \{0.9, 1\}$ воспользуемся критерием найденым на семинаре.Для выборки из экспоненциального распределения с параметром $\theta$ и $H_0 : \theta = \theta_0$ vs $H_1: \theta > \theta_0$:
$$S = \{2 \theta_0 \sum_{i=1}^{n}{X_i} < b_{\alpha}\},$$
где $b_{\alpha}$ - квантиль $\chi^2_{2n}$.

Для проверки $H_0 : \theta = \theta_0$ vs $H_1: \theta < \theta_0$:
$$S = \{2 \theta_0 \sum_{i=1}^{n}{X_i} > b_{1 - \alpha}\}.$$


Испоьзуем данные критерии для $\theta = 0.9$ и $\theta = 1$. В данном случае возьмем $\alpha = 0.1$ (иначе мы не сможем отвергнуть ни одну из гипотез).

#  $H_0 : \theta = 0.9$ vs $H_1: \theta > 0.9$

In [89]:
theta = 0.9
2 * 0.9 * np.sum(data) < sts.distributions.chi2.ppf(0.1, 2 * len(data))

False

Таким образом мы не отвергаем гипотезу $H_0$.

#  $H_0 : \theta = 1$ vs $H_1: \theta < 1$

In [90]:
theta = 1
2 * theta * np.sum(data) > sts.distributions.chi2.ppf(0.9, 2 * len(data))

True

Таким образом мы отвергаем гипотезу, что $\theta = 1$.

В итоге мы отвергнули все гипотезы, кроме $\theta = 0.9$. Следовательно, мы предпологаем, что это и есть наше истинное значение параметра. Интересное также посмотреть на величину $\overline{X}$:

In [91]:
np.mean(data)

1.134570549918088

Данная величина как раз очень похожа на $\frac{1}{\theta} = \frac{1}{0.9} \approx 1.11$, что и должно получается исходя из того, что $\overline{X} \xrightarrow{P_{\theta}} \frac{1}{\theta}$.

Вывод: с помощью различных критериев проверок разных гипотез мы смогли определить истинное значение параметра экспоненциального распределения равное $\theta = 0.9$. В данном случае коэффициенты $\alpha$ в обоих критериях мы брали достаточно малыми, поэтому вероятность ошибки невелика и равна $\max{\alpha} = 0.1$, то есть 10%.