In [29]:
from scipy.stats import geom, norm
import numpy as np

### Предварительные расчеты

$Geom(p) \sim p(1-p)^{m-1}$

1) $\hat{\theta}_{MLE}:$

$\frac{dLn(L)}{d \theta} = 0 \Rightarrow \hat{\theta}_{MLE} = \frac{n}{\sum_{i=1}^{n} m_i} = \frac{1}{\overline m}$

2) $i(\theta):$

$i(\theta) = E(\frac{dLn(L)}{d \theta})^2 = \frac{1}{\theta^2(1-\theta)}$

$\hat{\theta}_{MLE}$ - состоятельна (т.к. существует единственное решение $\frac{dLn(L)}{d \theta} = 0$)

По теореме об асимптотической нормальности, получаем:

$\sqrt{n}(\hat{\theta} - \theta) \xrightarrow{\text{d}} N(0, i(\theta) ^ {-1})$

Откуда получаем:

$P(q_{\frac{\alpha}{2}} \leq \frac{\sqrt{n} (\hat \theta - \theta)}{\sqrt{\hat \theta^2(1-\hat \theta)}} \leq q_{1 - \frac{\alpha}{2}}) = 1 - \alpha$

Следовательно:

$P(-q_{1 - \frac{\alpha}{2}} \frac{\sqrt{\hat \theta^2(1-\hat \theta)}}{\sqrt{n}} + \hat\theta \leq \theta \leq q_{1 - \frac{\alpha}{2}} \frac{\sqrt{\hat \theta^2(1-\hat \theta)}}{\sqrt{n}} + \hat\theta) = 1 - \alpha$





In [123]:
def generate(param, size, num_experiments=1000, confidence_level=0.95):
  alpha = 1 - confidence_level

  critical_value_r = norm.ppf(1-alpha/2)

  cover_count = 0

  for _ in range(num_experiments):
    seq = geom.rvs(param, size=size)

    MLE = 1 / np.mean(seq)

    fisher_info = np.sqrt((1 - MLE) * MLE**2)

    right_bound = critical_value_r * fisher_info / np.sqrt(size) + MLE
    left_bound = -critical_value_r * fisher_info / np.sqrt(size) + MLE

    if left_bound <= param <= right_bound:
      cover_count += 1

  return cover_count / num_experiments

In [145]:
print(f"n =  25  : {generate(0.7, 25)}")
print(f"n = 10000: {generate(0.7, 10000)}")

n =  25  : 0.94
n = 10000: 0.953


### Выводы

Так как оценка состоятельна, то по теоереме об асимптотической нормальности получаем:

$SE(\hat\theta) = \sqrt{\frac{1}{n*i(\theta)}}  \xrightarrow{\text{n → ∞}} 0$

По теоереме Чебышева:

$P(| \hat \theta - \theta| > \epsilon ) \leq \frac{Var(\hat\theta)}{\epsilon ^2} = \frac{SE(\hat\theta)^2}{\epsilon ^2} \xrightarrow{\text{n → ∞}} 0$

Получается, что с увеличением n оценка становится точнее.