# Задание 4.1

## Гипергеометрическое распределени


### Критерий согласия <b>$\chi^2$</b> (Хи-квадрат)

Пусть  $\vec{x}=(X_1, X_2, ..., X_n)$ - выобрка независимых одинаково распределённых случайных величин. <br>
$\nu_1$, $\nu_2$, ..., $\nu_N$ - частоты попадания выборочных данных в соответсвующие подмножества группировки $\epsilon_1$, $\epsilon_2$, ..., $\epsilon_N$ (в дискретном случае - в подмножества значений исследуемой случайной величины)<br>
$$\nu_j=\sum_{i=1}^{n}I(X_i=j), j=1,...,N$$ 

Тогда вектор $\nu = (\nu_1, \nu_2, ..., \nu_N) \sim M(n, p_1, p_2, ... , p_n)$, т.е. имеет полиномиальное распределение, где $\vec{p}=(p_1, p_2, ... , p_n)$ - вероятности попадания исследуемой случайной величины в соответсвующие подмножества группировки $\epsilon_1$, $\epsilon_2$, ..., $\epsilon_N$<br>

Простую гипотеза $H_0$ заключается в том, что $\underline{p} = \underline{\mathring{p}} = (\mathring{p_1}, \mathring{p_2}, ... , \mathring{p_N}) $ - заданый вероятностный вектор $(0<\mathring{p_j}<1, j=1,...,N; \space\mathring{p_1}+...+\mathring{p_N}=0)$<br>

Статистика критерия $\mathring{X_n^2}=\mathring{X_n^2}(\vec{x})=\mathring{X_n^2}(\nu)=\sum_{i=1}^{N}\frac{(\nu_j-n \mathring{p_j})^2}{n \mathring{p_j}}=\sum_{i=1}^{N}\frac{\nu_j^2}{n \mathring{p_j}}-n$ <br>
<br>
Если гипотеза $H_0$ справедлива, то поскольку относительная частота $\frac{\nu_j}{n}$ события $\{\xi = j\}$ является состаятельной оценкой его вероятности $\mathring{p_j}\space(j=1,...,N)$, то при больших объёмах выборки $n$ разности $|\frac{\nu_j}{n} - p_j|$ должны быть малы, следовательно значение статистики $\mathring{X_n^2}$ не должно быть слишком большим. Поэтому естесвтенно задать критическую область для гипотезы $H_0$ в виде $X_{1\alpha}=\{\vec{x}: \mathring{X_n^2}(\vec{x})>t_\alpha\}$, где $t_\alpha$ при заданном уровне значимости $\alpha$ должна быть выбранна из условия $P(\mathring{X_n^2} > t_\alpha | H_0)=\alpha$<br>
<br>
Поскольку для вычисление точное значение границы $t_\alpha$ требуется знать $L(t_\alpha|H_0)$, а точное распредение статистики при гипотезе $H_0$ неудобно для расчёта критерия, граничное значение находят из пределеного распределения (при $n \rightarrow \infty L(t_\alpha|H_0)\rightarrow \chi^2(N-1)$).<br>
То есть граница уровня значимости $\alpha$ - это есть ни что иное, как $1-\alpha$-квантиль распределения $\chi^2(N-1)$ <br>
<br>
К достоинствам данного критерия можно отнести тот факт, что его можно применять даже в том случае, когда данные имеют нечисловой характер. <br>
Одним из недостатков критерия является потеря некоторой информации о выборке при группировке слагаемых.<br>
Для уменьшения эффекта потери инфрмации чаще всего принимают $N\approx 5$ для мальеньких выборок и $N\approx 10,...,15$ для больших выборок. <br>
Наиболее оптимальное значение $N$ помогает заключить эвристическое правило Старджесса, которое говорит, что <br>
$$ N = 1 + \lfloor log_2 n \rfloor $$

Из всего выше сказанно следует заключить, что критерий согласия $\chi^2$ обычно применяется, когда $n\geq 50$, $\nu_j\geq5 \space \forall j$, и выглядит следующим обазом<br>

$$ H_0\space отвергается \space \space \Leftrightarrow \space\space \mathring{X_n^2}>1-\alpha-квантиль\spaceраспределения \space\chi^2(N-1) $$

### Зададим гипергеометрическое распределение $HG(200, 70, 10)$

In [1]:
import numpy as np
from scipy.stats import hypergeom

volumes = [5, 10, 100, 1000, 10**5]
count_samples = 5

N, M, n = (200, 70, 10)
hg = hypergeom(N, n, M)

np.random.seed(1000)
data = {v: np.array([hg.rvs(size=v) for _ in range(count_samples)]) for v in volumes}

### Применим критерий 
Для мальеньких выборок объёма 5 и 10 применять данный критерий не будем.
Рассмотрим уровени значимости $\alpha = 0.1, \space 0.05 $<br> 
Гиптоза $H_0$ утверждает, что исследуемая случайная величина распределена как $HG(200,70,10)$.<br>
Правилом Старджесса в данном случае пользоваться не будем, так как значения полученных величин заключены в пределах от 0 до 10, то есть получить больше чем 11 интервалов не представляется возможным.

In [30]:
from scipy.stats import chi2
from math import ceil
from scipy.special import binom 

In [94]:
def compute_quntile(cdf, a, eps=0.001, max_range=30):
    x = np.arange(-1, max_range, eps)
    for xx in x:
        if cdf(xx)<a and cdf(xx+eps)>a:
            return xx+eps


In [87]:
def find_ps(boxes, hyposis):
    N, M, n = hyposis
    ans = np.empty(0)
    for i in boxes:
        p = binom(M, i) * binom(N-M, n-i) / binom(N, n)
        ans = np.append(ans, p)
    return ans

In [88]:
def find_nus(boxes, data):
    ans = np.empty(0)
    for i in boxes:
        nu = len(np.where(data==i)[0])
        ans = np.append(ans, nu)
    return ans

In [98]:
hyposis = (200, 70, 10)
for alpha in [0.1, 0.05]:
    print()
    print(f"                     УРОВЕНЬ ЗНАЧИМОСТИ {alpha}              ")
    print()
    for volume in volumes:
        if volume<=10:
            continue
        for choice in range(count_samples):
            N_boxes =  11
            boxes = range(0, 11)
            hyposis_ps = find_ps(boxes, hyposis)
            nus = find_nus(boxes, data[volume][choice])
            
            chi_stat = 0
            for j in range(len(nus)):
                chi_stat += (nus[j] - volume*hyposis_ps[j])**2 / (volume*hyposis_ps[j])
                
            q = compute_quntile(chi2(N_boxes-1).cdf, 1-alpha)
            if(chi_stat<q):
                answ = "H0 принимается"
            else:
                answ = "H0 отклоняется"
            print(f"{'n = '+str(volume)},",
                  f"Выборка №{choice+1},",
                  f"Число интервалов = {N_boxes},",
                  f"Значение статистики Пирсона = {chi_stat:.4}",
                  f"Квантиль {q:.4},",
                  answ)
            print()
        print("="*100)


                     УРОВЕНЬ ЗНАЧИМОСТИ 0.1              

n = 100, Выборка №1, Число интервалов = 11, Значение статистики Пирсона = 5.723 Квантиль 15.99, H0 принимается

n = 100, Выборка №2, Число интервалов = 11, Значение статистики Пирсона = 4.168 Квантиль 15.99, H0 принимается

n = 100, Выборка №3, Число интервалов = 11, Значение статистики Пирсона = 8.578 Квантиль 15.99, H0 принимается

n = 100, Выборка №4, Число интервалов = 11, Значение статистики Пирсона = 6.211 Квантиль 15.99, H0 принимается

n = 100, Выборка №5, Число интервалов = 11, Значение статистики Пирсона = 6.749 Квантиль 15.99, H0 принимается

n = 1000, Выборка №1, Число интервалов = 11, Значение статистики Пирсона = 5.325 Квантиль 15.99, H0 принимается

n = 1000, Выборка №2, Число интервалов = 11, Значение статистики Пирсона = 10.44 Квантиль 15.99, H0 принимается

n = 1000, Выборка №3, Число интервалов = 11, Значение статистики Пирсона = 8.078 Квантиль 15.99, H0 принимается

n = 1000, Выборка №4, Число интервалов = 

Как видно, критерий принял H0 для всех выборок для обоих уровней значимости.<br>
Теперь проверим как работает этот критерий для близкой, но заведомо неверной гипотезе H0. <br>
Пусть H0 утверждает, что исследуемая случайная величина распределена как $HG(190,70,10)$.<br>

In [103]:
hyposis = (190,70,10)
for alpha in [0.1, 0.05]:
    print()
    print(f"                     УРОВЕНЬ ЗНАЧИМОСТИ {alpha}              ")
    print()
    for volume in volumes:
        if volume<=10:
            continue
        for choice in range(count_samples):
            N_boxes =  11
            boxes = range(0, 11)
            hyposis_ps = find_ps(boxes, hyposis)
            nus = find_nus(boxes, data[volume][choice])
            
            chi_stat = 0
            for j in range(len(nus)):
                chi_stat += (nus[j] - volume*hyposis_ps[j])**2 / (volume*hyposis_ps[j])
                
            q = compute_quntile(chi2(N_boxes-1).cdf, 1-alpha)
            if(chi_stat<q):
                answ = "H0 принимается"
            else:
                answ = "H0 отклоняется"
            print(f"{'n = '+str(volume)},",
                  f"Выборка №{choice+1},",
                  f"Число интервалов = {N_boxes},",
                  f"Значение статистики Пирсона = {chi_stat:.4}",
                  f"Квантиль {q:.4},",
                  answ)
            print()
        print("="*100)


                     УРОВЕНЬ ЗНАЧИМОСТИ 0.1              

n = 100, Выборка №1, Число интервалов = 11, Значение статистики Пирсона = 4.952 Квантиль 15.99, H0 принимается

n = 100, Выборка №2, Число интервалов = 11, Значение статистики Пирсона = 8.45 Квантиль 15.99, H0 принимается

n = 100, Выборка №3, Число интервалов = 11, Значение статистики Пирсона = 4.13 Квантиль 15.99, H0 принимается

n = 100, Выборка №4, Число интервалов = 11, Значение статистики Пирсона = 8.816 Квантиль 15.99, H0 принимается

n = 100, Выборка №5, Число интервалов = 11, Значение статистики Пирсона = 3.716 Квантиль 15.99, H0 принимается

n = 1000, Выборка №1, Число интервалов = 11, Значение статистики Пирсона = 18.85 Квантиль 15.99, H0 отклоняется

n = 1000, Выборка №2, Число интервалов = 11, Значение статистики Пирсона = 30.02 Квантиль 15.99, H0 отклоняется

n = 1000, Выборка №3, Число интервалов = 11, Значение статистики Пирсона = 38.27 Квантиль 15.99, H0 отклоняется

n = 1000, Выборка №4, Число интервалов = 11

Видно, что близкие по своей алтернативе гипотезы критерий отклоняет только при больших объёмах выборки.<br>
Это говорит о том, что при малых объёмах выборки критерий говорит лишь о приближённых значениях, близких к истинным.

## Гамма распределение

### Зададим гамма распределение $Г(2, 1/2)$

In [4]:
import numpy as np
from scipy.stats import gamma

volumes = [5, 10, 100, 1000, 10**5]
count_samples = 5

a, th = 2, 1/2 
g = gamma(a, scale=1/th)

np.random.seed(1000)
data = {v: np.array([g.rvs(size=v) for _ in range(count_samples)]) for v in volumes}

### Подсчёт выборочного среднего и выборочной дисперсии

Отметим, что для $\xi \sim Г(2, 1/2)$: <br>
$E[\xi] = 4  $ <br>
$D[\xi] = 8  $

In [55]:
for volume in volumes:
    for choice in range(count_samples):
        print(f"{'n = '+str(volume):>10},",
              f"Выборка №{choice+1}, выборочное среднее = {np.mean(data[volume][choice]):.3},",
              f"выборочная дисперсия = {np.var(data[volume][choice]):.3},",
              f"несмещённая выборочная дисперсия = {np.var(data[volume][choice], ddof=1):.4}")
    print()

     n = 5, Выборка №1, выборочное среднее = 3.61, выборочная дисперсия = 1.63, несмещённая выборочная дисперсия = 2.039
     n = 5, Выборка №2, выборочное среднее = 2.85, выборочная дисперсия = 2.14, несмещённая выборочная дисперсия = 2.672
     n = 5, Выборка №3, выборочное среднее = 4.42, выборочная дисперсия = 5.94, несмещённая выборочная дисперсия = 7.429
     n = 5, Выборка №4, выборочное среднее = 4.59, выборочная дисперсия = 11.0, несмещённая выборочная дисперсия = 13.75
     n = 5, Выборка №5, выборочное среднее = 2.6, выборочная дисперсия = 2.3, несмещённая выборочная дисперсия = 2.876

    n = 10, Выборка №1, выборочное среднее = 1.57, выборочная дисперсия = 1.3, несмещённая выборочная дисперсия = 1.445
    n = 10, Выборка №2, выборочное среднее = 4.23, выборочная дисперсия = 12.4, несмещённая выборочная дисперсия = 13.82
    n = 10, Выборка №3, выборочное среднее = 4.65, выборочная дисперсия = 7.92, несмещённая выборочная дисперсия = 8.796
    n = 10, Выборка №4, выборочное

Как видно из при увеличении n значения оценок сходятся к истинным значениям параметров

# Задание 3.2

## Гипергеометрическое распределение

### Теоретическое построение оценок

Рассмотрим задачу оценки численности замкнутой популяции животных.
Тогда будем считать, что в какой-то момент времени  $M$ животных были помечены бирками, и в настоящий момент имеется $m$ выборок по $n$ наблюдейний в каждом.<br>
$x_1, x_2, ... , x_m \sim HG(\theta, M, n)$, где $\theta$ - неизвестная численность популяции. <br>
Найдём оценку методом моментов. <br>
Статистика $T(\vec{X}) = \bar{x}$ является смещённой оценокой для $\theta$, так как $E[T]=E[x_1]=\frac{M n}{\theta}$ <br>
По методу моментов оценкой неизвесного параметра будет $\hat{\theta}=\frac{M n}{\bar{x}}$. Эта оценка является состоятельной. <br><br>

Теперь найдём оценку для численности популяции методом максимального правдоподобия. <br>
Для этого предположим, что $\frac{M}{\theta} << 1$ и $n >> 1$, тогда гиепергеометрическое распределение приближается распределением Пуассона $\Pi(\frac{nM}{\theta}) $. [1]<br>
Логарифмическая функция правдоподобия будет иметь вид: <br>
$ln(L(\vec{X}, \theta)) = \sum_{i=1}^{m}ln(\frac{exp\{-\frac{nM}{\theta}\}(\frac{nM}{\theta})^{x_i}}{x_i!})= -m\frac{nM}{\theta}-ln(\theta)\sum_{i=1}^{m}x_i  + ln(nM)\sum_{i=1}^{m}x_i - \sum_{i=1}^{m}ln(x_i!)$<br><br>
Найдём максимум этой функции:<br>
$$\frac{\partial ln L}{\partial \theta} = 0$$
$$m \frac{nM}{\hat\theta^2}-\frac{1}{\hat\theta}\sum_{i=1}^{m}x_i=0 \space \space \Leftrightarrow \space\space 
nM = \hat\theta\frac{1}{m}\sum_{i=1}^{m}x_i \space \space \Leftrightarrow \space\space \hat{\theta}=\frac{nM}{\bar{x}}$$<br>
Оценка методом максимального правдоподобия точно такой же, как и оценка методом моментов. <br>

<br>
Стоит отметить, что исходная модель не является регулярной, однако после приближения распределением Пуассона, регулярность появилась. <br>
Продолжим исследавать модель и найдём эффективную оценку и параметрическую функцию, которую она оценивает. <br>
$$V = \frac{\partial ln L}{\partial \theta} = m \frac{nM}{\theta^2}-\frac{1}{\theta}\sum_{i=1}^{m}x_i \space \space \Leftrightarrow \space\space \frac{\theta}{m nM} V = \frac{1}{\theta} - \frac{\bar{x}}{nM} $$<br>
Таким образом, $T(\vec{X}) = \frac{\bar{x}}{nM}$ является эффективной оценкой для $\frac{1}{\theta}$ <br>


[1] https://stats.stackexchange.com/questions/73159/verification-of-poisson-approximation-to-hypergeometric-distribution

### Проверка оценок на данных

In [3]:
for volume in volumes:
    for choice in range(count_samples):
        print(f"{'n = '+str(volume):>10},",
              f"Выборка №{choice+1}, выборочное среднее = {int(n*M/np.mean(data[volume][choice])):},")
    print()

     n = 5, Выборка №1, выборочное среднее = 175,
     n = 5, Выборка №2, выборочное среднее = 250,
     n = 5, Выборка №3, выборочное среднее = 218,
     n = 5, Выборка №4, выборочное среднее = 166,
     n = 5, Выборка №5, выборочное среднее = 218,

    n = 10, Выборка №1, выборочное среднее = 170,
    n = 10, Выборка №2, выборочное среднее = 304,
    n = 10, Выборка №3, выборочное среднее = 250,
    n = 10, Выборка №4, выборочное среднее = 194,
    n = 10, Выборка №5, выборочное среднее = 205,

   n = 100, Выборка №1, выборочное среднее = 194,
   n = 100, Выборка №2, выборочное среднее = 212,
   n = 100, Выборка №3, выборочное среднее = 183,
   n = 100, Выборка №4, выборочное среднее = 203,
   n = 100, Выборка №5, выборочное среднее = 185,

  n = 1000, Выборка №1, выборочное среднее = 199,
  n = 1000, Выборка №2, выборочное среднее = 201,
  n = 1000, Выборка №3, выборочное среднее = 205,
  n = 1000, Выборка №4, выборочное среднее = 198,
  n = 1000, Выборка №5, выборочное среднее = 19

## Гамма распределение

### Теоретическое построение оценок

В реальной ситуации интерес представляет выяспенение обоих параметров гамма распределения. Сформулируем задачу. <br>
$x_1, x_2, ... , x_n \sim \Gamma(\theta_1, \theta_2)$, где $\vec{\theta} = (\theta_1, \theta_2)$ - неизвестные параметры. <br>
Напишем систему уравнений по методу момнтов.<br>
$$\begin{cases} \frac{\hat{\theta_1}}{\hat{\theta_2}} = \bar{x} \\ \frac{\hat{\theta_1}}{\hat{\theta_2}^2} = s^2 \end{cases} \space \space \Leftrightarrow \space\space  \begin{cases}  \hat{\theta_1}= \frac{\bar{x}^2}{s^2}  \\ \hat{\theta_2} =  \frac{\bar{x}}{s^2} \end{cases},  $$
где $\bar{x}$ - выборочное среднее, $s^2$ - несмещённая выборочная дисперсия. <br>
Полученные оценки являются состоятельными. Вопрос об их смещённости остаётся открытым. <br>
Проверим эту оценку на данных.

In [11]:
for volume in volumes:
    for choice in range(count_samples):
        x_sr = np.mean(data[volume][choice])
        x_d = np.var(data[volume][choice], ddof=1)
        print(f"{'n = '+str(volume):>10},",
              f"Выборка №{choice+1}, первый параметр = {x_sr**2 / x_d:.3},"
              f"второй параметр = {x_sr / x_d:.4}")
    print()

     n = 5, Выборка №1, первый параметр = 6.4,второй параметр = 1.772
     n = 5, Выборка №2, первый параметр = 3.04,второй параметр = 1.067
     n = 5, Выборка №3, первый параметр = 2.63,второй параметр = 0.5953
     n = 5, Выборка №4, первый параметр = 1.53,второй параметр = 0.3335
     n = 5, Выборка №5, первый параметр = 2.36,второй параметр = 0.9055

    n = 10, Выборка №1, первый параметр = 1.71,второй параметр = 1.089
    n = 10, Выборка №2, первый параметр = 1.3,второй параметр = 0.3063
    n = 10, Выборка №3, первый параметр = 2.45,второй параметр = 0.5282
    n = 10, Выборка №4, первый параметр = 2.29,второй параметр = 0.6905
    n = 10, Выборка №5, первый параметр = 5.39,второй параметр = 2.065

   n = 100, Выборка №1, первый параметр = 1.93,второй параметр = 0.5827
   n = 100, Выборка №2, первый параметр = 2.87,второй параметр = 0.627
   n = 100, Выборка №3, первый параметр = 2.09,второй параметр = 0.4722
   n = 100, Выборка №4, первый параметр = 2.02,второй параметр = 0.55

Видна явная состоятельность оценки

Теперь попробуем найти оценки для гамма распределения с 2-мя неизвестными параметрами методом максимального правдоподобия.<br>
Логарифмическая функция правдоподобия будет иметь вид: <br>
$ln(L(\vec{X}, \vec{\theta})) = \sum_{i=1}^{n}((\theta_1-1)ln(x_i) + \theta_1 ln(\theta_2) - \theta_2 x_i - ln(\Gamma(\theta_1))) = (\theta_1-1)\sum_{i=1}^{n}ln(x_i) + n \theta_1 ln(\theta_2) - \theta_2 \sum_{i=1}^{n}x_i - n\space 
ln(\Gamma(\theta_1))$<br>
Отметим несколько фактов. Заметим, что модель является регулярной и экспоненциальной. <br>
Достаточными статистиками: <br>
<ul>
 <li>Для $\theta_1$ ялвяется $T_1(\vec{X}) = \sum_{i=1}^{n}ln(x_i)$ </li>
 <li>Для $\theta_2$ является $T_1(\vec{X}) = \sum_{i=1}^{n}x_i$ </li>
</ul>
Составим систему урванений для метода максимального правдоподобия. <br>
$$\begin{cases} \frac{\partial ln L}{\partial \theta_1} = 0 \\ \frac{\partial ln L}{\partial \theta_2} = 0 \end{cases} \space \space \Leftrightarrow \space\space  \begin{cases} \sum_{i=1}^{n}ln(x_i) + n \space ln(\theta_2) - n \space \psi(\theta_1) = 0  \\ n \theta_1 \frac{1}{\theta_2} - \sum_{i=1}^{n}x_i = 0 \end{cases} \space \space \Leftrightarrow \space\space  \begin{cases}  \theta_2 =  \frac{\theta_1}{\bar{X}}\\ \overline{ln(X)} + ln(\theta_1) - ln(\bar{X}) -  \psi(\theta_1) = 0 \end{cases}  , $$
где $\psi(\theta_1) = (ln(\Gamma(\theta_1))'$ - диагамма, $\bar{X} = \frac{1}{n}\sum_{i=1}^{n}x_i$, $\overline{ln(X)} = \frac{1}{n}\sum_{i=1}^{n}ln(x_i)$ <br>
Второе уравнение является трансцендентным уравнением и поэтому можно решить только численными методами. <br>
Проверим оценку на данных.

In [18]:
from scipy.optimize import bisect
from scipy.special import digamma
for volume in volumes:
    for choice in range(count_samples):
        x_sr = np.mean(data[volume][choice])
        x_ln_sr = np.mean(np.log(data[volume][choice]))
        eq = lambda theta: x_ln_sr + np.log(theta) - np.log(x_sr) - digamma(theta)
        theta_1 = bisect(eq, 1, 10)
        theta_2 = theta_1 / x_sr
        print(f"{'n = '+str(volume):>10},",
              f"Выборка №{choice+1}, первый параметр = {theta_1:.3},"
              f"второй параметр = {theta_2:.3}")
    print()

     n = 5, Выборка №1, первый параметр = 6.58,второй параметр = 1.82
     n = 5, Выборка №2, первый параметр = 4.0,второй параметр = 1.4
     n = 5, Выборка №3, первый параметр = 2.75,второй параметр = 0.621
     n = 5, Выборка №4, первый параметр = 2.83,второй параметр = 0.618
     n = 5, Выборка №5, первый параметр = 3.33,второй параметр = 1.28

    n = 10, Выборка №1, первый параметр = 1.92,второй параметр = 1.22
    n = 10, Выборка №2, первый параметр = 1.45,второй параметр = 0.343
    n = 10, Выборка №3, первый параметр = 2.49,второй параметр = 0.536
    n = 10, Выборка №4, первый параметр = 1.82,второй параметр = 0.547
    n = 10, Выборка №5, первый параметр = 5.23,второй параметр = 2.0

   n = 100, Выборка №1, первый параметр = 2.0,второй параметр = 0.603
   n = 100, Выборка №2, первый параметр = 2.54,второй параметр = 0.555
   n = 100, Выборка №3, первый параметр = 1.85,второй параметр = 0.417
   n = 100, Выборка №4, первый параметр = 2.26,второй параметр = 0.622
   n = 100, В

Видна явная состоятельность оценки

Продолжим исследование гамма распределения.<br>
Теперь будем искать эффективную оценку для первого параметра распределения при известном втором.<br>
$x_1, x_2, ... , x_n \sim \Gamma(\theta, \lambda)$, $\theta$ - неизвестный параметр <br>
$$V(\vec{X}, \theta)=\frac{\partial ln L}{\partial \theta} =  \sum_{i=1}^{n}ln(x_i) + n \space ln(\lambda) - n \space \psi(\theta) \space \space \Leftrightarrow \space\space  \frac{1}{n}V(\vec{X}, \theta) = \frac{1}{n}\sum_{i=1}^{n}ln(x_i) + ln(\lambda) - \psi(\theta)$$ 
Таким образом эффективной оценкой для $\psi(\theta)$ является статистика $T(\vec{X}) = \frac{1}{n}\sum_{i=1}^{n}ln(x_i) + ln(\lambda) $, которая является фунцией от достаточной статистики, то есть оценка $\widehat{\psi(\theta)}$ будет отпимальной.
Обратная диагамма функция находится только численными методами.

Наконец будем искать эффективную оценку для второго параметра распределения при известном первом.<br>
$x_1, x_2, ... , x_n \sim \Gamma(\lambda, \theta)$, $\theta$ - неизвестный параметр <br>
$$V(\vec{X}, \theta)=\frac{\partial ln L}{\partial \theta} =   n \lambda \frac{1}{\theta} - \sum_{i=1}^{n}x_i \space \space \Leftrightarrow \space\space  \frac{1}{n \lambda}V(\vec{X}, \theta) = \frac{1}{\theta} - \frac{1}{n \lambda} \sum_{i=1}^{n}x_i$$ 
Таким образом эффективной оценкой для $\psi(\theta)$ является статистика $T(\vec{X}) = \frac{1}{n \lambda} \sum_{i=1}^{n}x_i $, которая является фунцией от достаточной статистики, то есть оценка $\frac{1}{\hat{\theta}}$ будет отпимальной.<br>
Найдём оптимальную несмещённую оценку для $\hat{\theta}$. Для этого найдём смещение для $T_0(\vec{X})= \frac{n \lambda}{\sum_{i=1}^{n}x_i }$. Воспмним, что $\sum_{i=1}^{n}x_i \sim \Gamma(n\lambda, \theta) $ <br>
$$E[T_0] = \int_{0}^{+\infty} \frac{n\lambda}{x} \frac{x^{n\lambda-1}\theta^{n\lambda} e^{-x\theta}}{\Gamma(n\lambda)} dx = \frac{n\lambda \theta^{n\lambda}}{\Gamma(n\lambda)} \int_{0}^{+\infty} (\frac{z}{\theta})^{n\lambda-2} e^{-z} \frac{dz}{\theta} = \theta  \frac{n\lambda}{\Gamma(n\lambda)} \Gamma(n\lambda - 1) = \theta  \frac{n\lambda}{n\lambda-1}$$
Тогда несмещённой оптимальной оценкой будет $T(\vec{X})=\frac{n\lambda-1}{n\lambda}  \frac{n \lambda}{\sum_{i=1}^{n}x_i } =  \frac{n \lambda -1 }{\sum_{i=1}^{n}x_i } $ <br>
Посмотрим, как ведёт себя эта оценка на смоделированных данных

In [21]:
for volume in volumes:
    for choice in range(count_samples):
        x_s = np.sum(data[volume][choice])
        theta =  (volume*a - 1) / x_s
        print(f"{'n = '+str(volume):>10},",
              f"Выборка №{choice+1}, искомый параметр = {theta:.3}")
    print()

     n = 5, Выборка №1, искомый параметр = 0.498
     n = 5, Выборка №2, искомый параметр = 0.631
     n = 5, Выборка №3, искомый параметр = 0.407
     n = 5, Выборка №4, искомый параметр = 0.393
     n = 5, Выборка №5, искомый параметр = 0.691

    n = 10, Выборка №1, искомый параметр = 1.21
    n = 10, Выборка №2, искомый параметр = 0.449
    n = 10, Выборка №3, искомый параметр = 0.409
    n = 10, Выборка №4, искомый параметр = 0.572
    n = 10, Выборка №5, искомый параметр = 0.727

   n = 100, Выборка №1, искомый параметр = 0.6
   n = 100, Выборка №2, искомый параметр = 0.435
   n = 100, Выборка №3, искомый параметр = 0.449
   n = 100, Выборка №4, искомый параметр = 0.548
   n = 100, Выборка №5, искомый параметр = 0.528

  n = 1000, Выборка №1, искомый параметр = 0.512
  n = 1000, Выборка №2, искомый параметр = 0.499
  n = 1000, Выборка №3, искомый параметр = 0.493
  n = 1000, Выборка №4, искомый параметр = 0.49
  n = 1000, Выборка №5, искомый параметр = 0.511

n = 100000, Выборка 

Видно, что даже при малых выборках значение близко к истинному