In [4]:
import numpy as np
import scipy.stats as stats

## Метод моментов

Из того, что мы обсудили в лекции, для получения оценки методом моментов достаточно:

* Получить оценку первого выборочного момента $M_1 = \frac{1}{n} \sum_{i=1}^{n} X_{i}$ и приравнять ее к теоретическому значению $E(X) = \frac{1}{n}\sum_{i=1}^{n} X_{i}$;
* Получить оценку второго выборочного момента $M_2 = \frac{1}{n} \sum_{i=1}^{n} X_{i}^{2}$ и приравнять ее к теоретическому значению $E(X^2) = \frac{1}{n} \sum_{i=1}^{n} X_{i}^{2}$;
* Продолжить, пока число уравнений не станет равным числу параметров.

Далее будем считать, что $X_1, ..., X_n$ - независимые одинаково распределенные случайные величины.

### Распределение Бернулли

Параметр у распределения один - $p$. Тогда, нам будет достаточно разрешить следующее уравнение:
$$ E_p(X) = \frac{1}{n}\sum_{i=1}^{n} X_i,$$
$$ p = \frac{1}{n}\sum_{i=1}^{n} X_i.$$
откуда следует $ \hat{p} = \sum_{i=1}^{n} X_i $.

### Нормальное распределение

Нормальное распределение определяется 2 параметрами - $\mu$ и $\sigma$. Соответственно, нам необходимо разрешить 2 уравнения.

Как и ранее, уравняем теоретические значения моментов и их выборочные аналоги:
$$ E(X) = \mu = \frac{1}{n} \sum_{i=1}^{n}X_i,$$
$$ E(X^2)= V(X) + (E(X))^2 = \sigma^2 + \mu^2 = \frac{1}{n} \sum_{i=1}^{n}X_i^2.$$

Отсюда получаем:
$$ \hat{\mu} = \bar{X} = \frac{1}{n} \sum_{i=1}^{n}X_i,$$
$$ \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n}X_i^2 - \bar{X} = \frac{1}{n} \sum_{i=1}^{n}(X_i- \bar{X})^2.  $$

In [36]:
mu, sigma = 3, 1
s = np.random.normal(mu, sigma, 1000)

In [37]:
np.mean(s)

3.0766117561345183

Как мы можем заметить, выборочная оценка не всегда с точностью равна парметру распределения. Однако, как мы помним, выборочная оценка сама является случайной величиной - поэтому следует думать о ней в терминах вероятности. Ответ на вопрос - в каких пределах может находиться значение оценки с заданной точностью - призвано дать интервальное оценивание.

## Метод моментов - альтернативная формулировка

Из того, что мы обсудили в лекции, для получения оценки методом моментов достаточно:

* Получить оценку первого выборочного момента $M_1 = \frac{1}{n} \sum_{i=1}^{n} X_{i}$ и приравнять ее к теоретическому значению $E(X) = \frac{1}{n}\sum_{i=1}^{n} X_{i}$;
* Получить оценку второго выборочного центрального момента $M_2 = \frac{1}{n} \sum_{i=1}^{n} (X_{i} - M_1)^{2}$ и приравнять ее к теоретическому значению $E((X-\mu)^2)$.
* Продолжить, пока число уравнений не станет равным числу параметров.

Можно показать, что данные методы эквивалентны. Для некоторых задач удобнее воспользоваться альтернативной формулировкой.

### Гамма распределение

Напомним, что гамма- распределение является двупараметрическим с параметрами $\alpha$ и $\theta$.

Теоретические моменты опеределены как:
$$ E(X) = \alpha\theta,$$
$$ V(X) = \alpha\theta^2.$$

Получим:
$$\alpha\theta = \frac{1}{n} \sum_{i=1}^{n} X_i, $$
$$\alpha\theta^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i-\bar{X})^2. $$

Легко можно преобразовать:
$$\alpha = \frac{\bar{X}}{\theta}, $$
$$\alpha\theta^2 = \frac{\bar{X}}{\theta}\theta^2 = \bar{X}\theta = \frac{1}{n} \sum_{i=1}^{n} (X_i-\bar{X})^2.$$

Тогда:
$$ \hat{\theta} = \frac{1}{n\bar{X}} \sum_{i=1}^{n} (X_i-\bar{X})^2,$$
$$ \hat{\alpha} = \frac{\bar{X}}{\hat{\theta}} = \frac{n\bar{X}^2}{\sum_{i=1}^{n} (X_i-\bar{X})^2}. $$

In [53]:
shape, scale = 2.0, 2.5
s = np.random.gamma(shape, scale, 1000)

In [64]:
mean = np.mean(s)
theta = 1/(float(len(s))*mean) * np.sum(np.power(s - mean, 2))
alpha = mean/theta

In [65]:
alpha

2.0247819919070396

In [66]:
theta

2.5597654949274675