In [3]:
import numpy as np
import scipy.stats as stats

## Доверительный интервал для оценки среднего

Как мы установили ранее, $\bar{X}$ является несмещенной оценкой среднего, которая распределена асимптотически нормально. Стандартная ошибка среднего в данном случае $\frac{\sigma}{\sqrt{n}}$.

Так как истинное значение нам неизвестно, мы используем оценку:
$$ S^2 = \frac{1}{n-1}\sum_{i=1}^{n} (X_i - \bar{X})^2.$$

Получается, что вместо статистики:
$$ \frac{\bar{X} - \mu}{\sigma/\sqrt{n}}, $$

мы используем статистику:

$$ \frac{\bar{X} - \mu}{S/\sqrt{n}}. $$

Мы уже знаем, что асимптотически \bar{X} все равно распределена нормально, однако на практике различия могут быть существенными. Поэтому, используется истинное распределение искомой статистики, а именно t-распределение Стьюдента.

Доверительным интервалом для оценки среднего $\bar{X}$ по выборке размера $n$ называется интервал вида:
$$ \bar{X} \pm t_{\alpha/2, n-1} \frac{S}{\sqrt{n}}.$$



In [6]:
stats.t.interval(0.95, 15)

(-2.131449545559323, 2.131449545559323)

Асимптотически, распределение Стьдента сходится к нормальному распределению.

## Доверительный интервал для оценки дисперсии

Для нормально распределенной выборки $X_1, ..., X_n$ доверительный интервал для дисперсии принимает вид:
$$\frac{(n-1)S^2}{b} \leq \sigma^2 \leq \frac{(n-1)S^2}{a},$$
где $a = \chi^{2}_{1-\alpha/2, n-1}$ и $b = \chi^{2}_{\alpha/2, n-1}.$ 

In [8]:
stats.chi2.interval(0.95, 15)

(6.2621377950432526, 27.488392863442979)

## Доверительный интервал для оценки доли

Вспомним, что для распределения Бернулли $V(X) = p(1-p).$ Тогда, если мы хотим оценить долю, т.е. отношение суммы положительных ответов к общему числу ответов, $\hat{p} = \bar{X}.$

Доверительный интервал для доли: 
$$ \hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}.} $$

In [9]:
stats.norm.interval(0.95)

(-1.959963984540054, 1.959963984540054)

## Пример: A/B тесты

Одним из самых распостраненных способов использования доверительных интервалов - тест на разность доли в 2 группах, особенно важный для A/B тестов.

Будем считать, что у нас есть 2 группы: контрольная и тестовая, причем нас интересует доля пользователей ,совершивших некоторое действие. Как мы уже знаем, доля является случайной величиной, а нам хотелось бы получить ответ на вопрос: можем ли мы считать разницу в долях случайной, или возникшей на некоторой регулярной основе?

Доверительный интервал для разности двух долей $p_1$ и $p_2$:
$$ (\hat{p_1}-\hat{p_2}) \pm  z_{\alpha/2} \sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n} \frac{\hat{p_2}(1-\hat{p_2})}{n} }.$$

Применение данной статистики для нахождения значимости изменений давно стало частью общераспостраненной методолгии, пример можно найти, например, тут: 
https://developer.amazon.com/public/apis/manage/ab-testing/doc/math-behind-ab-testing