# Доверительные интервалы для доли

## Генерация данных

In [1]:
import numpy as np
from functools import partial

In [2]:
np.random.seed(1)

statistical_population = np.random.randint(2, size=100_000)

# выборка
random_sample = np.random.choice(statistical_population, size=1000)

In [3]:
# истинное значение доли
statistical_population.mean()

0.49771

## точечная оценка

In [4]:
random_sample.mean()

0.502

## доверительный интервал для доли

In [6]:
from statsmodels.stats.proportion import proportion_confint

### Доверительный интервал на основе нормального распределения

$$\hat{p}\pm z_{1-\frac{\alpha}{2}} \sqrt{\frac{\hat{p}\left(1-\hat{p}\right)}{n}}$$

In [9]:
normal_interval = proportion_confint(sum(random_sample), len(random_sample), method='normal')

In [11]:
print('normal interval {}'.format(list(map(partial(round, ndigits=5), normal_interval))))

normal interval [0.47101, 0.53299]


### Доверительный интервал Уилсона

$$\frac1{ 1 + \frac{z^2}{n} } \left( \hat{p} + \frac{z^2}{2n} \pm z \sqrt{ \frac{ \hat{p}\left(1-\hat{p}\right)}{n} + \frac{
z^2}{4n^2} } \right), \;\; z \equiv z_{1-\frac{\alpha}{2}}$$ 

In [12]:
wilson_interval = proportion_confint(sum(random_sample), len(random_sample), method='wilson')

In [13]:
print('wilson interval {}'.format(list(map(partial(round, ndigits=5), wilson_interval))))

wilson interval [0.47106, 0.53292]


## Размер выборки для интервала заданной ширины

In [14]:
from statsmodels.stats.proportion import samplesize_confint_proportion

In [15]:
n_samples = int(samplesize_confint_proportion(random_sample.mean(), 0.01))
n_samples

9603

In [16]:
np.random.seed(1)
random_sample = np.random.choice(statistical_population, size = n_samples)

In [18]:
normal_interval = proportion_confint(sum(random_sample), len(random_sample), method='normal')

In [19]:
print('normal interval {} with width {}'.format(list(map(partial(round, ndigits=5), normal_interval)), 
                                                round(normal_interval[1] - normal_interval[0],3)))

normal interval [0.48183, 0.50182] with width 0.02
