# Определение размера выборок

В scipy, вроде, нет встроенных возможностей для этого.  
Переход к односторонним гипотезам уменьшает размер выборки.  

## Тест пропорций

In [31]:
from statsmodels.stats.power import zt_ind_solve_power
from statsmodels.stats.proportion import proportion_effectsize

# параметры, которые задаем сами
baseline = 0.10  # базовый уровень конверсии (10%)
effect = 0.02    # MDE (2%)
alpha = 0.05     # уровень значимости (5%)
power = 0.8      # мощность теста (80%)

# расчёт эффекта
effect_size = proportion_effectsize(baseline, baseline + effect)

# расчёт размера выборки
sample_size = zt_ind_solve_power(
    effect_size=effect_size,
    alpha=alpha,
    power=power,
    alternative='two-sided'  # двусторонний тест, для односторонних: 'larger' или 'smaller'
)

# лучше сделать округление вверх ceil?
print(f"Необходимый размер выборки: {sample_size:.0f}")

Необходимый размер выборки: 3835


## Тест Уэлча

In [28]:
from statsmodels.stats.power import tt_ind_solve_power

# параметры, которые задаем сами
effect_size = 0.5  # MDE (разница между средними / стандартное отклонение)
alpha = 0.05       # уровень значимости (5%)
power = 0.8        # мощность теста (80%)
ratio = 1          # соотношение размеров выборок (1:1)

# расчёт размера выборки
sample_size = tt_ind_solve_power(
    effect_size=effect_size,
    alpha=alpha,
    power=power,
    ratio=ratio,
    alternative='two-sided'  # двусторонний тест, для односторонних: 'larger' или 'smaller'
)

# лучше сделать округление вверх ceil?
print(f"Необходимый размер выборки: {sample_size:.0f}")

Необходимый размер выборки: 64


## Хи-квадрат

In [19]:
from statsmodels.stats.power import GofChisquarePower

# Параметры
effect_size = 0.3  # Cohen's w (размер эффекта)
alpha = 0.05       # уровень значимости (5%)
power = 0.8        # мощность теста (80%)
n_bins = 2         # количество категорий (для таблицы 2x2). number of bins or cells in the distribution

# расчёт размера выборки
sample_size = GofChisquarePower().solve_power(
    effect_size=effect_size,
    alpha=alpha,
    power=power,
    n_bins=n_bins,  # количество категорий (для таблицы 2x2). number of bins or cells in the distribution
)

print(f"Необходимый размер выборки: {sample_size:.0f}")

Необходимый размер выборки: 87
