In [1]:
import statsmodels.stats.api as sms

Пусть:

p - вероятность выпадения "фальшивой" стороны монеты (предположим, что это сторона с вероятностью 0.6)
q = 1 - p - вероятность выпадения "настоящей" стороны монеты (стороны с вероятностью 0.4)
n - количество бросков монеты, которые мы хотим сделать
Наша гипотеза H0 состоит в том, что монета настоящая, и её вероятность выпадения одной из сторон равна p=0.6. Альтернативная гипотеза H1 будет заключаться в том, что монета фальшивая, и вероятность выпадения одной из сторон отличается от p=0.6.

Для того чтобы определить количество бросков, чтобы с вероятностью 95% определить, что монета фальшивая, мы должны провести статистический тест на основе результатов эксперимента.

Один из популярных статистических тестов для этого случая - тест пропорций (proportion test). Мы хотим найти минимальное n, при котором результат теста будет позволять нам отвергнуть нулевую гипотезу H0 в пользу альтернативной гипотезы H1 (то есть монета фальшивая) с вероятностью не менее 95%.

In [4]:
# Заданные вероятности
p = 0.6
q = 0.4
# Желаемая вероятность ошибки первого рода (вероятность ложного обвинения, alpha)
alpha = 0.05
# Желаемая статистическая мощность теста (вероятность правильного обнаружения, 1 - beta)
power = 0.95

# Выполняем расчёт
effect_size = abs(p - q)
required_n = sms.NormalIndPower().solve_power(effect_size, alpha=alpha, power=power, ratio=1, alternative='two-sided')

# Округляем до ближайшего целого, так как количество бросков должно быть целым числом
required_n = int(round(required_n))
print("Минимальное количество бросков:", required_n)

Минимальное количество бросков: 650


Пропорциональный тест (proportion test) - это статистический тест, который используется для сравнения двух пропорций или долей в выборке и позволяет определить, есть ли статистически значимая разница между этими пропорциями. Он является частным случаем более общего категория тестов - тестов на сравнение пропорций.

Пропорциональный тест может применяться в различных ситуациях, например, для сравнения эффективности двух лечений, для проверки гипотезы о том, что пропорции в разных группах равны, для проверки гипотезы о соответствии данных ожидаемой теоретической пропорции и так далее.

Пусть у нас есть две выборки с числом успехов (событий интереса) и общим числом наблюдений в каждой выборке:

1. Выборка 1: n1 наблюдений, k1 успешных исходов (пропорция p1 = k1 / n1).
2. Выборка 2: n2 наблюдений, k2 успешных исходов (пропорция p2 = k2 / n2).

Нулевая гипотеза H0 в пропорциональном тесте заключается в том, что пропорции p1 и p2 равны (p1 = p2), то есть различия между выборками случайны. Альтернативная гипотеза H1 предполагает, что пропорции не равны (p1 ≠ p2).

Основной шаг пропорционального теста - вычисление статистики теста, которая использует информацию о пропорциях и размерах выборок. На основе этой статистики мы вычисляем p-значение, которое показывает вероятность получить наблюдаемые различия между пропорциями или ещё более экстремальные различия при условии, что нулевая гипотеза верна.

Если p-значение меньше выбранного уровня значимости (например, 0.05), мы отвергаем нулевую гипотезу в пользу альтернативной и заключаем, что различия в пропорциях статистически значимы.

Пропорциональный тест можно выполнять как для односторонней, так и для двусторонней альтернативы, в зависимости от вопроса, который мы хотим исследовать.

В коде мы используем пропорциональный тест для двусторонней альтернативы, чтобы определить минимальное количество бросков монеты, необходимое для обнаружения разницы в пропорциях между "фальшивой" и "настоящей" сторонами монеты.