1. Оптимальный дизайн эксперимента:
Рандомизация: Разделение игроков на контрольную и экспериментальную группы должно быть случайным, чтобы исключить возможные искажения.
Контроль за внешними факторами: Убедиться, что другие факторы, такие как маркетинговые кампании или сезонные изменения, не влияют на результаты.
Длительность эксперимента: Должна быть достаточной, чтобы собрать достаточное количество данных для статистической значимости.
Мониторинг: Регулярное отслеживание ключевых метрик во время эксперимента, чтобы реагировать на неожиданные изменения.
Этичность: Гарантировать, что экспериментальные манипуляции не наносят вреда игрокам.

2. Рассчет длительности эксперимента:
Поскольку в игру ежедневно приходит около 100 новых игроков, мы ожидаем, что за месяц в игру придет 100 * 30 = 3000 новых игроков. Таким образом, в течение месяца мы сможем наблюдать поведение 3000 игроков. Чтобы получить статистически значимые результаты, мы можем выбрать 500 игроков в контрольную и экспериментальную группы каждый месяц.

3. Генерация датасета и рассчет интервалов:
Для генерации датасета с около 10% плательщиков (контроль) можно использовать случайную выборку из общего числа игроков. После этого можно рассчитать 95% доверительный интервал для доли плательщиков с помощью биномиального метода или нормального аппроксимации, если размер выборки достаточно большой.

4. Генерация вариантов экспериментальной группы:
Хуже: Мы можем сгенерировать экспериментальную группу, в которой процент плательщиков снизится, чтобы проверить, сможет ли наше обновление изменить это. Рассчитаем силу эффекта и интервалы для этой группы.
Лучше: Экспериментальная группа, в которой процент плательщиков увеличится до 11%, как ожидается. Рассчитаем силу эффекта и интервалы.
Без эффекта: Группа, в которой изменений не происходит. Рассчитаем силу эффекта и интервалы.

5. Решение задачи двумя подходами:
Частотистский подход: Рассчитаем длительность эксперимента и доверительные интервалы с помощью стандартных формул и методов для оценки статистической значимости.

Байесовский подход: Используем байесовские методы, такие как байесовский доверительный интервал или анализ вероятностей, чтобы оценить вероятность различных результатов эксперимента, учитывая априорные знания.

Хорошо, давайте сначала сгенерируем датасет с около 10% плательщиков, а затем создадим несколько вариантов экспериментальной группы.

In [1]:
import numpy as np
from scipy.stats import binom, norm

# Задаем параметры
total_players = 500
conversion_rate = 0.10  # 10% плательщиков
alpha = 0.05  # Уровень значимости

# Генерируем датасет для контрольной группы
control_group = np.random.binomial(1, conversion_rate, total_players)

# Рассчитываем 95% доверительный интервал для контрольной группы
ci_lower, ci_upper = binom.interval(0.95, total_players, conversion_rate)

print("95% Доверительный интервал для контрольной группы:", ci_lower, ci_upper)

# Создаем несколько вариантов экспериментальной группы
experimental_groups = {}

# Хуже: Уменьшаем процент плательщиков до 9%
experimental_groups['worse'] = np.random.binomial(1, 0.09, total_players)

# Лучше: Увеличиваем процент плательщиков до 11%
experimental_groups['better'] = np.random.binomial(1, 0.11, total_players)

# Без эффекта: Оставляем процент плательщиков на уровне 10%
experimental_groups['no_effect'] = np.random.binomial(1, 0.10, total_players)

# Рассчитываем силу эффекта и 95% доверительные интервалы для каждой экспериментальной группы
for group_name, group_data in experimental_groups.items():
    conversion_rate_group = np.mean(group_data)
    effect_size = conversion_rate_group - conversion_rate
    hdi = norm.interval(0.95, loc=effect_size, scale=np.sqrt(conversion_rate_group*(1-conversion_rate_group)/total_players))
    print("\nЭкспериментальная группа:", group_name)
    print("Средний процент плательщиков:", conversion_rate_group)
    print("Силa эффекта:", effect_size)
    print("95% HDI:", hdi)
    

95% Доверительный интервал для контрольной группы: 37.0 64.0

Экспериментальная группа: worse
Средний процент плательщиков: 0.086
Силa эффекта: -0.014000000000000012
95% HDI: (-0.038574540856009545, 0.010574540856009524)

Экспериментальная группа: better
Средний процент плательщиков: 0.124
Силa эффекта: 0.023999999999999994
95% HDI: (-0.004888566005915862, 0.05288856600591585)

Экспериментальная группа: no_effect
Средний процент плательщиков: 0.09
Силa эффекта: -0.010000000000000009
95% HDI: (-0.03508447637144731, 0.015084476371447286)


В этом коде мы сначала создаем датасет для контрольной группы, используя биномиальное распределение для генерации случайных результатов (плательщик/не плательщик) с заданной вероятностью конверсии. Затем мы рассчитываем 95% доверительный интервал для контрольной группы.

Далее мы создаем несколько вариантов экспериментальной группы, меняя процент плательщиков для каждого варианта. После этого рассчитываем силу эффекта и 95% доверительные интервалы для каждой экспериментальной группы, используя нормальное распределение для оценки стандартной ошибки.