<a href="https://colab.research.google.com/github/averinpv/averinpv.github.io/blob/main/GB_itog_analitic2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#2) Мы хотим провести А/Б-тест для трех источников трафика. Нынешняя конверсия равна 5%,
мы ожидаем прирост в 0,2%.
Уровень доверия 97% и уровень мощности 87%.
Всего на наш продукт заходит 40 000 пользователей в месяц.
3) За сколько дней мы сможем протестировать гипотезу? И что вы можете посоветовать по
результатам подсчета?
3.1) Допустим в задаче нет проблемы с количеством посетителей на сайт, тогда подведите
результаты тестирования, если у нас следующие результаты по количеству конверсии:
1) 25 000
2) 30 000
3) 32 000


ОТВЕТ:
Для расчета длительности А/Б-теста используется формула:
 \(n = \frac{{2(Z_{\alpha}+Z_{\beta})^2 * p * (1-p)}}{{\delta^2}} \), где \( n \) - необходимый размер выборки, \( Z_{\alpha} \) и \( Z_{\beta} \) - значения Z-критерия для выбранного уровня доверия и мощности соответственно, \( p \) - базовая конверсия, а \( \delta \) - минимально значимый прирост конверсии.

Подставим в формулу данные из условия: \( p = 0,05 \), \( \delta = 0,002 \), \( Z_{\alpha} = 1,96 \) (для уровня доверия 97%) и \( Z_{\beta} = 0,1257 \) (для уровня мощности 87%).

Теперь можем вычислить необходимый размер выборки \( n \):
\( n = \frac{{2(1,96+0,1257)^2 * 0,05 * (1-0,05)}}{{0,002^2}} \)

\( n \approx 6,843 \), округлим до 7.

Теперь мы знаем, что нужно провести тест на минимум 7 дней.

Для расчета результатов тестирования, мы можем использовать стандартную формулу Z-критерия для двух долей.

1) При 25 000 посетителях: \( p_1 = \frac{{0,05 * 25000}}{{40000}} \), \( p_2 = \frac{{(0,05+0,002) * 25000}}{{40000}} \)
2) При 30 000 посетителях: \( p_1 = \frac{{0,05 * 30000}}{{40000}} \), \( p_2 = \frac{{(0,05+0,002) * 30000}}{{40000}} \)
3) При 32 000 посетителях: \( p_1 = \frac{{0,05 * 32000}}{{40000}} \), \( p_2 = \frac{{(0,05+0,002) * 32000}}{{40000}} \)

Затем, используя найденные значения \( p_1 \) и \( p_2 \), можно рассчитать Z-статистику и проверить статистическую значимость различий между конверсиями в контрольной и тестовой группах.


In [6]:
import math
!pip install scipy
from scipy.stats import norm

def calculate_sample_size(alpha, beta, p, delta):
    z_alpha = abs(norm.ppf(alpha/2)) # Z-критерий для уровня доверия alpha
    z_beta = abs(norm.ppf(beta)) # Z-критерий для мощности 1 - beta
    n = (2 * (z_alpha + z_beta)**2 * p * (1 - p)) / delta**2
    return math.ceil(n)

def calculate_conversion(p_total, visitors_total, delta):
    p_control = p_total / visitors_total
    p_test = (p_total + delta) / visitors_total
    return p_control, p_test

def calculate_z_statistic(p_control, p_test, visitors_total, delta):
    se_control = math.sqrt(p_control * (1 - p_control) / visitors_total)
    se_test = math.sqrt(p_test * (1 - p_test) / visitors_total)
    z = (p_test - p_control) / math.sqrt(se_control**2 + se_test**2)
    return z

alpha = 0.03 # Уровень доверия
beta = 0.13 # Уровень мощности
p_baseline = 0.05 # Базовая конверсия
delta = 0.02 # Минимально значимый прирост конверсии
visitors_total = 40000 # Общее количество посетителей

# Расчет размера выборки
sample_size = calculate_sample_size(alpha, beta, p_baseline, delta)
print("Необходимый размер выборки:", sample_size)

# Результаты тестирования для различных количеств посетителей
visitors_list = [25000, 30000, 32000]
for visitors in visitors_list:
    p_total = p_baseline * visitors
    p_control, p_test = calculate_conversion(p_total, visitors_total, delta)
    z_statistic = calculate_z_statistic(p_control, p_test, visitors_total, delta)
    print(f"При {visitors} посетителях: Z-статистика = {z_statistic:.4f}")


Необходимый размер выборки: 2581
При 25000 посетителях: Z-статистика = 0.0004
При 30000 посетителях: Z-статистика = 0.0004
При 32000 посетителях: Z-статистика = 0.0004


#4) Вы решили сравнивать метрику CPA в двух группах. Размер выборки - 2350 элементов в каждой группе. Для проверки нормальности распределения на выборке в 2350 наблюдений применили , критерий Шапиро-Уилка и получили p-value, равный 0.00002, alpha = 5%. Какой бы вывод мы могли сделать в данном случае? В этом случае какой статистический критерий для проверки первоначальной гипотезы тут лучше всего подойдёт и почему ?
ОТВЕТ:
При p-value, равном 0.00002, что намного меньше выбранного уровня значимости \( \alpha = 0.05 \), мы бы отвергли нулевую гипотезу о нормальности распределения данных. Это означает, что данные не соответствуют нормальному распределению.

В случае, когда данные не соответствуют нормальному распределению, для сравнения метрик CPA в двух группах лучше использовать непараметрические тесты. Один из наиболее распространенных непараметрических тестов для сравнения двух независимых выборок - это критерий Манна-Уитни (или U-критерий Вилкоксона). Этот тест позволяет определить, есть ли статистически значимые различия между метриками CPA в двух группах, не требуя нормальности распределения данных.

Таким образом, критерий Манна-Уитни будет лучшим выбором в данном случае, поскольку он подходит для непараметрического сравнения двух групп и не требует предположения о нормальности распределения данных.



#5) Мы провели АБ-тест на увеличение average timespent per user. По итогам тестирования мы получили следующие данные. Является ли результат статистически значимым с уровнем доверия 80%? Какую версию мы выкатим на продакшн? A) Средняя - 360, отклонение - 40, количество - 9802 B) Средняя - 352, отклонение - 58, количество – 9789
ОТВЕТ:
Для определения статистической значимости различий между двумя группами (версиями A и B) по метрике average timespent per user при уровне доверия 80%, можно воспользоваться Z-тестом.

Сначала вычислим Z-статистику по формуле:
\[ Z = \frac{{(\bar{x}_A - \bar{x}_B)}}{{\sqrt{\frac{{s_A^2}}{{n_A}} + \frac{{s_B^2}}{{n_B}}}}} \]

Где:
- \( \bar{x}_A \) и \( \bar{x}_B \) - средние значения метрики в группах A и B соответственно,
- \( s_A \) и \( s_B \) - стандартные отклонения метрики в группах A и B соответственно,
- \( n_A \) и \( n_B \) - количество наблюдений в группах A и B соответственно.

Затем найдем критическое значение Z для уровня доверия 80% (конвертировав его в значение стандартного нормального распределения) и сравним с рассчитанной Z-статистикой. Если рассчитанная Z-статистика превышает критическое значение, различия будут статистически значимыми.


In [9]:
import math

def calculate_z_statistic(mean_a, mean_b, std_a, std_b, n_a, n_b):
    return (mean_a - mean_b) / math.sqrt((std_a**2 / n_a) + (std_b**2 / n_b))

mean_a = 360
mean_b = 352
std_a = 40
std_b = 58
n_a = 9802
n_b = 9789

# Расчет Z-статистики
z_statistic = calculate_z_statistic(mean_a, mean_b, std_a, std_b, n_a, n_b)

# Критическое значение Z для уровня доверия 80%
critical_value = 1.282 # Значение Z для уровня доверия 80%

# Проверка статистической значимости различий
if z_statistic > critical_value:
    print("Результат является статистически значимым.")
    print("Рекомендуется выкатить версию A на продакшн.")
else:
    print("Результат не является статистически значимым.")
    print("Рекомендуется провести дополнительные исследования перед принятием решения.")


Результат является статистически значимым.
Рекомендуется выкатить версию A на продакшн.


#6) Создайте техническую архитектуру проекта по аб тестированию продукта он-лайн кинотеатра
с учетом кросс-девайс аналитики по следующей гипотезе:
Если договориться с банком о 99% кэшбэке на подписку первого месяца, то это повысит
конверсию в подписку на 30%, благодаря упрощенному принятию решения со стороны
пользователя.
На схеме необходимо отобразить:
1) Управленческий процесс по договоренностям с внешними партнерами
2) Архитектуру данных с указанием систем, из которых будем скачивать данные
3) Внутрикомандное взаимодействие

Для реализации AB-тестирования гипотезы о повышении конверсии в подписку на онлайн кинотеатр с использованием кросс-девайс аналитики, необходима следующая техническая архитектура:

### 1. Управленческий процесс по договоренностям с внешними партнерами:
- Назначить ответственного за взаимодействие с банком для договоренностей о кэшбэке.
- Установить контактное лицо с внешними партнерами для проведения переговоров и заключения соглашений о кэшбэке.

### 2. Архитектура данных:
- Системы сбора данных:
  - Веб-аналитика: сбор данных о поведении пользователей на веб-сайте и мобильном приложении.
  - CRM-система: сведения о подписчиках и пользователях.
  - Платежные системы: информация о платежах и транзакциях.
  - Внешние источники данных: данные о кэшбэке и соглашениях с банком.

### 3. Внутрикомандное взаимодействие:
- Продуктовый отдел:
  - Определение параметров и целей AB-теста.
  - Разработка пользовательского интерфейса для предложения кэшбэка.
- Маркетинговый отдел:
  - Разработка и запуск маркетинговых кампаний, анонсирующих кэшбэк.
- Аналитический отдел:
  - Проведение анализа данных и выявление влияния кэшбэка на конверсию в подписку.
- Технический отдел:
  - Интеграция веб-аналитики и CRM с системами сбора данных.
  - Разработка и реализация механизмов для отображения предложения о кэшбэке на веб-сайте и мобильном приложении.

### Процесс AB-тестирования:
1. Подготовка:
   - Настройка экспериментальной и контрольной групп.
   - Разработка и размещение предложения о кэшбэке для экспериментальной группы.
2. Запуск теста:
   - Отслеживание поведения пользователей в обеих группах в течение определенного периода времени.
3. Анализ результатов:
   - Сравнение конверсии в подписку между экспериментальной и контрольной группами.
   - Оценка статистической значимости различий.
4. Принятие решения:
   - В зависимости от результатов теста принятие решения о внедрении предложения о кэшбэке в продакшн или отказе от него.

Такая архитектура позволит эффективно провести AB-тестирование и оценить эффективность предложения о кэшбэке на конверсию в подписку.