In [None]:
import numpy as np
import pandas as pd # для работы с таблицами
import warnings
import hashlib
warnings.filterwarnings('ignore')

from scipy import stats # при работе со статистикой
import scipy.stats as stats

import matplotlib.pyplot as plt # Библиотека для визуализации результатов
%matplotlib inline
import matplotlib.gridspec as gridspec
import seaborn as sns # Более продвинутая библиотека для визуализации

import statsmodels.api as sm
import math

**2) Мы хотим провести А/Б-тест для трех источников трафика. Нынешняя конверсия равна 5%, мы ожидаем прирост в 0,2%.**
**Уровень доверия 97% и уровень мощности 87%. Всего на наш продукт заходит 40 000 пользователей в месяц.**

**3) За сколько дней мы сможем протестировать гипотезу? И что вы можете посоветовать по результатам подсчета?**

In [None]:
p1 = 0.05
p2 = 0.052
alpha = 0.03
beta = 0.13

# Z-значения
z_alpha = stats.norm.ppf(1 - alpha / 2)
z_beta = stats.norm.ppf(1 - beta)

# Размер выборки
n = ((z_alpha + z_beta)**2 * (p1*(1 - p1) + p2*(1 - p2))) / ((p2 - p1)**2)

# Количество пользователей
total_users_month = 40000
users_day = total_users_month / 30

# Три источника трафика
users_source_per_day = users_day * 3

print(f"Необходимый размер выборки для каждой группы: {n:.2f}")
print(f"Количество пользователей, необходимое для теста на 1 источник трафика в день: {users_source_per_day:.2f}")

Необходимый размер выборки для каждой группы: 262965.46
Количество пользователей, необходимое для теста на 1 источник трафика в день: 4000.00


**3) За сколько дней мы сможем протестировать гипотезу? И что вы можете посоветовать по результатам подсчета?**

In [None]:
days_needed = n / users_source_per_day  # 30 дней в месяце
print(f"Количество дней для тестирования при общем количестве посетителей в месяц 40 000 человек:: {days_needed:.2f}")

Количество дней для тестирования при общем количестве посетителей в месяц 40 000 человек:: 65.74


При планировании теста необходимо убедиться в достаточности количества времени для получения необходимых данных.

Периодически отслеживайте прогресс теста, чтобы убедиться, что нет неожиданных событий, которые могут повлиять на результаты.

Убедиться, что полученные результаты обладают необходимой статистической значимостью и поддерживают или опровергают исходную гипотезу.

Основываясь на результатах теста, необходимо принять решение о дальнейших действиях

**3.1) Допустим в задаче нет проблемы с количеством посетителей на сайт, тогда подведите результаты тестирования, если у нас следующие результаты по количеству конверсии**:

**1) 25 000**

**2) 30 000**

**3) 32 000**

In [None]:
current_conversion_rate = 0.05  # Нынешняя конверсия (5%)\n",
expected_increase = 0.002  # Ожидаемый прирост (0.2%)\n",
total_users_month = 40000  # Общее количество пользователей
conversions = [25000, 30000, 32000]
conversion_vers = [conv / total_users_month for conv in conversions]

alpha = 1-0.97 # Уровень доверия
power = 0.87 # Уровень мощности

# Функция для проведения A/B теста
def ab_test(p1, observed_conversions, total_users_month, alpha, power):
  p2 = observed_conversions / total_users_month
  std1 = math.sqrt(p1 * (1 - p1) / total_users_month)
  std2 = math.sqrt(p2 * (1 - p2) / total_users_month)
  # Критические значения Z для доверительного интервала и мощности теста\n",
  z_alpha = stats.norm.ppf(1 - alpha / 2)
  z_beta = stats.norm.ppf(power)
  # Z-статистика
  z = (p2 - p1) / math.sqrt(std1 ** 2 + std2 ** 2)
  # P-значение
  p_value = 1 - stats.norm.cdf(z)
  # Значим ли результат
  significant = p_value < alpha
  return p2, z, z_alpha, p_value, significant

In [None]:
results = []
for conv in conversions:
    p2, z, z_alpha, p_value, significant = ab_test(
        current_conversion_rate, conv, total_users_month, alpha, power,
    )
    results.append({'конверсий': conv,
                    'ожидаемая конверсия': round(p2 * 100, 2),
                    'z-статистика': round(z, 5),
                    'критическое значение z': round(z_alpha, 5),
                    'p-значение': round(p_value, 5),
                    'значим': significant
    })
print(results)

[{'конверсий': 25000, 'ожидаемая конверсия': 62.5, 'z-статистика': 216.60554, 'критическое значение z': 2.17009, 'p-значение': 0.0, 'значим': True}, {'конверсий': 30000, 'ожидаемая конверсия': 75.0, 'z-статистика': 288.79795, 'критическое значение z': 2.17009, 'p-значение': 0.0, 'значим': True}, {'конверсий': 32000, 'ожидаемая конверсия': 80.0, 'z-статистика': 329.29278, 'критическое значение z': 2.17009, 'p-значение': 0.0, 'значим': True}]


Все три источника трафика показали значительное превышение ожидаемого прироста конверсии. Z-статистика значительно превышает критическое значение, а p-значение равно нулю, что указывает на высокую статистическую значимость результатов. Улучшение конверсии по сравнению с текущей является значимым.


**4) Вы решили сравнивать метрику CPA в двух группах. Размер выборки - 2350 элементов в каждой группе.**
**Для проверки нормальности распределения на выборке в 2350 наблюдений применили,**
**критерий Шапиро-Уилка и получили p-value, равный 0.00002, alpha = 5%. **
**Какой бы вывод мы могли сделать в данном случае?**

**В этом случае какой статистический критерий для проверки первоначальной** **гипотезы тут лучше всего подойдёт и почему ?**

p-value = 0.00002, что значительно меньше alpha = 0.05. Нулевую гипотезу о нормальности распределения следует отвергнуть. Распределение данных не является нормальным.

Данные не распределены нормально, следует использовать непараметрические методы для сравнения двух групп.

Для проверки равенства средних подходят критерии Манна-Уитни, Уилкоксона и Краскера-Уолласа.

**5) Мы провели АБ-тест на увеличение average timespent per user. По итогам тестирования мы**
**получили следующие данные. Является ли результат статистически значимым с уровнем**
**доверия 80%? Какую версию мы выкатим на продакшн?**

**A) Средняя - 360, отклонение - 40, количество - 9802**

**B) Средняя - 352, отклонение - 58, количество - 9789**

In [None]:
mean_a = 360
std_a = 40
n_a = 9802

mean_b = 352
std_b = 58
n_b = 9789

# Стандартные ошибки
se_a = std_a / math.sqrt(n_a)
se_b = std_b / math.sqrt(n_b)

# t-статистика и p-value
t_stat, p_val = stats.ttest_ind_from_stats(mean1=mean_a, std1=std_a, nobs1=n_a,
                                          mean2=mean_b, std2=std_b, nobs2=n_b,
                                          equal_var=False)
print(f"T-статистика: {t_stat}"),
print(f"P-value: {p_val}")

# Уровень доверия 80%
alpha = 0.20
if p_val < alpha:
    print("Результат статистически значим. На продакшн выкати версию А."),
    version_to_deploy = 'A',
else:
    print("Результат не является статистически значимым. Можно оставить текущую версию."),
    version_to_deploy = 'B'

T-статистика: 11.236630785707332
P-value: 3.3977828784122323e-29
Результат статистически значим. На продакшн выкати версию А.


Рекомендуем выкатить на продакшн версию A, так как она показала лучшие результаты по average timespent per user.
