# Задача 1
На сайте запущен А/В тест с целью увеличить доход. В приложенном excel файле вы найдете сырые данные по результатам эксперимента – user_id, тип выборки variant_name и доход принесенный пользователем revenue. Проанализируйте результаты эксперимента и напишите свои рекомендации менеджеру.

## Загрузка библиотек и данных

In [4]:
import pandas as pd
import numpy as np
import scipy.stats as stats


file_name = './data/AB_Test_Results.xlsx'
xl_data = pd.ExcelFile(file_name)
df = xl_data.parse('AB Test Results')
df['REVENUE'] = df['REVENUE'].astype(float)
df.info()


ImportError: Missing optional dependency 'openpyxl'.  Use pip or conda to install openpyxl.

Типы данных корректны. В строках отсутствуют нулевые значения (Null). Сведем данные по каждому пользователю в одну строку, чтобы получить доход на одного пользователя. Для этог воспользуемся сводной таблицей.

In [None]:
df = pd.pivot_table(df, index='USER_ID', columns='VARIANT_NAME',
                    values='REVENUE', aggfunc=np.sum)
df.describe()


VARIANT_NAME,control,variant
count,3931.0,3934.0
mean,0.163572,0.089342
std,3.385721,1.484566
min,0.0,0.0
25%,0.0,0.0
50%,0.0,0.0
75%,0.0,0.0
max,196.01,58.63


In [None]:
df[(df.control.notnull()) & (df.variant.notnull())].describe()


VARIANT_NAME,control,variant
count,1541.0,1541.0
mean,0.111901,0.111713
std,1.498332,2.117499
min,0.0,0.0
25%,0.0,0.0
50%,0.0,0.0
75%,0.0,0.0
max,41.53,58.63


In [None]:
df[(df.control.notnull()) & (df.variant.notnull())].head(10)


VARIANT_NAME,control,variant
USER_ID,Unnamed: 1_level_1,Unnamed: 2_level_1
3,0.0,0.0
10,0.0,0.0
18,0.0,0.0
25,0.0,0.0
40,0.0,0.0
57,0.0,0.0
60,0.0,0.0
64,0.0,0.0
67,0.0,0.0
86,0.0,0.0


Траффик между группами разделен плохо. 1541 пользователей попали в обе группы. Это 39,2 % пользователей обеих групп. Удаление такого количества пользователей (более 5%) может повлиять на результаты эксперимента.
Однако, не смотря на это, попробуем произвести оценку оставшейся выборки.

In [None]:
data_a = df[(df.control.notnull()) & (df.variant.isnull())]['control']
data_b = df[(df.control.isnull()) & (df.variant.notnull())]['variant']


Выборка A (контрольная)

In [None]:
data_a.describe()


count    2390.000000
mean        0.196887
std         4.172201
min         0.000000
25%         0.000000
50%         0.000000
75%         0.000000
max       196.010000
Name: control, dtype: float64

Выборка B (с изменениями на сайте)

In [None]:
data_b.describe()


count    2393.000000
mean        0.074935
std         0.858207
min         0.000000
25%         0.000000
50%         0.000000
75%         0.000000
max        23.040000
Name: variant, dtype: float64

Группы распределены равномерно. Средний чек и максимум в контрольной группе выше, стандартное отклонение больше. Проверку статистической значимости будем проверять с помощью t-теста, т. к. у нас имеется относительно большая выборка. Метрика распределяется не нормально.

In [None]:
stats.ttest_ind(a=data_a, b=data_b)


Ttest_indResult(statistic=1.4005048871360148, pvalue=0.16142707540780146)

# Рекомендации
1. A/B-тестирование выполнено ошибками в планировании. Нарушено сплитование траффика. Более 1,5 тысяч пользователей оказались как в двух группах. Это 39% пользователей каждой группы.
2. В таких условиях корректное проведение A/B тестирование не представляется возможным.
3. Рекомендуется настроить систему разделения траффика, провести A/A тестирование и только после этого продолжать A/B-тестирования изменений. Использование существующей системы разделения траффика для этого не годится.
4. Статистически значимых различий между очищенными группами не обнаружено (p-value = 0.1614).