# A/B тест для крупного интернет-магазина

Нам предстоит проанализировать данные для крупного интернет-магазина. Вместе с отделом маркетинга мы разработали список гипотез для увеличения выручки. Необходимо <b>приоритизировать гипотезы</b>, запустить <b>A/B тест</b>, <b>проанализировать результаты</b> и <b>принять решение</b> о дальнейших действиях на основе проведенного анализа. Разделим данные исследование на несколько шагов:

## <a href='#section0'>0. Загрузка библиотек</a><br>
## <a href='#section1'>1. Приоритизация гипотез</a><br>
### <a href='#section10'>1.0 Импорт и предобработка файла</a><br>
### <a href='#section11'>1.1 Фреймворк ICE</a><br>
### <a href='#section12'>1.2 Фреймворк RICE</a><br>
## <a href='#section2'>2. Анализ A/B теста</a><br>
### <a href='#section20'>2.0. Импорт и предобработка файлов</a><br>
### <a href='#section21'>2.1. Кумулятивная выручка по группам</a><br>
### <a href='#section22'>2.2. Кумулятивный средний чек по группам</a><br>
### <a href='#section23'>2.3. Кумулятивная конверсия по группам</a><br>
### <a href='#section24'>2.4. Выбор границы для определения аномальных пользователей</a><br>
### <a href='#section25'>2.5. Выбор границы для определения аномальных заказов</a><br>
### <a href='#section26'>2.6. Различия в конверсии между группами по «сырым» данным</a><br>
### <a href='#section27'>2.7. Различия в среднем чеке заказа между группами по «сырым» данным</a><br>
### <a href='#section28'>2.8. Различия в конверсии между группами по «очищенным» данным</a><br>
### <a href='#section29'>2.9. Различия в среднем чеке заказа между группами по «очищенным» данным</a><br>
## <a href='#section3'>3. Принятие решения по итогам A/B теста</a><br>

## <a id='section0'>0. Загрузка библиотек</a><br>

In [1]:
#Импортируем библиотеки
import pandas as pd
import datetime as dt
from matplotlib import pyplot as plt
import seaborn as sns
import numpy as np
from scipy import stats as st
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
#Выберем стили графиков
large = 16; med = 12; small = 10
params = {'axes.titlesize': med,
          'axes.titleweight': 'light',
          'axes.labelweight': 'light',
          'legend.fontsize': small,
          'figure.figsize': (12, 6),
          'axes.labelsize': med,
          'axes.titlesize': large,
          'xtick.labelsize': small,
          'ytick.labelsize': small,
          'figure.titlesize': large}
plt.rcParams.update(params)
sns.set_style('darkgrid')

---

## <a id='section1'>1. Приоритизация гипотез</a><br>

### <a id='section10'>1.0 Импорт и предобработка файла</a><br>

In [2]:
#Импортируем файл с гипотезами
hypothesis = pd.read_csv('/datasets/hypothesis.csv')
#Назначаем имя датафрейма
hypothesis.name = 'hypothesis'
#Проверим данные на пропуски и аномалии
def check_dataframe(dataframe):
    print('Проверяем датафрейм:', dataframe.name)
    display(dataframe.head(10))
    display(dataframe.describe())
    display(dataframe.info())
    display(dataframe.duplicated().unique())
check_dataframe(hypothesis)

FileNotFoundError: [Errno 2] File /datasets/hypothesis.csv does not exist: '/datasets/hypothesis.csv'

В данных нет явных пропусков, ошибок, аномалий и дубликатов.

In [None]:
#Настроим датафрейм так, чтобы гипотезы отобажались полностью
pd.set_option('max_colwidth', 400)
hypothesis

### <a id='section11'>1.1 Фреймворк ICE</a><br>

In [None]:
#Находим значение ICE Score по формуле Impact * Confidence / Efforts и отсортируем имеющиеся гипотезы
hypothesis['ICE_Score'] = hypothesis['Impact'] * hypothesis['Confidence'] / hypothesis['Efforts']
#Нарисуем график оценки гипотез по ICE Score
x = pd.Series(range(0, len(hypothesis['ICE_Score'])))
y = hypothesis['ICE_Score'].values
types =  hypothesis.index
fig, ax = plt.subplots()
ax.scatter(x, y)
ax.set_xlabel('Порядковый номер гипотезы')
ax.set_ylabel('ICE Score')
ax.set_title('Оценка гипотез по ICE Score')
ax.set_xticklabels([])
for i, txt in enumerate(types):
    ax.annotate(txt, (x[i], y[i]), xytext=(10,10), textcoords='offset points')
    plt.scatter(x, y, marker="d", color='r')

Наилучший результат - у гипотезы 8

In [None]:
print('Гипотеза 8:', hypothesis.iloc[8,0])
print('Оценка ICE Score:', hypothesis.iloc[8,5])

Согласно фреймворку ICE, в первую очередь подлежит проверки Гипотеза № 8: "Запустить акцию, дающую скидку на товар в день рождения" с оценкой ICE Score 16.2

### <a id='section12'>1.2 Фреймворк RICE</a><br>

In [None]:
#Находим значение RICE Score по формуле Reach * Impact * Confidence / Efforts и отсортируем имеющиеся гипотезы
hypothesis['RICE_Score'] = (hypothesis['Reach'] * hypothesis['Impact'] * hypothesis['Confidence'])/ hypothesis['Efforts']
#Нарисуем график оценки гипотез по RICE Score
x = pd.Series(range(0, len(hypothesis['RICE_Score'])))
y = hypothesis['RICE_Score'].values
types =  hypothesis.index
fig, ax = plt.subplots()
ax.scatter(x, y)
ax.set_xlabel('Порядковый номер гипотезы')
ax.set_ylabel('RICE Score')
ax.set_title('Оценка гипотез по RICE Score')
ax.set_xticklabels([])
for i, txt in enumerate(types):
    ax.annotate(txt, (x[i], y[i]), xytext=(10,10), textcoords='offset points')
    plt.scatter(x, y, marker="s", color='mediumblue')

Наилучший результат - у гипотезы 7

In [None]:
print('Гипотеза 7:', hypothesis.iloc[7,0])
print('Оценка RICE Score:', hypothesis.iloc[7,6])

Согласно фреймворку RICE, в первую очередь подлежит проверке Гипотеза № 7: "Добавить форму подписки на все основные страницы, чтобы собрать базу клиентов для email-рассылок" с оценкой RICE Score 112.

In [None]:
#Посмотрим, как распределятся оценки гипотез по ICE/RICE фреймворкам на одном графике
x = hypothesis['ICE_Score'].values
y = hypothesis['RICE_Score'].values
types =  hypothesis.index
fig, ax = plt.subplots()
ax.scatter(x, y)
ax.set_xlabel('ICE Score')
ax.set_ylabel('RICE Score')
ax.set_title('Распределение оценок гипотез по ICE/RICE фреймворкам')
for i, txt in enumerate(types):
    ax.annotate(txt, (x[i], y[i]), xytext=(10,10), textcoords='offset points')
    plt.scatter(x, y, marker="D", color='g')

Появился еще один лидер: оценка гипотезы 0 превосходит оценку гипотезы 7 по фреймворку ICE. Но, как и гипотеза 8, уступает в фреймворке RICE.

In [None]:
print('Гипотеза 0:', hypothesis.iloc[0,0])

#### Вывод
Фреймворк RICE в отличие от ICE учитывает в т.ч. охват пользователей для теста. Для нас он будет приоритетным. Так, скидка на товар в день рождения - это очень ограниченная акция. Проверка такой гипотезы может потребовать более длительного времени, поскольку в среднем ежедневно только 1/365 от всех пользователей могут участвовать в этом тесте. Если учесть, что не все пользователи увидят сообщения об акции, а те которые увидят и примут участие будут разделены на контрольную и тестовую группу, то пользователей будет еще меньше. Если же тест будет слишком продолжительным, на него могут повлиять макроэкономические факторы, сезонность и действия конкурентов. Для проведения нашего A/B теста остановимся на гипотезе с максимальным RICE Score: Гипотеза № 7 "Добавить форму подписки на все основные страницы, чтобы собрать базу клиентов для email-рассылок".

---

## <a id='section2'>2. Анализ A/B теста</a><br>

### <a id='section20'>2.0. Импорт и предобработка файлов</a><br>

In [None]:
#Импортируем файлы
orders = pd.read_csv('/datasets/orders.csv')
visitors = pd.read_csv('/datasets/visitors.csv')
#Назначаем имена датафреймов
orders.name = 'orders'
visitors.name = 'visitors'
#Проверяем данные на пропуски и аномалии
check_dataframe(orders)
check_dataframe(visitors)

В данных нет явных пропусков, ошибок, аномалий и дубликатов. Столбцы с датами времени необходимо перевести в соответсвующий формат. Там где это возможно, изменим тип данных для оптимизации размера файлов.

In [None]:
#Оптимизируем типы данных
convert_dict_orders = {'transactionId': 'uint32', 'visitorId':'uint32', 'revenue':'uint32'}
orders = orders.astype(convert_dict_orders)
visitors['visitors'] = visitors['visitors'].astype('uint32')
#Переводим стобцы с датами в нужный формат
visitors['date'] = visitors['date'].map(lambda x: dt.datetime.strptime(x, '%Y-%m-%d'))
orders['date'] = orders['date'].map(lambda x: dt.datetime.strptime(x, '%Y-%m-%d'))

Названия столбцов и типы данных изменены.

In [None]:
#Проверим, не пересекаются ли пользователи в группах
uniqueVisitorsA = orders[orders['group'] == 'A']['visitorId'].unique()
uniqueVisitorsB = orders[orders['group'] == 'B']['visitorId'].unique()
visitorsIntersection = np.intersect1d(uniqueVisitorsA,uniqueVisitorsB)
visitorsIntersection

In [None]:
len(visitorsIntersection)

58 уникальных пользователей находятся и в группе А, и в группе B. Это означает, что в ходе теста они "перетекли" из одной группы в другую, внося шум в итоговые результаты. Исключим их сразу.

In [None]:
orders = orders[np.logical_not(orders['visitorId'].isin(visitorsIntersection))]

### <a id='section21'>2.1. Кумулятивная выручка по группам</a><br>

In [None]:
#Создадим массив из уникальных пар значений дат и групп A/B теста
datesGroups = orders[['date', 'group']].drop_duplicates()
#Агрегируем таблицу заказов, оставив соответствующие datesGroups значения даты и группы, и посчитаем  количество уникальных посетителей сделавших заказы, количество транзакций и сумму выручки; затем отсортируем по дате и группе
ordersAggregated = datesGroups.apply(lambda x: \
                                     orders[np.logical_and(orders['date'] <= x['date'], \
                                                           orders['group'] == x['group'])]\
                                     .agg({
                                        'date':'max', 
                                        'group':'max', 
                                        'transactionId': pd.Series.nunique, 
                                        'visitorId': pd.Series.nunique, 
                                        'revenue':'sum'}), axis=1).sort_values(by=['date', 'group'])
ordersAggregated.head()

In [None]:
#Агрегируем таблицу посетителей, оставив соответствующие datesGroups значения даты и группы, и посчитаем количество уникальных посетителей; затем отсортируем по дате и группе
visitorsAggregated = datesGroups.apply(lambda x: visitors[np.logical_and(visitors['date'] <= x['date'], \
                                                                         visitors['group'] == x['group'])]\
                                       .agg({
                                            'date': 'max', 
                                            'group':'max', 
                                            'visitors':'sum'}), axis=1).sort_values(by=['date', 'group'])
visitorsAggregated.head()

In [None]:
#Объединим две полученные таблицы в одну и изменим названия столбцов
cumulativeData = ordersAggregated.merge(visitorsAggregated, left_on=['date', 'group'], right_on=['date', 'group'])
cumulativeData.columns = ['date', 'group', 'transactions', 'buyers', 'revenue', 'visitors']
cumulativeData.head()

In [None]:
#Создадим датафреймы с кумулятивным количеством заказов и кумулятивной выручкой для каждой из групп
cumulativeRevenueA = cumulativeData[cumulativeData['group'] == 'A'][['date', 'revenue', 'transactions']]
cumulativeRevenueB = cumulativeData[cumulativeData['group'] == 'B'][['date', 'revenue', 'transactions']]
#Строим графики кумулятивной выручки для каждой из групп
plt.plot(cumulativeRevenueA['date'], cumulativeRevenueA['revenue'], label='A')
plt.plot(cumulativeRevenueB['date'], cumulativeRevenueB['revenue'], label='B')
#Добавим подписи к графикам
plt.xlabel('Дата')
plt.ylabel('Кумулятивная выручка')
plt.title('Кумулятивная выручка по группам')
plt.legend()
plt.show()

Выручка равномерно увеличивается в течение теста, но после 17 августа в группе B произошел либо всплеск числа заказов, либо была произведена аномально дорогие заказы. Данные выбросы необходимо проанализировать.

### <a id='section22'>2.2. Кумулятивный средний чек по группам</a><br>

In [None]:
#Построим графики кумулятивного среднего чека по группам, средний чек найдем через отношение всей выручки к числу заказов
plt.plot(cumulativeRevenueA['date'], cumulativeRevenueA['revenue']/cumulativeRevenueA['transactions'], label='A')
plt.plot(cumulativeRevenueB['date'], cumulativeRevenueB['revenue']/cumulativeRevenueB['transactions'], label='B')
#Добавим подписи к графикам
plt.xlabel('Дата')
plt.ylabel('Кумулятивный средний чек')
plt.title('Кумулятивный средний чек по группам')
plt.legend()
plt.show()

Средний чек для обеих групп выравнивался до середины теста, затем средний чек в группе B становится значительно больше среднего чека в группе A. Возможно, резкий всплеск синего графика говорит о том, что в группу B попали крупные заказы. Это сместило реальный средний чек для данной группы выше.

In [None]:
#Для определения относительного изменения кумулятивного среднего чека, соберем данные в одной таблице
mergedCumulativeRevenue = cumulativeRevenueA.merge(cumulativeRevenueB, \
                                                   left_on='date', 
                                                   right_on='date', 
                                                   how='left', 
                                                   suffixes=['A', 'B'])
#Построим график относительного изменения кумулятивного среднего чека группы B к группе A
plt.plot(mergedCumulativeRevenue['date'], \
        (mergedCumulativeRevenue['revenueB']/mergedCumulativeRevenue['transactionsB'])\
         /(mergedCumulativeRevenue['revenueA']/mergedCumulativeRevenue['transactionsA']) - 1)
#Добавляем ось X
plt.axhline(y=0, color='grey', linestyle='--')
#Добавим подписи к графику
plt.xlabel('Дата')
plt.ylabel('Отношение кумулятивного среднего чека')
plt.title('Отношение кумулятивного среднего чека группы B к группе A')
plt.show()

В нескольких точках график различия резко меняется. Вероятно, причиной этого являются крупные заказы и выбросы.

### <a id='section23'>2.3. Кумулятивная конверсия по группам</a><br>

In [None]:
#Посчитаем кумулятивную конверсию
cumulativeData['conversion'] = cumulativeData['transactions']/cumulativeData['visitors']
#Выделим данные для обеих групп в отдельные таблицы
cumulativeDataA = cumulativeData[cumulativeData['group'] == 'A']
cumulativeDataB = cumulativeData[cumulativeData['group'] == 'B']
#Построим графики
plt.plot(cumulativeDataA['date'], cumulativeDataA['conversion'], label='A')
plt.plot(cumulativeDataB['date'], cumulativeDataB['conversion'], label='B')
plt.legend()
#Задаем масштаб осей
plt.axis(['2019-08-01', '2019-08-31', 0.01, 0.05])
#Добавим подписи к графикам
plt.xlabel('Дата')
plt.ylabel('Кумулятивная конверсия')
plt.title('Кумулятивная конверсия по группам')
#Добавляем ось X
plt.axhline(y=0.028, color='grey', linestyle='--')
plt.show()

В начале теста группы колебались в районе значения 0.028, но затем конверсия группы B стала больше и зафиксировалась на уровне 0.029, а конверсия группы A просела и также зафиксировалась на уровне 0.026. Кривые стабилизировались в конце теста и это косвенный признак возможности скорого завершения теста.

In [None]:
#Объединим данные о кумулятивных конверсиях в одну таблицу
mergedCumulativeConversions = cumulativeDataA[['date', 'conversion']].merge(cumulativeDataB[['date', 'conversion']], \
                                                                            left_on='date', 
                                                                            right_on='date', 
                                                                            how='left', 
                                                                            suffixes=['A', 'B'])
#Построим график относительного различия кумулятивных конверсий
plt.plot(mergedCumulativeConversions['date'], \
         mergedCumulativeConversions['conversionB']/\
         mergedCumulativeConversions['conversionA'] - 1)
#Задаем масштаб осей 
plt.axis(['2019-08-01', '2019-08-31', -0.3, 0.3])
#Добавляем оси X
plt.axhline(y=0, color='grey', linestyle='--')
plt.axhline(y=0.1, color='darkgrey', linestyle='--')
plt.axhline(y=0.2, color='darkgrey', linestyle='--')
#Добавим подписи к графику
plt.xlabel('Дата')
plt.ylabel('Отношение кумулятивной конверсии')
plt.title('Отношение кумулятивной конверсии группы B к группе A')
plt.show()

В начале теста отношение конверсий не установилось, но затем конверсия группы B стала превышать конверсию группы A и держится в коридоре прироста 12-20% относительно группы A.

### <a id='section24'>2.4. Выбор границы для определения аномальных пользователей</a><br></a><br>

In [None]:
#Сгруппируем таблицу заказов по пользователям
ordersByBuyers = orders.drop(['date', 'revenue'], axis=1).groupby(['group', 'visitorId'], as_index=False)\
                .agg({'transactionId': pd.Series.nunique}).sort_values(by='transactionId', ascending=False)
ordersByBuyers.columns = ['group', 'buyerId', 'transactions']
#Изучим гистограмму распределения
plt.hist(ordersByBuyers['transactions'])
#Добавим подписи к графику
plt.xlabel('Количество заказов')
plt.ylabel('Количество уникальных пользователей')
plt.title('Распределение количества заказов на  одного пользователя')
plt.show()
plt.show()

Большинство посетителей покупают только 1 раз и есть небольшая группа которые покупают чаще.

In [None]:
#Построим точечную диаграмму числа заказов на одного посетителя
x_values1 = pd.Series(range(0, len(ordersByBuyers['transactions'])))
sns.scatterplot(x=x_values1, y='transactions', data=ordersByBuyers, alpha=0.7, y_jitter=0.05, hue='group')
#Добавим подписи к графику
plt.xlabel('Количество уникальных пользователей')
plt.ylabel('Количество заказов')
plt.title('Распределение количества заказов на  одного пользователя по группам')
plt.show()

Выводы прошлого графика подтвердились: в основном, посетители делают 1 заказ. Посетители, которые делают более 2 заказов распределены между группами хаотично и нет какой-то определенной тенденции.

In [None]:
print(np.percentile(ordersByBuyers['transactions'], [90, 95, 99]))

95% пользователей делают не более 1 заказа. Установим это за нижнюю границу

### <a id='section25'>2.5. Выбор границы для определения аномальных заказов</a><br>

In [None]:
#Изучим гистограмму распределения стоимостей заказов
plt.hist(orders['revenue'], bins=500)
plt.xlim(0, 100000)
#Добавим подписи к графику
plt.xlabel('Выручка с заказов')
plt.ylabel('Количество уникальных пользователей')
plt.title('Распределение стоимостей заказов')
plt.show()

Основная масса транзакций не превышает 20 000 рублей.

In [None]:
#Построим точечную диаграмму стоимостей заказов
x_values2 = pd.Series(range(0, len(orders['revenue'])))
sns.scatterplot(x=x_values2, y='revenue', data=orders, alpha=0.4, hue='group')
plt.ylim(0, 100000)
#Добавим подписи к графику
plt.xlabel('Количество уникальных пользователей')
plt.ylabel('Выручка с заказов')
plt.title('Распределение стоимостей заказов по группам')
plt.show()

In [None]:
#Построим точечные диаграммы стоимостей заказов по группам с ограничением выручки 20000 рублей
plt.subplots(figsize=(15,6))
#График для группы 'A'
x = pd.Series(range(0, len(orders[orders['group'] == 'A']['revenue'])))
plt.subplot(1, 2, 1)
sns.scatterplot(x=x, y='revenue', data=orders[orders['group'] == 'A'], alpha=0.7, color='#fc8a23')
plt.ylim(0, 20000)
plt.xticks([])
plt.ylabel('Выручка с заказов', fontsize=12)
plt.title('Распределение стоимостей заказов для группы A', fontsize=14)
#График для группы 'B'
x = pd.Series(range(0, len(orders[orders['group'] == 'B']['revenue'])))
plt.subplot(1, 2, 2)
sns.scatterplot(x=x, y='revenue', data=orders[orders['group'] == 'B'], alpha=0.7)
plt.ylim(0, 20000)
plt.xticks([])
plt.ylabel('Выручка с заказов', fontsize=12)
plt.title('Распределение стоимостей заказов для группы B', fontsize=14)
plt.show()

Действительно, заказов дороже 20000 рублей не так много. Эта граница, которую мы определим для аномальных заказов по графику. На первый взгляд, заказы распределены хаотично между группами и нет какой-то определенной тенденции.

In [None]:
#Посчитаем перцентили для определения более точной границы
print(np.percentile(orders['revenue'], [90, 95, 99]))

Не более 5% заказов имеют стоимость выше 26785 рублей. Возьмем это за нижнюю границу стоимости.

### <a id='section26'>2.6. Различия в конверсии между группами по «сырым» данным</a><br>

<b>Нулевая гипотеза 1 - Статистически значимых различий в конверсии между группами по "сырым" данным нет. Альтернативная гипотеза 1 - Статистически значимые различия в конверсии между группами по "сырым" данным есть. Уровень статистической значимости  p < 0.05</b>

In [None]:
#Разделим всех посетителей по группам и датам
visitorsADaily = visitors[visitors['group'] == 'A'][['date', 'visitors']]
visitorsADaily.columns = ['date', 'visitorsPerDateA']
visitorsBDaily = visitors[visitors['group'] == 'B'][['date', 'visitors']]
visitorsBDaily.columns = ['date', 'visitorsPerDateB']
#Найдем количество заказов по группам и датам
ordersADaily = orders[orders['group'] == 'A'][['date', 'transactionId', 'revenue']]\
                    .groupby('date', as_index=False)\
                    .agg({'transactionId': pd.Series.nunique, 'revenue': 'sum'})
ordersADaily.columns = ['date', 'ordersPerDateA', 'revenuePerDateA']
ordersBDaily = orders[orders['group'] == 'B'][['date', 'transactionId', 'revenue']]\
                    .groupby('date', as_index=False)\
                    .agg({'transactionId': pd.Series.nunique, 'revenue': 'sum'})
ordersBDaily.columns = ['date', 'ordersPerDateB', 'revenuePerDateB']
#Соединим полученные четыре таблицы в одну
daily_data = ordersADaily.merge(ordersBDaily,\
                                left_on='date', 
                                right_on='date', 
                                how='left').merge(visitorsADaily,\
                                                left_on='date', 
                                                right_on='date', 
                                                how='left').merge(visitorsBDaily, \
                                                                 left_on='date', 
                                                                 right_on='date', 
                                                                 how='left')
#Найдем количество заказов, сделанных пользователями разных групп
ordersByUsersA = orders[orders['group'] == 'A']\
            .groupby('visitorId', as_index=False)\
            .agg({'transactionId': pd.Series.nunique})
ordersByUsersA.columns = ['visitorId', 'orders']
ordersByUsersB = orders[orders['group'] == 'B']\
            .groupby('visitorId', as_index=False)\
            .agg({'transactionId': pd.Series.nunique})
ordersByUsersB.columns = ['visitorId', 'orders']
#Для каждой из групп сохраним выборку, где каждый элемент число заказов определенного пользователя, в т.ч. ноль. Нули найдем разницей между суммой посетителей и количеством записей о заказах.
sampleA = pd.concat([ordersByUsersA['orders'], pd.Series(0, index=\
    np.arange(daily_data['visitorsPerDateA'].sum() - len(ordersByUsersA['orders'])), name='orders')], axis=0)
sampleB = pd.concat([ordersByUsersB['orders'], pd.Series(0, index=\
    np.arange(daily_data['visitorsPerDateB'].sum() - len(ordersByUsersB['orders'])), name='orders')], axis=0)
#Определим, есть ли статистически значимые различия в конверсии между группами. 
alpha = 0.05
result_raw_1 = st.mannwhitneyu(sampleA, sampleB)[1]
print('p-значение: ', '{0:.3f}'.format(result_raw_1))
if result_raw_1 < alpha:
    print('Отвергаем нулевую гипотезу')
else:
    print('Не получилось отвергнуть нулевую гипотезу')

Анализ "сырых данных" показал, что в конверсии между группами есть статистически значимые различия и мы отвергаем нулевую гипотезу.

In [None]:
#Сравним прирост конверсии группы B к конверсии группы A через отношение средних в выборках
print('{0:.2%}'.format(sampleB.mean()/sampleA.mean() - 1))

Анализ "сырых данных" показал, что относительный прирост конверсии группы B к конверсии группы A равен 15.98%.

### <a id='section27'>2.7. Различия в среднем чеке заказа между группами по «сырым» данным</a><br>

<b>Нулевая гипотеза 2 - Статистически значимых различий в средних чеках заказа между группами по "сырым" данным нет. Альтернативная гипотеза 2 - Статистически значимые различия  в средних чеках заказа между группами по "сырым" данным есть. Уровень статистической значимости  p < 0.05</b>

In [None]:
##Определим, есть ли статистически значимые различия в средних чеках между группами. Нулевая гипотеза - средние чеки равны. Альтернативная гипотеза - средние чеки не равны.
alpha = 0.05
result_raw_2 = st.mannwhitneyu(orders[orders['group'] == 'A']['revenue'], orders[orders['group'] == 'B']['revenue'])[1]
print('p-значение: ', '{0:.3f}'.format(result_raw_2))
if result_raw_2 < alpha:
    print('Отвергаем нулевую гипотезу')
else:
    print('Не получилось отвергнуть нулевую гипотезу')

Анализ "сырых данных" показал, что в средних чеках между группами нет статистически значимых различий и мы не можем отвергнуть нулевую гипотезу.

In [None]:
#Определим относительное различие среднего чека
print('{0:.2%}'.format(orders[orders['group'] == 'B']['revenue'].mean()/orders[orders['group'] == 'A']['revenue'].mean() - 1))

Анализ "сырых данных" показал, что относительный прирост среднего чека группы B к среднему чеку группы A равен 28.66%. Разница значительная, посмотрим какой результат покажут "очищенные данные".

### <a id='section28'>2.8. Различия в конверсии между группами по «очищенным» данным</a><br>

<b>Нулевая гипотеза 3 - Статистически значимых различий в конверсии между группами по "очищенным" данным нет. Альтернативная гипотеза 3 - Статистически значимые различия в конверсии между группами по "очищенным" данным есть. Уровень статистической значимости  p < 0.05</b>

In [None]:
#Найдем посетителей с большим количеством заказов
VisitorsWithManyOrders = pd.concat([ordersByUsersA[ordersByUsersA['orders'] > 1]['visitorId'],\
                                    ordersByUsersB[ordersByUsersB['orders'] > 1]['visitorId']], axis=0)
#Найдем посетителей с дорогими заказами
VisitorsWithExpensiveOrders = orders[orders['revenue'] > 26785]['visitorId']
#Соединим таблицы и удалим дубликаты
abnormalVisitors = pd.concat([VisitorsWithManyOrders, VisitorsWithExpensiveOrders], axis=0)\
                                    .drop_duplicates()\
                                    .sort_values()
print(abnormalVisitors.head(5))
print(abnormalVisitors.shape)

Мы получили 86 аномальных пользователя. Исключим их действия, создав отфильтрованные выборки.

In [None]:
#Создадим отфильтрованные выборки
sampleAFiltered = pd.concat([ordersByUsersA[np.logical_not(ordersByUsersA['visitorId']\
                            .isin(abnormalVisitors))]['orders'],pd.Series(0, index=\
                            np.arange(daily_data['visitorsPerDateA'].sum() - len(ordersByUsersA['orders'])),\
                                                                                    name='orders')], axis=0)
sampleBFiltered = pd.concat([ordersByUsersB[np.logical_not(ordersByUsersB['visitorId']\
                            .isin(abnormalVisitors))]['orders'],pd.Series(0, index=\
                            np.arange(daily_data['visitorsPerDateB'].sum() - len(ordersByUsersB['orders'])),\
                                                                                    name='orders')], axis=0)
#Определим, есть ли статистически значимые различия в конверсии между группами.  Нулевая гипотеза - конверсии равны. Альтернативная гипотеза - конверсии не равны.
alpha = 0.05
result_clean_1 = st.mannwhitneyu(sampleAFiltered, sampleBFiltered)[1]
print('p-значение: ', '{0:.3f}'.format(result_clean_1))
if result_clean_1 < alpha:
    print('Отвергаем нулевую гипотезу')
else:
    print('Не получилось отвергнуть нулевую гипотезу')

p-значение немного увеличилось. Анализ "очищенных данных" показал, что в конверсии между группами есть статистически значимые различия и мы отвергаем нулевую гипотезу. Как и в случае с "сырыми данными", статистическая значимость достигнута. Это означает, что сегмент B значительно лучше сегмента A.

In [None]:
#Сравним прирост конверсии группы B к конверсии группы A через отношение средних в выборках
print('{0:.2%}'.format(sampleBFiltered.mean()/sampleAFiltered.mean() - 1))

Анализ "очищенных данных" показал, что относительный прирост конверсии группы B к конверсии группы A равен 17.39%. Этот результат почти на 9% больше в относительном выражении, чем по итогам анализа "сырых данных".

### <a id='section29'>2.9. Различия в среднем чеке заказа между группами по «очищенным» данным</a><br>

<b>Нулевая гипотеза 4 - Статистически значимых различий в средних чеках заказа между группами по "очищенным" данным нет. Альтернативная гипотеза 4 - Статистически значимые различия  в средних чеках заказа между группами по "очищенным" данным есть. Уровень статистической значимости  p < 0.05</b>

In [None]:
##Определим, есть ли статистически значимые различия в средних чеках между группами. Нулевая гипотеза - средние чеки равны. Альтернативная гипотеза - средние чеки не равны.
alpha = 0.05
result_clean_2 = st.mannwhitneyu(orders[np.logical_and(
                                    orders['group'] == 'A',
                                    np.logical_not(orders['visitorId'].isin(abnormalVisitors)))]['revenue'],
                                 orders[np.logical_and(
                                    orders['group'] == 'B',
                                    np.logical_not(orders['visitorId'].isin(abnormalVisitors)))]['revenue'])[1]
print('p-значение: ', '{0:.3f}'.format(result_clean_2))
if result_clean_2 < alpha:
    print('Отвергаем нулевую гипотезу')
else:
    print('Не получилось отвергнуть нулевую гипотезу')

Анализ "очищенных данных" показал, что статистическая значимость различий среднего чека заказа не достигнута. Это означает, что удаление выбросов не помогло.

In [None]:
#Определим относительное различие среднего чека
print('{0:.2%}'.format(orders[np.logical_and(orders['group']=='B',\
                              np.logical_not(orders['visitorId'].isin(abnormalVisitors)))]['revenue'].mean()/\
                       orders[np.logical_and(orders['group']=='A',\
                              np.logical_not(orders['visitorId'].isin(abnormalVisitors)))]['revenue'].mean() - 1))

Анализ "очищенных данных" показал, что относительный прирост конверсии группы B к конверсии группы A стал отрицателен и равен -3.37%. Это означает, что средний чек группы А в конце немного вырвался вперед, но расхождение очень незначительное.

## <a id='section3'>3. Принятие решения по итогам A/B теста</a><br>

#### Выводы

1. Имеются статистически значимые различия конверсии между группами и по "сырым" и по "очищенным данным. Относительный прирост конверсии группы B к конверсии группы A равен 17.39% - это хороший результат
2. Статистическая значимость различия среднего чека заказов не достигнута ни по "сырым", ни по "очищенным данным". Более того, после фильтрации аномалий отношение средних чеков стало совсем незначительным (3.37% в пользу группы 'A')

Это может означать, что посетители из группы 'B' более замотивированы к покупке, но по какой-то причине они приносят чуть меньше выручки, чем посетители из группы 'A'. То есть увеличив конверсию, мы, возможно, понизили доходность. Вероятно, проблема в рекламном сообщении / источнике трафика/ таргетинге/ демографических характеристиках посетителей / качестве выборки или других причинах. 

#### Решение

Остановить тест и признать его неуспешным. На основе базовой гипотезы создать несколько новых тестов, в которых будет исследовано влияние дополнительных факторов на базовую гипотезу.