### Часть 1. Приоритизация гипотез.

In [None]:
# Импортирум необходимые библиотеки
import pandas as pd
import datetime as dt
import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt
from pandas.plotting import register_matplotlib_converters
import warnings
# конвертеры, которые позволяют использовать типы pandas в matplotlib  
register_matplotlib_converters()

# Опция 'max_colwidth' помогает увидеть неусеченную 
# форму вывода на экран каждого столбца
pd.set_option('display.max_colwidth', 200)

In [None]:
# Загрузим датасет
try:
    hypothesis = pd.read_csv('/datasets/hypothesis.csv')
except:
    hypothesis = pd.read_csv(r'C:\Users\User\OneDrive\Education\1_Ya_DA\13_decision_making_in_business\project_a_b_test\hypothesis.csv')

In [None]:
# Посмотрим первые десять строк датасета
hypothesis.head(10)

In [None]:
# Выведем статистику датасета
hypothesis.info()

In [None]:
# Приведём названия колонок к нижнему регистру в соответствии с хорошим стилем
hypothesis.columns = hypothesis.columns.str.lower()

In [None]:
# Добавим наименование гипотезы для наглядности
hypothesis = hypothesis.rename(index = lambda x: x+1)
hypothesis.index = 'Гипотеза ' + hypothesis.index.astype(str)
hypothesis

In [None]:
# Применим фреймворк ICE для приоритизации гипотез. Отсортируем их по убыванию приоритета.
hypothesis['ice'] = hypothesis['impact'] * hypothesis['confidence'] / hypothesis['efforts']
round(hypothesis[['hypothesis', 'ice']].sort_values('ice', ascending=False), 2)                

In [None]:
# Применим фреймворк RICE для приоритизации гипотез. Отсортируем их по убыванию приоритета.
hypothesis['rice'] = hypothesis['reach'] * hypothesis['impact'] * hypothesis['confidence'] / hypothesis['efforts']
hypothesis[['hypothesis', 'rice']].sort_values('rice', ascending=False)                   

Вывод

При применении фреймворка ICE на первых трёх местах оказались:
- гипотеза 9 - запустить акцию, дающую скидку на товар в день рождения;
- гипотеза 1 - добавить два новых канала привлечения трафика, что позволит привлекать на 30% больше пользователей;
- гипотеза 8- добавить форму подписки на все основные страницы, чтобы собрать базу клиентов для email-рассылок.

При применении фреймворка RICE на первых трёх местах: 
- гипотеза 8 - добавить форму подписки на все основные страницы, чтобы собрать базу клиентов для email-рассылок;
- гипотеза 3 - добавить блоки рекомендаций товаров на сайт интернет магазина, чтобы повысить конверсию и средний чек заказа;
- гипотеза 1 - добавить два новых канала привлечения трафика, что позволит привлекать на 30% больше пользователей.

Фреймворк RICE в отличае от фреймворка ICE, включает в себя параметр 'reach' (охват), который измеряется количеством людей/событий за период времени. При оценке гипотез фреймворком RICE, на первом месте гипотеза 8, её оценка более чем в два раза больше гипотезы 3, которая на втором месте. Предположу, что это явилось результатом применения параметра "reach". В фреймворке ICE параметр 'reach' не учитывается, поэтому гипотеза 8 оказалась на третьем месте.  
Приоритетными будут гипотезы 8, 3, 1.

### Часть 2. Анализ А/В-теста.

In [None]:
# Загрузим датасеты
try:
    orders, visitors = (
        pd.read_csv('/datasets/orders.csv'),
        pd.read_csv('/datasets/visitors.csv')
    )
except:
    orders, visitors = (
        pd.read_csv(r'C:\Users\User\OneDrive\Education\1_Ya_DA\13_decision_making_in_business\project_a_b_test\orders.csv'),
        pd.read_csv(r'C:\Users\User\OneDrive\Education\1_Ya_DA\13_decision_making_in_business\project_a_b_test\visitors.csv')
    )

In [None]:
orders.head()

In [None]:
orders.info()

In [None]:
# Проверим датасет на наличие пропущенных значений
orders.isna().sum()

In [None]:
# Проверим датасет на наличие дубликатов
orders.duplicated().sum()

In [None]:
visitors.head()

In [None]:
visitors.info()

In [None]:
visitors.isna().sum()

In [None]:
visitors.duplicated().sum()

In [None]:
# Преобразуем в колонке "date" временные данные
orders['date'] = orders['date'].map(lambda x: dt.datetime.strptime(x, '%Y-%m-%d'))
visitors['date'] = visitors['date'].map(lambda x: dt.datetime.strptime(x, '%Y-%m-%d'))

Посмотрим, есть ли одни и те же пользователи в обеих группах датасета orders. Отфильтруем группы, найдём пользователей на пересечении групп, исключим их из датасета, чтобы не "портили" статистику.

In [None]:
# Отфильтруем группы методом query
groupA = orders.query('group == "A"')
groupB = orders.query('group == "B"')

In [None]:
# Посмотрим, какое количество пользователей находится на пересечении обоих групп
groupIntersection = list(np.intersect1d(groupA['visitorId'], groupB['visitorId']))
len(groupIntersection)

In [None]:
# Исключим пользователей находящихся в обоих группах
orders = orders.query('visitorId not in @groupIntersection')

Вывод

Загрузили данные, посмотрели первичную статистику - пропусков и дубликатов не обнаружили. Выявили 58 пользователей находящихся в обоих группах, исключили их. Переходим к анализу А/В теста.

#### Стабильность кумулятивных метрик
Чтобы исключить проблему подсматривания, проанализируем графики метрик. Изучим графики кумулятивных, или накапливаемых данных. По графику кумулятивных метрик определим, стоит останавливать тест или нет. 

In [None]:
# Создадим датафрейм datesGroups с уникальными парами значений 'date' и 'group', 
# таблицы orders. Избавимся от дубликатов методом drop_duplicates().
datesGroups = orders[['date', 'group']].drop_duplicates()

In [None]:
orders.head()

In [None]:
# Объявим переменную ordersAggregated, содержащую: дату, группу A/B-теста и т.д.
ordersAggregated = (datesGroups
    .apply(
        lambda x: orders[np.logical_and(
            orders['date'] <= x['date'], orders['group'] == x['group'])]
    .agg(
        {'date': 'max'
        , 'group': 'max'
        , 'transactionId': 'nunique'
        , 'visitorId': 'nunique'
        , 'revenue': 'sum'}), axis=1)
    .sort_values(by=['date', 'group'])
    )

In [None]:
# Объявим переменную visitorsAggregated, содержащую: дату; группу A/B-теста и т.д.
visitorsAggregated = (datesGroups
    .apply(
        lambda x: visitors[np.logical_and(
            visitors['date'] <= x['date'], visitors['group'] == x['group'])]
    .agg(
        {'date': 'max'
        , 'group': 'max'
        , 'visitors': 'sum'}), axis=1)
    .sort_values(by=['date', 'group'])
    )

In [None]:
#  Определим переменную cumulativeData, объединив ordersAggregated и visitorsAggregated 
# по колонкам 'date', 'group' методом merge()
cumulativeData = (ordersAggregated
    .merge(visitorsAggregated, left_on=['date', 'group'], right_on=['date', 'group'])
    )
# Добавим столбцы
cumulativeData.columns = [
    'date'
    , 'group'
    , 'orders'
    , 'buyers'
    , 'revenue'
    , 'visitors'
]


Получили датасет `cumulativeData` с колонками:
- `date` - дата;
- `group` - группа А/В-теста;
- `orders` - кумулятивное количество заказов на указанную дату включительно;
- `buyers` - кумулятивное количество уникальных  пользователей, совершивших хотя бы один заказ в группе, на указанную дату включительно;
- `revenue` - кумулятивная выручка заказов в группе по указанную дату включительно;
- `visitors` - кумулятивное количество посетителей интернет-магазина на указанную дату включительно.

### Часть 2. Анализ A/B-теста

1. Построим график кумулятивной выручки по группам.

In [None]:
# Датафрейм с накопительным количеством заказов и накопительной выручкой 
# по дням в группе "А"
cumulativeRevenueA = cumulativeData[cumulativeData['group'] == 'A'][
    ['date', 'revenue', 'orders']
    ]

# Датафрейм с накопительным количеством заказов и накопительной выручкой 
# по дням в группе "B"
cumulativeRevenueB = cumulativeData[cumulativeData['group'] == 'B'][
    ['date', 'revenue', 'orders']
    ]
    
plt.figure(figsize=(9, 5))

plt.plot(cumulativeRevenueA['date'], cumulativeRevenueA['revenue'], label='A')
plt.plot(cumulativeRevenueB['date'], cumulativeRevenueB['revenue'], label='B')
plt.xlabel('Дата')
plt.ylabel('Выручка в млн. руб.')
plt.legend()

Вывод

Выручка группы В больше выручки группы А. Выручка группы А растёт равномерно, выручка группы В растёт равномерно до определённого момента, далее резко вырастает и переходит в стабильный рост. "Взрывной" рост выручки группы В может сигнализировать нам о росте числа заказов, либо о появлении очень дорогих заказов в рассматриваемом периоде.

2. Построим график кумулятивного среднего чека по группам. 

In [None]:
plt.figure(figsize=(9,5))

plt.plot(cumulativeRevenueA['date'], cumulativeRevenueA['revenue'] / 
cumulativeRevenueA['orders'], label='A')
plt.plot(cumulativeRevenueB['date'], cumulativeRevenueB['revenue'] / 
cumulativeRevenueB['orders'], label='B')
plt.xlabel('Дата')
plt.ylabel('Средний чек в тыс. руб.')
plt.legend()

Вывод

Средний чек группы А показывает падение вначале и рост в середине тренда, после чего умеренное движение к росту. Средний чек группы В показывает рост вначале и всплеск в середине тренда (крупные заказы). Нужно посмотреть детальнее на данные, что мы и сделаем на следующем графике.

3. Построим график относительного изменения кумулятивного среднего чека группы B к группе A.

In [None]:
# Объединим таблицы методом merge() и сохраним в переменной mergedCumulativeRevenue
mergedCumulativeRevenue = (cumulativeRevenueA
    .merge(cumulativeRevenueB
        , left_on='date'
        , right_on='date'
        , how='left'
        , suffixes=['A', 'B'])
        )

plt.figure(figsize=(9, 5))

plt.plot(mergedCumulativeRevenue['date'], 
    (mergedCumulativeRevenue['revenueB'] / mergedCumulativeRevenue['ordersB']) / 
    (mergedCumulativeRevenue['revenueA'] / mergedCumulativeRevenue['ordersA']) - 1
    )

plt.axhline(y=0, color='black', linestyle='--')
plt.xlabel('Дата')
plt.ylabel('Отношение кумулятивного среднего чека группы "В" к группе "А"')

Вывод

График подтверждает предыдущий вывод: по соотношению среднего чека видно, что в группу "В" попали крупные заказы - резкий рост в середине тренда.

4. Построим график кумулятивного среднего количества заказов на посетителя по группам.

In [None]:
cumulativeVisitorsA = cumulativeData[cumulativeData['group'] == 'A'][
    ['date', 'visitors', 'orders']
    ]

cumulativeVisitorsB = cumulativeData[cumulativeData['group'] == 'B'][
    ['date', 'visitors', 'orders']
    ]


plt.figure(figsize=(9,5))

plt.plot(cumulativeVisitorsA['date'], cumulativeVisitorsA['orders'] / 
cumulativeVisitorsA['visitors'], label='A')
plt.plot(cumulativeVisitorsB['date'], cumulativeVisitorsB['orders'] / 
cumulativeVisitorsB['visitors'], label='B')
plt.xlabel('Дата')
plt.ylabel('Среднее количество заказов на посетителя')
plt.legend()

Видим всплеск вначале и пересечение групп в одной точке, после чего группа В "ушла в рост" с незначительными колебаниями и понижением тренда в конце, в то время как группа А "пошла на понижение" тренда с незначительными колебаниями и понижением тренда более глубоким чем у группы А. Посмотрим на относительные изменения на следующем графике.

5. Построим график относительного изменения кумулятивного среднего количества заказов на посетителя группы B к группе A.

In [None]:
mergedCumulativeVisitors = (cumulativeVisitorsA
    .merge(cumulativeVisitorsB
        , left_on='date'
        , right_on='date'
        , how='left'
        , suffixes=['A', 'B'])
        )

plt.figure(figsize=(9, 5))

plt.plot(mergedCumulativeVisitors['date'], 
    (mergedCumulativeVisitors['ordersB'] / mergedCumulativeVisitors['visitorsB']) / 
    (mergedCumulativeVisitors['ordersA'] / mergedCumulativeVisitors['visitorsA']) - 1
    )

plt.axhline(y=0, color='black', linestyle='--')
plt.xlabel('Дата')
plt.ylabel('Отношение зказов группы "В" к группе "А"')

Вывод

График подтверждает предположение предыдущего вывода о преобладании среднего количества заказов на посетителя группы B к группе A. Посмотрим на аномалии, возможно, они изменят картину.

6. Постройте точечный график количества заказов по пользователям.

In [None]:
# Вернём в переменную результат работы методов группировки, аггрегации, 
# переименования, сортировки таблицы orders
ordersByUsers = (orders
    .groupby('visitorId', as_index=False)
    .agg({'transactionId': 'nunique'})
    .rename(columns={'visitorId': 'users', 'transactionId': 'orders'})
    .sort_values(by='orders', ascending=False)
    )

In [None]:
# Переменная с результатом работы серии из чисел от 0 до 
# количества наблюдений в ordersByUsers
x_values = pd.Series(range(0, len(ordersByUsers)))

plt.figure(figsize=(9, 5))

plt.scatter(x_values, ordersByUsers['orders'])
plt.title('График количества заказов по пользователям')

Вывод

Большинство пользователей делает один заказ, немногие пользователи делают два - три заказа.

7. Посчитайте 95-й и 99-й перцентили количества заказов на пользователя. Выберите границу для определения аномальных пользователей

In [None]:
np.percentile(ordersByUsers['orders'], [95, 99])


Вывод

Не более пяти процентов пользователей делают два заказа и не более одного процента пользователей делают три заказа. 

Выберем два заказа как границу для определения аномальных пользователей.

8. Постройте точечный график стоимостей заказов.

In [None]:
x_values = pd.Series(range(0, len(orders['revenue'])))

plt.figure(figsize=(9, 5))

plt.scatter(x_values, orders['revenue'])
plt.title('График стоимостей заказов')

Вывод

В основном, сумма заказа не превышает 10 000 у. е., есть исключения в ~ 20 000 у. е. и более.

9. Посчитайте 95-й и 99-й перцентили стоимости заказов. Выберите границу для определения аномальных заказов.

In [None]:
np.percentile(orders['revenue'], [95, 99])

Вывод

Пять процентов заказов не превышают сумму в 26 785 у. е. и один процент заказов не превышает сумму 53 904 у. е.

Выберем 53 904 у. е. как границу для опраеделения аномальных заазов.

10. Посчитаем статистическую значимость различий в среднем количестве заказов на посетителя между группами по «сырым» данным.

Подготовим данные для статистических тестов.  

In [None]:
# Сгруппируем посетителей по дням и получим кумулятивные данные о посетителях 
# по группе А 
visitorsADaily = visitors[visitors['group'] == 'A'][['date', 'visitors']]
visitorsADaily.columns = ['date', 'visitorsPerDateA']

visitorsACummulative = visitorsADaily.apply(
    lambda x: visitorsADaily[visitorsADaily['date'] <= x['date']].agg(
        {'date': 'max', 'visitorsPerDateA': 'sum'}
    ),
    axis=1,
)

visitorsACummulative.columns = ['date', 'visitorsCummulativeA']

In [None]:
# Сгруппируем посетителей по дням и получим кумулятивные данные о посетителях 
# по группе В 
visitorsBDaily = visitors[visitors['group'] == 'B'][['date', 'visitors']]
visitorsBDaily.columns = ['date', 'visitorsPerDateB']

visitorsBCummulative = visitorsBDaily.apply(
    lambda x: visitorsBDaily[visitorsBDaily['date'] <= x['date']]
    .agg(
        {'date': 'max', 'visitorsPerDateB': 'sum'}
    ),
    axis=1,
)
visitorsBCummulative.columns = ['date', 'visitorsCummulativeB']

In [None]:
# Сгруппируем количество заказов и выручку по дням и получим кумулятивные данные 
# по группе А 
ordersADaily = (orders
                .query('group == "A"')
                 .groupby('date', as_index=False)
                 .agg({'transactionId': pd.Series.nunique, 'revenue': 'sum'}))
ordersADaily.columns = ['date', 'ordersPerDateA', 'revenuePerDateA']

ordersACummulative = ordersADaily.apply(
    lambda x: ordersADaily[ordersADaily['date'] <= x['date']]
    .agg(
        {'date': 'max', 'ordersPerDateA': 'sum', 'revenuePerDateA': 'sum'}
    ),
    axis=1,
).sort_values(by=['date'])

ordersACummulative.columns = ['date','ordersCummulativeA','revenueCummulativeA']

In [None]:
# сгруппируем количество заказов и выручку по дням и получим кумулятивные данные 
# по группе B
ordersBDaily = (orders
                .query('group == "B"')
                 .groupby('date', as_index=False)
                 .agg({'transactionId': pd.Series.nunique, 'revenue': 'sum'}))
ordersBDaily.columns = ['date', 'ordersPerDateB', 'revenuePerDateB']

ordersBCummulative = ordersBDaily.apply(
    lambda x: ordersBDaily[ordersBDaily['date'] <= x['date']]
    .agg(
        {'date': 'max', 'ordersPerDateB': 'sum', 'revenuePerDateB': 'sum'}
    ),
    axis=1,
).sort_values(by=['date'])
ordersBCummulative.columns = ['date','ordersCummulativeB','revenueCummulativeB']

Объединим данные в единую таблицу, где:

- `date` — дата;
- `ordersPerDateA` — количество заказов в выбранную дату в группе A;
- `revenuePerDateA` — суммарная выручка в выбранную дату в группе A;
- `ordersPerDateB` — количество заказов в выбранную дату в группе B;
- `revenuePerDateB` — суммарная выручка в выбранную дату в группе B;
- `ordersCummulativeA` — суммарное число заказов до выбранной даты включительно в группе A;
- `revenueCummulativeA` — суммарная выручка до выбранной даты включительно в группе A;
- `ordersCummulativeB` — суммарное количество заказов до выбранной даты включительно в группе B;
- `revenueCummulativeB` — суммарная выручка до выбранной даты включительно в группе B;
- `visitorsPerDateA` — количество пользователей в выбранную дату в группе A;
- `visitorsPerDateB` — количество пользователей в выбранную дату в группе B;
- `visitorsCummulativeA` — количество пользователей до выбранной даты включительно в группе A;
- `visitorsCummulativeB` — количество пользователей до выбранной даты включительно в группе B.

In [None]:
# Объединим данные в единую таблицу
data = (
    ordersADaily
    .merge(
        ordersBDaily, left_on='date', right_on='date', how='left'
    )
    .merge(ordersACummulative, left_on='date', right_on='date', how='left')
    .merge(ordersBCummulative, left_on='date', right_on='date', how='left')
    .merge(visitorsADaily, left_on='date', right_on='date', how='left')
    .merge(visitorsBDaily, left_on='date', right_on='date', how='left')
    .merge(visitorsACummulative, left_on='date', right_on='date', how='left')
    .merge(visitorsBCummulative, left_on='date', right_on='date', how='left')
)
data.head()

Сформируем нулевую и альтернативную гипотезы
- Н0: различий в среднем количестве заказов на посетителя между группами нет
- Н1: различия в среднем количестве заказов на посетителя между группами есть

In [None]:
# Сгруппируем заказы по пользователям для группы А
ordersByUsersA = (
    orders[orders['group'] == 'A']
    .groupby('visitorId', as_index=False)
    .agg({'transactionId': pd.Series.nunique})
)
ordersByUsersA.columns = ['userId', 'orders']

# сгруппируем заказы по пользователям для группы В
ordersByUsersB = (
    orders[orders['group'] == 'B']
    .groupby('visitorId', as_index=False)
    .agg({'transactionId': pd.Series.nunique})
)
ordersByUsersB.columns = ['userId', 'orders'] 

In [None]:
# Выделим все заказы и число пользователей в том числе пользователей,
# которые не сделали ни одного заказа
sampleA = pd.concat(
    [ordersByUsersA['orders'],
     pd.Series(0, index=np.arange(data['visitorsPerDateA'].sum() - len(ordersByUsersA['orders'])
                                 ), name='orders')
    ],axis=0)

sampleB = pd.concat(
    [ordersByUsersB['orders'],
     pd.Series(0, index=np.arange(data['visitorsPerDateB'].sum() - len(ordersByUsersB['orders'])
                                 ), name='orders')
    ],axis=0)

In [None]:
# Выведем относительный прирост в среднем количестве заказав пользователей группы B: 
# среднее количество заказов пользователей группы B / 
# среднее количество заказов пользователей группы А - 1
alpha = .05

results = stats.mannwhitneyu(sampleA, sampleB)

print('p-value: ' + '{0:.3f}'.format(results.pvalue))

if results.pvalue < alpha:
    print('Отвергаем нулевую гипотезу')
else:
    print('Не получилось отвергнуть нулевую гипотезу')
    
print('Относительное изменение группы В к группе А составляет: {:.2%}'
      .format(sampleB.mean() / sampleA.mean() - 1))

Вывод

p-value меньше 0.05, нулевую гипотезу отвергаем, так как статистически значимые различия в среднем количестве заказов на пользователя между группами - есть. Относительный прирост в среднем количестве заказов пользователей группы В к пользователям группы А - 15.98 %.

11. Посчитаем статистическую значимость различий в среднем чеке заказа между группами по «сырым» данным.

In [None]:
alpha = .05

results = stats.mannwhitneyu(orders[orders['group']=='A']['revenue'], orders[orders['group']=='B']['revenue'])

print('p-value: ' + '{0:.3f}'.format(results.pvalue))

print('Относительное различие в среднем чеке: ' + '{0:.2%}'.format(
    orders[orders['group']=='B']['revenue'].mean() / orders[orders['group'] == 'A']['revenue'].mean() - 1))

if results.pvalue < alpha:
    print("Отвергаем нулевую гипотезу")
else:
    print("Не получилось отвергнуть нулевую гипотезу")

Вывод

p-value больше 0.05, оставляем нулевую гипотезу, так как нет статистически значимых различий в среднем чеке между группами. Относительное различие среднего чека между группами 28,7 %.

12. Посчитаем статистическую значимость различий в среднем количестве заказов на посетителя между группами по «очищенным» данным.

Ранее определили границу количества аномальных заказов - 2 и границу суммы аномальных заказов - 53 904 у. е. Сделаем срезы пользователей с числом заказов больше 2 — usersWithManyOrders и пользователей, совершивших заказы на сумму больше 53 904 у. е. — usersWithExpensiveOrders. Объединим их в таблице abnormalUsers.

In [None]:
a = np.percentile(ordersByUsers['orders'], [99])
a

In [None]:
usersWithManyOrders = pd.concat(
    [
        ordersByUsersA[ordersByUsersA['orders'] > np.array(a)]['userId'],
        ordersByUsersB[ordersByUsersB['orders'] > np.array(a)]['userId'],
    ],
    axis=0,
)
usersWithExpensiveOrders = orders[orders['revenue'] > 53904]['visitorId']
abnormalUsers = (
    pd.concat([usersWithManyOrders, usersWithExpensiveOrders], axis=0)
    .drop_duplicates()
    .sort_values()
)
print(abnormalUsers.head())
print(abnormalUsers.shape[0])

Вывод

16 аномальных пользователей.

Посчитаем статистическую значимость различия среднего количества заказов после удаления аномальных пользователей.

In [None]:
# Создадим переменные sampleAFiltered и sampleBFiltered, в которых сохраним 
# очищенные данные о заказах — не включая аномальных пользователей.  
sampleAFiltered = pd.concat(
    [
        ordersByUsersA[
            np.logical_not(ordersByUsersA['userId'].isin(abnormalUsers))
        ]['orders'],
        pd.Series(
            0,
            index=np.arange(
                data['visitorsPerDateA'].sum() - len(ordersByUsersA['orders'])
            ),
            name='orders',
        ),
    ],
    axis=0,
)

sampleBFiltered = pd.concat(
    [
        ordersByUsersB[
            np.logical_not(ordersByUsersB['userId'].isin(abnormalUsers))
        ]['orders'],
        pd.Series(
            0,
            index=np.arange(
                data['visitorsPerDateB'].sum() - len(ordersByUsersB['orders'])
            ),
            name='orders',
        ),
    ],
    axis=0,
)

In [None]:
# Выведем p-value для сравнения среднего между очищенными группами. 
# Округлим p-value до пяти знаков после запятой. Выведем относительный 
# прирост среднего очищенной группы B, округлив до трёх знаков после запятой.
# print('{0:.5f}'.format(stats.mannwhitneyu(sampleAFiltered, sampleBFiltered)[1]))
alpha = .05

results = stats.mannwhitneyu(sampleAFiltered, sampleBFiltered)

print('p-value: ' + '{0:.3f}'.format(results.pvalue))
print('Относительный прирост конверсии группы B по отношению к группе A: ' + 
      '{0:.2%}'.format(sampleBFiltered.mean()/sampleAFiltered.mean()-1))


if results.pvalue < alpha:
    print("Отвергаем нулевую гипотезу")
else:
    print("Не получилось отвергнуть нулевую гипотезу")

Вывод

p-value меньше 0.05 - различия есть. Как с "сырыми" данными так и с "очищенными" статистическая значимость достигнута - сегмент группы В лучше сегмента А. Относительный прирост группы В к группе А - 18,92 %.

13. Посчитаем статистическую значимость различий в среднем чеке заказа между группами по «очищенным» данным. 

In [None]:
# Выведем p-value для сравнения средних чеков между очищенными группами. 
# Округлим p-value до трёх знаков после запятой. Выведем относительный прирост 
# среднего чека очищенной группы B, округлив до трёх знаков после запятой.
result = stats.mannwhitneyu(
    orders[
        np.logical_and(
            orders['group'] == "A",
            np.logical_not(orders['visitorId'].isin(abnormalUsers))
        )
    ]['revenue'],
    orders[
        np.logical_and(
            orders['group'] == "B",
            np.logical_not(orders['visitorId'].isin(abnormalUsers))
        )
    ]['revenue'] 
)

print('p-value: ' + '{0:.3f}'.format(results[1]))
    
print('Относительный прирост группы B относительно группы A по очищеным данным: ' +
      '{0:.2%}'.format(
          orders[
              np.logical_and(
                  orders['group'] == "B",
                  np.logical_not(orders['visitorId'].isin(abnormalUsers)),
              )
          ]['revenue'].mean() 
          / orders[
              np.logical_and(
                  orders['group'] == "A",
                  np.logical_not(orders['visitorId'].isin(abnormalUsers)),
              )
          ]['revenue'].mean() 
          - 1
      )
)
    
if result[1] < alpha:
    print('Отвергаем нулевую гипотезу')
else:
    print('Не получилось отвергнуть нулевую гипотезу')

Вывод

По очищенным данным различий в средних чеках в группах A и B не значимы. Относительное различие среднего чека между группами - 3.34 %.

---

14. Принимаем решение по результатам теста. Варианты решений:
-  Остановить тест, зафиксировать победу одной из групп.
-  Остановить тест, зафиксировать отсутствие различий между группами.
-  Продолжить тест.

Графики кумулятивной выручки и среднего чека показали, что результаты группы В лучше группы А - выручка выше а средний чек больше.

Статистическая значимость на "сырых" и "очищенных" данных показала, что есть различия в конверсии между группами, а в среднем чеке нет.

Делаем вывод, что резудьтаты группы В лучше результатов группы А.   
Фиксируем успех группы В, останавливаем тест.