# Тестирование новой версии сайта

Одно из самых важных и распространённых применений статистических тестов в бизнесе — это A/B-тестирование.

A/B-тестирование — это метод проверки эффективности изменений в продукте, который заключается в сравнении текущей версии продукта (версии А) с его изменённой версией (версией B) на основании данных, полученных до внедрения обновления в продукт и после него.

Чтобы понять, являются ли результаты A/B-теста статистически значимыми, как раз используются статистические тесты.

Мы будем подробнее говорить об A/B-тестировании в блоке «Машинное обучение в бизнесе», будем учиться правильно его проводить, а также интерпретировать результаты. Однако уже сейчас, зная основные статистические тесты, мы сможем решить простейшую задачу.

Компания по продаже бытовой техники представила новую версию сайта с рекомендациями товаров. Предполагается, что новый сайт будет стимулировать посетителей оставаться на нём в течение более длительного времени. Для проведения теста компания перенаправляет часть трафика на обновлённую версию сайта.

Результат с дневным трафиком хранится в файле new-site.

Примечание. Разделитель в файле — символ табуляции '\t'.

Каждая строка показывает время пребывания посетителей на сайте. Если посетитель пользовался исходным дизайном, то считается, что он относился к контрольной группе А; если обновлённым — к тестовой группе B.

Необходимо провести небольшое исследование и определить, повлияло ли внедрение рекомендательной системы на длительность сессии пользователей на сайте.

Вам предстоит произвести статический анализ результатов A/B-теста и проверить предложенную бизнес-гипотезу. Итак, приступим!

In [5]:
import pandas as pd

data = pd.read_csv('data/new-site.csv', sep='\t')
data.head(5)

Unnamed: 0,site,dwell-time
0,0,2
1,1,48
2,0,15
3,1,16
4,0,38


In [7]:
# Предполагаем, что в данных есть столбцы 'site' (0/1) и 'dwell-time' (время на сайте)
sum_A = data[data['site'] == 0]['dwell-time'].sum()
sum_B = data[data['site'] == 1]['dwell-time'].sum()
print(sum_A)
print(sum_B)

16898
10032


In [8]:
mean_A = round(data[data['site'] == 0]['dwell-time'].mean())
mean_B = round(data[data['site'] == 1]['dwell-time'].mean())
print(mean_A)
print(mean_B)

91
88


In [9]:
from scipy.stats import shapiro

stat_A, p_A = shapiro(data[data['site'] == 0]['dwell-time'])
stat_B, p_B = shapiro(data[data['site'] == 1]['dwell-time'])

print('p-value для группы A:', p_A)
print('p-value для группы B:', p_B)

alpha = 0.05
if p_A < alpha:
    print("В группе A распределение не является нормальным")
else:
    print("В группе A распределение является нормальным")

if p_B < alpha:
    print("В группе B распределение не является нормальным")
else:
    print("В группе B распределение является нормальным")

p-value для группы A: 4.499873552750829e-17
p-value для группы B: 3.5727031185288115e-13
В группе A распределение не является нормальным
В группе B распределение не является нормальным


In [10]:
from scipy.stats import mannwhitneyu

# Получаем значения времени для каждой группы
group_A = data[data['site'] == 0]['dwell-time']
group_B = data[data['site'] == 1]['dwell-time']

# U-тест Манна–Уитни
stat, p_value = mannwhitneyu(group_A, group_B, alternative='two-sided')

print('p-value:', p_value)

alpha = 0.05
if p_value < alpha:
    print("Отвергаем нулевую гипотезу: различия между группами статистически значимы")
else:
    print("Нет оснований отвергать нулевую гипотезу: различия между группами не обнаружены")

p-value: 0.895811197131841
Нет оснований отвергать нулевую гипотезу: различия между группами не обнаружены
