<a href="https://colab.research.google.com/github/PodorogaElla/PforA/blob/main/AB_Sem8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

####Задание 1

На сайте запущен А/В тест с целью увеличить доход. В приложенном excel файле вы найдете сырые данные по результатам эксперимента – user_id, тип выборки variant_name и доход принесенный пользователем revenue. Проанализируйте результаты эксперимента и напишите свои рекомендации менеджеру.

In [10]:
from tqdm import tqdm
import pandas as pd
import numpy as np
from scipy import stats
from statsmodels.stats.meta_analysis import effectsize_smd
from statsmodels.stats.power import tt_ind_solve_power
import warnings


In [15]:
df = pd.read_excel('gb_sem_8_hm.xlsx')
df.shape

(10000, 3)

In [16]:
df = df.groupby(['USER_ID', 'VARIANT_NAME']).agg({'REVENUE':'sum'})
df.reset_index(inplace=True)
df.drop_duplicates('USER_ID', keep=False, inplace=True)
df.shape

(4783, 3)

Анализ данных

Первичный анализ

In [17]:
df.describe()

Unnamed: 0,USER_ID,REVENUE
count,4783.0,4783.0
mean,4994.395777,0.135873
std,2898.618472,3.011392
min,2.0,0.0
25%,2476.0,0.0
50%,4975.0,0.0
75%,7515.0,0.0
max,9998.0,196.01


In [18]:
control = df[df['VARIANT_NAME'] == 'control']
treatment = df[df['VARIANT_NAME'] == 'variant']
print(f"Контрольная группа: {control.count()[0]} Тестовая группа: {treatment.count()[0]}")

Контрольная группа: 2390 Тестовая группа: 2393


Применение статистических критериев

In [22]:
def continious_result(control: pd.DataFrame,
                      treatment: pd.DataFrame,
                      column: str,
                      n_iters: int = 10_000) -> pd.DataFrame:
    # Статистика по выборкам
    size = control.loc[:, column].shape[0]

    control_mean = control.loc[:, column].mean()
    treatment_mean = treatment.loc[:, column].mean()

    control_std = control.loc[:, column].std(ddof=1)
    treatment_std = treatment.loc[:, column].std(ddof=1)

    # Бутсрап
    booted_diff = []
    for _ in tqdm(range(n_iters)):
        control_sample = control.loc[:, column].sample(n=size, replace=True).values
        treatment_sample = treatment.loc[:, column].sample(n=size, replace=True).values
        booted_diff.append(np.mean(control_sample - treatment_sample))

    # Считаем статистику после бустрапа
    md_ci, std_ci = np.mean(booted_diff), np.std(booted_diff, ddof=1)
    left_ci, right_ci = np.percentile(booted_diff, [2.5, 97.5])
    p_value_ci = 2 * (1 - stats.norm.cdf(np.abs(md_ci / std_ci)))

    # Считаем мощность эксперимента
    effect_size, _ = effectsize_smd(mean1=treatment_mean, sd1=treatment_std, nobs1=size,
                                    mean2=control_mean, sd2=control_std, nobs2=size)
    power = tt_ind_solve_power(effect_size=effect_size,
                               nobs1=size,
                               alpha=.05,
                               power=None,
                               ratio=1)
    # Формируем отчёт
    result = pd.DataFrame({'effect_size': effect_size,
                           'alpha': p_value_ci,
                           'beta': (1-power),
                           'CI': f'[{np.round(left_ci, 3)}, {np.round(right_ci, 3)}]',
                           'difference': md_ci,},
                          index=[column])
    return result

continious_result(control,
                  treatment,
                  column='REVENUE')

100%|██████████| 10000/10000 [00:06<00:00, 1651.68it/s]


Unnamed: 0,effect_size,alpha,beta,CI,difference
REVENUE,-0.040483,0.163397,0.712143,"[-0.004, 0.321]",0.122002


Рекомендации

Ноль лежит в пределах доверительного интервала, alpha намного больше 0.05, beta стремится к единице. На основе этого можно сделать выводы, что у нас нет статистически значимых данных. Следовательно, мы не можем выкатывать тестовое решение в продакт.

Необходимо искать другие решения для дальнейшего A/B-тестирования.