# Delta-method

In [21]:
## комменты добавить

In [14]:
import numpy as np
import pandas as pd
import scipy.stats as sps
from statsmodels.stats.power import tt_ind_solve_power

код и текст из https://t.me/nodatanogrowth/621

Как работать с Ratio-метриками – Delta-method.

В посте с видами метрик в АБ-тестах я рассказал о трех видах метрик: долях, непрерывных и метриках отношения (ratio-метриках). Больше всего интереса вызывает именно последний вид, поскольку к ratio-метрикам нельзя просто взять и применить привычные стат.критерии. 

Проблема заключается в том, что в ratio-метриках числитель (num) и знаменатель (denom) зависимы. А тот же t-test, как и многие другие тесты, предполагают независимость данных. Как итог – мы неправильно оцениваем дисперсию метрики.

Один из вариантов решения проблемы – применение delta-method’а. Суть метода проста. В нем мы корректируем нашу дисперсию на корреляцию. Для это нам понадобится следующая функция оценки дисперсии:

In [2]:
def est_ratio_var(num, denom):  ## числитель и знаменатель

    mean_num, mean_denom = np.mean(num), np.mean(denom)
    var_num, var_denom = np.var(num), np.var(denom)
    
    cov = np.cov(num, denom)[0, 1]
    
    ratio_var = (
            (var_num / mean_denom ** 2)
            - (2 * (mean_num / mean_denom ** 3) * cov)
            + ((mean_num ** 2 / mean_denom ** 4) * var_denom)
    )
    
    return ratio_var

Рассмотрим работу метода на примере метрики CTR. Т. е. у нас будут колонки 'clicks' и 'views' на каждого user_id. Тогда можно выделить 2 ключевых момента работы с ней:

1 Расчет размера выборки  
В коде ниже, rel_mde – относительный MDE, cohen_d – стандартизированный MDE. Пользователей делим 90 на 10.

In [17]:
## сгенерировал "датасет"
df = pd.DataFrame(
    {
        'id': range(1, 21), 
        'clicks': np.random.randint(6, 16, 20), 
        'views': np.random.randint(1, 6, 20)
    }
)
df

Unnamed: 0,id,clicks,views
0,1,14,1
1,2,8,3
2,3,8,2
3,4,15,2
4,5,6,5
5,6,14,4
6,7,10,2
7,8,14,3
8,9,7,5
9,10,15,3


In [18]:
rel_mde = 0.1

var = est_ratio_var(df['clicks'], df['views'])
control_std = var**0.5

control_mean = df['clicks'].sum() / df['views'].sum()
test_mean = control_mean * (1 + rel_mde)

cohen_d = (test_mean - control_mean) / control_std

n1 = tt_ind_solve_power(
    effect_size=cohen_d,
    alpha=0.05,
    power=0.8,
    ratio=9,  # n2/n1
    alternative="two-sided"
)

print(f"Размер выборки delta-method: "
      f"n1 = {round(n1)}, "
      f"n2 = {round(9 * n1)}"
)

Размер выборки delta-method: n1 = 353, n2 = 3180


2 Оценка статистической значимости изменений:

In [15]:
def delta_method(group_A, group_B):

    ratio_A = group_A['clicks'].sum() / group_A['views'].sum()
    ratio_B = group_B['clicks'].sum() / group_B['views'].sum()

    var_A = est_ratio_var(group_A['clicks'], group_A['views'])
    var_B = est_ratio_var(group_B['clicks'], group_B['views'])

    uplift = ratio_B - ratio_A
    se = np.sqrt(var_B / len(group_B) + var_A / len(group_A))

    t = uplift / se
    p_val = (1 - sps.norm.cdf(abs(t))) * 2
    
    return p_val

Я нахожу Delta-method самым простым в интерпретации для бизнеса. Но существуют и другие методы работы с ratio-метриками – линеризация, бутстреп, бакетизация. Все они имеют свои плюсы и минусы, а также нюансы применения.

In [20]:
delta_method(df[0:18], df[18:20])

0.08685927790261405