In [3]:
from scipy.stats import norm, t
import math

**Задача**:

Известна конверсия до введения новой функциональности. 0.11

После введения конверсия на выборке размером 1400 уменьшилась до 0.09.

Статзначимо ли уменьшение конверсии?

In [4]:
alpha = 0.05
mu = 0.11
x_mean = 0.09
n = 1400


#### Решение

Рассмотрим задачу с такого ракурса.

* Продажа - успех, отсутствие продажи - неудача.

* То есть мы имеем дело со случайной величиной, распределенной по Бернулли. 

* Ее мат. ожидание == вероятность успеха == доля успешных попыток == Конверсия  (до введения фичи) == mu == 0.09.

* x_mean - среднее реализованной бернуллиевской сл.величины. На выборке размером 1400 

* Тогда знаем ее дисперсию: mu * (1 - mu)



H0: Конверсия не изменилась. x_mean == mu

H1: Конверсия снизилась. x_mean < mu

Посчиатем z-score

In [6]:
z = (x_mean - mu)/(math.sqrt(mu*(1-mu)/n))
z

-2.391677773876565

In [7]:
p_value = norm.cdf(z)
p_value

0.008385779779039888

In [8]:
p_value < alpha

True

Отклоняем H0

In [6]:
print("p-value = {:6.4f}".format(p_value))

p-value = 0.0084


**Вывод**: Различия в конверсии стат. значимы. Конверсия в действительности уменьшилась.

#### AB-тест.

Известны размеры выборок, количества успешных лидов.

Задача: 
Определить, изменилась ли конверсия.

In [9]:
n1, p1 = 16500, 1599 #Контроль
n2, p2 = 15903, 1580 #Тест

H0: Конверсии равны. p1 == p2

H1: Конверсии различны. p1 != p2

**Промежуточный вывод**:
    
Выборки независимы, распрдлены по нормальному закону.

Можем использовать критерий Стьюдента.

In [12]:
P = (p1*n1 + p2*n2)/(n1+n2)
t_stat = (p1 - p2)/(math.sqrt(P*(1-P)*(1/n1 - 1/n2)))

In [16]:
t_stat

7.926404398041062

In [17]:
p_value = 2*t.cdf(-t_stat, df = 1) 
p_value

0.079894243081432

In [18]:
p_value < alpha

False

Результат не статзначим

**Вывод**: конверсия не изменилась