## Z тест для пропорций

В этом ноутбуке мы посмотрим, как тестировать гипотезы относительно пропорций.

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats as st

Допустим, мы интернет магазин и проводим классический АБ тест. В тестовой группе пользователи совершали покупки с помощью обновленной формы заказа, в контрольной группе старая форма.

Мы проверяем гипотезы:

H0: Конверсия в тестовой группе равна конверсии в контрольной группе

H1: Конверсия в тестовой группе не равна конверсии в контрольной группе

In [2]:
# Сгенерируем данные
# Сколько было пользователей
users_test, users_control = 10000, 10000
# Количество попыток
n = 1
# Вероятность покупки. Пусть новая форма действительно увеличивает конверсию.
p_test, p_control = 0.07, 0.055

np.random.seed(10)
test = np.random.binomial(n, p_test, size=users_test)
control = np.random.binomial(n, p_control, size=users_control)

In [3]:
# Проверим получившуюся конверсию
cr_test = np.mean(test)
cr_control = np.mean(control)
print(cr_test, cr_control)

0.0676 0.0563


In [4]:
# Напишем функцию для двувыборочного z теста пропорций
def two_sample_z_test_for_proportions(data1, data2, alpha=0.05):
    p1, p2 = np.mean(data1), np.mean(data2)
    n1, n2 = len(data1), len(data2)
    var1, var2 = p1 * (1-p1) / n1, p2 * (1-p2) / n2 # дисперсия
    sed = np.sqrt(var1 + var2) #стандартная ошибка распределения разницы пропорций
    z_score = (p1-p2) / sed
    p_value = (1 - st.norm.cdf(np.abs(z_score))) * 2
    answer = 'reject H0' if p_value < alpha else 'Do not reject H0'
    return (answer, p_value)

In [5]:
two_sample_z_test_for_proportions(control, test)

('reject H0', 0.0009147913768559057)