# A/B Test — конверсия, доверительные интервалы, z‑test

In [None]:
import pandas as pd
import numpy as np
from math import sqrt
from scipy.stats import norm

# Пример данных
# group, visitors, conversions
data = pd.DataFrame({
    "group": ["A","B"],
    "visitors": [5000, 5100],
    "conversions": [450, 510]
})
data["cr"] = data["conversions"] / data["visitors"]
data


In [None]:
# Z-test на разницу пропорций
p1 = data.loc[0, "cr"]
p2 = data.loc[1, "cr"]
n1 = data.loc[0, "visitors"]
n2 = data.loc[1, "visitors"]

p_pool = (p1*n1 + p2*n2) / (n1+n2)
se = sqrt(p_pool*(1-p_pool)*(1/n1 + 1/n2))
z = (p2 - p1) / se
p_value = 2*(1 - norm.cdf(abs(z)))
print({"z": z, "p_value": p_value})


In [None]:
# 95% доверительные интервалы для каждой конверсии (Вальд)
z_crit = norm.ppf(0.975)
for i,row in data.iterrows():
    p = row.cr
    n = row.visitors
    half = z_crit * sqrt(p*(1-p)/n)
    print(row.group, (p - half, p + half))


**Вывод:** если `p_value < 0.05`, отличия статистически значимы.