## Расчет p-value для долей (SE proportions)

In [1]:
import math
from scipy import stats

In [2]:
def calculate_p_value(clicks_a, impressions_a, clicks_b, impressions_b):
    # Вычисляем пропорции
    p1 = clicks_a / impressions_a
    p2 = clicks_b / impressions_b
    
    # Вычисляем общую пропорцию
    p_pooled = (clicks_a + clicks_b) / (impressions_a + impressions_b)
    
    # Вычисляем стандартную ошибку - se proportion
    se = math.sqrt(p_pooled * (1 - p_pooled) * (1/impressions_a + 1/impressions_b))
    
    # Вычисляем z-статистику
    z = (p2 - p1) / se
    
    # Вычисляем p-value
    p_value = 2 * (1 - stats.norm.cdf(abs(z)))
    
    return p_value

In [10]:
# Пример использования
impressions_a = 1752
clicks_a = 10
impressions_b = 1742
clicks_b = 7

p_value = calculate_p_value(clicks_a, impressions_a, clicks_b, impressions_b)
print(f"P-value: {p_value:.4f}")

if p_value < 0.05:
    print('Тест значим')
else:
    print('Нулевая гипотеза не опровергнута')

P-value: 0.4730
Нулевая гипотеза не опровергнута


## Расчет p-value для средних значений (SE means)

In [None]:
from math import sqrt
import scipy.stats as st

sp = 20 # предполагаемое среднее
n = 64 # выборка
mean = 18.5 # наше среднее
std = 4 # стандартное отклонение

se = std / sqrt(n) # se mean
z_value = (mean - sp) / se
p_score = st.norm.cdf(z_value)*2
print(f"Стандартное отклонение: {se}\nZ-значение: {z_value}\np-value: {p_score:4f}")