In [None]:
import pandas as pd
import numpy as np
from statsmodels.stats.proportion import proportions_ztest
import statsmodels.api as sm

# Задача 2 - Проверка гипотезы о добавлении нового фильтра на сайт

### Мы хотим проверить гипотезу о том, что добавление нового фильтра увеличивает количество бронирований.
### Результат, который мы хотим достичь с помощью нового фильтра, - это увеличение количества бронирований.
### Целевая метрика для сравнения контрольной и тестовой групп - конверсия в бронирование после перехода на сайт, так как количество переходов на сайт одинаковое в группах
### Конверсия = кол-во бронирований / кол-во заходов на сайт

In [None]:
count1 = 450
n1 = 5000
count2 = 300
n2 = n1

In [None]:
conversion_a = count2 / n2
conversion_a

0.06

In [None]:
conversion_b = count1 / n1
conversion_b

0.09

## Гипотезы:
- H0: conversion_b <= conversion_a

  Конверсия в группе Б не превышает конверсию в группе А


- H1: conversion_b > conversion_a

  Конверсия в группе Б больше, чем конверсия в группе А

## Z-test для сравнения двух биномиальных распределений

In [None]:
success_cnts = np.array([count1, count2])
total_cnts = np.array([n1, n2])
test_stat, pval = proportions_ztest(count=success_cnts, nobs=total_cnts, alternative='larger')
print('One-sided z-test: z = {}, p value = {}'.format(test_stat, pval))

One-sided z-test: z = 5.694947974514993, p value = 6.170477315681293e-09


p-value < 0,05 => отклоняем нулевую гипотезу. Конверсия в группе Б больше, чем конверсия в группе А, и это различие статисчтически значимо.



## Доверительные интервалы для конверсии в каждой группе

In [None]:
low_a, high_a = sm.stats.proportion_confint(count=count2, nobs=n2, alpha=0.05, method='wilson')

In [None]:
print(low_a, high_a)

0.05374897325570841 0.06692660445594185


In [None]:
low_b, high_b = sm.stats.proportion_confint(count=count1, nobs=n1, alpha=0.05, method='wilson')

In [None]:
print(low_b, high_b)

0.08237915058874333 0.0982503650062035


Доверительные интервалы не пересекаются, что подтверждает, что различие в конверсиях групп А и Б статистически значимо.