## Проверка статистических гипотез (для нормального распределения)

### Задача  
В среднем пользователь пользуется нашим приложением 20 раз в день. Ваш коллега добавил несколько новых функций в приложение и сделал их доступными для части пользователей (N=64),  
а через какое-то время снова замерил среднее количество использования приложением пользователями, теперь среднее равно 18.4 раз со стандартным отклонением 4.  
H0: ничего не поменялось, результат случайный  
H1: изменение значимо, пользователи стали реже пользоваться приложением.

In [8]:
import scipy.stats as st

M = 20

n = 64
mean = 18.5
sd = 4

# H0: M = 20
# H1: M! = 20
alpha = 0.05

Если верна H_0, то в соответствии с ЦПТ выборочные средние распределились бы нормально вокруг среднего ГС (пока что мы думаем, что оно 20)  
со стандартным отклонением (стандартной ошибкой среднего):

In [2]:
se = sd / (n ** 0.5)
print('se:', se)

se: 0.5


Теперь посчитаем, насколько наше выборочное среднее (18.4) отклонилось от среднего ГС (20) в единицах стандартного отклонения → сделаем Z-преобразование:

In [3]:
Z = (mean - M) / se
print('Z:', Z)

Z: -3.0


Как это интерпретировать: если бы среднее в ГС было равно 20, то наше выборочное среднее находилось бы от него в 3 стандартных отклонениях (в левую сторону).  
  
Теперь считаем вероятность такого (-3 или 3) или еще более сильного отклонения (>-3 или 3<)  

In [4]:
p_value = st.norm.cdf(Z) * 2
print('p_value:', p_value)

p_value: 0.0026997960632601866


Чем меньше p-значение, тем больше оснований отклонить нулевую гипотезу. Классические пороги для отклонения нулевой гипотезы равны 0.05 или 0.01 (более строгий вариант).

In [5]:
if p_value > alpha:
    print('do not reject H0')
else:
    print('reject H0')

reject H0


Вывод: в нашем случае коллега статистически значимо ухудшил приложение

### Ошибки первого и второго рода  
Ошибка 1 рода (False positive): отклонили нулевую гипотезу, хотя она была верна (сказали, что есть эффект, когда на деле его нет, false alarm)  
Ошибка 2 рода (False negative): не отклонили нулевую гипотезу, хотя верна была альтернативная (говорим, что нет эффекта, когда на самом деле он есть)  