# Проверка гипотез.

**Гипотезы** — это утверждения, которые формулируются для проведения исследований. Мы можем использовать статистические маетоды (статистические тесты) и данные наблюдений, чтобы подтвердить или опровергнуть их. Таким образом, мы можем проверить, является ли наше утверждение истинным.

## Определение гипотез

Прежде всего, мы должны понять, на какой вопрос мы ищем ответ, и он должен быть сформулирован в виде **Нулевой Гипотезы (H₀)** и **Альтернативной Гипотезы (H₁ или Hₐ)**. Нужно помнить, что H₀ и H₁ должны быть **взаимоисключающими**, а H₁ не должно содержать равенства:

- H₀: μ=x, H₁: μ≠x
- H₀: μ≤x, H₁: μ>x
- H₀: μ≥x, H₁: μ<x

### Проверка предположений

Все статистические тесты можно разделить на две основные группы:  **параметрические**  и  **непараметрические**. Обе группы служат для одних и тех же задач, но делают это в немного по-разному.

**Параметрические тесты** используются только тогда, когда предполагается нормальное (или близкое к нормальному) распределение. Наиболее широко используемыми тестами являются **Z-тест**, **t-тест** и **ANOVA**.

**Непараметрические тесты** используются, когда непрерывные данные не распределены нормально или когда данные дискретны. Методы, которые относятся к этой группе - **критерий хи-квадрат**, **точный критерий Фишера**, **U-критерий Манна-Уитни**.

Как определится с группой тестов?

Чтобы решить, использовать ли параметрическую или непараметрическую версию теста, мы должны проверить конкретные требования, перечисленные ниже:

- Наблюдения в каждой выборке независимы и одинаково распределены.
- Наблюдения в каждой выборке распределены нормально.
- Наблюдения в каждой выборке имеют одинаковую дисперсию.

Сделаем небольшые пояснения. 

Две выборки зависят друг от друга (**зависимые выборки**), если каждому значению одной выборки можно закономерным и однозначным способом поставить в соответствие ровно одно значение другой выборки. Аналогично определяется зависимость нескольких выборок.

Чаще всего зависимые выборки возникают, когда измерение проводится для нескольких моментов времени, например, одного процесса. Таким образом, зависимые выборки образуют значения параметров изучаемого процесса, соответствующие различным моментам времени. 


**Независимые (несвязанные) выборки** - выборки, в которые объекты исследования набирались независимо друг от друга. Например, если экспериментальная (основная) и контрольная группы при сравнении различных методов лечения формируются с помощью случайного выбора из некоторого набора пациентов, то такие выборки являются независимыми.  

Давайте рассмотрим это на примере медицинского эксперимента. Организуются две гурппы участников:

- **экспериментальной группа**, группа, которая что-то делает, получает что-то или формирует новую функцию, которую мы пытаемся изучить. В нашем случае группа получает экспериментальное лекарство.

- **контрольная группа**, то есть группа, которая ничего не делает, ничего не получает или не меняется в своей работе. Участники группы не получают лекарства, им выдается обычный мел или сахарная таблетка. 


Можно использовать различные способы для формирования групп, чтобы сделать эксперимент более надежным. Например:

- **Слепой  эксперимент**  — это когда участники не знают, входят ли они в контрольную или экспериментальную группу.

- **Двойной  слепой эксперимент**  — это когда ни участники, ни люди, проводящие обследование, не знают, принадлежит ли участник к контрольной или экспериментальной группе.

- **Блокировка**  - разделение участников на связанные группы. Например, мы можем блокировать по полу, случайным образом выбирая равное количество мужчин и женщин вместо случайной выборки, в которой количество мужчин и женщин не контролируется. Например, если затем половине мужчин и половину женщин дают препарат, а другой половине мужчин и другой половине женщин дадут пустышку. Блокировка по полу поможет увидеть, действует ли препарат и влияет ли он на мужчин и женщин по-разному.

- **Совпадающие  пары** - это эксперимент с более конкретным видом блокировки. Участники  экспериментальной группы и контрольной группы подобраны по сходным характеристикам. Например, чтобы посмотреть, как пол и возраст меняют действие препарата от кровяного давления. Мы можем сопоставить возраст и пол в контрольной группе с возрастом и полом в  экспериментальной группе - помещаем одного 18-летнего мужчину в экспериментальную группу, а другого 18-летнего мужчину — в контрольную группу. План эксперимента с подобранными парами является улучшением по сравнению с полностью случайным планом. Участников по-прежнему случайным образом распределяют по экспериментальной и контрольной группам, но в ходе эксперимента учитываются потенциально мешающие переменные, такие как возраст и пол.

### Выбор правильного теста

После определения с требованиями и выбора версии теста, мы выбираем соответствующий тест для использования. При выборе правильного теста важно проанализировать, сколько групп сравнивается и являются ли данные парными или нет. 

Чтобы определить, совпадают ли данные, необходимо рассмотреть, были ли данные собраны от одних и тех же лиц. 

Далее, подходящий тест выбирается по следующей схеме.

<img src="https://github.com/SerjiEvg/data-analysis/raw/main/images/%D0%A1%D1%85%D0%B5%D0%BC%D0%B0%20%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%B0%20%D0%BC%D0%B5%D1%82%D0%BE%D0%B4%D0%B0%20%D0%BF%D1%80%D0%BE%D0%B2%D0%B5%D1%80%D0%BA%D0%B8%20%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7%D1%8B.png" width="1000"/>

### Решение и заключение

После выполнения проверки гипотезы мы получаем **связанное значение p**, которое показывает **значимость теста**.

Если **p-значение** меньше, чем **альфа (уровень значимости)**, другими словами, имеется достаточно доказательств, чтобы утверждать, что H₀ недействителен; и мы можем отказаться от H₀. В противном случае мы не можете отвергнуть H₀. 

Нужно всегда помнить, что отказ от H₀ подтверждает H₁. Однако отказ от отклонения H₀ не означает, что H₀ действителен, и не означает, что H₁ неверен.

## Пример прохождения этапов проверки гипотезы (независимый t-тест)

Профессор университета читал онлайн-лекции вместо очных занятий из-за Covid-19. Позже он загружал в облако записанные лекции для студентов, которые **асинхронно** слушали курс (тех, кто не посещал урок, но позже смотрел записи). Однако он считает, что учащиеся, которые посещают занятия в учебное время (**синхронно**) и участвуют в процессе, более успешны. Поэтому он записал средние оценки студентов в конце семестра. 

Данные представлены ниже.

In [None]:
synchronous = [94. , 84.9, 82.6, 69.5, 80.1, 79.6, 81.4, 77.8, 81.7, 78.8, 73.2, 87.9, 87.9, 93.5, 82.3, 79.3, 78.3, 71.6, 88.6, 74.6, 74.1, 80.6]
asynchronous = [77.1, 71.7, 91. , 72.2, 74.8, 85.1, 67.6, 69.9, 75.3, 71.7, 65.7, 72.6, 71.5, 78.2]

Проведем проверку гипотезы, чтобы проверить, является ли предположение профессора статистически значимым, используя **уровень значимости 0,05** для оценки нулевой и альтернативной гипотез.

Прежде чем приступать к проверке гипотез, проверим соответствующие предположения. 

#### Определение гипотезы

Поскольку оценки получены от разных людей, данные **непарные**. Рассматриваются две группы, и по схеме мы выбираем **параметрический независимый t-тест**.

H₀: μₛ≤μₐ (**нулевая гипотеза** - оценки студентов с синхронным посещением занятий не лучше, чем оценки студентов с асинхронным посещением)

H₁ : μₛ>μₐ (**альтернативная гипотеза** - оценки студентов с синхронным посещением занятий лучше, чем оценки студентов с асинхронным посещением)

#### Проверка предположений

Установим дополнительные пакеты, которые нам понадобятся

In [None]:
!pip install scikit_posthocs

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting scikit_posthocs
  Downloading scikit_posthocs-0.7.0-py3-none-any.whl (38 kB)
Installing collected packages: scikit-posthocs
Successfully installed scikit-posthocs-0.7.0


In [None]:
import scikit_posthocs as sp
import numpy as np
from scipy import stats
import pandas as pd
pd.options.display.float_format = '{:,.4f}'.format

Для проверки нормальности мы используем **W-критерий Шапиро-Уилка**, который обычно предпочтительнее для небольших выборок. Однако есть и другие варианты, такие как критерий **Колмогорова-Смирнова**, **Д'Агостино** и **Пирсона** (более исчерпывающую информацию можно получить [здесь](https://docs.scipy.org/doc/scipy/reference/stats.html))

In [None]:
def check_normality(data):
    test_stat_normality, p_value_normality=stats.shapiro(data)
    print("p value:%.4f" % p_value_normality)
    if p_value_normality <0.05:
        print("Отклонить нулевую гипотезу >> Данные не распределены нормально")
    else:
        print("Не удалось отвергнуть нулевую гипотезу >> Данные нормально распределены")  

In [None]:
check_normality(synchronous)
check_normality(asynchronous)

p value:0.6556
Не удалось отвергнуть нулевую гипотезу >> Данные нормально распределены
p value:0.0803
Не удалось отвергнуть нулевую гипотезу >> Данные нормально распределены


Формулируем гипотезы для проверки равенства дисперсий:
- H₀: дисперсии выборок одинаковы.
- H₁: дисперсии выборок различны.

Для проверки однородности дисперсии мы используем **тест Левена**, но также можете задействовать и **тест Бартлетта**. Более подробно [здесь](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.bartlett.html#scipy.stats.bartlett).

In [None]:
def check_variance_homogeneity(group1, group2):
    test_stat_var, p_value_var= stats.levene(group1,group2)
    print("p value:%.4f" % p_value_var)
    if p_value_var <0.05:
        print("Отклонить нулевую гипотезу >> Дисперсия выборок различна.")
    else:
        print("Не удалось отвергнуть нулевую гипотезу >> Дисперсия выборок одинакова.")

Функция проверяет нулевую гипотезу о том, что **дисперсии совокупности равны** (называется **однородностью дисперсии** или **гомоскедастичностью**). 

Предположим, что результирующее p-значение теста Левена меньше **уровня значимости (обычно 0,05)**. В этом случае маловероятно, что полученные различия в выборочных дисперсиях произошли на основе случайной выборки из совокупности с одинаковыми дисперсиями.

In [None]:
check_variance_homogeneity(synchronous, asynchronous)

p value:0.8149
Не удалось отвергнуть нулевую гипотезу >> Дисперсия выборок одинакова.


#### Проверка предположений

Поскольку предположения (независимости выборок, нормальности и однородности дисперсий) выполнены, мы можем выполнить параметрическую версию t-теста для 2 групп и непарных данных.

In [None]:
ttest,p_value = stats.ttest_ind(synchronous,asynchronous)
print("p-значение:%.8f" % p_value)
print("Так как гипотеза односторонняя >> используем p_value/2 >> p_value_one_side:%.4f" %(p_value/2))
if p_value/2 < 0.05:
    print("Отклонить нулевую гипотезу")
else:
    print("Не удалось отвергнуть нулевую гипотезу")

p-значение:0.00753598
Так как гипотеза односторонняя >> используем p_value/2 >> p_value_one_side:0.0038
Отклонить нулевую гипотезу


#### Решение и заключение

По результатам статистического теста мы отклонили нулевую гипотезу:

- H₀: μₛ≤μₐ (**нулевая гипотеза** - оценки студентов с синхронным посещением занятий не лучше, чем оценки студентов с асинхронным посещением)

тем самым подтверждая гипотезу H₁:
- H₁ : μₛ>μₐ (**альтернативная гипотеза** - оценки студентов с синхронным посещением занятий лучше, чем оценки студентов с асинхронным посещением)

**При заданном уровне значимости 0.05, имеется достаточно оснований для вывода о том, что средний балл студентов, изучающих курс синхронно, выше, чем у студентов, изучающих курс асинхронно.**