# Статистические гипотезы

Для того чтобы самостоятельно сформулировать гипотезу, лучше всего использовать следующий формат утверждения:

ЕСЛИ Я (СДЕЛАЮ ЭТО С НЕЗАВИСИМОЙ ПЕРЕМЕННОЙ), ТОГДА (ЭТО ПРОИЗОЙДЁТ С ЗАВИСИМОЙ ПЕРЕМЕННОЙ).

Хорошее изложение гипотезы должно:

✔️ Включать утверждения «если» и «тогда».

✔️ Включать как независимые, так и зависимые переменные.

✔️ Поддаваться проверке с помощью экспериментов, опросов или других научно обоснованных методов.

**Статистической** называют гипотезу о распределении вероятностей, лежащем в основе наблюдаемой выборки данных. Важно переформулировать статистическую гипотезу как нулевую (Н0) и альтернативную (Н1) гипотезы, чтобы иметь возможность проверить её математически.

**Альтернативная гипотеза (Н1)** — это, как правило, ваша исходная гипотеза, предсказывающая взаимосвязь между переменными. В преобладающем большинстве случаев **нулевая гипотеза (Н0)** — это предсказание отсутствия связи между интересующими вас переменными (хотя иногда нулевая гипотеза может звучать другим образом).

Нулевая гипотеза предполагает отсутствие разницы между параметрами или распределениями выборки. 

В статистике **параметр** — это описание совокупности. Например, если вы спросите всех в университете (совокупности) об их среднем росте, вы получите параметр, истинное описание популяции, поскольку спросили всех. 

Математически Н0 формулируется в виде равенства. Если нулевая гипотеза отклоняется, то мы переходим к альтернативной гипотезе, противоречащей Н0.

Н0: Нулевая гипотеза — статистическая гипотеза, подлежащая проверке.

Н1: Альтернативная гипотеза — альтернатива нулевой гипотезе.

Каждый раз, как вы сталкиваетесь с задачей на определение нулевой и альтернативной гипотезы, начните с поиска утверждения, которое вы хотите доказать и которое может быть представлено в виде неравенства. Это ваша альтернативная гипотеза. Для того чтобы произвести доказательство альтернативной гипотезы, мы формулируем нулевую гипотезу в виде равенства. Две гипотезы противоречат друг другу. Следовательно, для доказательства альтернативной гипотезы нам достаточно опровергнуть нулевую.

# Статистическая значимость

Ошибка I (первого)  рода: отклонение нулевой гипотезы, если она верна.

Ошибка II (второго)  рода: принятие нулевой гипотезы, если она ложна.

Для определения того, что связь между двумя или более переменными вызвана чем-то иным, чем случайность, используется понятие статистической значимости p-value. 

**P-value** — это вероятность обнаружения наблюдаемых результатов, когда нулевая гипотеза () верна.

Статистическая значимость произвольна: она зависит от порога, называемого уровнем значимости  a (альфа).  

**Уровень значимости a** — это фиксированная вероятность ошибочного отклонения истинной нулевой гипотезы, то есть вероятность ошибки I рода. 

Если *p-value* вашего теста **ниже уровня значимости**, это означает, что ваши результаты статистически значимы и согласуются с альтернативной гипотезой. Если *p-value* **выше уровня значимости**, ваши результаты считаются статистически незначимыми и мы не можем отвергнуть нулевую гипотезу. 

 Помимо a , мы должны учитывать b (бета), вероятность ошибки II рода. Если b определяет риск ложноотрицательного результата, то 1-b  — это вероятность не допустить ошибки II рода. Такая вероятность называется «мощность теста». Чем ниже b, тем выше мощность. 

Установив частоту ошибок I рода, вы также косвенно влияете на размер частоты ошибок II рода. По этой причине хорошим балансом служат обычно используемые уровни à=0.01, 0.05 или 0.10. 

### Проверка гипотезы

Общий алгоритм проверки гипотезы состоит из пяти основных этапов:

- Изложение исследовательской гипотезы как нулевой (Н0) и альтернативной (Н1) гипотезы.
- Выбор уровня значимости (а).
- Сбор данных для проверки гипотезы.
- Выполнение соответствующего статистического теста: вычисление p-value и сравнение его с уровнем значимости.
- Формулировка вывода: отклонить или не отклонять нулевую гипотезу.

**Двусторонний тест** — это статистический тест, в котором критическая область распределения является двусторонней и проверяет, больше или меньше выборка определённого диапазона значений. Если тестируемая выборка попадает в одну из критических областей, вместо нулевой гипотезы принимается альтернативная гипотеза.

# Тесты на нормальность

Существует ряд методов, с помощью которых можно проверить, является ли используемая выборка данных гауссовской, чтобы использовать стандартные методы, или выборка не подчиняется нормальному закону распределения. Во втором случае вместо стандартных (параметрических) статистических тестов необходимо использовать непараметрические статистические методы.

Если вы установили, к какому закону принадлежит распределение вашего признака, например к распределению Пуассона, то рекомендуется использовать специальные параметрические тесты, ориентированные именно на этот конкретный закон, так как они дадут более корректные результаты. 

**Тест Шапиро-Уилка** оценивает выборку данных и определяет, насколько вероятно, что данные были получены из распределения Гаусса.

**Тест Д’Агостино Kв2** вычисляет эксцесс и перекос по данным, чтобы определить, отклоняется ли распределение данных от нормального распределения.

**Перекос** — это количественная оценка того, насколько распределение смещено влево или вправо, мера асимметрии в распределении.

**Эксцесс** количественно определяет, какая часть распределения находится в хвосте. 

После того как тест на нормальность пройден, чтобы определить, какой статистический тест использовать, необходимо знать типы переменных, с которыми вы имеете дело.

Напомним, что числовые (количественные) переменные включают в себя два типа:

1. **Непрерывные**: представляют собой меры и обычно могут быть представлены в виде делений меньше единицы (например, 0.75 грамма).
2. **Дискретные**: представляют собой счётчики и обычно не могут быть представлены в виде делений меньше единицы (например, 1 дерево).

Помимо числовых выделяют категориальные и бинарные переменные. 

- К **категориальным** относятся те признаки, которые можно разбить на категории, например уровень образования: начальный, средний, высший. 
- **Бинарными** являются переменные, которые могут принимать лишь два значения, например пол студента: мужской или женский.

# Параметрические тесты

Наиболее распространённые типы параметрических тестов включают **корреляционные** и **сравнительные** тесты.

## Корреляционные тесты

Наиболее распространённым является параметрический тест на корреляцию Пирсона. Другие изученные вами типы корреляций, например корреляция Спирмена, относятся к непараметрическим тестам.

## Сравнительные тесты

Сравнительные тесты ищут различия между средними параметрами по группам. Их можно использовать для проверки влияния категориальной переменной на среднее значение какой-либо другой характеристики. 

**Т-тест (t-критерий)** используется при сравнении средних значений ровно двух групп одной совокупности (например, среднего роста мужчин и женщин).

**Независимый T-тест** проверяет разницу между одной и той же переменной из разных совокупностей (например, сравнение собак и кошек). Стоит отметить, что T-тест используется на выборках размером меньше 30. 

В случае, если объём выборки превышает 30, используется **z-тест**. Для проведения z-теста необходимо владеть информацией о разбросе данных. Таким образом, z-тест используется для определения того, различаются ли рассчитанные средние значения двух выборок в случае, если доступно стандартное отклонение и выборка велика. T-тест используется для определения того, как средние значения различных наборов данных отличаются друг от друга, если стандартное отклонение или дисперсия неизвестны.

Тесты **ANOVA** и **MANOVA** используются при сравнении средних значений более чем двух групп (например, среднего роста детей, подростков и взрослых).

# Непараметрические тесты

Непараметрические тесты не делают предположений о нормальности данных и не привязаны к типу шкалы измерения признаков. 

## Корреляционные тесты

Для поиска зависимостей между не гауссовскими или категориальными величинами часто используют тест на **корреляцию Спирмена** и Xв2-тест (Хи-квадрат-тест).

**Критерий Хв2** оценивает, являются ли ожидаемые частоты каждой переменной значимо отличающимися от наблюдаемых частот или нет. 

## Тесты на сравнение выборок

**Критерий Уилкоксона** используется для сравнения двух независимых выборок путём анализа их медианных значений. 

**Критерий Краскела-Уоллиса** предназначен для сравнения распределений в нескольких выборках. 

**ANOSIM (анализ сходства)** — это непараметрический тест на наличие существенных различий между двумя или более группами, основанный на любой мере расстояния.