# Параметрические методы проверки гипотез.

**Параметрические статистические** тесты предполагают, что выборка данных была взята из определенного распределения. Они часто ссылаются на статистические тесты, предполагающие **распределение Гаусса**. Поскольку данные часто соответствуют этому распределению, чаще используются параметрические статистические методы.

Типичный вопрос, который у нас может возникнуть в отношении двух или более выборок данных, заключается в том, имеют ли они одинаковое распределение. **Параметрические тесты статистической значимости** — это те статистические методы, которые предполагают, что данные поступают из одного и того же распределения Гаусса, то есть распределения данных с одним и тем же средним значением и стандартным отклонением.

В общем, каждый тест вычисляет тестовую статистику, например, p-значение, которое можно использовать для интерпретации результата теста. Значение p можно рассматривать как вероятность наблюдения двух выборок данных при базовом предположении (нулевой гипотезе), что две выборки были взяты из совокупности с одинаковым распределением.

Значение p можно интерпретировать в контексте выбранного уровня значимости, называемого **альфа**. Обычное значение альфы составляет 5% или 0,05. Если p-значение ниже уровня значимости, то тест говорит, что имеется достаточно доказательств, чтобы отклонить нулевую гипотезу, и что выборки, вероятно, были взяты из данных с различным распределением:
- p <= alpha: отклонить нулевую гипотезу, другое распределение.
- p > alpha: невозможно отклонить нулевую гипотезу, то же распределение.

## Тестовые данные

Прежде чем мы рассмотрим конкретные тесты параметрической значимости, давайте сначала определим набор тестовых данных. Мы создадим две выборки, взятые из разных наборов. Каждая выборка будет взята из распределения Гаусса.

Мы будем использовать функцию **randn()** пакета **NumPy** для создания выборки из 100 гауссовых случайных чисел со средним значением 0 и стандартным отклонением 1. Наблюдения в первой выборке масштабируются, чтобы задать среднее значение 50 и стандартное отклонение, равное 5. Наблюдения во второй выборке масштабируются, чтобы иметь задать значение 51 и стандартное отклонение 5.

Мы ожидаем, что статистические тесты обнаружат, что выборки были взяты из разных распределений, хотя небольшой размер выборки в 100 наблюдений на выборку добавит некоторый шум к этому решению.

In [None]:
# Генерация выборок гауссовых данных
from numpy.random import seed
from numpy.random import randn
from numpy import mean
from numpy import std
# запуск генератора случайных чисел
seed(1)
# генерация двух наборов
data1 = 5 * randn(100) + 50
data2 = 5 * randn(100) + 51
# оценка
print('набор данных 1: среднее=%.3f стандартное отклонение=%.3f' % (mean(data1), std(data1)))
print('набор данных 2: среднее=%.3f стандартное отклонение=%.3f' % (mean(data2), std(data2)))

набор данных 1: среднее=50.303 стандартное отклонение=4.426
набор данных 2: среднее=51.764 стандартное отклонение=4.660


При выполнении примера создаются выборки данных, затем вычисляются и распечатываются среднее значение и стандартное отклонение для каждой выборки, подтверждая их различное распределение.

## t-критерий Стьюдента

**Критерий Стьюдента** (названное в честь Уильяма Госсета, который использовал псевдоним «Студент») — это проверка статистической гипотезы о том, что две независимые выборки данных, о которых известно, что они имеют распределение Гаусса, имеют одно и то же распределение Гаусса.

Одним из наиболее часто используемых **t-тестов** является **t-критерий независимых выборок**. Этот тест используется, когда нужно сравнить средние значения двух независимых выборок для данной переменной.

Предположение или нулевая гипотеза теста состоит в том, что средние значения двух совокупностей равны. Отказ от этой гипотезы указывает на наличие достаточных доказательств того, что средние значения наборов различны и распределения не равны:
- Не удалось отклонить H0: распределения выборок равны.
- Удалось отклонить H0: распределения выборок не равны.

Критерий Стьюдента доступен в Python через функцию **ttest_ind()** пакета **SciPy**. Функция принимает две выборки данных в качестве аргументов и возвращает рассчитанную статистику и p-значение.

Мы можем продемонстрировать t-критерий Стьюдента на наших тестовых данных, ожидая, что тест обнаружит разницу в распределении между двумя независимыми выборками.

In [None]:
# t-test Стьюдента
from numpy.random import seed
from numpy.random import randn
from scipy.stats import ttest_ind
# запуск генератора случайных чисел
seed(1)
# генерация двух наборов
data1 = 5 * randn(100) + 50
data2 = 5 * randn(100) + 51
# сравнение выборок
stat, p = ttest_ind(data1, data2)
print('Статистики=%.3f, p=%.3f' % (stat, p))
# мнтерпретация
alpha = 0.05
if p > alpha:
	print('Распределения выборок равны (не удалось отклонить H0)')
else:
	print('Выборки различны (удалось отклонить H0)')

Статистики=-2.262, p=0.025
Выборки различны (удалось отклонить H0)


При выполнении примера вычисляется t-критерий Стьюдента для сгенерированных выборок данных и печатается статистика и p-значение. Интерпретация статистики показывает, что выборочные средние значения различаются со значимостью не менее 5%.

## Парный критерий Стьюдента

Мы можем захотеть сравнить средние между двумя выборками данных, которые каким-то образом связаны. Например, выборки данных могут представлять собой две независимые меры или оценки одного и того же объекта. Эти выборки данных являются повторяющимися или зависимыми и называются **парными выборками** или **повторными измерениями**.

Поскольку выборки не являются независимыми, мы не можем использовать критерий Стьюдента. Вместо этого мы должны использовать модифицированную версию теста, которая корректирует тот факт, что выборки данных зависимы, называемую **парным t-критерием Стьюдента**.

Критерий Стьюдента зависимых выборок также используется для сравнения двух средних значений одной зависимой переменной. Однако, в отличие от теста независимых выборок, t-критерий зависимых выборок используется для сравнения средних значений одной выборки, двух совпадающих или парных выборок.

Тест упрощен, потому что он больше не предполагает, что между наблюдениями есть различия. Предположение по умолчанию или нулевая гипотеза теста состоит в том, что между выборками нет разницы в средних значениях. Отклонение нулевой гипотезы указывает на то, что имеется достаточно доказательств того, что выборочные средние значения различны:
- Не удалось отклонить H0: Распределения парных выборок равны.
- Удалось отклонить H0: Распределения парных выборок не равны.

Парный t-критерий Стьюдента можно реализовать на Python с помощью функции **ttest_rel()** пакета **SciPy**. Как и в непарной версии, функция принимает в качестве аргументов две выборки данных и возвращает рассчитанную статистику и p-значение.

Мы можем продемонстрировать парный критерий Стьюдента на нашем тестовом наборе данных. Хотя выборки независимы, а не парны, мы все-же попробуем вычислить статистику.

In [None]:
# Парный t-test Стьюдента
from numpy.random import seed
from numpy.random import randn
from scipy.stats import ttest_rel
# запуск генератора случайных чисел
seed(1)
# генерация двух наборов
data1 = 5 * randn(100) + 50
data2 = 5 * randn(100) + 51
# сравнение выборок
stat, p = ttest_rel(data1, data2)
print('Statistics=%.3f, p=%.3f' % (stat, p))
# оценка
alpha = 0.05
if p > alpha:
	print('Распределения выборок равны (не удалось отклонить H0)')
else:
	print('Выборки различны (удалось отклонить H0)')

Statistics=-2.372, p=0.020
Выборки различны (удалось отклонить H0)


При выполнении примера вычисляются и печатаются статистика теста и значение p. Интерпретация результата предполагает, что выборки имеют разные средние значения и, следовательно, разные распределения.

## Анализ дисперсии теста

Иногда бывают ситуации, когда у нас может быть несколько независимых выборок данных. Мы можем выполнить t-критерий Стьюдента попарно для каждой комбинации выборок данных, чтобы получить представление о том, какие выборки имеют разные средние значения. Это может быть обременительно, если нас интересует только то, имеют ли все выборки одинаковое распределение или нет.

Чтобы ответить на этот вопрос, мы можем использовать тест **дисперсионного анализа** или сокращенно **ANOVA**. **ANOVA** — это статистический тест, который предполагает, что средние значения для 2 или более групп равны. Если данные свидетельствуют о том, что это не так, нулевая гипотеза отклоняется и хотя бы одна выборка данных имеет другое распределение:
- Не удалось отклонить H0: все распределения выборок равны.
- Удалось отклонить H0: одно или несколько распределений выборок не равны.

Важно отметить, что тест может только прокомментировать, одинаковы ли все образцы или нет; он не может количественно определить, какие образцы отличаются или насколько.

Цель **однофакторного дисперсионного анализа** (**односторонний дисперсионный анализ**) состоит в том, чтобы сравнить средние значения двух или более групп (независимая переменная) по одной зависимой переменной, чтобы увидеть, значительно ли отличаются групповые средние значения друг от друга.

Тест требует, чтобы выборки данных представляли собой распределение Гаусса, чтобы выборки были независимыми и чтобы все выборки данных имели одинаковое стандартное отклонение.

Тест ANOVA можно выполнить на Python с помощью функции **f_oneway()** пакета **SciPy**. Функция принимает две или более выборки данных в качестве аргументов и возвращает тестовую статистику и f-значение.

Мы можем изменить нашу тестовую задачу, чтобы иметь две выборки с одинаковым средним значением и третью выборку с немного другим средним значением. Затем мы ожидаем, что тест обнаружит, что по крайней мере одна выборка имеет другое распределение.

In [None]:
# Тест дисперсионного анализа
from numpy.random import seed
from numpy.random import randn
from scipy.stats import f_oneway
# запуск генератора случайных чисел
seed(1)
# генерация двух наборов
data1 = 5 * randn(100) + 50
data2 = 5 * randn(100) + 50
data3 = 5 * randn(100) + 52
# сравнение выборок
stat, p = f_oneway(data1, data2, data3)
print('Статистика=%.3f, p=%.3f' % (stat, p))
# интерпретация
alpha = 0.05
if p > alpha:
	print('Распределения выборок равны (не удалось отклонить H0)')
else:
	print('Выборки различны (удалось отклонить H0)')

Статистика=3.655, p=0.027
Выборки различны (удалось отклонить H0)


При выполнении примера вычисляются и печатаются статистика теста и значение p. Интерпретация p-значения правильно отвергает нулевую гипотезу, указывающую на то, что одно или несколько выборочных средних различаются.

## Тест ANOVA с повторными измерениями

У нас может быть несколько выборок данных, которые каким-то образом связаны или зависят друг от друга.

Например, мы можем повторить одни и те же измерения объекта в разные периоды времени. В этом случае выборки перестанут быть независимыми; вместо этого у нас будет несколько парных образцов.

Мы могли бы повторить попарный критерий Стьюдента несколько раз. В качестве альтернативы мы можем использовать один тест, чтобы проверить, имеют ли все выборки одинаковое среднее значение. Можно использовать вариант теста ANOVA, модифицированный для проверки более чем двух образцов. Этот тест называется **тестом повторных измерений ANOVA**.

Предположение по умолчанию или нулевая гипотеза состоит в том, что все парные выборки имеют одно и то же среднее значение и, следовательно, одинаковое распределение. Если выборки предполагают, что это не так, то нулевая гипотеза отклоняется, и одна или несколько парных выборок имеют другое среднее значение:
- Не удалось отклонить H0: все распределения парных выборок равны.
- Удалось отклонить H0: одно или несколько распределений парных выборок не равны.

Однако дисперсионный анализ с повторными измерениями имеет ряд преимуществ по сравнению с парными t-тестами. Во-первых, с помощью дисперсионного анализа с повторными измерениями мы можем исследовать различия зависимой переменной, которая была измерена более чем в два момента времени, тогда как с помощью независимого t-критерия мы можем сравнивать оценки зависимой переменной только в два момента времени.