# Нулевая и альтернативная гипотезы
**Гипотеза** — это предположение или теоретическое представление о взаимосвязи между явлениями или воздействиями, которое требует проверки на основе фактических данных и экспериментов.
Основные цели формулирования гипотез в медицине:

* исследование причин возникновения заболеваний,
* разработка новых методов лечения,
* предупреждение распространения заболеваний.
Они могут быть как конкретными, основанными на научных данных, так и гипотетическими, открывающими новые пути исследования.

Формулируются гипотезы в начале исследования. Это необходимо, чтобы понимать, какие доказательства нужно собрать для их подтверждения или опровержения. Формулируется две гипотезы: нулевая (H0) и альтернативная (H1).

* Нулевая гипотеза (H0) — утверждение, которое мы стремимся опровергнуть. Обычно H0 формулируется как утверждение о том, что нет разницы или эффекта.

* Альтернативная гипотеза (H1) — утверждение, которое мы стремимся поддержать. Обычно H1 формулируется как утверждение о том, что существует разница или эффект.

* То есть нулевая гипотеза — гипотеза об отсутствии различий, а альтернативная гипотеза — о значимости различий.
**Принципы формулирования гипотез**
* Гипотезы должны быть конкретными и проверяемыми.
* Гипотезы должны быть сформулированы в терминах наблюдаемых переменных.
* Нулевая гипотеза должна быть исчерпывающей. То есть должна охватывать все возможные результаты, кроме тех, которые поддерживают альтернативную гипотезу.
* Альтернативная гипотеза должна быть исключающей. То есть должна исключать все возможные результаты, которые поддерживают нулевую гипотезу.
*Пример*
Нулевая гипотеза (H0): новое лекарство не более эффективно в снижении артериального давления у пациентов с гипертонией, чем плацебо.

Альтернативная гипотеза (H1): новое лекарство более эффективно в снижении артериального давления у пациентов с гипертонией, чем плацебо.

Если результаты исследования покажут, что новое лекарство статистически значимо более эффективно, чем плацебо, то мы отвергнем нулевую гипотезу и поддержим альтернативную. Это будет означать, что новое лекарство, вероятно, более эффективно в снижении артериального давления, чем плацебо.
# Классификации видов гипотез
**По содержанию**
* гипотезы о законах распределения
Н0: распределение длительности восстановления после операции у пациентов с ранением наружных геморроидальных узлов подчиняется экспоненциальному закону распределения.
* гипотезы о параметрах распределения
Н0: параметры распределения уровня определенного биомаркера у пациентов с диагностированным раком не изменятся после применения нового противоопухолевого препарата.
**Гипотезы о средних**
* о значимости различия между средними
Н0: средняя концентрация определенного белка в крови у пациентов с различными типами сахарного диабета не отличается.
* о равенстве среднего определенному значению
H0: среднее количество мочевины в моче у пациентов с хронической почечной недостаточностью в возрасте старше 60 лет превышает среднее количество у здоровых людей того же возраста.
**Гипотезы о дисперсиях**
* о равенстве дисперсий определенному значению
H0: дисперсия давления у пациентов с гипертонией равна 80 мм ртутного столба.
* о значимости различия дисперсий двух совокупностей
H0: дисперсия реакции пациентов на новое средство для лечения гипертонии будет различаться в зависимости от их возрастной группы.
**Гипотезы о коэффициентах корреляции**
* о равенстве коэффициентов корреляции определенному значению
H0: коэффициент корреляции между уровнем физической активности и уровнем холестерина у пациентов с сердечно-сосудистыми заболеваниями равен 0.6.
* о значимости различия коэффициентов корреляции двух совокупностей
H0: существует сильная отрицательная корреляция между уровнем стресса и чувствительностью к боли. Чем выше уровень стресса, тем ниже чувствительность к боли.
**Гипотезы о долях признака**
* о равенстве доли признака определенному значению
H0: доля пациентов, достигших полной ремиссии после лечения острого лимфобластного лейкоза у детей, равна 90% при использовании протокола лечения, включающего высокодозную химиотерапию и трансплантацию стволовых клеток.
* о значимости различия долей признака в двух совокупностях
H0: доля пациентов с определенным генетическим вариантом, обладающих высокой чувствительностью к определенному лекарству, выше среди женщин, чем среди мужчин.
**Гипотезы о независимости признаков в корреляционной таблице**
H0: уровень физической активности пациентов с заболеванием суставов не коррелирует с уровнем воспаления в их организме.
**По направленности**
* направленные 
Н0: эффективность нового препарата в лечении определенного заболевания не превышает эффективность стандартного лечения.
* ненаправленные
Н0: средний уровень холестерина у пациентов, принимающих новый препарат, не отличается от среднего уровня холестерина у пациентов, принимающих плацебо.
# Статистический критерий. Уровень статистической значимости
**Статистический критерий** — числовое значение или правило, используемое для принятия статистических решений на основе данных из выборки. Позволяет оценить вероятность того, что наблюдаемые различия или эффект случайны, а также помогает определить, являются ли полученные результаты статистически значимыми.
Два основных типа методов, используемых для проведения статистического анализа данных:

* параметрические,
* непараметрические.
**Параметрические критерии**, такие как t-критерий Стьюдента или дисперсионный анализ, предполагают, что данные распределены нормально и имеют определенные параметры. Они обычно более мощные, чем непараметрические критерии, и могут обеспечить более точные результаты при выполнении всех предпосылок.

**Непараметрические критерии**, такие как критерий Уилкоксона-Манна-Уитни или критерий Краскела-Уоллиса, являются более гибкими. Могут быть использованы в случаях, когда данные не удовлетворяют предположениям о нормальном распределении или равенстве дисперсий. Они менее чувствительны к отклонениям от стандартных условий и могут быть применены к нестандартным или категориальным данным.

**Уровень статистической значимости** — обозначается как p-значение, это вероятностный порог, который используется в статистическом анализе для оценки степени, до какого предела результаты исследования могут быть случайными. Он отражает вероятность того, что различия или связи между данными считаются статистически значимыми.
Большинство прикладных исследователей в медицине используют низший уровень статистической значимости, чтобы отклонить нулевую гипотезу H0:

p ≤ 0,05

Это означает, что различия достоверны или существенны на 5% уровне значимости. То есть вероятность того, что различия незначимы (несущественны, недостоверны) — не больше 5%.

Реже в медицинской статистике применяется достаточный уровень значимости — 1% (р≤0,01) и высший — 0,1% (р≤0,001).
**Ключевые факторы**
1. Контекст исследования

Важно понимать цель исследования, его методику, особенности выборки пациентов и другие аспекты, которые способны повлиять на интерпретацию статистических результатов.

2. Размер выборки

Статистическую мощность и уверенность в полученных результатах может повысить большой объем данных. Маленькие выборки могут исказить результаты или привести к недостоверным выводам.

3. Методы анализа данных

Корректность и аккуратность применяемых статистических методов играют важную роль. Неправильный выбор метода или его неправильная реализация может привести к неверным выводам.

4. Коррекция на множественные сравнения

При выполнении множественных сравнений возможно увеличение вероятности ложноположительных результатов. Поэтому важно применять соответствующие корректировки и учитывать этот фактор при интерпретации статистической значимости.

5. Предварительные гипотезы и предположения

Важно заранее четко определить гипотезы и предположения исследования. Некорректное формулирование или неясное понимание гипотез могут привести к ошибочным заключениям о статистической значимости.
# Мощность статистического критерия
**Мощность статистического критерия** — вероятность обнаружения статистически значимых различий между группами или переменными, если эти различия действительно существуют.\
**Ключевые факторы**
Существует несколько ключевых факторов, оказывающих влияние на уровень мощности статистического критерия в медицинских исследованиях. Важно учитывать, что низкая мощность может быть вызвана несколькими причинами:

1. Количество наблюдений в выборке

Чем больше размер выборки, тем выше статистическая мощность, что позволяет эффективнее выявлять наличие статистически значимых различий.

2. Величина эффекта

Если различия между группами или условиями малы, то для их выявления понадобится больший размер выборки.

3. Выбранный уровень значимости (обычно 0,05)

Понижение уровня значимости (например, до 0,01) может снизить мощность критерия.

4. Уровень шума или изменчивость данных

Если данные содержат большое количество шума, необходим больший размер выборки для выявления статистически значимых результатов.

5. Выбор конкретного статистического критерия

Некоторые критерии более эффективны при определенных условиях и размерах выборки, что может повлиять на способность критерия обнаруживать различия.
**Выбор статистического критерия**
При выборе статистического критерия для проверки гипотезы важно учитывать несколько ключевых аспектов, тщательный анализ которых поможет исследователю получить достоверные и интерпретируемые результаты:

1. О чем гипотеза и какой тип статистической задачи необходимо решить

Например, если исследователь хочет проверить эффективность нового метода лечения на пациентах с определенным заболеванием, то для этой задачи может потребоваться применение критериев для сравнения средних или процентов.

2. Шкалы измерения данных

Определение шкалы измерения (например, номинальной, порядковой, интервальной или относительной) позволяет выбрать соответствующий критерий для анализа данных.

Например, для количественных переменных часто применяют t-тест, а для категориальных переменных можно использовать критерий хи-квадрат (подробнее об этом мы расскажем в следующих модулях).

3. Размеры выборки

Количество наблюдений в выборке играет ключевую роль в определении статистической мощности и точности результатов исследования.

Большие выборки обладают способностью выявить даже незначительные различия между группами или переменными, что значительно улучшает достоверность и обобщаемость полученных данных. А недостаточно большая выборка может снизить статистическую мощность и привести к менее точным и интерпретируемым результатам.

Поэтому важно балансировать размер выборки, чтобы обеспечить адекватную статистическую мощность анализа и достоверность выводов исследования.

4. Применимость критерия к выборкам неравным по объему

Некоторые статистические критерии могут быть применены к выборкам разного размера. Но при этом нужно учитывать адекватность интерпретации результатов и возможность предвзятости в данных.

5. Возможности исследователя для расчета критерия

Исследователь должен обладать необходимыми знаниями и навыками для выбора и правильного применения статистического критерия, а также иметь доступ к соответствующим программным инструментам.
# Расчет объемов выборок
Расчет объема выборки в медицинских исследованиях напрямую влияет на мощность и точность результатов. При планировании исследования необходимо учитывать следующие факторы:

1. Величина ожидаемого эффекта

Чем меньше ожидаемый эффект, тем больше необходим образец для его обнаружения. Определение минимально значимого клинического эффекта является важным этапом при расчете объема выборки.
2. Уровень статистической значимости (обычно α = 0.05)

Чем стандартнее уровень значимости, тем больше образец необходим для обнаружения различий.
3. Определение желаемого уровня мощности исследования (обычно 0,8 или выше)

Позволяет оптимизировать объем выборки для обнаружения не только статистической, но и клинической значимости. Обычно выбирают мощность, равную 80–90%.
**Формулы**
Корректный расчет объемов выборок в медицинских исследованиях позволяет обеспечить достаточную мощность и точность результатов. Рассмотрим формулы расчета объемов выборок для двух групп: исследуемой и контрольной.

Критерий исхода — количественная переменная. Чтобы сравнить средние в двух независимых группах, минимальный объем групп рассчитывается по формуле:
![image.png](attachment:image.png)
# Статистические ошибки
**Случайная ошибка**
Если бы все единицы генеральной совокупности имели одно и то же значение изучаемого признака, то никакой случайной ошибки в статистических исследованиях не было бы:

* Если бы все 12-летние девочки имели рост 150 см, то какую бы выборку 12-летних девочек мы ни взяли, они имели бы средний рост равный 150 см.
* Если бы все студенты медицинских университетов не курили, то в любой выборке будущих врачей были бы только некурящие студенты.
* Если бы исследуемое лекарство было одинаково эффективно абсолютно для всех болеющих данным заболеванием, то какую бы выборку из заболевших мы ни рассматривали, результаты оценки эффективности лекарства были бы всегда одинаковы и равны 100%.
**Случайная ошибка** — это неизбежная ошибка любого выборочного исследования, связанная со случайностью отбора единиц из генеральной совокупности. Часть никогда не сможет абсолютно точно охарактеризовать целое, какой бы большой она ни была.
**Систематическая ошибка**
Это постоянное, неслучайное, однонаправленное отклонение результатов исследований от истинных характеристик генеральной совокупности.

**Систематическая ошибка** (смещение) принципиально отличается от случайной ошибки:

* Систематическая ошибка может появиться как при выборочном исследовании, так и при сплошном. При хорошо спланированном и выполненном исследовании этой ошибки может и не быть.
* Не связана с количественной репрезентативностью, ее величина почти не зависит от числа единиц наблюдения. В хорошо спланированном исследовании она может отсутствовать в малой выборке. В плохо спланированном исследовании она может быть огромной при изучении всей генеральной совокупности.
* Часто бывает связана с качественной репрезентативностью выборки.
* Искажает истинные характеристики генеральной совокупности только в одну сторону (либо в большую, либо в меньшую). Например, выборки, извлеченные из одной генеральной совокупности, снова и снова будут давать только завышенные оценки (либо только заниженные).
* Обычно появляется в плохо спланированном и неаккуратно выполненном исследовании. Может возникнуть на любом этапе работы: и при сборе материала, и при его разработке, и при его анализе, и при формулировании выводов.
* Величину систематической ошибки в большинстве случаев рассчитать невозможно. Можно только предположительно судить о направлении смещения. Часто исследователю вообще остается неизвестным, являются ли полученные оценки смещенными или нет.
# Причины появления статистических ошибок
Проведено экспериментальное исследование с целью изучить эффективность нового лекарственного средства «А». Испытуемых разделили на две группы:

* первая группа в течение месяца принимала новое лекарственное средство «А»,
* вторая группа также в течение месяца принимала лекарственное средство «В» (в настоящее время именно оно обычно используется для лечения изучаемой патологии).
Выявлено, что лекарство «А» более эффективно, чем лекарство «В». Это может быть истиной. Но может оказаться и ложным выводом. На самом деле эти лекарства по своей эффективности могут быть примерно одинаковы, либо новое лекарство «А» даже менее эффективно, чем лекарство «В».

Посмотрим, какие систематические ошибки могли «обмануть» исследователя, привести его к ложному заключению:

1. Исследователь неправильно сформировал сравниваемые группы пациентов. Пациенты, получавшие новое лекарство «А», имели более благоприятную форму заболевания (менее тяжелую). Нарушенные процессы в их организме под влиянием лечения восстановились быстрее и надежнее.
2. Лекарство «А» приятнее на вкус, поэтому пациенты, получавшие его, строже соблюдали схему лечения, не пропускали время приема.
3. Лекарство «А» — это новое лекарственное средство, а лекарство «В» — старое. Многие люди больше доверяют всему новому. Поэтому и сами пациенты, и врач-исследователь, наблюдавший за изменением их здоровья, были склонны думать, что новое лекарственное средство действует лучше.
4. Фирма-производитель лекарства «А» очень заинтересована в том, чтобы была научно доказана высокая эффективность разработанного препарата. Это позволило бы получать большую прибыль от его продажи.
Поэтому фирма высоко оплачивала труд врачей-исследователей, дарила им ценные подарки, приглашала на праздничные мероприятия, помогала публиковать научные статьи и прочее. В обмен на полученное материальное вознаграждение врачи-исследователи на этапе сбора или этапе обработки данных умышленно «откорректировали» собранные сведения, чтобы доказать эффективность и безопасность лекарства «А».

1. В процессе сбора первичного статистического материала или его обработки были допущены ошибки. Например, были перепутаны учетные документы. В результате статистические карты пациентов, получавших лекарство «В», были обработаны как документация пациентов, получавших лекарство «А».
2. Исследователь допустил ошибки в ходе анализа собранных сведений: неверно сгруппировал данные, выбрал для расчета неверную формулу, неправильно интерпретировал результаты расчетов.
**Рассмотрим самые частые причины появления систематических ошибок (смещений).**
1. Неправильный отбор единиц наблюдения

В этом случае выборка по своей структуре не похожа на генеральную совокупность (то есть отсутствует качественная репрезентативность выборки).

Дизайн исследования может предусматривать изучение не одной выборки, а нескольких выборок в сравнении. Например, формируется основная группа, принимающая лекарственный препарат, и контрольная группа, принимающая плацебо. При неправильном отборе сравниваемые группы могут существенно различаться по некоторым важным факторным признакам, влияющим на результат (пол, возраст, степень тяжести заболевания, сопутствующие заболевания).

Такая ошибка возникает при формировании исследуемых совокупностей. О ней следует помнить на подготовительном этапе в ходе планирования исследования.

2. Особенности измерения признака

Разные методы измерения одного и того же признака могут дать разные результаты. Например, при измерении диастолического артериального давления с помощью сфигмоманометра результаты будут примерно на 10 мм.рт.ст. выше, чем при измерении с помощью внутриартериальной канюли. При измерении систолического артериального давления результаты будут выше, если испытуемый во время обследования говорит.

О возможности такого смещения следует помнить на втором этапе исследования при сборе статистического материала.

3. Воздействие вмешивающихся факторов

Два или более явления могут быть взаимосвязаны (как говорят «ходят вместе»). Размер одного явления изменяется, и размер другого явления тоже изменяется. Но это совершенно не значит, что одно из явлений — это причина другого. Возможно, есть какой-то третий фактор, который оказывает влияние на оба изучаемых явления, вызывая их изменения.
4. Умышленное искажение данных испытуемым или исследователем

Такое смещение может появиться при изучении распространенности поведения, осуждаемого обществом (табакокурение, злоупотребление алкоголем, употребление наркотиков, число искусственных абортов). Полученные данные, скорее всего, окажутся заниженными, так как многие испытуемые не скажут правду, не сознаются в своем неблаговидном поведении.

А вот при изучении документации, которая отражает качество работы медперсонала, полученные данные, скорее всего, окажутся завышенными. Особенно если учитываемые показатели качества влияют на оплату труда. Ведь каждому работнику хочется выглядеть в глазах начальства лучше и зарабатывать больше.
#  Ошибки I и II рода
Ошибки I и II рода — это ключевые понятия задач проверки статистических гипотез. Важные концепции в статистике, особенно в контексте медицинских исследований.

**Ошибка I рода** — обозначается α (альфа-ошибка), связана с отклонением от истины в статистическом выводе по причине ложного утверждения о наличии эффекта или различия, когда его на самом деле нет.

Эта ошибка может возникнуть из-за слишком жестких критериев статистической значимости, недостаточного размера выборки или случайного распределения данных. Например, если исследование предполагает связь между двумя переменными, но на самом деле такой связи нет, а исследование все равно показывает статистически значимый результат, это ошибка 1-го рода.

**Ошибка II рода** — обозначается β (бета-ошибка), напротив, связана с принятием ложного утверждения об отсутствии эффекта или различия там, где оно действительно есть.

Эта ошибка может возникнуть из-за недостаточной мощности статистики, неадекватного выбора методов анализа или неудачного размера выборки. Например, исследование может ошибочно прийти к выводу, что новый препарат не эффективен, хотя на самом деле он мог бы иметь положительное влияние на пациентов.![image-2.png](attachment:image-2.png)
Ошибки I и II рода могут иметь серьезные последствия в медицине, подрывая доверие к результатам исследований и влияя на принятие важных решений.

Ошибка I рода (ложно выносится заключение о наличии эффекта или различия там, где его на самом деле нет), может привести к ненужному распространению нового лекарства или метода лечения, который не принесет пользу пациентам или даже нанесет вред. Это может привести к потере времени, ресурсов и здоровья.

Ошибка II рода (ложно заключается, что эффекта или различия нет, а он существует), может привести к игнорированию метода диагностики или эффективного лечения, что также может иметь негативные последствия для здоровья пациентов. Они не смогут получить необходимое лечение из-за ошибочных выводов исследования, что в конечном итоге ухудшит их состояние.
# Проверка статистических гипотез
Главная цель проверки гипотез заключается в определении статистической значимости. Этот анализ может либо подтвердить, либо опровергнуть предположение о том, что наблюдаемые результаты не случайны, а отражают наличие связи между изучаемыми переменными. Такой подход позволяет научным исследованиям быть более обоснованными и точными, улучшая качество полученных выводов и обобщений.
Этапы проверки статистических гипотез состоят из нескольких последовательных шагов, которые помогают исследователям оценить достоверность своих гипотез:

1. На первом этапе происходит формулирование нулевой H0 и альтернативной H1 гипотез. Проверяется всегда нулевая гипотеза. Если доказать, что она несостоятельна, то альтернативная гипотеза верна.
Для проверки гипотезы применяют критерии (тесты), позволяющие принять или опровергнуть гипотезу, о них мы поговорим в следующих модулях.

2. На втором этапе исследователи выбирают методы статистического анализа, проводят эксперимент и собирают данные. По данным выборки рассчитывают эмпирическое значение kэмп.
3. На третьем этапе происходит оценка статистической значимости полученных результатов. Она включает в себя расчет значений статистических критериев, сравнение их с критическими значениями критерия kкрит, который определяется на основании объема выборки, р-уровня значимости и числа степеней свободы.
4. На четвертом этапе на основе полученных данных принимается решение. Когда результаты статистически значимы, исследователь отвергает нулевую гипотезу в пользу альтернативной. Когда статистическая значимость не подтверждена, нулевая гипотеза остается в силе.
Сравнивается эмпирический и критический значения критерия. Если kэмп > kкрит, то нулевую гипотезу отвергают.

Исключения составляют:

* критерий Манна-Уитни,
* критерий Т-Уилкоксона,
* критерий знаков.
