# **Введение**
Дисперсионный анализ (ANOVA) — это мощный статистический метод, широко используемый в медицине для сравнения средних значений между двумя или более группами. ANOVA позволяет исследователям определить, есть ли статистически значимые различия между группами и является ли какая-то из них доминирующей.
# **Основные понятия дисперсионного анализа**
Дисперсия в дисперсионном анализе представляет собой меру изменчивости данных внутри групп и между группами, которые анализируются с целью выявления статистически значимых различий. Используется для определения различий в средних значениях между группами и оценки влияния различных факторов на исследуемую переменную.

F-статистика
Один из ключевых показателей в анализе различий между группами, — это F-статистика, которая используется для сравнения дисперсии межгрупповых различий с дисперсией внутригрупповых различий.

Распределение Фишера
![image.png](attachment:image.png)

Межгрупповая и внутригрупповая дисперсии
Межгрупповая дисперсия MSB, объяснённая влиянием фактора, описывает разброс значений между группами вокруг общего среднего значения данных. Это часть общей дисперсии, которая объясняется различиями между группами.
Внутригрупповая дисперсия MSW, необъяснённая, характеризует разброс данных внутри градаций фактора (групп) вокруг их средних значений. Это часть общей дисперсии, которая объясняется различиями внутри группы или выборки
Отношение межгрупповой и внутригрупповой дисперсий — фактическое отношение Фишера. Его сравнивают с критическим значением отношения Фишера. Если фактическое отношение Фишера превышает критическое значение, то средние значительно отличаются друг от друга, а исследуемый фактор оказывает существенное влияние на изменение данных. В обратном случае: средние друг от друга не отличаются, а фактор не оказывает существенного влияния на изменение данных.

Общая сумма квадратов SST
Общая сумма квадратов SST, представляющая общую изменчивость данных, является метрикой, характеризующей степень изменчивости данных без учета их разделения на группы.
SST вычисляется следующим образом: 

* вычисление отклонения каждого наблюдения от среднего значения;
* суммирование квадратов полученных отклонений.
Общая сумма квадратов SST образуется за счет двух компонентов:

* межгрупповой суммы квадратов (SSB), отражающей различие средних значений групп от общего среднего;
* внутригрупповой суммы квадратов (SSW), представляющей сумму квадратов отклонений от среднего внутри каждой из групп.

Оценка значимости влияния факторов с использованием гипотез
В процессе проведения дисперсионного анализа вычисляется удельный вес совокупного воздействия одного или нескольких факторов на изменение зависимой переменной. Одним из ключевых моментов в проведении анализа является оценка значимости влияния факторов с использованием гипотез.

* Нулевая гипотеза  предполагает, что все  классов градации имеют одинаковые значения средних (  ). Это означает, что между группами нет статистически значимых различий и любые обнаруженные различия могут быть обусловлены случайной вариацией.

* Альтернативная гипотеза  утверждает, что не все классы градации имеют одинаковые значения средних, указывая на наличие статистически значимых различий между группами.

Условия применения дисперсионного анализа
Для корректного и эффективного применения дисперсионного анализа важно соблюдать определенные условия:

1. Нормальность распределения данных

Для успешного применения дисперсионного анализа данные в каждой из групп должны быть распределены нормально. Хотя этот фактор не является строгим требованием при больших выборках, проверка нормальности поможет избежать искажений результатов. Предположение о нормальности позволяет использовать параметрические методы, которые предполагают нормальное распределение данных. 

Для проверки условия нормальности могут применяться различные статистические тесты, такие как тест Шапиро-Уилка или критерий согласия Колмогорова-Смирнова.

2. Гомогенность дисперсий между группами

Это означает, что дисперсии данных в различных группах должны быть примерно одинаковыми. Проверка на гомогенность дисперсий перед проведением анализа позволяет корректно интерпретировать результаты и избежать ошибок. 

Гомогенность дисперсий можно проверить с помощью статистических тестов, например, теста Левена или теста Бартлетта. 

3. Обеспечение независимости наблюдений и однородности выборок

Каждое наблюдение в исследуемых группах должно быть независимым от других, чтобы исключить влияние результатов одного наблюдения на другие и гарантировать объективность и достоверность выводов. Однородность выборок подразумевает, что группы должны быть сравнимы между собой и не должны иметь систематических различий, которые могли бы искажать результаты.

4. Категориальный фактор

Он делит данные на группы для сравнения средних значений. Присутствие категориального фактора является основой для применения дисперсионного анализа и обеспечивает возможность выявления статистически значимых различий между группами.

Поправка Бонферрони
В случае отклонения от нормального распределения F-статистика может быть скорректирована, например, с помощью поправки Бонферрони.

Поправка Бонферрони — это один из методов коррекции уровня значимости в множественном сравнении, используемом для уменьшения вероятности ложноположительных результатов. 

Суть поправки Бонферрони заключается в том, что уровень значимости (обычно обозначаемый как α) делится на количество статистических тестов, проводимых в рамках множественного сравнения. Другими словами, α уровень значимости делится на число гипотез, которые проверяются одновременно, чтобы скорректировать его на множественное тестирование и уменьшить вероятность ошибки первого рода.

# **Однофакторный дисперсионный анализ**
Однофакторный дисперсионный анализ является статистическим методом, позволяющим сравнивать средние значения между двумя и более группами, которые различаются только по одной переменной, рассматриваемой в качестве фактора, влияющего на результаты исследования.
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)
# **Двухфакторный дисперсионный анализ с повторениями**
Двухфакторный дисперсионный анализ с повторениями применяется для проверки не только возможной зависимости результативного признака от двух факторов A и B, но и возможного взаимодействия факторов.
При проведении статистического анализа следует учитывать три ключевых аспекта:

1. В случае, когда нулевая гипотеза об отсутствии эффекта не может быть отклонена, необходимо проанализировать причины. 
2. При обнаружении статистически значимого эффекта важно вычислить его величину и соответствующие доверительные интервалы. Это позволит оценить клиническую значимость полученных результатов.
3. Необходимо удостовериться в представительности данных, полученных во время проведения исследования. В противном случае все последующие выводы могут быть недостоверными.
Обеспечить равные вероятности попадания в различные группы — нетривиальная задача.

Специальные методы, предназначенные для обеспечения случайного распределения, называются методами рандомизации.
Особое значение имеет также участие пациента и его уверенность в эффективности нового метода лечения. Чтобы исключить влияние этих факторов на результаты исследования, используется слепой метод.

В идеальном случае это может быть двойной слепой метод, при котором ни пациент, ни наблюдающий его врач не знают, какой метод лечения был применен.
Однако не всегда возможно реализовать двойной слепой метод, поэтому используются и другие варианты.

Простой слепой метод, когда информация о примененном методе доступна либо врачу, либо пациенту.
Частично слепой метод — как врач, так и пациент имеют лишь частичную информацию.
Главной целью всех этих методов является минимизация информации, доступной участникам исследования.

Рандомизированные контролируемые испытания (РКИ) — эталон научного исследования в современной медицине, предназначенный для оценки клинической эффективности.
Сущность РКИ заключается в проведении исследования, где пациенты случайным образом распределяются между двумя группами:

1. Контрольная группа, в которой пациенты либо не получают лечения, либо получают стандартное лечение или плацебо.
2. Группа активного лечения, где применяется новый метод лечения с целью оценки его эффективности.
Необходимо применять объективные параметры для измерения конечных результатов исследования. Они включают:

* общую смертность;
* показатели смертности от конкретного заболевания;
* частоту повторных госпитализаций;
* частоту возникновения серьезных осложнений, особенно тех, которые могут угрожать жизни пациента или привести к инвалидности;
* оценку качества жизни пациентов.
# **Этапы статистического исследования**
Каждое статистическое исследование проходит через четыре важных этапа:

1. Разработка плана и программы исследования, в рамках которого определяются методы и стратегии сбора данных.
Подразумевает разработку всестороннего плана и программы исследования. На этом этапе осуществляется:

* Определение цели и постановка задач исследования, где формулируется основная цель научного исследования и подзадачи, последовательное решение которых способствует достижению основной цели.
* Изучение научной литературы с целью получения информации о рассматриваемой проблеме, выбора соответствующей методологии исследования, а также выявления наличия подобных исследований в недавнем прошлом (что может исключить необходимость проводить данное исследование). На основе анализа литературы также формулируется рабочая гипотеза.
* Составление рабочей гипотезы, представляющей собой предварительное предположение о выводах, которые могут быть сделаны на основе исследования.
* В случае расхождения между полученными результатами и рабочей гипотезой исследователю необходимо выполнить две задачи. Во-первых, убедиться в отсутствии ошибок в счёте. Во-вторых, оценить адекватность выбранной методики исследования относительно поставленной цели.
* Определение единицы наблюдения, то есть первичного элемента, на основе которого формируется набор данных (или первоначального носителя информационных признаков). Выбор единицы наблюдения преимущественно зависит от цели и задач исследования.

Определение предполагаемого объема выборки
Основным требованием к выборочной совокупности является ее репрезентативность, то есть способность отражать характеристики генеральной совокупности.

Для определения необходимого объема выборки, который обеспечит количественную репрезентативность, существуют специальные формулы. Определение этого объема основывается на допущении о возможной ошибке, которое предполагает максимально допустимое отклонение результатов выборочного исследования от значений в генеральной совокупности.

Для определения необходимого объёма выборки применяют различные подходы. При формировании случайной выборки, после выбора объекта и записи всех необходимых данных о нем, возможны два способа действий: объект может быть возвращен или не возвращен в генеральную совокупность.

Таким образом, выборка может быть:

* повторной, если объект возвращается в генеральную совокупность;
* бесповторной, если объект не возвращается в генеральную совокупность.
В большинстве статистических исследований различие между повторной и бесповторной выборками практически отсутствует, на практике предпочтение часто отдается повторной выборке.

Без информации о параметрах генеральной совокупности вычисление необходимого объёма повторной выборки, когда результат отражается показателем в виде относительной величины, может быть выполнено с применением следующей формулы: ![image-4.png](attachment:image-4.png)
В случае единовременного наблюдения исследователь получает данные об объекте в определенный момент времени, например, о состоянии здоровья конкретной группы населения на основе результатов профилактического обследования.
А при текущем наблюдении исследование осуществляется в течение определенного временного интервала, такого как месяц, год и так далее.
Объем исследования определяется количеством наблюдаемых единиц, включенных в него.
Объектом исследования является анализируемая статистическая совокупность.
План исследования должен включать следующие вопросы:

определение ожидаемых сроков выполнения исследования;
оценку требуемых и имеющихся материальных и финансовых ресурсов;
установление формата исследования (научная статья, доклад, диссертация, курсовая или выпускная работа).
Программа исследования — перечень вопросов, подлежащих изучению.

2. Сбор информации на основе специально разработанных первичных документов или иных источников.
Проводится запись всех планируемых характеристик для каждой единицы наблюдения. При этом для каждой единицы создается отдельный документ учета (анкета, медицинская отчетная документация, специальная карта исследования и так далее).

Сбор данных может быть осуществлен различными способами, включая анкетирование, интервьюирование, копирование информации из первичной медицинской документации.

3. Обработка и сводка полученных данных, что включает в себя их анализ и систематизацию.
1. Методология исследования предусматривает определенную последовательность действий, начиная с контроля собранного материала с целью идентификации учетных документов, содержащих дефекты, которые могут потребовать исправления, дополнения или исключения из анализа. Например, возможные дефекты могут включать отсутствие указания пола, возраста или неотвеченные вопросы в опроснике.

Для получения дополнительных данных исследователь может обратиться к официальным документам, таким как амбулаторные карты, истории болезни. Если эти данные не могут быть предоставлены из дополнительных источников или напрямую от исследуемых лиц, документы с недостатками должны быть исключены из дальнейшего анализа.

2. Группировка материала — разделение собранного материала на группы в соответствии с атрибутивными и/или количественными характеристиками (типологическая или вариационная). Например, классификация студентов по учебным курсам: I, II, III, IV. 

3. Шифровка — применение условных обозначений выделяемых признаков. При ручной обработке данных коды могут представлять собой числовые или буквенные обозначения, в то время как в компьютерной обработке в основном используются числовые коды.

4. Сводка материала — процесс внесения цифровых данных, полученных после подсчета, в таблицы для анализа.

5. Вычисление статистических показателей и их обработка — выполнение расчетов для определения основных статистических характеристик данных, а также применение методов статистического анализа для интерпретации информации.

6. Визуализация результатов — создание графического представления полученных показателей для наглядного отражения статистических данных.

4. Статистический анализ, который направлен на выявление закономерностей, проверку гипотез и интерпретацию результатов исследования. Предусматривает статистический анализ полученных результатов для выявления закономерностей, тенденций и выводов на основе имеющейся информации. Это то, что вы изучали в течение всего курса.
# **Критерии эффективности при оценке результатов исследования**
Исследования должны соответствовать утвержденному протоколу.

Протокол исследования — это документ, который содержит основные цели и задачи исследования. А также детальное описание методологии, организационных аспектов и условий, при которых оно будет проводиться.
Протокол часто содержит предшествующие результаты и обоснование нового исследования, однако эти разделы могут быть представлены и в других материалах. Тщательно продуманный протокол клинического исследования снижает вероятность ошибок.

Также важно, чтобы протокол был реалистичным, потому что полученные в результате исследований научные данные должны быть обобщаемыми и воспроизводимыми.
**Эффективность**
Эффективность лекарственного средства или метода лечения представляет собой максимальную способность достижения желаемого результата независимо от дозировки. Для того чтобы лекарственное средство считалось эффективным, оно должно продемонстрировать свою эффективность при изучаемой дозировке в борьбе с определенным заболеванием.

Критерии оценки эффективности могут быть разделены:

* на критерии, определяющие мгновенный эффект от терапии;
* на критерии, определяющие долгосрочные результаты лечения.
Первые характеризуют результат непосредственно после завершения лечебного курса, в то время как вторые отражают сохранение эффекта через определенный временной промежуток.

Один из аспектов оценки эффективности лекарственных препаратов заключается в установлении терапевтической эквивалентности между близкими по действию препаратами, такими как дженерики. Для этого необходимо провести сравнительный анализ и продемонстрировать сходство или различия в пределах определенных параметров.

**Безопасность**
Критериями безопасности являются все нежелательные явления, зафиксированные в ходе клинического исследования. На основе этих данных производится расчет числа и процента пациентов, у которых произошло хотя бы одно нежелательное явление.

Термин побочные эффекты обычно применяется к зарегистрированным лекарственным средствам.

Для изучаемых препаратов чаще используется термин неблагоприятные явления, поскольку наличие прямой связи с новым препаратом не установлено.

Или же неблагоприятные реакции, когда имеются предположения о возможной связи.

Зарегистрированные лекарственные препараты обладают известными побочными эффектами, которые подробно описаны в указаниях по применению. У незарегистрированных препаратов, находящихся в процессе изучения, неблагоприятные явления и реакции описаны в брошюре и уведомлениях исследователя.  

**Предварительное завершение исследования**
Во время проведения научного исследования могут возникнуть обстоятельства, в силу которых дальнейшее продолжение работы или привлечение новых участников становится нецелесообразным.

Среди причин, приводящих к такому решению, могут быть отмечены следующие:

* обнаружение значительного числа серьезных побочных эффектов, что делает дальнейшее продвижение исследования небезопасным;
* невозможность достаточно быстро включить или удержать необходимое количество пациентов из-за сложности набора;
* финансовые сложности;
* несоответствие протокола исследования практическим реалиям, что мешает достижению статистически значимых результатов;
* выявление новой информации, негативно влияющей на баланс между пользой и риском во время выполнения исследования.

# **Оценка и интерпретация результатов клинического исследования**
Научные исследования подвержены различным ошибкам или отклонениям от установленных правил. Наиболее распространенными из них являются: 

1. Отсутствие сравнительного аспекта в методологии проведения исследования

Проведение исследования без учета сравнения с другими методами или препаратами может исказить оценку эффективности рассматриваемого вмешательства.

2. Ошибки при процедуре рандомизации и случайное формирование групп

Процедура рандомизации сама по себе не гарантирует формирование сравнимых по исходным данным групп пациентов. Недостаточность информации о сопоставимости групп делает выводы о сравнительной эффективности двух препаратов малоубедительными и подверженными влиянию случайных факторов.

3. Неправильное применение статистического анализа

Является распространенным недостатком в научных исследованиях. Часто авторы используют парный t-критерий Стьюдента для сопоставления эффективности двух или нескольких препаратов, что может вести к ошибочным выводам. 

В случаях, когда требуется оценить различия в эффективности нескольких методов лечения на одних и тех же пациентах, более корректным подходом является использование дисперсионного анализа повторных наблюдений. При ограниченных объемах выборки (от 10 до 15 человек), необходимо применять специализированные статистические методы, разработанные для анализа небольших наборов данных.

Доказательная медицина играет решающую роль в формировании современных знаний о лечении различных заболеваний, особенно тех, которые представляют высокую социальную значимость из-за их распространенности или неблагоприятного прогноза. Современная клиническая фармакология предлагает медицинским специалистам обширный выбор методов лечения и конкретных лекарственных препаратов, эффективность которых имеет разную степень научной обоснованности. 

При оценке ценности опубликованных материалов крайне важно учитывать ряд ключевых аспектов: насколько четко обозначена задача/цель, наличие процедуры рандомизации и информации о сопоставимости формируемых групп, частота выбывания, план лечения, соблюдение режима приема препарата, а также все ли пациенты были учтены в конце исследования, четко ли указана длительность исследования. Решающее значение имеет также то, проводилось ли исследование слепым или открытым методом.
