Прокальцитонин (ПКТ) — показатель системного воспалительного процесса в организме и сепсиса. Бактериальная инфекция с осложнениями значительно увеличивает уровень прокальцитонина в крови.

Имеются данные о уровне прокальцитонина у пациентов с тремя нозологическими формами:

### Двухсторонняя нижнедолевая внебольничная пневмония:

2.2, 1.4, 2.1, 2.8, 3.1, 1.7, 1.8, 3.2 (нг/мл)

### Перитонит

 3.2, 3.1, 4.1, 4.5, 2.8, 1.7, 2.3 (нг/мл)

### Сепсис

6.2, 7.1, 14.2, 21.5, 2.1, 1.7, 22.4, 23.0 (нг/мл)

Задача: определить, есть ли различия в уровне прокальцитонина в зависимости от нозологии пациента

Решение:

В данном случае необходимо определить влияние одного качественного показателя (заболевание) на количественный показатель (уровень ПКТ). Для решения данный задачи оптимально применить однофакторный дисперсионный анализ.

In [6]:
import numpy as np

Найдем средние значения уровня ПКТ для кажной группы

Пневмония

In [8]:
y1 = np.array([2.2, 1.4, 2.1, 2.8, 3.1, 1.7, 1.8, 3.2])
n1 = len(y1)
y1_mean = y1.mean()
print(f"У пациентов с пневмонией (всего {n1} наблюдений) средний уровень ПКТ составляет {round(y1_mean, 2)} нг/мл")

У пациентов с пневмонией (всего 8 наблюдений) средний уровень ПКТ составляет 2.29 нг/мл


Перитонит

In [9]:
y2 = np.array([3.2, 3.1, 4.1, 4.5, 2.8, 1.7, 2.3])
n2 = len(y2)
y2_mean = y2.mean()
print(f"У пациентов с перитонитом (всего {n2} наблюдений) средний уровень ПКТ составляет {round(y2_mean, 2)} нг/мл")

У пациентов с перитонитом (всего 7 наблюдений) средний уровень ПКТ составляет 3.1 нг/мл


Сепсис

In [10]:
y3 = np.array([6.2, 7.1, 14.2, 21.5, 2.1, 1.7, 22.4, 23.0])
n3 = len(y3)
y3_mean = y3.mean()
print(f"У пациентов с сепсисом (всего {n3} наблюдений) средний уровень ПКТ составляет {round(y3_mean, 2)} нг/мл")

У пациентов с сепсисом (всего 8 наблюдений) средний уровень ПКТ составляет 12.27 нг/мл


Определим, имеются ли статистически достоверные различия в средних значения прокальцитонина между группами.

Всего 3 группы

In [11]:
k = 3

Общее количество пациентов n

In [12]:
n = n1 + n2 + n3

Соберем все значения в один массив

In [13]:
y_all = np.concatenate([y1, y2, y3])

Найдем среднее значение ПКТ среди всех пациентов.

In [14]:
y_mean = np.mean(y_all)

Найдем сумму квадратов отклонений от общего среднего S2

In [15]:
s2 = np.sum((y_all - y_mean)**2)

Найдем сумму квадратов отклонений средних групповых значений от общего среднего s2_f

In [17]:
s2_f = ((y1_mean - y_mean)**2) * n1 + ((y2_mean - y_mean)**2) * n2 + ((y3_mean - y_mean)**2) * n3

Вычислим остаточную сумму квадратов отклонений s2_residual

In [18]:
s2_residual = s2 - s2_f

Найдем общую дисперсия

In [19]:
sigma2_general = s2 / (n - 1)

Найдем факторную дисперсию

In [20]:
sigma2_f = s2_f / (k - 1)

Найдме остаточную дисперсию

In [21]:
sigma2_residual = s2_residual / (n - k)

Вычислим F_h

In [22]:
f_h = sigma2_f / sigma2_residual
f_h

8.14734367095837

Найдем значение F_table в таблице Фишера-Снедекора для a = 0.05, при этом:

In [23]:
df_out = k - 1
df_inner = n - k
df_out, df_inner

(2, 20)

F_table = 3.49. Т.к. для данных групп F_h > F_table, то различия в уровне ПКТ статистически значимые

Вычислим эмпирическое корреляционное отношение eta2

In [25]:
eta2 = s2_f / s2
eta2

0.4489551649367152

### Вывод

Имеются статистически достовернные различия в уровне ПКТ у пациентов с различными нозологическими формами. При этом, значение эмпирического корреляционного отношения больше 0.3. Таким образом, различия в росте между группами статистически значимые.