In [18]:
import numpy as np
import scipy.stats as stats
import pandas as pd
from statsmodels.stats.multicomp import pairwise_tukeyhsd

Провести дисперсионный анализ для определения того, есть ли различия среднего роста среди взрослых футболистов, хоккеистов и штангистов. Даны значения роста в трех группах случайно выбранных спортсменов:
Футболисты: 173, 175, 180, 178, 177, 185, 183, 182.
Хоккеисты: 177, 179, 180, 188, 177, 172, 171, 184, 180.
Штангисты: 172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170.


In [19]:
fut = np.array([173, 175, 180, 178, 177, 185, 183, 182])
hoc = np.array([177, 179, 180, 188, 177, 172, 171, 184, 180])
bar = np.array([172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170])

In [20]:
# Проверим выборки на выполнение условий применимости дисперсионного анализа с помощью теста Шапиро:
print(stats.shapiro(fut))
print(stats.shapiro(hoc))
print(stats.shapiro(bar))

ShapiroResult(statistic=0.9775082468986511, pvalue=0.9495404362678528)
ShapiroResult(statistic=0.9579196572303772, pvalue=0.7763139009475708)
ShapiroResult(statistic=0.9386808276176453, pvalue=0.5051165223121643)


Поскольку значения pvalue значительно больше уровня статзначимости 5%, у нас нет отклонений от нормальности во всех выборках.

In [21]:
# Для начала оценим длину выборок и сравним их.
n1 = len(fut)
n2 = len(hoc)
n3 = len(bar)
n1, n2, n3

(8, 9, 11)

In [22]:
# Поскольку выборки разной длины потребуется проверка однородности дисперсий с помощью теста Бартлетта:
stats.bartlett(fut, hoc, bar)

BartlettResult(statistic=0.4640521043406442, pvalue=0.7929254656083131)

Значение pvalue больше, чем 0,05. Таким образом, можно приступить к выполнению дисперсионного анализа.

In [23]:
# Посчитаем средние значения по выборкам:
μ_fut = np.mean(fut)
μ_hoc = np.mean(hoc)
μ_bar = np.mean(bar)
μ_fut, μ_hoc, μ_bar

(179.125, 178.66666666666666, 172.72727272727272)

In [24]:
# Средние значения разные. Посчитаем общее среднее значение, соединив выборки в один массив:
all = np.concatenate([fut, hoc, bar])
all

array([173, 175, 180, 178, 177, 185, 183, 182, 177, 179, 180, 188, 177,
       172, 171, 184, 180, 172, 173, 169, 177, 166, 180, 178, 177, 172,
       166, 170])

In [25]:
μ_all = np.mean(all)
μ_all

176.46428571428572

In [26]:
# Найдем сумму квадратов отклонений наблюдений от общего среднего:
S2 = np.sum((all - μ_all)**2)
S2

830.9642857142854

In [27]:
# Найдем сумму квадратов отклонений средних групповых значений от общего среднего:
S2_f = ((μ_fut - μ_all)**2) * n1 + ((μ_hoc - μ_all)**2) * n2 + ((μ_bar - μ_all)**2) * n3
S2_f

253.9074675324678

In [28]:
# Найдем остаточную сумму квадратов отклонений:
S2_r = np.sum((fut - μ_fut)**2) + np.sum((hoc - μ_hoc)**2) + np.sum((bar - μ_bar)**2)
S2_r

577.0568181818182

In [29]:
# Найдем общую дисперсию:
σ2_all = S2 / (len(all) - 1)
σ2_all

30.776455026455015

In [30]:
# Найдем факторную дисперсию:
k = 3
σ2_f = S2_f / (k - 1)
σ2_f

126.9537337662339

In [31]:
# Найдем остаточную дисперсию:
σ2_r = S2_r / (len(all) - k)
σ2_r

23.08227272727273

In [32]:
# Теперь рассчитаем наблюдаемое значение:
F_n = σ2_f/σ2_r
F_n

5.500053450812598

По критерию Фишера найдем значение для уровня значимости и двух степеней свободы 2 (как 3 минус 1) и 25 (как длины выборок минус количество выборок, т.е. 28 - 3. Получаем значение 3,385. Поскольку наблюдаемое значение больше него, из этого следует, что различия роста в трех группах статистически значимы.

Для качественной оценки различий среднего роста спортсменов по видам спорта применим тест Тьюки.

In [36]:
# Для его проведения необходимо одинаковая длина выборок. "Дорастим" первые две до длины третьей их средними значениями:
fut_app = np.append(fut, [round(μ_fut), round(μ_fut), round(μ_fut)])
fut_app

array([173, 175, 180, 178, 177, 185, 183, 182, 179, 179, 179])

In [37]:
hoc_app = np.append(hoc, [round(μ_hoc), round(μ_hoc)])
hoc_app

array([177, 179, 180, 188, 177, 172, 171, 184, 180, 179, 179])

In [38]:
df = pd.DataFrame({'height': [173, 175, 180, 178, 177, 185, 183, 182, 179, 179, 179,
                              177, 179, 180, 188, 177, 172, 171, 184, 180, 179, 179,
                              172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170],
                   'group': np.repeat(['fut', 'hoc', 'bar'], repeats=11)})
tukey = pairwise_tukeyhsd(endog=df['height'],
                         groups=df['group'],
                         alpha=0.05)
print(tukey)

Multiple Comparison of Means - Tukey HSD, FWER=0.05 
group1 group2 meandiff p-adj   lower   upper  reject
----------------------------------------------------
   bar    fut   6.3636 0.0053  1.7524 10.9748   True
   bar    hoc      6.0 0.0087  1.3888 10.6112   True
   fut    hoc  -0.3636 0.9794 -4.9748  4.2476  False
----------------------------------------------------


Из результатов теста видно, что различия есть между ростом штангистов и футболистами/хоккеистами.