Провести дисперсионный анализ для определения того, есть ли различия среднего роста среди взрослых футболистов, хоккеистов и штангистов. Даны значения роста в трех группах случайно выбранных спортсменов: Футболисты: 173, 175, 180, 178, 177, 185, 183, 182. Хоккеисты: 177, 179, 180, 188, 177, 172, 171, 184, 180. Штангисты: 172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170. Данная промежуточная аттестация оценивается по системе "зачет" / "не зачет". "Зачет" ставится, если Слушатель успешно выполнил задание. "Незачет" ставится, если Слушатель не выполнил задание. Критерии оценивания: 1 - Слушатель провел дисперсионный анализ для определения того, есть ли различия среднего роста среди взрослых футболистов, хоккеистов и штангистов.

In [1]:
import numpy as np
from scipy import stats

In [2]:
# Рост взрослых футболистов, хоккеистов и штангистов
football_heights = np.array([173, 175, 180, 178, 177, 185, 183, 182])
hockey_heights = np.array([177, 179, 180, 188, 177, 172, 171, 184, 180])
weightlifting_heights = np.array([172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170])

Шаг 1: Посчитаем средний рост в каждой группе.

In [3]:
# Средний рост в каждой группе
mean_football_height = np.mean(football_heights)
mean_hockey_height = np.mean(hockey_heights)
mean_weightlifting_height = np.mean(weightlifting_heights)

print("Средний рост футболистов:", mean_football_height)
print("Средний рост хоккеистов:", mean_hockey_height)
print("Средний рост штангистов:", mean_weightlifting_height)

Средний рост футболистов: 179.125
Средний рост хоккеистов: 178.66666666666666
Средний рост штангистов: 172.72727272727272


Шаг 2: Посчитаем общую среднюю высоту.

In [4]:
# Общая средняя высота
overall_mean_height = np.mean(np.concatenate([football_heights, hockey_heights, weightlifting_heights]))
print("Общая средняя высота:", overall_mean_height)

Общая средняя высота: 176.46428571428572


Шаг 3: Посчитаем сумму квадратов отклонений наблюдений от общей средней.

In [5]:
# Сумма квадратов отклонений наблюдений от общей средней
ss_total = np.sum((np.concatenate([football_heights, hockey_heights, weightlifting_heights]) - overall_mean_height) ** 2)
print("Сумма квадратов отклонений наблюдений от общей средней (SS Total):", ss_total)

Сумма квадратов отклонений наблюдений от общей средней (SS Total): 830.9642857142854


Шаг 4: Посчитаем сумму квадратов отклонений средних групповых значений от общей средней.

In [6]:
# Количество наблюдений в каждой группе
n_football = len(football_heights)
n_hockey = len(hockey_heights)
n_weightlifting = len(weightlifting_heights)

# Сумма квадратов отклонений средних групповых значений от общей средней
ss_between = n_football * (mean_football_height - overall_mean_height) ** 2 + \
             n_hockey * (mean_hockey_height - overall_mean_height) ** 2 + \
             n_weightlifting * (mean_weightlifting_height - overall_mean_height) ** 2

print("Сумма квадратов отклонений средних групповых значений от общей средней (SS Between):", ss_between)

Сумма квадратов отклонений средних групповых значений от общей средней (SS Between): 253.9074675324678


Шаг 5: Посчитаем факторную дисперсию.

In [7]:
# Факторная дисперсия (межгрупповая дисперсия)
df_between = 2  # количество групп минус один
ms_between = ss_between / df_between
print("Факторная дисперсия (межгрупповая дисперсия):", ms_between)

Факторная дисперсия (межгрупповая дисперсия): 126.9537337662339


Шаг 6: Посчитаем остаточную дисперсию.

In [8]:
# Остаточная дисперсия (внутригрупповая дисперсия)
ss_within = np.sum((football_heights - mean_football_height) ** 2) + \
            np.sum((hockey_heights - mean_hockey_height) ** 2) + \
            np.sum((weightlifting_heights - mean_weightlifting_height) ** 2)

df_within = n_football + n_hockey + n_weightlifting - 3  # общее количество наблюдений минус количество групп
ms_within = ss_within / df_within
print("Остаточная дисперсия (внутригрупповая дисперсия):", ms_within)

Остаточная дисперсия (внутригрупповая дисперсия): 23.08227272727273


Шаг 7: Посчитаем значение статистики F.

In [9]:
# Значение статистики F
f_value = ms_between / ms_within
print("Значение статистики F:", f_value)

Значение статистики F: 5.500053450812598


### Второй вариант

In [10]:
import numpy as np
from scipy.stats import f_oneway

# Заданные значения роста для каждой группы спортсменов
football_players = np.array([173, 175, 180, 178, 177, 185, 183, 182])
hockey_players = np.array([177, 179, 180, 188, 177, 172, 171, 184, 180])
weightlifters = np.array([172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170])

# Вычисление среднего роста в каждой группе
mean_football = np.mean(football_players)
mean_hockey = np.mean(hockey_players)
mean_weightlifting = np.mean(weightlifters)

# Выполнение дисперсионного анализа
f_statistic, p_value = f_oneway(football_players, hockey_players, weightlifters)

# Вывод результатов
print("Средний рост футболистов:", mean_football)
print("Средний рост хоккеистов:", mean_hockey)
print("Средний рост штангистов:", mean_weightlifting)
print("\nРезультаты дисперсионного анализа:")
print("F-статистика:", f_statistic)
print("p-значение:", p_value)

# Определение статистической значимости различий
alpha = 0.05
if p_value < alpha:
    print("\nЕсть статистически значимые различия между средними значениями роста в группах.")
else:
    print("\nНет статистически значимых различий между средними значениями роста в группах.")

Средний рост футболистов: 179.125
Средний рост хоккеистов: 178.66666666666666
Средний рост штангистов: 172.72727272727272

Результаты дисперсионного анализа:
F-статистика: 5.500053450812596
p-значение: 0.010482206918698694

Есть статистически значимые различия между средними значениями роста в группах.


Этот код вычисляет средний рост для каждой группы спортсменов, выполняет дисперсионный анализ и выводит результаты, включая F-статистику и p-значение. На основе уровня значимости alpha выводится заключение о наличии статистически значимых различий между средними значениями роста в группах.