### Ситуация на работе у Java-разработчика

Java-разработчик работает в компании, занимающейся разработкой онлайн-курсов. Они хотят узнать, влияет ли новый метод обучения на результаты студентов. В компании есть три группы студентов, каждая из которых использовала разные методы обучения. Необходимо выяснить, есть ли значительные различия в средних оценках между группами с помощью теста Тьюки.

### Постановка задачи
Нулевая гипотеза (H₀): Нет значительных различий в средних оценках между любыми двумя группами.
Альтернативная гипотеза (H₁): Существуют значительные различия в средних оценках между как минимум двумя группами.
Данные для теста
Предположим, что у нас есть оценки студентов для трёх групп:

Группа 1: [85, 87, 90, 91, 89, 95, 92, 88]
Группа 2: [78, 80, 79, 77, 76, 75, 74, 73]
Группа 3: [88, 85, 87, 84, 83, 86, 82, 81]

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from itertools import combinations
from scipy.stats import f

# Данные
group1 = np.array([85, 87, 90, 91, 89, 95, 92, 88])
group2 = np.array([78, 80, 79, 77, 76, 75, 74, 73])
group3 = np.array([88, 85, 87, 84, 83, 86, 82, 81])

# Объединение данных
data = [group1, group2, group3]

# Вычисление средних значений для каждой группы
means = [np.mean(group) for group in data]
n_groups = len(data)
n_total = sum(len(group) for group in data)

# Вычисление общей средней
grand_mean = np.mean(np.concatenate(data))

# Вычисление межгрупповой суммы квадратов (SSB)
ssb = sum(len(group) * (np.mean(group) - grand_mean) ** 2 for group in data)

# Вычисление внутригрупповой суммы квадратов (SSW)
ssw = sum(sum((x - np.mean(group)) ** 2 for x in group) for group in data)

# Вычисление степени свободы
dfb = n_groups - 1
dfw = n_total - n_groups

# Вычисление среднеквадратичных отклонений
msb = ssb / dfb
msw = ssw / dfw

# Вычисление F-статистики
f_stat = msb / msw

# Вычисление критического значения F
alpha = 0.05
f_critical = f.ppf(1 - alpha, dfb, dfw)

# Вывод результатов ANOVA
print("Результаты ANOVA:")
print(f"F-статистика: {f_stat:.2f}")
print(f"Критическое значение F: {f_critical:.2f}")

if f_stat > f_critical:
    print("Отвергаем нулевую гипотезу. Существуют значительные различия между группами.")
else:
    print("Не отвергаем нулевую гипотезу. Нет значительных различий между группами.")

# Тест Тьюки
q_critical = 3.314  # Критическое значение q для уровня значимости 0.05 и dfw = 21, 3 группы
comparisons = list(combinations(range(n_groups), 2))

# Вычисление стандартной ошибки
se = np.sqrt(msw * (1 / len(group1) + 1 / len(group2)))

# Проведение парных сравнений
print("\nРезультаты теста Тьюки:")
for i, j in comparisons:
    diff = np.abs(means[i] - means[j])
    q_stat = diff / se
    print(f"Сравнение группы {i + 1} и группы {j + 1}: q = {q_stat:.2f}")
    if q_stat > q_critical:
        print(f"  Различия значимы (q > {q_critical})")
    else:
        print(f"  Различия не значимы (q <= {q_critical})")

# Построение графика
plt.figure(figsize=(10, 6))
for i, group in enumerate(data):
    plt.scatter([i + 1] * len(group), group, label=f'Group {i + 1}')
plt.axhline(y=grand_mean, color='r', linestyle='--', label='Overall Mean')
plt.legend()
plt.xlabel('Group')
plt.ylabel('Scores')
plt.title('Scores by Group')
plt.show()