In [17]:


import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.stats import shapiro, levene
import matplotlib.pyplot as plt


In [18]:

data = pd.DataFrame({
    'A': [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3],
    'B': [1, 1, 1, 1, 1, 2, 2, 2, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2],
    'Отклик': [3.33, 2.75, 3.32, 1.44, 4.41, 5.64, 6.96, 8.15, 6.99, 5.60, 5.02, 5.01, 3.24, 4.10, 5.12, 3.16, 3.84, 3.82, 6.51, 6.25, 6.61, 7.17, 6.92, 4.10, 8.21, 7.83, 5.36, 7.86]
})


In [19]:
data

Unnamed: 0,A,B,Отклик
0,1,1,3.33
1,1,1,2.75
2,1,1,3.32
3,1,1,1.44
4,1,1,4.41
5,1,2,5.64
6,1,2,6.96
7,1,2,8.15
8,2,1,6.99
9,2,1,5.6


In [20]:

# Однофакторный дисперсионный анализ для фактора A
model_a = ols('Отклик ~ C(A)', data=data).fit()
anova_table_a = sm.stats.anova_lm(model_a, typ=2)
print("Однофакторный ANOVA для фактора A:")
print(anova_table_a)

# Проверка остатков на нормальность (фактор A)
residuals_a = model_a.resid
shapiro_test_a = shapiro(residuals_a)
print(f"Тест Шапиро-Уилка для остатков (фактор A): p-value = {shapiro_test_a[1]:.4f}")

# Проверка однородности дисперсий (фактор A)
levene_test_a = levene(*[data[data['A'] == level]['Отклик'] for level in data['A'].unique()])
print(f"Тест Левена для остатков (фактор A): p-value = {levene_test_a.pvalue:.4f}")


Однофакторный ANOVA для фактора A:
             sum_sq    df         F    PR(>F)
C(A)      29.256583   2.0  5.848943  0.008246
Residual  62.525360  25.0       NaN       NaN
Тест Шапиро-Уилка для остатков (фактор A): p-value = 0.9623
Тест Левена для остатков (фактор A): p-value = 0.1204


In [21]:

# Однофакторный дисперсионный анализ для фактора B
model_b = ols('Отклик ~ C(B)', data=data).fit()
anova_table_b = sm.stats.anova_lm(model_b, typ=2)
print("Однофакторный ANOVA для фактора B:")
print(anova_table_b)

# Проверка остатков на нормальность (фактор B)
residuals_b = model_b.resid
shapiro_test_b = shapiro(residuals_b)
print(f"Тест Шапиро-Уилка для остатков (фактор B): p-value = {shapiro_test_b[1]:.4f}")

# Проверка однородности дисперсий (фактор B)
levene_test_b = levene(*[data[data['B'] == level]['Отклик'] for level in data['B'].unique()])
print(f"Тест Левена для остатков (фактор B): p-value = {levene_test_b.pvalue:.4f}")


Однофакторный ANOVA для фактора B:
             sum_sq    df         F    PR(>F)
C(B)       2.583139   1.0  0.752943  0.393485
Residual  89.198804  26.0       NaN       NaN
Тест Шапиро-Уилка для остатков (фактор B): p-value = 0.0868
Тест Левена для остатков (фактор B): p-value = 0.5892


In [None]:

# Апостериорный анализ 
if anova_table_a['PR(>F)'][0] < 0.05:  # Если фактор A значим
    tukey_a = pairwise_tukeyhsd(endog=data['Отклик'], groups=data['A'], alpha=0.05)
    print("Попарные сравнения для фактора A:")
    print(tukey_a)

if anova_table_b['PR(>F)'][0] < 0.05:  # Если фактор B значим
    tukey_b = pairwise_tukeyhsd(endog=data['Отклик'], groups=data['B'], alpha=0.05)
    print("Попарные сравнения для фактора B:")
    print(tukey_b)

  if anova_table_a['PR(>F)'][0] < 0.05:  # Если фактор A значим


Попарные сравнения для фактора A:
Multiple Comparison of Means - Tukey HSD, FWER=0.05
group1 group2 meandiff p-adj   lower  upper  reject
---------------------------------------------------
     1      2     0.09 0.9921 -1.7785 1.9585  False
     1      3    2.182 0.0198  0.3135 4.0505   True
     2      3    2.092 0.0177  0.3304 3.8536   True
---------------------------------------------------


  if anova_table_b['PR(>F)'][0] < 0.05:  # Если фактор B значим


In [23]:
def check_assumptions(data, factor, response):
    levels = data[factor].unique()
    print(f"Проверка предположений для фактора {factor}:")
    
    # Проверка нормальности остатков для каждого уровня
    for level in levels:
        residuals = data[data[factor] == level][response] - data[data[factor] == level][response].mean()
        shapiro_test = shapiro(residuals)
        print(f"  Уровень {level}: Тест Шапиро-Уилка для остатков: p-value = {shapiro_test[1]:.4f}")
    
    # Проверка однородности дисперсий для всех уровней
    levene_test = levene(*[data[data[factor] == level][response] for level in levels])
    print(f"  Тест Левена для однородности дисперсий: p-value = {levene_test.pvalue:.4f}")

In [24]:

# Проверка предположений для фактора A
check_assumptions(data, 'A', 'Отклик')

# Проверка предположений для фактора B
check_assumptions(data, 'B', 'Отклик')

Проверка предположений для фактора A:
  Уровень 1: Тест Шапиро-Уилка для остатков: p-value = 0.7809
  Уровень 2: Тест Шапиро-Уилка для остатков: p-value = 0.4427
  Уровень 3: Тест Шапиро-Уилка для остатков: p-value = 0.4895
  Тест Левена для однородности дисперсий: p-value = 0.1204
Проверка предположений для фактора B:
  Уровень 1: Тест Шапиро-Уилка для остатков: p-value = 0.3011
  Уровень 2: Тест Шапиро-Уилка для остатков: p-value = 0.0748
  Тест Левена для однородности дисперсий: p-value = 0.5892
