In [8]:
import pandas as pd
import numpy as np

# Загрузка данных из файла
data = pd.read_csv('data_big.csv')

# Получение выборок
sample1 = data['diarrhea.1']
sample2 = data['weakness.1']

def equal_var_test(sample1, sample2, alpha=0.05):
    var1 = np.var(sample1, ddof=1)  # Вычисление выборочной дисперсии первой выборки
    var2 = np.var(sample2, ddof=1)  # Вычисление выборочной дисперсии второй выборки
    
    F = var1 / var2  # Вычисление статистики F-распределения
    F_critical = 1 / F  # Критическое значение статистики F-распределения
    
    if F < F_critical:
        return True
    else:
        return False

# Проверка гипотезы о равенстве дисперсий
if equal_var_test(sample1, sample2):
    print("Дисперсии выборок равны")
else:
    print("Дисперсии выборок не равны")


Дисперсии выборок равны


In [9]:
from scipy.stats import ttest_ind

def t_test(sample1, sample2, alpha=0.05):
    t_stat, p_value = ttest_ind(sample1, sample2)
    
    if p_value > alpha:
        return True
    else:
        return False

# Проверка гипотезы о равенстве средних значений
if t_test(sample1, sample2):
    print("Средние значения выборок равны")
else:
    print("Средние значения выборок не равны")

Средние значения выборок не равны


In [11]:
import pandas as pd
import statsmodels
import statsmodels.api as sm
from statsmodels.formula.api import ols
from scipy import stats
from statsmodels.stats import multicomp

# Загрузка данных из файла
data = pd.read_csv('data_big.csv')

# Получение переменных
factor_variable = data['tremor.1']
target_variable = data['weakness.1']

# Создание модели однофакторного дисперсионного анализа
model = ols('target_variable ~ factor_variable', data=data).fit()

# Проведение однофакторного дисперсионного анализа
anova_table = sm.stats.anova_lm(model, typ=2)

# Вывод таблицы ANOVA
print(anova_table)

# Проверка гипотезы о равенстве дисперсий
p_value = anova_table['PR(>F)'][0]
alpha = 0.05

if p_value > alpha:
    print("Гипотеза о равенстве дисперсий принимается")
else:
    print("Гипотеза о равенстве дисперсий отвергается")

# Множественные сравнения с поправками (например, метод Холма)
mc = sm.stats.multicomp.MultiComparison(data['weakness.1'], data['tremor.1'])
mc_results = mc.allpairtest(stats.ttest_ind, method='holm')

# Вывод результатов множественных сравнений
print(mc_results[0])


                    sum_sq    df         F    PR(>F)
factor_variable   0.826920   1.0  2.004275  0.166516
Residual         13.202492  32.0       NaN       NaN
Гипотеза о равенстве дисперсий принимается
Test Multiple Comparison ttest_ind 
FWER=0.05 method=holm
alphacSidak=0.02, alphacBonf=0.017
group1 group2   stat  pval pval_corr reject
-------------------------------------------
     0      1     nan  nan       nan  False
     0      2     nan  nan       nan  False
     1      2 -0.5298  0.6       1.0  False
-------------------------------------------


  var *= np.divide(n, n-ddof)  # to avoid error on division by zero
  var *= np.divide(n, n-ddof)  # to avoid error on division by zero


In [12]:
import pandas as pd
import scipy.stats as stats

# Загрузка данных из файла
data = pd.read_csv('data_big.csv')

# Получение переменных
diarrhea_variable = data['diarrhea.1']
weakness_variable = data['weakness.1']

# Проверка гипотезы о равенстве дисперсий (критерий Краскела-Уоллиса)
h_statistic, p_value_h = stats.kruskal(diarrhea_variable, weakness_variable)

alpha = 0.05

print('Переменная diarrhea.1 (2 градации):')
if p_value_h > alpha:
    print("Гипотеза о равенстве дисперсий принимается (критерий Краскела-Уоллиса)")
else:
    print("Гипотеза о равенстве дисперсий отвергается (критерий Краскела-Уоллиса)")

# Сравнение средних (критерий Манна-Уитни)
u_statistic, p_value_u = stats.mannwhitneyu(diarrhea_variable, weakness_variable)

if p_value_u > alpha:
    print("Нет статистически значимой разницы между средними (критерий Манна-Уитни)")
else:
    print("Есть статистически значимая разница между средними (критерий Манна-Уитни)")


Переменная diarrhea.1 (2 градации):
Гипотеза о равенстве дисперсий отвергается (критерий Краскела-Уоллиса)
Есть статистически значимая разница между средними (критерий Манна-Уитни)


In [13]:
# Получение переменных
tremor_variable = data['tremor.1']
weakness_variable = data['weakness.1']

# Проверка гипотезы о равенстве дисперсий (критерий Краскела-Уоллиса)
h_statistic, p_value_h = stats.kruskal(tremor_variable, weakness_variable)

alpha = 0.05

print('Переменная tremor.1 (3 градации):')
if p_value_h > alpha:
    print("Гипотеза о равенстве дисперсий принимается (критерий Краскела-Уоллиса)")
else:
    print("Гипотеза о равенстве дисперсий отвергается (критерий Краскела-Уоллиса)")

# Сравнение средних (критерий Манна-Уитни)
u_statistic, p_value_u = stats.mannwhitneyu(tremor_variable, weakness_variable)

if p_value_u > alpha:
    print("Нет статистически значимой разницы между средними (критерий Манна-Уитни)")
else:
    print("Есть статистически значимая разница между средними (критерий Манна-Уитни)")


Переменная tremor.1 (3 градации):
Гипотеза о равенстве дисперсий принимается (критерий Краскела-Уоллиса)
Нет статистически значимой разницы между средними (критерий Манна-Уитни)


In [14]:
# Получение переменных
suspiciousness_1 = data['suspiciousness.1']
suspiciousness_2 = data['suspiciousness.2']

# Проверка однородности изменений по критерию Стьюдента для зависимых выборок
t_statistic, p_value_t = stats.ttest_rel(suspiciousness_1, suspiciousness_2)

alpha = 0.05

if p_value_t > alpha:
    print("Нет статистически значимой разницы в изменениях (критерий Стьюдента для зависимых выборок)")
else:
    print("Есть статистически значимая разница в изменениях (критерий Стьюдента для зависимых выборок)")

# Проверка однородности изменений по ранговому критерию Вилкоксона
w_statistic, p_value_w = stats.wilcoxon(suspiciousness_1, suspiciousness_2)

if p_value_w > alpha:
    print("Нет статистически значимой разницы в изменениях (ранговый критерий Вилкоксона)")
else:
    print("Есть статистически значимая разница в изменениях (ранговый критерий Вилкоксона)")

Нет статистически значимой разницы в изменениях (критерий Стьюдента для зависимых выборок)
Нет статистически значимой разницы в изменениях (ранговый критерий Вилкоксона)


