In [5]:
import pandas as pd
from scipy.stats import shapiro, mannwhitneyu, ttest_ind

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(healthy_data, sick_data, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_healthy_stat, shapiro_healthy_p = shapiro(healthy_data)
    shapiro_sick_stat, shapiro_sick_p = shapiro(sick_data)
    
    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_healthy_p > 0.05 and shapiro_sick_p > 0.05:
        # داده‌ها نرمال هستند، از t-test استفاده می‌کنیم
        t_stat, p_value = ttest_ind(healthy_data, sick_data, equal_var=False)
        test_used = "t-test"
    else:
        # داده‌ها نرمال نیستند، از Mann-Whitney U test استفاده می‌کنیم
        u_stat, p_value = mannwhitneyu(healthy_data, sick_data, alternative='two-sided')
        test_used = "Mann-Whitney U test"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    healthy_mean = healthy_data.mean()
    sick_mean = sick_data.mean()
    healthy_std = healthy_data.std()
    sick_std = sick_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Healthy Mean': healthy_mean,
        'Sick Mean': sick_mean,
        'Healthy Std': healthy_std,
        'Sick Std': sick_std,
        'Shapiro Healthy p-value': shapiro_healthy_p,
        'Shapiro Sick p-value': shapiro_sick_p,
        'p-value (t-test/U-test)': p_value,
        'Test Used': test_used  # نتیجه تست آماری که استفاده شده
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به گروه سالم و بیمار
    healthy_data = df.iloc[:13]['Individual Means']  # 13 نفر سالم
    sick_data = df.iloc[13:]['Individual Means']     # 113 نفر بیمار
    
    # تحلیل آماری برای هر فایل
    analyze_group_statistics(healthy_data, sick_data, sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3\analysis_results3.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3\analysis_results3.xlsx ذخیره شد.


In [8]:
import pandas as pd
from scipy.stats import shapiro, mannwhitneyu, ttest_ind

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group1_name, group2_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    
    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05:
        # داده‌ها نرمال هستند، از t-test استفاده می‌کنیم
        t_stat, p_value = ttest_ind(group1_data, group2_data, equal_var=False)
        test_used = "t-test"
    else:
        # داده‌ها نرمال نیستند، از Mann-Whitney U test استفاده می‌کنیم
        u_stat, p_value = mannwhitneyu(group1_data, group2_data, alternative='two-sided')
        test_used = "Mann-Whitney U test"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'p-value (t-test/U-test)': p_value,
        'Test Used': test_used  # نتیجه تست آماری که استفاده شده
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, "Group 1 (1-13)", "Group 2 (14-126)", sheet_name)
    analyze_group_statistics(group2_data, group3_data, "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)
    analyze_group_statistics(group1_data, group3_data, "Group 1 (1-13)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/analysis_results1.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/analysis_results1.xlsx ذخیره شد.


In [11]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used  # نتیجه تست آماری که استفاده شده
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/analysis_results1_three.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/analysis_results1_three.xlsx ذخیره شد.


In [12]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal
import statsmodels.api as sm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
        
        # اگر ANOVA معنی‌دار است، از آزمون Tukey's HSD برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            tukey = pairwise_tukeyhsd(data_combined, labels, alpha=0.05)
            tukey_results = tukey.summary()
        else:
            tukey_results = "No significant differences found"
        
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"
        
        # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            dunn_results = sp.posthoc_dunn(data_combined, labels)
        else:
            dunn_results = "No significant differences found"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used,
        'Post-Hoc Results': tukey_results if test_used == "ANOVA" else dunn_results  # نتایج پس‌هاک
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/analysis_results3_withPosthoc.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


ModuleNotFoundError: No module named 'scikit_posthocs'

In [13]:
pip install scikit-posthocs


Note: you may need to restart the kernel to use updated packages.


ERROR: Could not find a version that satisfies the requirement scikit-posthocs (from versions: none)

[notice] A new release of pip is available: 24.3.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip
ERROR: No matching distribution found for scikit-posthocs


In [14]:
pip install pingouin


Note: you may need to restart the kernel to use updated packages.


ERROR: Could not find a version that satisfies the requirement pingouin (from versions: none)

[notice] A new release of pip is available: 24.3.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip
ERROR: No matching distribution found for pingouin


In [21]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal
import statsmodels.api as sm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.spatial.distance import pdist, squareform

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
        
        # اگر ANOVA معنی‌دار است، از آزمون Tukey's HSD برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            tukey = pairwise_tukeyhsd(data_combined, labels, alpha=0.05)
            tukey_results = tukey.summary()
        else:
            tukey_results = "No significant differences found"
        
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"
        
        # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            # اجرای Dunn's Test به کمک فاصله جفتی (pairwise) و استفاده از مدل داده‌های اصلی
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            dist_matrix = pdist(data_combined.values.reshape(-1, 1))
            square_dist = squareform(dist_matrix)
            dunn_results = square_dist  # برای تست Dunn's باید محاسبات بیشتری انجام دهیم
        else:
            dunn_results = "No significant differences found"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used,
        'Post-Hoc Results': tukey_results if test_used == "ANOVA" else dunn_results  # نتایج پس‌هاک
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/analysis_results1_withPosthoc.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient1/analysis_results1_withPosthoc.xlsx ذخیره شد.


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/analysis_results2_withPosthoc.xlsx ذخیره شد.


In [1]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal
import statsmodels.api as sm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.spatial.distance import pdist, squareform
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
        
        # اگر ANOVA معنی‌دار است، از آزمون Tukey's HSD برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            tukey = pairwise_tukeyhsd(data_combined, labels, alpha=0.05)
            tukey_results = tukey.summary()
        else:
            tukey_results = "No significant differences found"
        
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"
        
        # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            # اجرای Dunn's Test با استفاده از scikit-posthocs
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            dunn_results = sp.posthoc_dunn(data_combined, groups=labels, p_adjust='bonferroni')
        else:
            dunn_results = "No significant differences found"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used,
        'Post-Hoc Results': tukey_results if test_used == "ANOVA" else dunn_results  # نتایج پس‌هاک
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/analysis_results2_withPosthoc2.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


ModuleNotFoundError: No module named 'scikit_posthocs'

In [2]:
pip install scikit-posthocs


Collecting scikit-posthocs
  Downloading scikit_posthocs-0.11.4-py3-none-any.whl.metadata (5.8 kB)
Downloading scikit_posthocs-0.11.4-py3-none-any.whl (33 kB)
Installing collected packages: scikit-posthocs
Successfully installed scikit-posthocs-0.11.4
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.3.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [3]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal
import statsmodels.api as sm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.spatial.distance import pdist, squareform
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
        
        # اگر ANOVA معنی‌دار است، از آزمون Tukey's HSD برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            tukey = pairwise_tukeyhsd(data_combined, labels, alpha=0.05)
            tukey_results = tukey.summary()
        else:
            tukey_results = "No significant differences found"
        
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"
        
        # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            # اجرای Dunn's Test با استفاده از scikit-posthocs
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            dunn_results = sp.posthoc_dunn(data_combined, groups=labels, p_adjust='bonferroni')
        else:
            dunn_results = "No significant differences found"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used,
        'Post-Hoc Results': tukey_results if test_used == "ANOVA" else dunn_results  # نتایج پس‌هاک
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/analysis_results2_withPosthoc2.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


TypeError: posthoc_dunn() got an unexpected keyword argument 'groups'

In [4]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal
import statsmodels.api as sm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.spatial.distance import pdist, squareform
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
        
        # اگر ANOVA معنی‌دار است، از آزمون Tukey's HSD برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            tukey = pairwise_tukeyhsd(data_combined, labels, alpha=0.05)
            tukey_results = tukey.summary()
        else:
            tukey_results = "No significant differences found"
        
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"
        
        # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            # اجرای Dunn's Test با استفاده از scikit-posthocs
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            
            # استفاده از posthoc_dunn برای مقایسه پس‌هاک
            dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        else:
            dunn_results = "No significant differences found"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used,
        'Post-Hoc Results': tukey_results if test_used == "ANOVA" else dunn_results  # نتایج پس‌هاک
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/analysis_results2_withPosthoc2.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/analysis_results2_withPosthoc2.xlsx ذخیره شد.


In [5]:
import pandas as pd
from scipy.stats import kruskal
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج پس‌هاک در یک لیست
posthoc_results = []

# تابع برای انجام آزمون‌های پس‌هاک
def perform_posthoc(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون Kruskal-Wallis
    h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
    
    # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
    if p_value < 0.05:
        # اجرای Dunn's Test با استفاده از scikit-posthocs
        data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
        labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
        
        # استفاده از posthoc_dunn برای مقایسه پس‌هاک
        dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        
        # ذخیره نتایج پس‌هاک در لیست
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': dunn_results
        })
    else:
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': "No significant differences found"
        })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # انجام آزمون‌های پس‌هاک برای مقایسه گروه‌ها
    perform_posthoc(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج پس‌هاک به DataFrame
posthoc_results_df = pd.DataFrame(posthoc_results)

# ذخیره نتایج پس‌هاک در فایل Excel
posthoc_output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results2.xlsx"
posthoc_results_df.to_excel(posthoc_output_path, index=False)

print(f"نتایج پس‌هاک در فایل {posthoc_output_path} ذخیره شد.")


نتایج پس‌هاک در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results2.xlsx ذخیره شد.


In [6]:
import pandas as pd
from scipy.stats import kruskal
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج پس‌هاک در یک لیست
posthoc_results = []

# تابع برای انجام آزمون‌های پس‌هاک
def perform_posthoc(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون Kruskal-Wallis
    h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
    
    # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
    if p_value < 0.05:
        # اجرای Dunn's Test با استفاده از scikit-posthocs
        data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
        labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
        
        # استفاده از posthoc_dunn برای مقایسه پس‌هاک
        dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        
        # تبدیل نتایج Dunn's Test به یک DataFrame ۳x۳
        dunn_results_df = pd.DataFrame(dunn_results, columns=[group1_name, group2_name, group3_name], index=[group1_name, group2_name, group3_name])
        
        # ذخیره نتایج پس‌هاک در لیست
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': dunn_results_df
        })
    else:
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': "No significant differences found"
        })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # انجام آزمون‌های پس‌هاک برای مقایسه گروه‌ها
    perform_posthoc(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج پس‌هاک به DataFrame برای نتایج پس‌هاک
posthoc_results_df = pd.DataFrame(posthoc_results)

# ذخیره نتایج پس‌هاک در فایل Excel
posthoc_output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results.xlsx"
posthoc_results_df.to_excel(posthoc_output_path, index=False)

print(f"نتایج پس‌هاک در فایل {posthoc_output_path} ذخیره شد.")


نتایج پس‌هاک در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results.xlsx ذخیره شد.


In [7]:
import pandas as pd
from scipy.stats import kruskal
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج پس‌هاک در یک لیست
posthoc_results = []

# تابع برای انجام آزمون‌های پس‌هاک
def perform_posthoc(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون Kruskal-Wallis
    h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
    
    # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
    if p_value < 0.05:
        # اجرای Dunn's Test با استفاده از scikit-posthocs
        data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
        labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
        
        # استفاده از posthoc_dunn برای مقایسه پس‌هاک
        dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        
        # تبدیل نتایج Dunn's Test به یک DataFrame ۳x۳ با نام گروه‌ها
        dunn_results_df = pd.DataFrame(dunn_results, columns=[group1_name, group2_name, group3_name], index=[group1_name, group2_name, group3_name])
        
        # ذخیره نتایج پس‌هاک در لیست
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': dunn_results_df
        })
    else:
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': "No significant differences found"
        })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # انجام آزمون‌های پس‌هاک برای مقایسه گروه‌ها
    perform_posthoc(group1_data, group2_data, group3_data, "Non-Hospital", "Hospital", "Healthy", sheet_name)

# تبدیل نتایج پس‌هاک به DataFrame برای نتایج پس‌هاک
posthoc_results_df = pd.DataFrame(posthoc_results)

# ذخیره نتایج پس‌هاک در فایل Excel
posthoc_output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results.xlsx"
posthoc_results_df.to_excel(posthoc_output_path, index=False)

print(f"نتایج پس‌هاک در فایل {posthoc_output_path} ذخیره شد.")


نتایج پس‌هاک در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results.xlsx ذخیره شد.


In [8]:
import pandas as pd
from scipy.stats import kruskal
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج پس‌هاک در یک لیست
posthoc_results = []

# تابع برای انجام آزمون‌های پس‌هاک
def perform_posthoc(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون Kruskal-Wallis
    h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
    
    # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
    if p_value < 0.05:
        # اجرای Dunn's Test با استفاده از scikit-posthocs
        data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
        labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
        
        # استفاده از posthoc_dunn برای مقایسه پس‌هاک
        dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        
        # تبدیل نتایج Dunn's Test به یک DataFrame ۳x۳
        dunn_results_df = pd.DataFrame(dunn_results, columns=[group1_name, group2_name, group3_name], index=[group1_name, group2_name, group3_name])
        
        # نمایش پی‌ویِی‌ها بین هر دو گروه
        for row in dunn_results_df.index:
            for col in dunn_results_df.columns:
                print(f"P-value between {row} and {col}: {dunn_results_df.loc[row, col]}")
        
        # ذخیره نتایج پس‌هاک در لیست
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': dunn_results_df
        })
    else:
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': "No significant differences found"
        })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # انجام آزمون‌های پس‌هاک برای مقایسه گروه‌ها
    perform_posthoc(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج پس‌هاک به DataFrame برای نتایج پس‌هاک
posthoc_results_df = pd.DataFrame(posthoc_results)

# ذخیره نتایج پس‌هاک در فایل Excel
posthoc_output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results.xlsx"
posthoc_results_df.to_excel(posthoc_output_path, index=False)

print(f"نتایج پس‌هاک در فایل {posthoc_output_path} ذخیره شد.")


P-value between Group 1 (1-13) and Group 1 (1-13): nan
P-value between Group 1 (1-13) and Group 2 (14-126): nan
P-value between Group 1 (1-13) and Group 3 (127-179): nan
P-value between Group 2 (14-126) and Group 1 (1-13): nan
P-value between Group 2 (14-126) and Group 2 (14-126): nan
P-value between Group 2 (14-126) and Group 3 (127-179): nan
P-value between Group 3 (127-179) and Group 1 (1-13): nan
P-value between Group 3 (127-179) and Group 2 (14-126): nan
P-value between Group 3 (127-179) and Group 3 (127-179): nan
P-value between Group 1 (1-13) and Group 1 (1-13): nan
P-value between Group 1 (1-13) and Group 2 (14-126): nan
P-value between Group 1 (1-13) and Group 3 (127-179): nan
P-value between Group 2 (14-126) and Group 1 (1-13): nan
P-value between Group 2 (14-126) and Group 2 (14-126): nan
P-value between Group 2 (14-126) and Group 3 (127-179): nan
P-value between Group 3 (127-179) and Group 1 (1-13): nan
P-value between Group 3 (127-179) and Group 2 (14-126): nan
P-value bet

In [10]:
import pandas as pd
from scipy.stats import kruskal
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج پس‌هاک در یک لیست
posthoc_results = []

# تابع برای انجام آزمون‌های پس‌هاک
def perform_posthoc(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون Kruskal-Wallis
    h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
    
    # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
    if p_value < 0.05:
        # اجرای Dunn's Test با استفاده از scikit-posthocs
        data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
        labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
        
        # استفاده از posthoc_dunn برای مقایسه پس‌هاک
        dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        
        # تبدیل نتایج Dunn's Test به یک DataFrame ۳x۳
        dunn_results_df = pd.DataFrame(dunn_results, columns=[group1_name, group2_name, group3_name], index=[group1_name, group2_name, group3_name])
        
        # نمایش نتایج پس‌هاک در قالب ماتریس ۳x۳
        print(f"Post-Hoc Results for {health_status}:")
        print(dunn_results_df)
        print("\n")
        
        # ذخیره نتایج پس‌هاک در لیست
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': dunn_results_df
        })
    else:
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': "No significant differences found"
        })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # انجام آزمون‌های پس‌هاک برای مقایسه گروه‌ها
    perform_posthoc(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج پس‌هاک به DataFrame برای نتایج پس‌هاک
posthoc_results_df = pd.DataFrame(posthoc_results)

# ذخیره نتایج پس‌هاک در فایل Excel
posthoc_output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/posthoc_results.xlsx"
posthoc_results_df.to_excel(posthoc_output_path, index=False)

print(f"نتایج پس‌هاک در فایل {posthoc_output_path} ذخیره شد.")


Post-Hoc Results for Somatomotor Network:
                   Group 1 (1-13)  Group 2 (14-126)  Group 3 (127-179)
Group 1 (1-13)                NaN               NaN                NaN
Group 2 (14-126)              NaN               NaN                NaN
Group 3 (127-179)             NaN               NaN                NaN


نتایج پس‌هاک در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/posthoc_results.xlsx ذخیره شد.


In [11]:
import pandas as pd
from scipy.stats import kruskal
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج پس‌هاک در یک لیست
posthoc_results = []

# تابع برای انجام آزمون‌های پس‌هاک
def perform_posthoc(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون Kruskal-Wallis
    h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
    
    # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
    if p_value < 0.05:
        # اجرای Dunn's Test با استفاده از scikit-posthocs
        data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
        labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
        
        # استفاده از posthoc_dunn برای مقایسه پس‌هاک
        dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        
        # تبدیل نتایج Dunn's Test به یک DataFrame ۳x۳
        dunn_results_df = pd.DataFrame(dunn_results, columns=[group1_name, group2_name, group3_name], index=[group1_name, group2_name, group3_name])
        
        # نمایش مقادیر P-value بین هر دو گروه
        print(f"Post-Hoc Results for {health_status}:")
        for row in dunn_results_df.index:
            for col in dunn_results_df.columns:
                print(f"P-value between {row} and {col}: {dunn_results_df.loc[row, col]}")
        
        # ذخیره نتایج پس‌هاک در لیست
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': dunn_results_df
        })
    else:
        posthoc_results.append({
            'Health Status': health_status,
            'Post-Hoc Results': "No significant differences found"
        })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # انجام آزمون‌های پس‌هاک برای مقایسه گروه‌ها
    perform_posthoc(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج پس‌هاک به DataFrame برای نتایج پس‌هاک
posthoc_results_df = pd.DataFrame(posthoc_results)

# ذخیره نتایج پس‌هاک در فایل Excel
posthoc_output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient2/posthoc_results.xlsx"
posthoc_results_df.to_excel(posthoc_output_path, index=False)

print(f"نتایج پس‌هاک در فایل {posthoc_output_path} ذخیره شد.")


Post-Hoc Results for Default Network:
P-value between Group 1 (1-13) and Group 1 (1-13): nan
P-value between Group 1 (1-13) and Group 2 (14-126): nan
P-value between Group 1 (1-13) and Group 3 (127-179): nan
P-value between Group 2 (14-126) and Group 1 (1-13): nan
P-value between Group 2 (14-126) and Group 2 (14-126): nan
P-value between Group 2 (14-126) and Group 3 (127-179): nan
P-value between Group 3 (127-179) and Group 1 (1-13): nan
P-value between Group 3 (127-179) and Group 2 (14-126): nan
P-value between Group 3 (127-179) and Group 3 (127-179): nan
Post-Hoc Results for Limbic Network:
P-value between Group 1 (1-13) and Group 1 (1-13): nan
P-value between Group 1 (1-13) and Group 2 (14-126): nan
P-value between Group 1 (1-13) and Group 3 (127-179): nan
P-value between Group 2 (14-126) and Group 1 (1-13): nan
P-value between Group 2 (14-126) and Group 2 (14-126): nan
P-value between Group 2 (14-126) and Group 3 (127-179): nan
P-value between Group 3 (127-179) and Group 1 (1-13): 

In [13]:
import pandas as pd
from scipy.stats import shapiro, f_oneway, kruskal
import statsmodels.api as sm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
from scipy.spatial.distance import pdist, squareform
import scikit_posthocs as sp

# بارگذاری داده‌ها از فایل اکسل
input_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/individual_means.xlsx"
data = pd.read_excel(input_path, sheet_name=None)

# ذخیره نتایج آماری در یک لیست
results = []

# تابع برای انجام تحلیل و محاسبه آمار
def analyze_group_statistics(group1_data, group2_data, group3_data, group1_name, group2_name, group3_name, health_status):
    # انجام آزمون نرمال بودن (Shapiro-Wilk)
    shapiro_group1_stat, shapiro_group1_p = shapiro(group1_data)
    shapiro_group2_stat, shapiro_group2_p = shapiro(group2_data)
    shapiro_group3_stat, shapiro_group3_p = shapiro(group3_data)

    # انتخاب تست آماری بر اساس نتایج شاپیرو
    if shapiro_group1_p > 0.05 and shapiro_group2_p > 0.05 and shapiro_group3_p > 0.05:
        # داده‌ها نرمال هستند، از ANOVA استفاده می‌کنیم
        f_stat, p_value = f_oneway(group1_data, group2_data, group3_data)
        test_used = "ANOVA"
        
        # اگر ANOVA معنی‌دار است، از آزمون Tukey's HSD برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            tukey = pairwise_tukeyhsd(data_combined, labels, alpha=0.05)
            tukey_results = tukey.summary()
        else:
            tukey_results = "No significant differences found"
        
    else:
        # داده‌ها نرمال نیستند، از Kruskal-Wallis استفاده می‌کنیم
        h_stat, p_value = kruskal(group1_data, group2_data, group3_data)
        test_used = "Kruskal-Wallis"
        
        # اگر Kruskal-Wallis معنی‌دار است، از آزمون Dunn's Test برای مقایسه پس‌هاک استفاده می‌کنیم
        if p_value < 0.05:
            # اجرای Dunn's Test با استفاده از scikit-posthocs
            data_combined = pd.concat([group1_data, group2_data, group3_data], axis=0)
            labels = [group1_name] * len(group1_data) + [group2_name] * len(group2_data) + [group3_name] * len(group3_data)
            
            # استفاده از posthoc_dunn برای مقایسه پس‌هاک
            dunn_results = sp.posthoc_dunn([group1_data, group2_data, group3_data], p_adjust='bonferroni')
        else:
            dunn_results = "No significant differences found"

    # محاسبه میانگین و انحراف معیار برای هر گروه
    group1_mean = group1_data.mean()
    group2_mean = group2_data.mean()
    group3_mean = group3_data.mean()
    group1_std = group1_data.std()
    group2_std = group2_data.std()
    group3_std = group3_data.std()

    # ذخیره نتایج در لیست
    results.append({
        'Health Status': health_status,
        'Group1': group1_name,
        'Group2': group2_name,
        'Group3': group3_name,
        'Group1 Mean': group1_mean,
        'Group2 Mean': group2_mean,
        'Group3 Mean': group3_mean,
        'Group1 Std': group1_std,
        'Group2 Std': group2_std,
        'Group3 Std': group3_std,
        'Shapiro Group1 p-value': shapiro_group1_p,
        'Shapiro Group2 p-value': shapiro_group2_p,
        'Shapiro Group3 p-value': shapiro_group3_p,
        'p-value (ANOVA/Kruskal-Wallis)': p_value,
        'Test Used': test_used,
        'Post-Hoc Results': tukey_results if test_used == "ANOVA" else dunn_results  # نتایج پس‌هاک
    })

# انجام تحلیل برای تمام شیت‌ها (برای هر فایل)
for sheet_name, df in data.items():
    # تقسیم داده‌ها به سه گروه
    group1_data = df.iloc[:13]['Individual Means']  # گروه اول: 13 نفر
    group2_data = df.iloc[13:126]['Individual Means']  # گروه دوم: 113 نفر
    group3_data = df.iloc[126:179]['Individual Means']  # گروه سوم: 53 نفر (از 127 تا 179)

    # تحلیل آماری برای مقایسه گروه‌ها
    analyze_group_statistics(group1_data, group2_data, group3_data, "Group 1 (1-13)", "Group 2 (14-126)", "Group 3 (127-179)", sheet_name)

# تبدیل نتایج به DataFrame
results_df = pd.DataFrame(results)

# ذخیره نتایج در فایل Excel
output_path = r"D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/analysis_results3_withPosthoc3.xlsx"
results_df.to_excel(output_path, index=False)

print(f"تحلیل‌ها انجام شد و نتایج در فایل {output_path} ذخیره شد.")


تحلیل‌ها انجام شد و نتایج در فایل D:/DOC Aarabi/parkinson/new paper/new13-06/text/ALL EXEL SUBNETWORKS GRADIENT/Gradient3/analysis_results3_withPosthoc3.xlsx ذخیره شد.
