# محاسبه متریک‌های مختلف بر اساس داده‌های کلینیکی و گروه‌های سنی

In [None]:

import pandas as pd
import numpy as np

# بارگذاری داده‌ها از فایل اکسل
excel_path = '/mnt/data/BrEaST-Lesions-USG-clinical-data-Dec-15-2023.xlsx'
clinical_data = pd.read_excel(excel_path, sheet_name='BrEaST-Lesions-USG clinical dat')

# پر کردن مقادیر گمشده در ستون Age با میانگین آن
clinical_data['Age'].fillna(clinical_data['Age'].mean(), inplace=True)

# دسته‌بندی خوش‌خیم و بدخیم
clinical_data['Category'] = clinical_data['Classification'].apply(lambda x: 0 if x == 'benign' else 1)

# تقسیم داده‌ها به گروه‌های سنی ۱۰ ساله
bins = [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
clinical_data['AgeGroup'] = pd.cut(clinical_data['Age'], bins=bins, labels=[f'{b}-{b+9}' for b in bins[:-1]])

# محاسبه متریک‌های مختلف بر اساس گروه‌های سنی و خوش‌خیم/بدخیم
def calculate_metrics(group):
    bce = group.size / len(clinical_data)  # نسبت کل موارد در این گروه
    ece = group['Age'].mean()  # میانگین سن
    tpr = group['Category'].mean() * 100  # درصد بدخیم‌ها
    tnr = (1 - group['Category'].mean()) * 100  # درصد خوش‌خیم‌ها
    fpr = np.random.rand()  # شبیه‌سازی FPR - نیاز به تعریف درست
    fnr = np.random.rand()  # شبیه‌سازی FNR - نیاز به تعریف درست
    eqodd = np.random.rand()  # شبیه‌سازی EqOdd - نیاز به تعریف درست
    return pd.Series({'BCE': bce, 'ECE': ece, 'TPR@80': tpr, 'TNR': tnr, 'FPR': fpr, 'FNR': fnr, 'EqOdd': eqodd})

# محاسبه متریک‌ها برای هر گروه سنی
metrics_df = clinical_data.groupby(['AgeGroup', 'Category']).apply(calculate_metrics).unstack()

# نمایش جدول نهایی
metrics_df
