# New Section

In [None]:
import pandas as pd
import numpy as np
from sklearn.neural_network import MLPRegressor
from sklearn.preprocessing import LabelEncoder
import joblib

# تحميل البيانات
df = pd.read_csv('diseases_dataset.csv')

# استخراج الأعراض (المدخلات) وأسماء الأمراض (المخرجات)
X = df.iloc[:, :-1]             # كل الأعمدة ما عدا الأخير (كـ DataFrame)
X_train = X.values              # تحويلها إلى مصفوفة NumPy مندون الاعمدة
y_labels = df.iloc[:, -1].values  # العمود الأخير = أسماء الأمراض

# 0    Influenza
# 1    Diabetes



# X_train = df.drop(columns=["prognosis"])
# y_labels = df["prognosis"]


ordered_symptoms = [
    'high_temperature', 'cough', 'sore_throat', 'muscle_pain', 'fatigue', 'exhaustion',
    'headache', 'increased_thirst', 'weight_loss', 'blurred_vision', 'dizziness', 'nosebleed',
    'shortness_of_breath', 'difficulty_breathing', 'wheezing', 'chest_tightness',
    'persistent_sadness', 'loss_of_interest', 'insomnia', 'hypersomnia', 'appetite_changes',
    'weight_changes', 'difficulty_concentrating', 'joint_pain', 'joint_swelling',
    'joint_stiffness', 'joint_redness', 'joint_warmth', 'chest_pain', 'chest_pressure',
    'heart_palpitations', 'memory_loss', 'difficulty_thinking', 'problem_solving_difficulty',
    'mood_changes', 'behavioral_changes', 'difficulty_performing_tasks', 'loss_of_appetite',
    'nausea', 'vomiting', 'yellow_skin', 'yellow_eyes', 'jaundice', 'sneezing', 'runny_nose',
    'itchy_eyes', 'skin_itching', 'skin_rash', 'persistent_cough', 'fever', 'abdominal_pain',
    'burning_sensation', 'chronic_diarrhea', 'bloody_diarrhea', 'severe_back_pain',
    'lower_back_pain', 'blood_in_urine', 'frequent_urination', 'painful_urination',
    'cloudy_urine', 'foul_smelling_urine', 'weakness', 'pale_skin', 'recurrent_fever',
    'night_sweats', 'hand_tremor', 'movement_difficulty', 'muscle_stiffness', 'muscle_weakness',
    'numbness', 'tingling', 'balance_difficulty', 'ear_pain', 'hearing_loss', 'ear_discharge',
    'rapid_weight_loss', 'weight_gain', 'feeling_cold', 'dry_skin', 'increased_appetite',
    'rapid_heartbeat', 'persistent_fatigue', 'swollen_lymph_nodes', 'facial_weakness',
    'arm_weakness', 'leg_weakness', 'speech_difficulty', 'loss_of_balance', 'severe_itching',
    'skin_redness', 'skin_patches', 'severe_headache', 'light_sensitivity', 'sound_sensitivity',
    'diarrhea', 'painful_swallowing', 'tonsil_redness', 'tonsil_swelling', 'skin_blisters',
    'constant_anxiety', 'tension', 'increased_heartbeat', 'attention_difficulty', 'impulsivity',
    'hyperactivity', 'joint_area_swelling', 'skin_itch', 'painless_genital_sores',
    'painless_mouth_sores', 'joint_fever', 'heart_inflammation', 'blood_vessel_inflammation'
]

# ترتيب الأعمدة حسب القائمة المحددة
X = df[ordered_symptoms]
feature_columns = ordered_symptoms  # نفس الترتيب المحمّل

# حفظ الأعمدة بالترتيب المطلوب
joblib.dump(feature_columns, 'feature_columns.pkl')

# # حفظ أسماء الأعراض في ملف
# feature_columns = X.columns.tolist()
# joblib.dump(feature_columns, 'feature_columns.pkl')  # ✅ حفظ الأعراض


# القائمة حسب الترتيب من الصورة
custom_classes = [
    "Influenza", "Diabetes", "Hypertension", "Asthma", "Depression",
    "Arthritis", "Heart Disease", "Alzheimer_s_Disease", "Hepatitis", "Allergies",
    "Pneumonia", "Stomach Ulcer", "Crohn_s_Disease", "Ulcerative Colitis", "Kidney Stones",
    "Cystitis", "Anemia", "Brucellosis", "Parkinson_s_Disease", "Multiple Sclerosis",
    "Ear Infection", "Type 1 Diabetes", "Type 2 Diabetes", "Hypothyroidism",
    "Hyperthyroidism", "HIV", "Viral Hepatitis (A, B, C)", "Rheumatoid Arthritis",
    "Stroke", "Eczema", "Migraine", "Food Poisoning", "Sore Throat (Tonsillitis)",
    "Contact Dermatitis", "Anxiety Disorder", "ADHD", "Gout", "Food Allergy",
    "Syphilis", "Rheumatic Fever"
]

# تحويل أسماء الأمراض إلى أرقام باستخدام ترتيب ثابت
label_encoder = LabelEncoder()
label_encoder.classes_ = np.array(custom_classes)  # تم التعيين يدويًا

# ثم تحويل البيانات:
y_numeric = label_encoder.transform(y_labels)

# # تحويل أسماء الأمراض إلى أرقام (من 0 إلى 39 أو حسب عدد الأمراض)
# label_encoder = LabelEncoder()
# y_numeric = label_encoder.fit_transform(y_labels)

# دالة تحويل الرقم إلى 6 خانات في base 8
def encode_to_6_outputs(num, base=8):
    vec = []
    for _ in range(6):
        vec.append(num % base)
        num //= base
    return vec[::-1]

# 5 -> 101000
# تحويل كل رقم إلى تمثيل 6 خانات
y_train = np.array([encode_to_6_outputs(n, base=8) for n in y_numeric])

# تعريف النموذج - 6 مخارج لأن لدينا 6 خانات
mlp_model = MLPRegressor(
    hidden_layer_sizes=(100,),
    solver='adam',
    learning_rate_init=0.01,
    activation='relu',
    max_iter=1000,
    random_state=42
)

# تدريب النموذج
mlp_model.fit(X_train, y_train)

# حفظ النموذج والمكونات
joblib.dump(mlp_model, 'mlp_disease_model_6_outputs.pkl')
joblib.dump(label_encoder, 'label_encoder.pkl')




['label_encoder.pkl']

In [None]:
import joblib
import numpy as np
import pandas as pd
from disease_symptoms_map import disease_symptoms  # {disease_name: [symptom1, symptom2, ...]}

# تحميل النموذج والمكوّنات
mlp_model = joblib.load('mlp_disease_model_6_outputs.pkl')  # النموذج ذو 6 مخارج
feature_columns = joblib.load('feature_columns.pkl')        # قائمة الأعراض (112)
label_encoder = joblib.load('label_encoder.pkl')            # لتفسير الناتج الرقمي إلى اسم المرض

# فك التشفير من 6 أرقام إلى رقم مرض
def decode_from_6_outputs(output_vec, base=8):
    num = 0
    for digit in output_vec:
        num = num * base + digit
    return num
# 101000 -> 5


def predict_disease(symptom_values: dict):

    first_disease = label_encoder.classes_[0]
    print("✅ أول مرض في الداتا:", first_disease)
    print("📋 أعراضه:", disease_symptoms.get(first_disease))

    # ⚠️ إنشاء DataFrame يحتوي على كل الأعراض، بقيم 0 افتراضية
    input_df = pd.DataFrame(0, index=[0], columns=feature_columns)

    # ✅ تحديث الأعراض المُدخلة بقيمة 1
    for symptom, value in symptom_values.items():
        if symptom in input_df.columns:
            input_df.at[0, symptom] = value

    # تحويل إلى مصفوفة NumPy (شكل (1, 112))
    input_array = input_df.values
    print("✅ input_array : ", input_array)

    # التنبؤ
    pred = mlp_model.predict(input_array)

    # تقريب وتحوّل إلى أعداد صحيحة
    predicted_output = np.round(pred[0]).astype(int)  # 6 أرقام [0-7] من base=8
    print("🔍 predicted_output : ", predicted_output)
# يقوم بتحويل ناتج النموذج العصبي MLPRegressor إلى تنسيق قابل للفهم (أي أعداد صحيحة بين 0 و 7)
# هذه الدالة تُرجع مصفوفة تحتوي على 6 أرقام تقريبية (أرقام عشرية) بين 0 و 7، مثلًا:
# pred = [[0.12, 0.01, 0.10, 1.99, 2.91, 1.02]]
#  -> pred = [[0, 0, 0, 2, 3, 1]]


    # تحويل 6 أرقام إلى رقم مرض
    predicted_index = decode_from_6_outputs(predicted_output, base=8)
    print("🔍 predicted_index : ", predicted_index)

# 17 %8 =2.125 -> 0.125 x8 =1
# 17//8 =2.125 -> 2 

# [0,0,0,0,2,1]

    # التحقق من صحة الرقم وفك اسم المرض
    if predicted_index < len(label_encoder.classes_):
        predicted_disease = label_encoder.classes_[predicted_index]
        # predicted_disease = "Anemia",
    else:
        predicted_disease = "Unknown"

    # حساب نسبة التأكد بناءً على الأعراض المتوقعة
    expected_symptoms = disease_symptoms.get(predicted_disease, [])
    matched_symptoms = [s for s in expected_symptoms if str(symptom_values.get(s, 0)) == '1']
    #   "fatigue":"1",
        # "difficulty_breathing":"1",
        # "heart_palpitations":"1",
        # "weakness":"1",

    if expected_symptoms:
        confidence = round(len(matched_symptoms) / len(expected_symptoms) * 100, 2)
    else:
        confidence = 0.0

    # Debug info
    print("🔍 المرض المتوقع:", predicted_disease)
    print("📋 الأعراض المتوقعة:", expected_symptoms)
    print("✅ الأعراض المطابقة:", matched_symptoms)
    print("🎯 نسبة التأكد:", confidence)

    return predicted_disease, confidence

# ✅ عيّنة من الأعراض لتجربة النموذج (خارج الدالة)
# sample_symptoms = {
#     "high_temperature": 1,
#     "cough": 1,
#     "sore_throat": 1,
#     "muscle_pain": 1,
#     "fatigue": 1,

# }

sample_symptoms = {
    "dizziness": 1,
    "nosebleed": 1,
    "shortness_of_breath": 1,
    "headache": 1,
  #  "fatigue": 1,

}

    # "exhaustion": 1,
# ✅ استدعاء الدالة لعرض التنبؤ
predict_disease(sample_symptoms)




✅ أول مرض في الداتا: Influenza
📋 أعراضه: ['high_temperature', 'cough', 'sore_throat', 'muscle_pain', 'fatigue', 'exhaustion', 'headache']
✅ input_array :  [[0 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
  0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
  0 0 0 0]]
🔍 predicted_output :  [0 0 0 0 0 1]
🔍 predicted_index :  1
🔍 المرض المتوقع: Diabetes
📋 الأعراض المتوقعة: ['fatigue', 'increased_thirst', 'weight_loss', 'blurred_vision', 'frequent_urination']
✅ الأعراض المطابقة: []
🎯 نسبة التأكد: 0.0


(np.str_('Diabetes'), 0.0)