In [4]:
# ===== Step 4: Hyperparameter Tuning for Logistic Regression =====
import pandas as pd
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_auc_score
import joblib

# تحميل البيانات النظيفة
df = pd.read_csv("/content/heart_disease_clean.csv")
selected_features = ['thalach', 'thal', 'cp', 'ca', 'oldpeak']

X = df[selected_features]
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

# إعداد GridSearchCV
param_grid = {
    'C': [0.01, 0.1, 1, 10],
    'penalty': ['l1', 'l2'],
    'solver': ['liblinear']  # liblinear يدعم l1 و l2
}

grid = GridSearchCV(LogisticRegression(max_iter=1000),
                    param_grid,
                    cv=5,
                    scoring='roc_auc',
                    n_jobs=-1)

grid.fit(X_train, y_train)

print("✅ أفضل باراميترز:", grid.best_params_)
print("📈 أفضل ROC-AUC (CV):", grid.best_score_)

# تقييم على test set
best_model = grid.best_estimator_
y_prob = best_model.predict_proba(X_test)[:,1]
print("🎯 ROC-AUC على Test Set:", roc_auc_score(y_test, y_prob))
import os
os.makedirs("models", exist_ok=True)  # لو الفولدر مش موجود هيعمله

# حفظ الموديل النهائي
joblib.dump(best_model, "models/final_model.pkl")
print("💾 تم حفظ الموديل في models/final_model.pkl")


✅ أفضل باراميترز: {'C': 1, 'penalty': 'l1', 'solver': 'liblinear'}
📈 أفضل ROC-AUC (CV): 0.8876777811560421
🎯 ROC-AUC على Test Set: 0.9307359307359307
💾 تم حفظ الموديل في models/final_model.pkl


In [5]:
import joblib
loaded_model = joblib.load("models/final_model.pkl")
print("✅ الموديل اتحمل بنجاح من الملف!")
print("🔍 نوع الموديل:", type(loaded_model))


✅ الموديل اتحمل بنجاح من الملف!
🔍 نوع الموديل: <class 'sklearn.linear_model._logistic.LogisticRegression'>


In [6]:
from google.colab import files
files.download("models/final_model.pkl")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>