In [36]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, confusion_matrix, roc_curve, auc
from sklearn.model_selection import train_test_split
from joblib import load

# Cargar los datos preprocesados
X = pd.read_csv('X_preprocessed.csv')
y = pd.read_csv('y_encoded.csv').squeeze()  

# Cargar modelos entrenados
svc_model = load('svc_model.joblib')
rf_model = load('rf_model.joblib')

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Predicciones y métricas para SVC
y_pred_svc = svc_model.predict(X_test)
y_prob_svc = svc_model.predict_proba(X_test)[:, 1]
fpr_svc, tpr_svc, _ = roc_curve(y_test, y_prob_svc)
roc_auc_svc = auc(fpr_svc, tpr_svc)

# Predicciones y métricas para RandomForest
y_pred_rf = rf_model.predict(X_test)
y_prob_rf = rf_model.predict_proba(X_test)[:, 1]
fpr_rf, tpr_rf, _ = roc_curve(y_test, y_prob_rf)
roc_auc_rf = auc(fpr_rf, tpr_rf)

# Reportes y matrices de confusión
print("Informe de clasificación para SVC:")
print(classification_report(y_test, y_pred_svc))
print("Matriz de confusión para SVC:")
print(confusion_matrix(y_test, y_pred_svc))

print("Informe de clasificación para RandomForest:")
print(classification_report(y_test, y_pred_rf))
print("Matriz de confusión para RandomForest:")
print(confusion_matrix(y_test, y_pred_rf))

# Comparación de curvas ROC
plt.figure()
plt.plot(fpr_svc, tpr_svc, color='darkorange', lw=2, label='Curva ROC SVC (área = %0.2f)' % roc_auc_svc)
plt.plot(fpr_rf, tpr_rf, color='blue', lw=2, label='Curva ROC RF (área = %0.2f)' % roc_auc_rf)
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Tasa de Falsos Positivos')
plt.ylabel('Tasa de Verdaderos Positivos')
plt.title('Comparación de Curvas ROC')
plt.legend(loc="lower right")
plt.grid()
plt.show()


AttributeError: This 'GridSearchCV' has no attribute 'predict_proba'