# Análisis de Performance

En la evaluación de los modelos de aprendizaje automático, es crucial realizar un análisis de rendimiento para comprender cómo se desempeñan en la tarea de clasificación. Esto implica medir su capacidad para hacer predicciones precisas y evaluar su eficacia en la resolución del problema en cuestión. A continuación, se detalla el análisis de rendimiento realizado en este caso de estudio:

## Rendimiento

Una vez hechas las predicciones en varios modelos, ahora vamos a evaluar la precisión de cada uno y así comparar cuál funcionó mejor. 

In [None]:
model_performance = pd.DataFrame({
    'Model': ['Logistic Regression', 'K-Nearest Neighbors', 'Gaussian Naïve Bayes'],
    'Accuracy': [acc_logreg, acc_knn, acc_gnb]
})

model_performance.sort_values(by='Accuracy', ascending=False)

## Curvas ROC

La curva ROC es una herramienta esencial para evaluar el rendimiento de modelos de clasificación binaria. Muestra la relación entre la tasa de verdaderos positivos y la tasa de falsos positivos a medida que varía el umbral de decisión del modelo. 

Para eso generamos los gráficos correspondientes a cada modelo.

### Regresión Logística

In [None]:
fpr_logreg_clf, tpr_logreg_clf, thresholds_logreg_clf = roc_curve(test_y, logreg_clf.predict_proba(test_X)[:, 1])

plt.figure(figsize=(8, 6))
plt.plot(fpr_logreg_clf, tpr_logreg_clf, label='ROC Curve (Logistic Regression)')
plt.xlabel('False Positives Rate (FPR)')
plt.ylabel('True Positives Rate (TPR)')
plt.legend()
plt.show()

![Evaluación Regresión Logística](../images/liver_roc_logreg.jpg)

### k-Nearest Neighbors

In [None]:
fpr_knn_clf, tpr_knn_clf, thresholds_knn_clf = roc_curve(test_y, knn_clf.predict_proba(test_X)[:, 1])

plt.figure(figsize=(8, 6))
plt.plot(fpr_knn_clf, tpr_knn_clf, label='ROC Curve (K-Nearest Neighbors)')
plt.xlabel('False Positives Rate (FPR)')
plt.ylabel('True Positives Rate (TPR)')
plt.legend()
plt.show()

![Evaluación k-Nearest Neighbors](../images/liver_roc_knn.jpg)

### Naïve Bayes

In [None]:
fpr_gnb_clf, tpr_gnb_clf, thresholds_gnb_clf = roc_curve(test_y, gnb_clf.predict_proba(test_X)[:, 1])

plt.figure(figsize=(8, 6))
plt.plot(fpr_gnb_clf, tpr_gnb_clf, label='ROC Curve (Gaussian Naïve Bayes)')
plt.xlabel('False Positives Rate (FPR)')
plt.ylabel('True Positives Rate (TPR)')
plt.legend()
plt.show()

: 

![Evaluación Naïve Bayes](../images/liver_roc_gnb.jpg)

El análisis de rendimiento y las curvas ROC son componentes esenciales para comprender cómo se comportan los modelos de clasificación en términos de sus tasas de aciertos y errores. Estas métricas y gráficos proporcionan información valiosa para tomar decisiones informadas sobre la selección y ajuste de modelos y para evaluar su idoneidad para la tarea de clasificación en cuestión.