In [5]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sklearn
from sklearn.metrics import roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV, cross_val_score
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.metrics import confusion_matrix




In [6]:

def curva_ROC(model_name,model,x_test,y_test):
    """
    Genera y muestra la curva ROC para un modelo de clasificación.

    Esta función toma un nombre de modelo, un modelo de clasificación de scikit-learn,
    y conjuntos de datos de prueba, y genera la curva ROC para evaluar el rendimiento del modelo.

    :param model_name: El nombre del modelo.
    :type model_name: str

    :param modelo: El modelo de clasificación de scikit-learn.
    :type modelo: sklearn.base.BaseEstimator

    :param x_test: Conjunto de datos de prueba (características).
    :type x_test: pandas.DataFrame or numpy.ndarray

    :param y_test: Conjunto de datos de prueba (etiquetas).
    :type y_test: pandas.Series or numpy.ndarray

    :return: None
    """
    
    # Obtener las probabilidades de predicción para la clase positiva
    y_prob_dt = model.predict_proba(x_test)[:, 1]

    # Calcular la curva ROC
    fpr_dt, tpr_dt, _ = roc_curve(y_test, y_prob_dt)
    roc_auc_dt = auc(fpr_dt, tpr_dt)

    # Dibujar la curva ROC
    plt.figure(figsize=(8, 6))
    plt.plot(fpr_dt, tpr_dt, color='green', lw=2, label='ROC curve (area = {:.2f})'.format(roc_auc_dt))
    plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.title('Receiver Operating Characteristic - {}'.format(model_name))
    plt.legend(loc='lower right')

In [7]:
def matriz_porcentajes(c_matrix):
    """
    Genera y muestra los procentajes de la matriz de confusión.

    Esta función toma la matriz de confusión, cambia los valores a porcentajes,
    y genera el grafico de heatmap.

    :param c_matrix: matriz de confusion.
    :type model_name: numpy matrix
        
    :return: None
    """   
    # Calcular porcentajes en lugar de contar
    cm_percentage = c_matrix.astype('float') / c_matrix.sum(axis=1)[:, np.newaxis] * 100.0

    # Crear un heatmap con seaborn
    
    sns.heatmap(cm_percentage, annot=True, fmt=".1f", cmap="Blues", square=True, cbar_kws={"shrink": 0.8})
    plt.xlabel('Etiquetas Predichas')
    plt.ylabel('Etiquetas Reales')
    plt.title('Matriz de Confusión con Porcentajes')
