# Evaluación del Modelo

Este notebook evalúa el rendimiento del modelo entrenado y visualiza los resultados.

In [1]:
import sys
sys.path.append('..')

from src.models.classifier import DocumentClassifier
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.metrics import classification_report, confusion_matrix, roc_curve, auc
import cv2
import os
import pandas as pd

In [5]:
# Cargar modelo entrenado
model = DocumentClassifier()
model.load_model('../data/models/checkpoints/best_model.h5')
# notebooks\data\models\checkpoints
# Realizar predicciones en conjunto de validación
y_pred = model.predict(X_val)
y_pred_classes = (y_pred > 0.5).astype(int)

FileNotFoundError: [Errno 2] Unable to synchronously open file (unable to open file: name = '../data/models/document_classifier.h5', errno = 2, error message = 'No such file or directory', flags = 0, o_flags = 0)

In [None]:
# Matriz de confusión
cm = confusion_matrix(y_val, y_pred_classes)
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.title('Matriz de Confusión')
plt.ylabel('Etiqueta Verdadera')
plt.xlabel('Etiqueta Predicha')
plt.show()

# Reporte de clasificación
print("\nReporte de Clasificación:")
print(classification_report(y_val, y_pred_classes))

In [None]:
# Curva ROC
fpr, tpr, _ = roc_curve(y_val, y_pred)
roc_auc = auc(fpr, tpr)

plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, color='darkorange', lw=2, label=f'ROC curve (AUC = {roc_auc:.2f})')
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Tasa de Falsos Positivos')
plt.ylabel('Tasa de Verdaderos Positivos')
plt.title('Curva ROC')
plt.legend(loc="lower right")
plt.show()

In [None]:
# Análisis de errores
def plot_errors(X_val, y_val, y_pred_classes, num_examples=5):
    errors = np.where(y_val != y_pred_classes)[0]
    
    if len(errors) > 0:
        num_examples = min(num_examples, len(errors))
        fig, axes = plt.subplots(1, num_examples, figsize=(15, 3))
        
        for i, idx in enumerate(errors[:num_examples]):
            axes[i].imshow(X_val[idx].squeeze(), cmap='gray')
            axes[i].set_title(f'True: {y_val[idx]}\nPred: {y_pred_classes[idx]}')
            axes[i].axis('off')
        
        plt.tight_layout()
        plt.show()
    else:
        print("No se encontraron errores en la clasificación")

plot_errors(X_val, y_val, y_pred_classes)