In [5]:
import cv2
import os
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report, f1_score, accuracy_score

# ==========================================
# CONFIGURACIÓN INICIAL
# ==========================================
# Definimos las clases. El índice 0 se deja vacío para coincidir con las carpetas s1, s2, s3.
subjects = ["", "Snoop Dogg", "Ice Cube", "Tupac Shakur"]

print("Iniciando sistema de reconocimiento para:", subjects[1:])

# ==========================================
# 1. FUNCIÓN DE DETECCIÓN DE ROSTROS
# ==========================================
def detect_face(img):
    """
    Recibe una imagen, la convierte a escala de grises y extrae el rostro.
    Usa el clasificador Haar Cascade para identificar rasgos faciales.
    """
    # Convertir a escala de grises (LBPH requiere un solo canal de color)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    
    # Cargar el detector de rostros pre-entrenado
    # Asegúrate de tener el archivo .xml en la misma carpeta que este script
    face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
    
    # Detectar rostros (scaleFactor=1.2 mejora la velocidad, minNeighbors=5 la precisión)
    faces = face_cascade.detectMultiScale(gray, scaleFactor=1.2, minNeighbors=5)
    
    # Si no se detecta ningún rostro, regresamos None
    if (len(faces) == 0):
        return None, None
    
    # Si detecta rostros, tomamos el primero (x, y, ancho, alto)
    (x, y, w, h) = faces[0]
    
    # Retornamos solo la región del rostro (cortada) y las coordenadas del rectángulo
    return gray[y:y+w, x:x+h], faces[0]

# ==========================================
# 2. PREPARACIÓN DE DATOS (ENTRENAMIENTO)
# ==========================================
def prepare_training_data(data_folder_path):
    """
    Lee las carpetas de entrenamiento, detecta rostros y prepara las etiquetas.
    Requisito: Mínimo 20 imágenes por categoría.
    """
    dirs = os.listdir(data_folder_path)
    faces = []
    labels = []
    
    print(f"Leyendo imágenes de: {data_folder_path}...")
    
    for dir_name in dirs:
        # Solo procesar carpetas que empiecen con 's' (s1, s2, s3)
        if not dir_name.startswith("s"):
            continue
            
        # Extraer el número de la etiqueta (ej: s1 -> 1)
        label = int(dir_name.replace("s", ""))
        subject_dir_path = data_folder_path + "/" + dir_name
        subject_images_names = os.listdir(subject_dir_path)
        
        for image_name in subject_images_names:
            if image_name.startswith("."): continue # Ignorar archivos ocultos
            
            image_path = subject_dir_path + "/" + image_name
            image = cv2.imread(image_path)
            
            if image is None: continue

            # Detectar rostro en la imagen actual
            face, rect = detect_face(image)
            
            # Si se encontró un rostro válido, lo agregamos al set de entrenamiento
            if face is not None:
                # Redimensionamos a 100x100 para estandarizar el tamaño
                face_resized = cv2.resize(face, (100, 100))
                faces.append(face_resized)
                labels.append(label)

    return faces, labels

# ==========================================
# 3. ENTRENAMIENTO DEL MODELO
# ==========================================
print("--- FASE 1: PREPARACIÓN Y ENTRENAMIENTO ---")
# Preparar datos
faces, labels = prepare_training_data("images/traindata")
print(f"Datos preparados. Total rostros válidos: {len(faces)}")
print(f"Total etiquetas: {len(labels)}")

# Crear el objeto reconocedor LBPH (Local Binary Patterns Histograms)
# Algoritmo sugerido en la Actividad 4
face_recognizer = cv2.face.LBPHFaceRecognizer_create()

# Entrenar el reconocedor
face_recognizer.train(faces, np.array(labels))
print("Modelo entrenado exitosamente.")

# ==========================================
# 4. EVALUACIÓN Y MÉTRICAS (F-SCORE)
# ==========================================
def evaluate_model(test_folder_path):
    """
    Evalúa el modelo con datos de prueba no vistos y calcula métricas.
    """
    print("\n--- FASE 2: EVALUACIÓN (TESTING) ---")
    y_true = [] # Etiquetas reales
    y_pred = [] # Etiquetas predichas
    correct_count = 0
    
    dirs = os.listdir(test_folder_path)
    
    for dir_name in dirs:
        if not dir_name.startswith("s"): continue
        
        true_label = int(dir_name.replace("s", ""))
        subject_dir_path = test_folder_path + "/" + dir_name
        subject_images_names = os.listdir(subject_dir_path)
        
        for image_name in subject_images_names:
            if image_name.startswith("."): continue
            
            image_path = subject_dir_path + "/" + image_name
            image = cv2.imread(image_path)
            if image is None: continue
            
            face, rect = detect_face(image)
            
            if face is not None:
                face_resized = cv2.resize(face, (100, 100))
                # Realizar predicción
                label_pred, confidence = face_recognizer.predict(face_resized)
                
                y_true.append(true_label)
                y_pred.append(label_pred)
                
                if true_label == label_pred:
                    correct_count += 1

    return y_true, y_pred, correct_count

# Ejecutar evaluación
true_labels, predicted_labels, correctos = evaluate_model("images/testdata")

# ==========================================
# 5. REPORTE DE RESULTADOS
# ==========================================
print("\n--- RESULTADOS FINALES ---")
print(f"Clasificaciones correctas: {correctos} de {len(true_labels)}")

# Calcular Accuracy
acc = accuracy_score(true_labels, predicted_labels)
print(f"Exactitud (Accuracy): {acc:.2f} ({acc*100:.1f}%)")

# Calcular F-Score
f_score = f1_score(true_labels, predicted_labels, average='macro')
print(f"F-Score (Macro Average): {f_score:.2f}")

print("\nReporte Detallado por Clase:")
print(classification_report(true_labels, predicted_labels, target_names=subjects[1:]))

Iniciando sistema de reconocimiento para: ['Snoop Dogg', 'Ice Cube', 'Tupac Shakur']
--- FASE 1: PREPARACIÓN Y ENTRENAMIENTO ---
Leyendo imágenes de: images/traindata...
Datos preparados. Total rostros válidos: 69
Total etiquetas: 69
Modelo entrenado exitosamente.

--- FASE 2: EVALUACIÓN (TESTING) ---

--- RESULTADOS FINALES ---
Clasificaciones correctas: 26 de 30
Exactitud (Accuracy): 0.87 (86.7%)
F-Score (Macro Average): 0.87

Reporte Detallado por Clase:
              precision    recall  f1-score   support

  Snoop Dogg       0.90      0.75      0.82        12
    Ice Cube       0.80      1.00      0.89        12
Tupac Shakur       1.00      0.83      0.91         6

    accuracy                           0.87        30
   macro avg       0.90      0.86      0.87        30
weighted avg       0.88      0.87      0.86        30

