<a href="https://colab.research.google.com/github/AgomferAustral/DMA-Caras/blob/main/Eigenfaces.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# conexion al Google Drive
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:


import cv2
import math
import numpy as np
import os
import random
import sys

from sklearn.model_selection import train_test_split
from sklearn.decomposition import PCA
from sklearn.manifold import Isomap



#!pip install --upgrade numpy
#!pip install --upgrade scipy




# Preprocesamos imagenes
## La carpeta de origen se llama Eigenfaces


In [None]:

face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + "haarcascade_frontalface_default.xml")




# Definicion de ruta de conexion - Origen - Destino imagenes

img_size=(60,60)

ruta_entrada = '/content/drive/MyDrive/Eigenfaces'
ruta_salida = f'/content/drive/MyDrive/Eigenfaces2-{img_size[0]}x{img_size[1]}'




# prompt: verificar si la carpeta en "ruta_salida" existe. Si no existe, crearla

if not os.path.exists(ruta_salida):
  os.makedirs(ruta_salida)



def procesar_archivos_en_carpetas(ruta_principal,ruta_final, imgsize):
  """Recorre las carpetas dentro de la ruta principal y procesa los archivos.

  Args:
    ruta_principal: La ruta de la carpeta principal.
  """

  fraccion = 8


  x_inicial = imgsize[0] // (fraccion - 2)
  y_inicial = imgsize[1] // (fraccion - 2)
  alto = imgsize[1]
  ancho = imgsize[0]
  multip = fraccion / (fraccion - 2)
  img_size = (math.floor(ancho * multip) , math.floor(alto * multip))


  print(f"Ruta principal: {ruta_principal}")
  for carpeta_actual, _, archivos in os.walk(ruta_principal):
    print(f"Carpeta actual: {carpeta_actual}")
    for archivo in archivos:
      print(f"Archivo: {archivo}")
      ruta_completa = os.path.join(carpeta_actual, archivo)
      try:

            img = cv2.imread(ruta_completa, cv2.IMREAD_GRAYSCALE)

            img = cv2.normalize(img, None, 0, 255, cv2.NORM_MINMAX)

            if img is None:
                print(f"⚠️ No se pudo leer: {ruta_completa}")
                continue

            # Detectar rostros
            faces = face_cascade.detectMultiScale(img, scaleFactor=1.1, minNeighbors=10, minSize=(110, 110))

            for i, (x, y, w, h) in enumerate(faces):
                face = img[y:y+h, x:x+w]  # Recortar rostro
                face_resized = cv2.resize(face, img_size)  # Redimensionar

                face_cutted = face_resized[y_inicial:y_inicial+alto, x_inicial:x_inicial+ancho]

                # Crear carpeta de salida manteniendo la estructura original
                relative_path = os.path.relpath(carpeta_actual, ruta_entrada)
                output_folder = os.path.join(ruta_salida, relative_path)
                os.makedirs(output_folder, exist_ok=True)

                # Guardar rostro procesado
                output_path = os.path.join(output_folder, f"{os.path.splitext(archivo)[0]}_face{i}.jpg")
                cv2.imwrite(output_path, face_cutted)
                print(f"✅ Guardado: {output_path}")


      except Exception as e:
          print(f"❌ Error procesando {ruta_completa}: {e}")


      except Exception as e:
        print(f"Error al procesar el archivo {ruta_completa}: {e}")



In [None]:
# Ejemplo de uso:
print("Procesando archivos")
procesar_archivos_en_carpetas(ruta_entrada, ruta_salida, img_size)
print("Proceso inicial terminado ...")


## el preprocesado queda en la carpeta Eigenfaces2-60x60

### copie una version de esa carpeta a "origen" para usar a continuacion

In [None]:
# origen de datos preprocesados
ruta_origen = "/content/drive/MyDrive/origen"

In [None]:
# Division de conjunto de datos

def dividir_datos(ruta_origen, proporcion_entrenamiento=0.75):
    """
    Divide las imágenes en conjuntos de entrenamiento y prueba,
    y guarda las etiquetas usando un diccionario de listas.

    Args:
        ruta_origen (str): Ruta al directorio raíz con las subcarpetas de imágenes.
        proporcion_entrenamiento (float): Proporción de imágenes para entrenamiento.

    Returns:
        dict: Diccionario con las rutas de las imágenes y etiquetas, organizadas en entrenamiento y prueba.
    """

    conjuntos_datos = {
        "entrenamiento": {"imagenes": [], "etiquetas": []},
        "prueba": {"imagenes": [], "etiquetas": []}
    }

    for persona in os.listdir(ruta_origen):
        ruta_persona = os.path.join(ruta_origen, persona)
        if os.path.isdir(ruta_persona):
            imagenes = [os.path.join(ruta_persona, img) for img in os.listdir(ruta_persona) if img.lower().endswith(('.png', '.jpg', '.jpeg'))]
            entrenamiento, prueba = train_test_split(imagenes, train_size=proporcion_entrenamiento, random_state=73)  # Semilla para reproducibilidad

            # Guardar datos de entrenamiento
            conjuntos_datos["entrenamiento"]["imagenes"].extend(entrenamiento)
            conjuntos_datos["entrenamiento"]["etiquetas"].extend([persona] * len(entrenamiento))

            # Guardar datos de prueba
            conjuntos_datos["prueba"]["imagenes"].extend(prueba)
            conjuntos_datos["prueba"]["etiquetas"].extend([persona] * len(prueba))

    return conjuntos_datos



In [None]:
# Ejemplo de uso
# En la variable "ruta_origen" se encuentran las imagenes preprocesadas para enternamiento
datos_divididos = dividir_datos(ruta_origen)

# Acceder a los datos
imagenes_entrenamiento = datos_divididos["entrenamiento"]["imagenes"]
etiquetas_entrenamiento = datos_divididos["entrenamiento"]["etiquetas"]
imagenes_prueba = datos_divididos["prueba"]["imagenes"]
etiquetas_prueba = datos_divididos["prueba"]["etiquetas"]

# Estructura de datos_divididos:
# {
#     "entrenamiento": {
#         "imagenes": ["ruta/a/imagen1.jpg", "ruta/a/imagen2.png", ...],
#         "etiquetas": ["persona1", "persona1", ...]
#     },
#     "prueba": {
#         "imagenes": ["ruta/a/imagen5.jpg", "ruta/a/imagen6.png", ...],
#         "etiquetas": ["persona2", "persona2", ...]
#     }
# }

In [None]:
print(imagenes_entrenamiento)
print("\n")
print(etiquetas_entrenamiento)
print("\n")
print(imagenes_prueba)
print("\n")
print(etiquetas_prueba)