# 01b_reetiquetado_binario.ipynb

## Reetiquetado Binario: Apto vs NoApto

Este notebook carga las carpetas originales de imágenes de tres clases (“Atento”, “Bostezo” y “Ojos cerrados”) y las reetiqueta en dos carpetas: Apto y NoApto.

**Estructura general:**
1. Configuración de rutas
2. Visualización rápida del dataset original
3. Funciones de reetiquetado
4. Ejecución del reetiquetado
5. Verificación de la nueva estructura

---
- **Apto**   ↔ imágenes de la clase `Atento`  
- **NoApto** ↔ imágenes de `Bostezo` + `Ojos_cerrados`

Vamos paso a paso: primero configuramos rutas y dependencias, luego creamos la estructura, definimos la función de reetiquetado, la ejecutamos y, finalmente, verificamos.

---

In [8]:

## 1. Imports y configuración de rutas

from pathlib import Path
import shutil, os
from tqdm import tqdm

# ------------------------
# Ajusta aquí si cambias nombres
# ------------------------
ROOT = Path("../data/balanced_frames")   # Origen: Atento, Bostezo, Ojos_cerrados
DEST = Path("../data/binario")           # Destino: Apto, NoApto

CLASE_ATENTO   = "Atento"
CLASE_NOAPTO   = ["Bostezo", "Eyes_Closed"]

# Extensiones de imagen a procesar
EXTS = ["*.jpg", "*.jpeg", "*.png"]


In [9]:
# Creamos las carpetas data/binario/Apto  y data/binario/NoApto  
for label in ["Apto", "NoApto"]:
    (DEST / label).mkdir(parents=True, exist_ok=True)

print("Estructura de destino creada:")
for path in (DEST / "Apto", DEST / "NoApto"):
    print(" -", path)


Estructura de destino creada:
 - ..\data\binario\Apto
 - ..\data\binario\NoApto


In [10]:
def reetiquetar(origen_root: Path, destino_root: Path):
    """
    Recorre cada subcarpeta de origen_root (Atento, Bostezo, Ojos_cerrados)
    y copia las imágenes a destino_root/Apto o destino_root/NoApto.
    """
    for clase_dir in origen_root.iterdir():
        if not clase_dir.is_dir():
            continue

        # Determinamos la etiqueta binaria
        if clase_dir.name == CLASE_ATENTO:
            etiqueta = "Apto"
        elif clase_dir.name in CLASE_NOAPTO:
            etiqueta = "NoApto"
        else:
            # Saltamos carpetas inesperadas
            print(f"⚠️  Carpeta no reconocida: {clase_dir.name}, se omite.")
            continue

        dst_dir = destino_root / etiqueta
        # Iteramos por cada extensión
        for ext in EXTS:
            for img_path in clase_dir.glob(ext):
                shutil.copy2(img_path, dst_dir / img_path.name)

        print(f"✅  Copiadas imágenes de '{clase_dir.name}' → '{etiqueta}'")


In [11]:
if __name__ == "__main__":
    print("Iniciando reetiquetado binario...")
    reetiquetar(ROOT, DEST)
    print("🎉 Reetiquetado completado.")


Iniciando reetiquetado binario...
✅  Copiadas imágenes de 'Atento' → 'Apto'
✅  Copiadas imágenes de 'Bostezo' → 'NoApto'
⚠️  Carpeta no reconocida: Distraído, se omite.
✅  Copiadas imágenes de 'Eyes_Closed' → 'NoApto'
⚠️  Carpeta no reconocida: Head_Nodding, se omite.
🎉 Reetiquetado completado.


In [13]:
# 5. Verificación final
print("Conteo de imágenes en data/binario:")
for label in ["Apto", "NoApto"]:
    # Busca cualquier archivo con extensión de imagen en subcarpetas
    imgs = list((DEST / label).rglob("*.*"))
    print(f" - {label}: {len(imgs)} imágenes")



Conteo de imágenes en data/binario:
 - Apto: 5000 imágenes
 - NoApto: 4868 imágenes
