# 01b_reetiquetado_binario.ipynb

## Reetiquetado Binario: Apto vs NoApto

Este notebook carga las carpetas originales de im√°genes de tres clases (‚ÄúAtento‚Äù, ‚ÄúBostezo‚Äù y ‚ÄúOjos cerrados‚Äù) y las reetiqueta en dos carpetas: Apto y NoApto.

**Estructura general:**
1. Configuraci√≥n de rutas
2. Visualizaci√≥n r√°pida del dataset original
3. Funciones de reetiquetado
4. Ejecuci√≥n del reetiquetado
5. Verificaci√≥n de la nueva estructura

---
- **Apto**   ‚Üî im√°genes de la clase `Atento`  
- **NoApto** ‚Üî im√°genes de `Bostezo` + `Ojos_cerrados`

Vamos paso a paso: primero configuramos rutas y dependencias, luego creamos la estructura, definimos la funci√≥n de reetiquetado, la ejecutamos y, finalmente, verificamos.

---

In [8]:

## 1. Imports y configuraci√≥n de rutas

from pathlib import Path
import shutil, os
from tqdm import tqdm

# ------------------------
# Ajusta aqu√≠ si cambias nombres
# ------------------------
ROOT = Path("../data/balanced_frames")   # Origen: Atento, Bostezo, Ojos_cerrados
DEST = Path("../data/binario")           # Destino: Apto, NoApto

CLASE_ATENTO   = "Atento"
CLASE_NOAPTO   = ["Bostezo", "Eyes_Closed"]

# Extensiones de imagen a procesar
EXTS = ["*.jpg", "*.jpeg", "*.png"]


In [9]:
# Creamos las carpetas data/binario/Apto  y data/binario/NoApto  
for label in ["Apto", "NoApto"]:
    (DEST / label).mkdir(parents=True, exist_ok=True)

print("Estructura de destino creada:")
for path in (DEST / "Apto", DEST / "NoApto"):
    print(" -", path)


Estructura de destino creada:
 - ..\data\binario\Apto
 - ..\data\binario\NoApto


In [10]:
def reetiquetar(origen_root: Path, destino_root: Path):
    """
    Recorre cada subcarpeta de origen_root (Atento, Bostezo, Ojos_cerrados)
    y copia las im√°genes a destino_root/Apto o destino_root/NoApto.
    """
    for clase_dir in origen_root.iterdir():
        if not clase_dir.is_dir():
            continue

        # Determinamos la etiqueta binaria
        if clase_dir.name == CLASE_ATENTO:
            etiqueta = "Apto"
        elif clase_dir.name in CLASE_NOAPTO:
            etiqueta = "NoApto"
        else:
            # Saltamos carpetas inesperadas
            print(f"‚ö†Ô∏è  Carpeta no reconocida: {clase_dir.name}, se omite.")
            continue

        dst_dir = destino_root / etiqueta
        # Iteramos por cada extensi√≥n
        for ext in EXTS:
            for img_path in clase_dir.glob(ext):
                shutil.copy2(img_path, dst_dir / img_path.name)

        print(f"‚úÖ  Copiadas im√°genes de '{clase_dir.name}' ‚Üí '{etiqueta}'")


In [11]:
if __name__ == "__main__":
    print("Iniciando reetiquetado binario...")
    reetiquetar(ROOT, DEST)
    print("üéâ Reetiquetado completado.")


Iniciando reetiquetado binario...
‚úÖ  Copiadas im√°genes de 'Atento' ‚Üí 'Apto'
‚úÖ  Copiadas im√°genes de 'Bostezo' ‚Üí 'NoApto'
‚ö†Ô∏è  Carpeta no reconocida: Distra√≠do, se omite.
‚úÖ  Copiadas im√°genes de 'Eyes_Closed' ‚Üí 'NoApto'
‚ö†Ô∏è  Carpeta no reconocida: Head_Nodding, se omite.
üéâ Reetiquetado completado.


In [13]:
# 5. Verificaci√≥n final
print("Conteo de im√°genes en data/binario:")
for label in ["Apto", "NoApto"]:
    # Busca cualquier archivo con extensi√≥n de imagen en subcarpetas
    imgs = list((DEST / label).rglob("*.*"))
    print(f" - {label}: {len(imgs)} im√°genes")



Conteo de im√°genes en data/binario:
 - Apto: 5000 im√°genes
 - NoApto: 4868 im√°genes
