INDICACIONES INICIALES:

- Correr en GPU
- Las carpetas deben subirse en zip
- Si se entrena el entorno, debe descargarse best. pt usando bloque 17, luego volver a subirlo usando bloque 3

#
$$\textbf{Entrenamiento del modelo}$$

##
$$\textbf{Bloque 1 ‚Äî Preparaci√≥n del entorno:}
\\ \text{Crea la estructura de carpetas del proyecto en Colab (inputs, temporales, dataset, runs y resultados) e instala librer√≠as.}$$


In [9]:
# Importa herramientas para manejar rutas, archivos, comandos y datos
from pathlib import Path                  # Permite trabajar con rutas de carpetas/archivos de forma simple
import shutil                             # Sirve para copiar/mover/borrar archivos y carpetas
import zipfile                            # Sirve para descomprimir/comprimir archivos .zip
import subprocess                         # Sirve para ejecutar comandos del sistema (ffmpeg, etc.)
import os                                 # Utilidades del sistema (rutas, variables, etc.)
import glob                               # Buscar archivos con patrones (ej: *.jpg)
import re                                 # Manejo de texto con patrones (regex)
import pandas as pd                       # Para crear/guardar tablas (CSV)

BASE = Path("/content")                   # Define la carpeta ra√≠z del entorno Colab
DIR_IN = BASE/"in"                        # Carpeta para archivos que t√∫ subes (video/zip)
DIR_WORK = BASE/"work"                    # Carpeta para trabajo temporal (frames, raw, etc.)
DIR_DATASET = BASE/"dataset"              # Carpeta del dataset final en formato YOLO
DIR_RUNS = BASE/"runs"                    # Carpeta donde YOLO guarda entrenamientos/predicciones
DIR_OUT = BASE/"out"                      # Carpeta para resultados finales listos para descargar

for d in [DIR_IN, DIR_WORK, DIR_DATASET, DIR_RUNS, DIR_OUT]:  # Recorre cada carpeta necesaria
    d.mkdir(parents=True, exist_ok=True)                      # Crea la carpeta si no existe

print("‚úÖ Carpetas listas:")              # Muestra confirmaci√≥n
print("IN:", DIR_IN)                     # Imprime ruta de inputs
print("WORK:", DIR_WORK)                 # Imprime ruta de temporales
print("DATASET:", DIR_DATASET)           # Imprime ruta del dataset final
print("RUNS:", DIR_RUNS)                 # Imprime ruta de salidas de YOLO
print("OUT:", DIR_OUT)                   # Imprime ruta de resultados descargables

# Instala la librer√≠a Ultralytics (YOLO) en el entorno de Colab
!pip -q install ultralytics

# Importa YOLO para confirmar que la instalaci√≥n qued√≥ OK
from ultralytics import YOLO

# Muestra la versi√≥n de FFmpeg para verificar que est√° instalado
!ffmpeg -version | head -n 2

# Lista la GPU disponible (si hay) para confirmar aceleraci√≥n por hardware
!nvidia-smi -L || true

# Imprime confirmaci√≥n de que Ultralytics qued√≥ listo
print("‚úÖ Ultralytics (YOLO) instalado y disponible")


‚úÖ Carpetas listas:
IN: /content/in
WORK: /content/work
DATASET: /content/dataset
RUNS: /content/runs
OUT: /content/out
ffmpeg version 4.4.2-0ubuntu0.22.04.1 Copyright (c) 2000-2021 the FFmpeg developers
built with gcc 11 (Ubuntu 11.2.0-19ubuntu1)
/bin/bash: line 1: nvidia-smi: command not found
‚úÖ Ultralytics (YOLO) instalado y disponible


##
$$\textbf{Bloque 4 ‚Äî Exploraci√≥n y control de espacio:} \
\\\ \text{Te muestra qu√© hay dentro de las carpetas del proyecto  y deja listas las carpetas de trabajo para frames y dataset crudo.}$$


In [13]:
# Define una funci√≥n simple para listar contenido de una carpeta sin tirar error
def listar_carpeta(ruta, max_items=50):                  # Crea una funci√≥n para listar archivos/carpetas
    ruta = Path(ruta)                                    # Convierte la ruta a formato Path
    print("\nüìÅ", ruta)                                   # Imprime la carpeta que se est√° revisando
    if not ruta.exists():                                # Si la carpeta no existe
        print("‚ö†Ô∏è No existe todav√≠a.")                    # Avisa sin romper el notebook
        return                                            # Termina la funci√≥n

    items = sorted(list(ruta.iterdir()), key=lambda p: (p.is_file(), p.name.lower()))  # Ordena primero carpetas
    if len(items) == 0:                                  # Si no hay nada dentro
        print("‚ö†Ô∏è Est√° vac√≠a.")                           # Avisa sin romper el notebook
        return                                            # Termina la funci√≥n

    for p in items[:max_items]:                          # Recorre hasta max_items elementos
        tipo = "DIR " if p.is_dir() else "FILE"          # Marca si es carpeta o archivo
        print(f" - {tipo} {p.name}")                     # Imprime el nombre

    if len(items) > max_items:                           # Si hay m√°s de max_items
        print(f" ... y {len(items)-max_items} m√°s")      # Avisa cu√°ntos faltan por mostrar

# Lista las carpetas principales del proyecto para ver el estado general
print("‚úÖ Listado r√°pido de carpetas del proyecto:")      # Mensaje de inicio
listar_carpeta("/content")                               # Muestra lo que hay en /content
listar_carpeta(DIR_IN)                                   # Muestra lo que hay en /content/in
listar_carpeta(DIR_WORK)                                 # Muestra lo que hay en /content/work
listar_carpeta(DIR_DATASET)                              # Muestra lo que hay en /content/dataset
listar_carpeta(DIR_RUNS)                                 # Muestra lo que hay en /content/runs
listar_carpeta(DIR_OUT)                                  # Muestra lo que hay en /content/out

# Muestra el espacio total del disco del entorno (si el comando est√° disponible)
print("\n‚úÖ Espacio total del entorno (df -h):")           # T√≠tulo del chequeo
try:
    subprocess.run(["df", "-h"], check=False)            # Ejecuta df sin romper si falla
except Exception:
    print("‚ö†Ô∏è No pude ejecutar df -h en este entorno.")   # Aviso si no se pudo

# Muestra cu√°nto pesa cada carpeta dentro de /content (para detectar qu√© est√° llenando)
print("\n‚úÖ Peso por carpeta dentro de /content (du -h):") # T√≠tulo del chequeo
try:
    subprocess.run(["bash", "-lc", "du -h --max-depth=1 /content | sort -h"], check=False)  # Ejecuta du ordenado
except Exception:
    print("‚ö†Ô∏è No pude ejecutar du en este entorno.")      # Aviso si no se pudo

# Detecta autom√°ticamente qu√© tipo de archivo tienes en /content/in (sin tirar error si no hay nada)
in_files = list(DIR_IN.iterdir())                               # Lee todo lo que hay dentro de /content/in

# Busca un video por extensi√≥n com√∫n (si existe)
video = next((p for p in in_files if p.suffix.lower() in [".mp4", ".mov", ".avi", ".mkv"]), None)  # Encuentra el primer video

# Busca un zip que se llame images.zip (si existe)
zip_images = next((p for p in in_files if p.name.lower() == "images.zip"), None)  # Encuentra images.zip

# Busca un zip que parezca export de CVAT (si existe)
zip_cvat = next((p for p in in_files if p.suffix.lower() == ".zip" and "cvat" in p.name.lower()), None)  # Encuentra zip CVAT

# Define carpetas de trabajo est√°ndar (frames y dataset_raw)
FRAMES_DIR = DIR_WORK/"frames"                                  # Carpeta donde se guardan frames extra√≠dos del video
RAW_DIR = DIR_WORK/"dataset_raw"                                # Carpeta donde se descomprime el export de CVAT

# Crea las carpetas si no existen
FRAMES_DIR.mkdir(parents=True, exist_ok=True)                   # Crea /content/work/frames si no existe
RAW_DIR.mkdir(parents=True, exist_ok=True)                      # Crea /content/work/dataset_raw si no existe

# Imprime un resumen claro de lo que se detect√≥
print("‚úÖ Detecci√≥n de inputs en /content/in:")                  # T√≠tulo del resumen
print(" - Video:", video.name if video else "No detectado")      # Informa si hay video
print(" - images.zip:", zip_images.name if zip_images else "No detectado")  # Informa si hay zip de im√°genes
print(" - zip CVAT:", zip_cvat.name if zip_cvat else "No detectado")        # Informa si hay export CVAT

# Imprime rutas de trabajo listas
print("\n‚úÖ Rutas de trabajo listas:")                           # T√≠tulo para rutas
print(" - FRAMES_DIR:", FRAMES_DIR)                              # Ruta donde ir√°n los frames
print(" - RAW_DIR:", RAW_DIR)                                    # Ruta donde ir√° el dataset crudo

# Mensaje gu√≠a para tu siguiente decisi√≥n (sin obligarte a nada)
print("\n‚ÑπÔ∏è Pr√≥ximo paso sugerido:")                              # Gu√≠a de flujo
if video:
    print(" - Tienes video: puedes extraer frames (Bloque 6).")   # Recomienda ruta A
elif zip_cvat:
    print(" - Tienes export CVAT: puedes descomprimir y normalizar dataset (Bloques 8+).")  # Recomienda ruta CVAT
elif zip_images:
    print(" - Tienes images.zip: puedes descomprimir para etiquetar (si lo necesitas).")    # Recomienda ruta B
else:
    print(" - A√∫n no hay inputs: puedes seguir armando notebook igual y subir despu√©s.")    # Recomienda seguir sin datos



‚úÖ Listado r√°pido de carpetas del proyecto:

üìÅ /content
 - DIR  .config
 - DIR  .ipynb_checkpoints
 - DIR  dataset
 - DIR  in
 - DIR  out
 - DIR  runs
 - DIR  sample_data
 - DIR  train
 - DIR  work
 - FILE data.yaml

üìÅ /content/in
 - DIR  .ipynb_checkpoints
 - FILE cvat t1p2 t10 y t3p2.zip

üìÅ /content/work
 - DIR  dataset_raw
 - DIR  frames

üìÅ /content/dataset
 - DIR  images
 - DIR  masks

üìÅ /content/runs
 - DIR  predict_val
 - DIR  train_unet

üìÅ /content/out
 - FILE dataset_summary.txt
 - FILE val_predictions.zip

‚úÖ Espacio total del entorno (df -h):

‚úÖ Peso por carpeta dentro de /content (du -h):
‚úÖ Detecci√≥n de inputs en /content/in:
 - Video: No detectado
 - images.zip: No detectado
 - zip CVAT: cvat t1p2 t10 y t3p2.zip

‚úÖ Rutas de trabajo listas:
 - FRAMES_DIR: /content/work/frames
 - RAW_DIR: /content/work/dataset_raw

‚ÑπÔ∏è Pr√≥ximo paso sugerido:
 - Tienes export CVAT: puedes descomprimir y normalizar dataset (Bloques 8+).


##
$$\textbf{Bloque 8 ‚Äî Importar export de CVAT:} \
\\\ \text{Si hay zip de CVAT (BLOQUE 3), lo descomprime en /content #/work/dataset_raw. Si no tiene cvat revisar bloque 6.}$$


In [14]:
# Descomprime el export de CVAT (si existe) en /content/work/dataset_raw (si no existe, no falla: avisa)
# Nota: Este zip suele llamarse algo como "cvat_yolo_export.zip" (el nombre puede variar)

# Vuelve a buscar un zip que parezca de CVAT por si lo subiste reci√©n
in_files = list(DIR_IN.iterdir())                                              # Lee archivos en /content/in
zip_cvat = next((p for p in in_files if p.suffix.lower() == ".zip" and "cvat" in p.name.lower()), None)  # Busca zip con "cvat" en el nombre

# Si no encontramos zip CVAT, avisamos y seguimos sin error
if zip_cvat is None:                                                           # Revisa si existe export de CVAT
    print("‚ö†Ô∏è No detect√© ning√∫n .zip de CVAT en /content/in (debe tener 'cvat' en el nombre).")           # Aviso
    print("‚ÑπÔ∏è Cuando lo tengas, s√∫belo y vuelve a correr este bloque.")         # Gu√≠a
else:
    # Limpia dataset_raw anterior para evitar mezclar versiones
    if RAW_DIR.exists():                                                       # Revisa si ya existe dataset_raw
        shutil.rmtree(RAW_DIR)                                                 # Borra dataset_raw anterior completo
    RAW_DIR.mkdir(parents=True, exist_ok=True)                                 # Crea dataset_raw limpio

    # Descomprime el zip de CVAT dentro de dataset_raw
    with zipfile.ZipFile(zip_cvat, "r") as z:                                  # Abre el zip de CVAT
        z.extractall(RAW_DIR)                                                  # Extrae todo su contenido en RAW_DIR

    # Lista contenido para confirmar que se extrajo algo
    extracted_any = any(RAW_DIR.rglob("*"))                                     # Verifica si hay archivos extra√≠dos
    if not extracted_any:                                                      # Si no se extrajo nada
        print("‚ö†Ô∏è El zip se descomprimi√≥, pero no veo archivos dentro. Revisa si el zip est√° correcto.")  # Aviso
    else:
        print("‚úÖ Export CVAT descomprimido en:", RAW_DIR)                      # Confirmaci√≥n
        # Muestra un vistazo r√°pido de archivos/carpetas extra√≠das
        top_items = sorted(list(RAW_DIR.iterdir()))                             # Lista el primer nivel de dataset_raw
        print("‚úÖ Primer nivel dentro de dataset_raw:")                         # T√≠tulo del listado
        for p in top_items[:30]:                                                # Muestra hasta 30 √≠tems
            tag = "DIR " if p.is_dir() else "FILE"                              # Marca si es carpeta o archivo
            print(" -", tag, p.name)                                            # Imprime nombre
        if len(top_items) > 30:                                                 # Si hay muchos √≠tems
            print(f" ... y {len(top_items)-30} m√°s")                            # Indica que hay m√°s


‚úÖ Export CVAT descomprimido en: /content/work/dataset_raw
‚úÖ Primer nivel dentro de dataset_raw:
 - DIR  cvat t1p2 t10 y t3p2


##
$$\textbf{Bloque 9 ‚Äî Detectar (CVAT) + Normalizar YOLO + Split:} \
\\\ \text{Busca autom√°ticamente im√°genes y labels dentro de #dataset\_raw, y construye el split en #/content/dataset.}$$


In [15]:
# Detecta im√°genes/labels en dataset_raw y construye dataset YOLO final (train/val) creando .txt vac√≠os para negativos
import random                                                    # Sirve para mezclar antes del split

img_exts = {".jpg", ".jpeg", ".png"}                             # Extensiones v√°lidas de im√°genes
train_ratio = 0.8                                                # Proporci√≥n train/val
seed = 42                                                        # Semilla para split repetible

# Define rutas YOLO est√°ndar de salida
IMG_TRAIN = DIR_DATASET/"images/train"                           # Im√°genes train
IMG_VAL   = DIR_DATASET/"images/val"                             # Im√°genes val
LBL_TRAIN = DIR_DATASET/"labels/train"                           # Labels train
LBL_VAL   = DIR_DATASET/"labels/val"                             # Labels val

# Crea carpetas de salida
for d in [IMG_TRAIN, IMG_VAL, LBL_TRAIN, LBL_VAL]:               # Recorre carpetas YOLO
    d.mkdir(parents=True, exist_ok=True)                         # Crea si falta

# Verifica que exista dataset_raw
if not RAW_DIR.exists():                                         # Si no existe dataset_raw
    print("‚ö†Ô∏è No existe /content/work/dataset_raw todav√≠a. Corre el Bloque 8 (descomprimir CVAT) primero.")  # Aviso
else:
    # Busca im√°genes y txt dentro de dataset_raw (recursivo)
    all_imgs = [p for p in RAW_DIR.rglob("*") if p.suffix.lower() in img_exts]   # Todas las im√°genes
    all_txt  = [p for p in RAW_DIR.rglob("*.txt")]                               # Todos los txt

    print("‚úÖ Archivos encontrados dentro de dataset_raw:")       # Resumen inicial
    print(" - Im√°genes:", len(all_imgs))                         # Cantidad im√°genes
    print(" - TXT:", len(all_txt))                               # Cantidad txt

    # Si falta algo, avisa pero no rompe
    if len(all_imgs) == 0:
        print("‚ö†Ô∏è No encontr√© im√°genes dentro de dataset_raw. Revisa estructura del export (o tu zip).")  # Aviso
    if len(all_txt) == 0:
        print("‚ö†Ô∏è No encontr√© labels (.txt) dentro de dataset_raw. Ojo: CVAT solo exporta txt con anotaciones.")  # Aviso

    # Detecta carpeta con m√°s im√°genes y carpeta con m√°s txt (candidatas principales)
    img_dir = None                                               # Carpeta candidata de im√°genes
    lbl_dir = None                                               # Carpeta candidata de labels

    if len(all_imgs) > 0:                                        # Si hay im√°genes
        counts_img_parent = {}                                   # Conteo por carpeta
        for p in all_imgs:                                       # Recorre im√°genes
            counts_img_parent[p.parent] = counts_img_parent.get(p.parent, 0) + 1  # Cuenta
        img_dir = max(counts_img_parent, key=counts_img_parent.get)              # Elige mayor

    if len(all_txt) > 0:                                         # Si hay txt
        counts_lbl_parent = {}                                   # Conteo por carpeta
        for p in all_txt:                                        # Recorre txt
            counts_lbl_parent[p.parent] = counts_lbl_parent.get(p.parent, 0) + 1  # Cuenta
        lbl_dir = max(counts_lbl_parent, key=counts_lbl_parent.get)              # Elige mayor

    print("\n‚úÖ Rutas detectadas (candidatas principales):")      # Imprime rutas
    print(" - img_dir:", str(img_dir) if img_dir else "No detectado")  # Carpeta im√°genes
    print(" - lbl_dir:", str(lbl_dir) if lbl_dir else "No detectado")  # Carpeta labels

    # Si no se detectaron rutas, termina sin error
    if (img_dir is None) or (lbl_dir is None):
        print("‚ö†Ô∏è No pude detectar img_dir y/o lbl_dir. Revisa qu√© hay dentro de dataset_raw (Bloque 4 listar carpetas).")  # Aviso
    else:
        # Crea mapas por stem para hacer match imagen <-> label
        img_map = {}                                             # stem -> ruta imagen
        for p in img_dir.iterdir():                              # Recorre archivos en img_dir
            if p.suffix.lower() in img_exts:                     # Si es imagen
                img_map[p.stem] = p                              # Guarda

        lbl_map = {}                                             # stem -> ruta label
        for p in lbl_dir.iterdir():                              # Recorre archivos en lbl_dir
            if p.suffix.lower() == ".txt":                       # Si es txt
                lbl_map[p.stem] = p                              # Guarda

        # Diagn√≥stico de matching
        all_stems = sorted(img_map.keys())                       # Todas las im√°genes (incluye negativos)
        paired = sorted(set(img_map.keys()) & set(lbl_map.keys()))            # Con label
        missing_lbl = sorted(set(img_map.keys()) - set(lbl_map.keys()))      # Sin label (negativos)
        missing_img = sorted(set(lbl_map.keys()) - set(img_map.keys()))      # Txt sin imagen

        print("\n‚úÖ Matching imagen + label (incluyendo negativos):")  # Reporte matching
        print(" - Total im√°genes:", len(all_stems))              # Total
        print(" - Con label (.txt):", len(paired))               # Con txt
        print(" - Sin label (se crear√° .txt vac√≠o):", len(missing_lbl))  # Negativos
        print(" - Txt sin imagen (se ignoran):", len(missing_img))       # Hu√©rfanos

        # Si no hay im√°genes, no se puede construir dataset
        if len(all_stems) == 0:
            print("‚ö†Ô∏è No hay im√°genes v√°lidas para construir dataset. Revisa nombres/extensiones.")  # Aviso
        else:
            # Limpia salidas anteriores
            for d in [IMG_TRAIN, IMG_VAL, LBL_TRAIN, LBL_VAL]:   # Recorre carpetas de salida
                for f in d.glob("*"):                            # Recorre archivos dentro
                    f.unlink()                                   # Borra

            # Split train/val sobre TODAS las im√°genes
            random.seed(seed)                                    # Semilla
            random.shuffle(all_stems)                             # Mezcla
            cut = int(len(all_stems) * train_ratio)              # Corte
            train_ids = all_stems[:cut]                          # Train stems
            val_ids = all_stems[cut:]                            # Val stems

            # Copia imagen y label (o crea vac√≠o si falta)
            def copy_img_and_label(stem, img_dst, lbl_dst):      # Funci√≥n copiar + label
                img_src = img_map[stem]                          # Imagen fuente
                shutil.copy2(img_src, img_dst / img_src.name)    # Copia imagen

                lbl_out = lbl_dst / f"{stem}.txt"                # Label destino
                if stem in lbl_map:                              # Si existe label real
                    shutil.copy2(lbl_map[stem], lbl_out)         # Copia label
                else:
                    lbl_out.write_text("", encoding="utf-8")     # Crea label vac√≠o (negativo)

            # Copia a train
            for s in train_ids:                                  # Recorre train
                copy_img_and_label(s, IMG_TRAIN, LBL_TRAIN)      # Copia

            # Copia a val
            for s in val_ids:                                    # Recorre val
                copy_img_and_label(s, IMG_VAL, LBL_VAL)          # Copia

            # Resumen final
            n_train_img = len(list(IMG_TRAIN.glob("*")))         # Cuenta imgs train
            n_train_lbl = len(list(LBL_TRAIN.glob("*.txt")))     # Cuenta labels train
            n_val_img = len(list(IMG_VAL.glob("*")))             # Cuenta imgs val
            n_val_lbl = len(list(LBL_VAL.glob("*.txt")))         # Cuenta labels val

            print("\n‚úÖ Dataset YOLO final creado en:", DIR_DATASET)  # Confirma creaci√≥n
            print(" - Train: imgs =", n_train_img, "| lbls =", n_train_lbl)  # Resumen train
            print(" - Val:   imgs =", n_val_img,   "| lbls =", n_val_lbl)    # Resumen val

            # Chequeo 1 txt por imagen (ideal)
            if n_train_img != n_train_lbl:
                print("‚ö†Ô∏è Ojo: TRAIN imgs != txt (deber√≠an ser iguales).")  # Aviso
            if n_val_img != n_val_lbl:
                print("‚ö†Ô∏è Ojo: VAL imgs != txt (deber√≠an ser iguales).")    # Aviso

            # Guarda resumen para trazabilidad
            summary_path = DIR_OUT/"dataset_summary.txt"         # Archivo resumen
            summary_text = (
                f"total_imgs={len(all_stems)}\n"
                f"imgs_with_lbl={len(paired)}\n"
                f"imgs_without_lbl_created_empty={len(missing_lbl)}\n"
                f"txt_without_img_ignored={len(missing_img)}\n"
                f"train_ratio={train_ratio}\n"
                f"train_imgs={n_train_img}\ntrain_lbls={n_train_lbl}\n"
                f"val_imgs={n_val_img}\nval_lbls={n_val_lbl}\n"
            )
            summary_path.write_text(summary_text, encoding="utf-8")  # Escribe resumen
            print("‚úÖ Resumen guardado en:", summary_path)        # Confirma guardado


‚úÖ Archivos encontrados dentro de dataset_raw:
 - Im√°genes: 885
 - TXT: 321

‚úÖ Rutas detectadas (candidatas principales):
 - img_dir: /content/work/dataset_raw/cvat t1p2 t10 y t3p2/images
 - lbl_dir: /content/work/dataset_raw/cvat t1p2 t10 y t3p2/labels

‚úÖ Matching imagen + label (incluyendo negativos):
 - Total im√°genes: 885
 - Con label (.txt): 321
 - Sin label (se crear√° .txt vac√≠o): 564
 - Txt sin imagen (se ignoran): 0

‚úÖ Dataset YOLO final creado en: /content/dataset
 - Train: imgs = 708 | lbls = 708
 - Val:   imgs = 177 | lbls = 177
‚úÖ Resumen guardado en: /content/out/dataset_summary.txt


##
$$\textbf{Bloque 11 ‚Äî Crear data.yaml (receta del dataset):} \
\\\ \text{Genera el archivo data.yaml que le dice a YOLO d√≥nde est√° tu dataset (train/val) y se crean manualmente las clases.}$$


In [16]:
# Crea el archivo data.yaml para YOLO (si no hay dataset a√∫n, no falla: avisa)
yaml_path = BASE/"data.yaml"                                    # Define la ruta donde se guardar√° el YAML

# Define aqu√≠ tus clases EXACTAS y en el MISMO orden que usaste en CVAT - OJO DEBE HACERSE MANUAL
classes = [
    "falla junta paramento izquierdo",
    "falla junta paramento derecho",
    "falla junta losa fondo",
    "estr√≠a lado izquierdo",
    "estr√≠a lado derecho",
    "estr√≠a centro",
    "da√±o paramento",
    "da√±o losa fondo",
]                                                               # Lista de nombres de clases (ed√≠tala t√∫)

# Verifica que existan carpetas train/val para evitar un YAML apuntando a nada
train_dir_ok = (DIR_DATASET/"images/train").exists()            # Revisa si existe la carpeta de im√°genes train
val_dir_ok = (DIR_DATASET/"images/val").exists()                # Revisa si existe la carpeta de im√°genes val

# Si no hay estructura dataset, avisa y no rompe el notebook
if not (train_dir_ok and val_dir_ok):                           # Si faltan carpetas b√°sicas del dataset
    print("‚ö†Ô∏è No detecto la estructura de dataset en /content/dataset/images/train y /val.")  # Aviso
    print("‚ÑπÔ∏è Corre el Bloque 10 (normalizaci√≥n + split) antes de crear el data.yaml.")       # Gu√≠a
else:
    # Si no definiste clases, avisa para que no entrenes con un YAML incompleto
    if len(classes) == 0:                                       # Si la lista de clases est√° vac√≠a
        print("‚ö†Ô∏è La lista 'classes' est√° vac√≠a. Agrega tus clases en el orden de CVAT antes de entrenar.")  # Aviso
        print("‚ÑπÔ∏è Igual crear√© el data.yaml, pero NO deber√≠as entrenar hasta completar 'classes'.")          # Gu√≠a

    # Construye el contenido del YAML que YOLO necesita
    yaml_text = f"""path: {DIR_DATASET}
train: images/train
val: images/val
names:
"""                                                             # Texto base del YAML (path + rutas train/val)

    # Agrega las clases con su √≠ndice (0,1,2...) en el orden correcto
    for i, c in enumerate(classes):                              # Recorre clases con √≠ndice
        yaml_text += f"  {i}: {c}\n"                              # Agrega cada clase al YAML

    # Guarda el archivo data.yaml
    yaml_path.write_text(yaml_text, encoding="utf-8")            # Escribe el YAML en disco

    # Prints de confirmaci√≥n + vista r√°pida del contenido
    print("‚úÖ data.yaml creado en:", yaml_path)                   # Confirma ruta del archivo creado
    print("‚úÖ Contenido de data.yaml:")                           # T√≠tulo del contenido
    print(yaml_text)                                              # Muestra el texto completo


‚úÖ data.yaml creado en: /content/data.yaml
‚úÖ Contenido de data.yaml:
path: /content/dataset
train: images/train
val: images/val
names:
  0: falla junta paramento izquierdo
  1: falla junta paramento derecho
  2: falla junta losa fondo
  3: estr√≠a lado izquierdo
  4: estr√≠a lado derecho
  5: estr√≠a centro
  6: da√±o paramento
  7: da√±o losa fondo



##
$$\textbf{Bloque 12 ‚Äî Entrenamiento YOLO:} \
\\\ \text{Entrena un modelo YOLO usando data.yaml y guarda los pesos (best.pt/last.pt) y m√©tricas dentro de #/content/runs/train.}$$


In [None]:
# Bloque 12 ‚Äî Entrenamiento YOLO (Optimizado para aprendizaje continuo)

from ultralytics import YOLO
import shutil

# 1. Configuraci√≥n de par√°metros
data_yaml = "/content/data.yaml"
batch_size = 16  # Si Colab te da error de "Out of Memory", baja esto a 8 o 4, si no, mant√©n en 16
epochs = 50
img_size = 640
output_dir = "/content/runs" # Ajustado para que Ultralytics maneje la estructura interna
best_pt_path = "/content/in/best.pt"

# 2. L√≥gica de carga de modelo (Transfer Learning)
if Path(best_pt_path).exists():
    print(f"‚úÖ Conocimiento previo detectado. Cargando: {best_pt_path}")
    model = YOLO(best_pt_path)
    # Recomendaci√≥n: Si retomas, bajamos un poco la tasa de aprendizaje inicial (lr0)
    # para que no olvide lo anterior bruscamente.
    lr_inicial = 0.001
else:
    print("‚ÑπÔ∏è Iniciando desde cero con YOLOv8 Nano.")
    model = YOLO("yolov8n.pt")
    lr_inicial = 0.01 # Tasa est√°ndar para modelos nuevos

# 3. Entrenamiento
print("üöÄ Iniciando entrenamiento con el dataset de 1300 im√°genes...")
results = model.train(
    data=data_yaml,
    epochs=epochs,
    imgsz=img_size,
    batch=batch_size,
    project=output_dir,
    name="train_experiment",
    exist_ok=True,
    # --- Mejoras de estabilidad ---
    lr0=lr_inicial,    # Tasa de aprendizaje ajustada seg√∫n el origen
    patience=30,       # Si en 30 √©pocas no mejora, para solo (ahorra tiempo)
    save=True,
    pretrained=True    # Asegura que use los pesos cargados
)

# 4. Gesti√≥n de archivos finales
print("‚úÖ Entrenamiento finalizado.")

# Definir la ruta donde YOLO dej√≥ el mejor archivo
new_best_path = Path(output_dir) / "train_experiment" / "weights" / "best.pt"

if new_best_path.exists():
    # Aseguramos que la carpeta destino exista
    Path("/content/in").mkdir(parents=True, exist_ok=True)

    # Copiamos el nuevo modelo al destino
    shutil.copy2(new_best_path, best_pt_path)
    print(f"‚≠ê El nuevo 'best.pt' ha sido actualizado en: {best_pt_path}")
else:
    print("‚ö†Ô∏è Error: No se encontr√≥ el archivo best.pt generado.")

‚ÑπÔ∏è Iniciando desde cero con YOLOv8 Nano.
üöÄ Iniciando entrenamiento con el dataset de 1300 im√°genes...
Ultralytics 8.4.9 üöÄ Python-3.12.12 torch-2.9.0+cpu CPU (Intel Xeon CPU @ 2.20GHz)
[34m[1mengine/trainer: [0magnostic_nms=False, amp=True, angle=1.0, augment=False, auto_augment=randaugment, batch=16, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, compile=False, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=/content/data.yaml, degrees=0.0, deterministic=True, device=cpu, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, end2end=None, epochs=50, erasing=0.4, exist_ok=True, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=640, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=yolov8n.pt, momentum=0.937, mosaic=1.0, multi_scale=0.0, name=tr

##
$$\textbf{Bloque 13 ‚Äî Validaci√≥n visual en im√°genes (val):} \
\\\ \text{Usa best.pt para predecir sobre images/val y guarda im√°genes con cajas dibujadas y las descarga.}$$


In [None]:
# Genera predicciones sobre val y descarga un ZIP con los resultados (si falta algo, no falla: avisa)
run_name = "train"                                               # Nombre del entrenamiento (debe coincidir con Bloque 12)
pred_name = "predict_val"                                        # Nombre de carpeta de predicciones para val

best_path = DIR_RUNS/run_name/"weights/best.pt"                  # Ruta esperada del modelo best.pt
val_images_dir = DIR_DATASET/"images/val"                        # Ruta esperada del set de validaci√≥n

# Revisa prerequisitos antes de predecir
if not best_path.exists():                                       # Si no existe best.pt
    print("‚ö†Ô∏è No encuentro best.pt todav√≠a en:", best_path)      # Aviso
    print("‚ÑπÔ∏è Corre el Bloque 12 (entrenamiento) y aseg√∫rate que termine bien.")  # Gu√≠a
elif not val_images_dir.exists():                                # Si no existe la carpeta val
    print("‚ö†Ô∏è No encuentro images/val en:", val_images_dir)      # Aviso
    print("‚ÑπÔ∏è Corre el Bloque 10 (normalizaci√≥n + split) para crear el dataset.")  # Gu√≠a
else:
    # Intenta ejecutar predicci√≥n sobre im√°genes de validaci√≥n
    try:
        print("‚úÖ Iniciando predicci√≥n sobre val:")              # Mensaje de inicio
        print(" - Modelo:", best_path)                           # Muestra el modelo que se usar√°
        print(" - Fuente (val):", val_images_dir)                # Muestra la carpeta fuente
        print(" - Salida:", DIR_RUNS/pred_name)                  # Muestra la carpeta de salida

        model = YOLO(str(best_path))                             # Carga el modelo entrenado
        model.predict(                                           # Ejecuta predicci√≥n sobre val
            source=str(val_images_dir),                          # Fuente: im√°genes val
            save=True,                                           # Guarda im√°genes con cajas dibujadas
            project=str(DIR_RUNS),                               # Carpeta base de salida
            name=pred_name,                                      # Nombre de la carpeta de predicci√≥n
            exist_ok=True                                        # Reutiliza carpeta si ya existe
        )

        print("‚úÖ Predicciones val guardadas en:", DIR_RUNS/pred_name)  # Confirmaci√≥n final

    except Exception as e:
        print("‚ö†Ô∏è Fall√≥ la predicci√≥n en val por un error:")      # Aviso de error
        print("   ", str(e)[:400])                                # Muestra parte del error
        print("‚ÑπÔ∏è Tip t√≠pico: revisa rutas, nombres o si hay im√°genes corruptas.")  # Gu√≠a r√°pida

    # Chequeo de outputs + creaci√≥n de ZIP para descargar
    out_dir = DIR_RUNS/pred_name                                  # Carpeta de salida
    if not out_dir.exists():                                      # Si no existe salida
        print("‚ö†Ô∏è No existe la carpeta de salida:", out_dir)      # Aviso
    else:
        # Lista im√°genes generadas
        out_imgs = sorted([p for p in out_dir.iterdir() if p.suffix.lower() in [".jpg",".png"]])  # Im√°genes salida
        print("‚úÖ Cantidad de im√°genes generadas:", len(out_imgs)) # Cuenta
        if out_imgs:
            print("‚úÖ Ejemplo:", out_imgs[0].name)                 # Muestra 1 ejemplo
        else:
            print("‚ö†Ô∏è No veo im√°genes generadas en predict_val (puede ser que YOLO no haya guardado o que no haya detecciones).")  # Aviso

        # Crea ZIP descargable con todo el contenido de predict_val
        zip_path = DIR_OUT/"val_predictions.zip"                   # Ruta del zip final
        if zip_path.exists():                                      # Si ya exist√≠a
            zip_path.unlink()                                      # Borra el zip anterior

        with zipfile.ZipFile(zip_path, "w", zipfile.ZIP_DEFLATED) as z:  # Crea zip
            for p in sorted(out_dir.rglob("*")):                   # Recorre todo dentro de predict_val
                if p.is_file():                                    # Solo archivos
                    z.write(p, arcname=str(p.relative_to(out_dir)))  # Agrega con ruta relativa

        print("‚úÖ ZIP de validaci√≥n creado en:", zip_path)          # Confirma zip

        # Descarga autom√°tica
        try:
            from google.colab import files                         # Importa descarga
            files.download(str(zip_path))                          # Descarga zip
            print("‚úÖ Descarga iniciada: val_predictions.zip")      # Confirmaci√≥n
        except Exception:
            print("‚ö†Ô∏è No pude iniciar descarga autom√°tica, pero el zip qued√≥ en /content/out.")  # Aviso


‚úÖ Iniciando predicci√≥n sobre val:
 - Modelo: /content/runs/train/weights/best.pt
 - Fuente (val): /content/dataset/images/val
 - Salida: /content/runs/predict_val

image 1/49 /content/dataset/images/val/000002.jpg: 384x640 (no detections), 46.6ms
image 2/49 /content/dataset/images/val/000007.jpg: 384x640 (no detections), 7.4ms
image 3/49 /content/dataset/images/val/000008.jpg: 384x640 (no detections), 7.0ms
image 4/49 /content/dataset/images/val/000009.jpg: 384x640 (no detections), 7.0ms
image 5/49 /content/dataset/images/val/000023.jpg: 384x640 2 Estrias, 7.1ms
image 6/49 /content/dataset/images/val/000024.jpg: 384x640 2 Estrias, 7.3ms
image 7/49 /content/dataset/images/val/000027.jpg: 384x640 2 Estrias, 9.1ms
image 8/49 /content/dataset/images/val/000029.jpg: 384x640 2 Estrias, 10.0ms
image 9/49 /content/dataset/images/val/000036.jpg: 384x640 2 Estrias, 7.0ms
image 10/49 /content/dataset/images/val/000040.jpg: 384x640 2 Estrias, 7.0ms
image 11/49 /content/dataset/images/val/000041

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

‚úÖ Descarga iniciada: val_predictions.zip


#
$$\textbf{Modelo DAICH}$$

##
$$\textbf{Bloque 14 ‚Äî Predicci√≥n en VIDEO (salida anotada + labels):} \
\\\ \text{Usa best.pt para predecir sobre un video y guarda: (1) video anotado y (2) archivos .txt por frame con detecciones (para luego armar CSVs).}$$


In [None]:
# Corre predicci√≥n sobre un video usando best.pt y guarda resultados (si falta algo, no falla: avisa)
run_name = "train"                                                # Define el nombre del entrenamiento (igual que antes)
pred_video_name = "predict_video"                                 # Define el nombre de la carpeta de salida para video

best_path = DIR_RUNS/run_name/"weights/best.pt"                   # Ruta esperada del modelo entrenado best.pt
video_path = next((p for p in DIR_IN.iterdir() if p.suffix.lower() in [".mp4", ".mov", ".avi", ".mkv"]), None)  # Busca un video en /content/in

# Chequea prerequisitos sin tirar error
if not best_path.exists():                                        # Si no existe best.pt
    print("‚ö†Ô∏è No encuentro best.pt en:", best_path)               # Aviso
    print("‚ÑπÔ∏è Corre el Bloque 12 (entrenamiento) antes de este bloque.")  # Gu√≠a
elif video_path is None:                                          # Si no hay video subido
    print("‚ö†Ô∏è No detecto ning√∫n video en /content/in.")           # Aviso
    print("‚ÑπÔ∏è Sube un video (mp4/mov/avi/mkv) y vuelve a correr este bloque.")  # Gu√≠a
else:
    # Intenta correr la predicci√≥n de YOLO sobre el video
    try:
        print("‚úÖ Iniciando predicci√≥n en video:")                # Mensaje de inicio
        print(" - Modelo:", best_path)                            # Muestra el modelo usado
        print(" - Video:", video_path.name)                       # Muestra el video usado
        print(" - Salida:", DIR_RUNS/pred_video_name)             # Muestra la carpeta de salida

        model = YOLO(str(best_path))                              # Carga el modelo entrenado
        model.predict(                                            # Ejecuta predicci√≥n
            source=str(video_path),                               # Fuente: video
            save=True,                                            # Guarda el video/frames con cajas dibujadas
            save_txt=True,                                        # Guarda detecciones en .txt (por frame)
            save_conf=True,                                       # Incluye confidence en esos .txt
            project=str(DIR_RUNS),                                # Carpeta base de salida
            name=pred_video_name,                                 # Nombre del run de predicci√≥n
            exist_ok=True                                         # Reutiliza carpeta si ya existe
        )

        print("‚úÖ Predicci√≥n completada en:", DIR_RUNS/pred_video_name)  # Confirmaci√≥n

    except Exception as e:
        print("‚ö†Ô∏è Fall√≥ la predicci√≥n en video por un error:")    # Aviso de error
        print("   ", str(e)[:400])                                # Muestra parte del error
        print("‚ÑπÔ∏è Tip t√≠pico: revisa que el video no est√© corrupto o que best.pt exista.")  # Gu√≠a

    # Chequea outputs esperados (sin romper)
    out_dir = DIR_RUNS/pred_video_name                            # Carpeta de salida del predict
    labels_dir = out_dir/"labels"                                 # Carpeta donde deber√≠an quedar los .txt

    print("\n‚úÖ Chequeo de outputs:")                              # T√≠tulo del chequeo
    if out_dir.exists():                                          # Si existe la carpeta de salida
        print(" - Carpeta salida OK:", out_dir)                   # Confirma
    else:
        print("‚ö†Ô∏è No existe la carpeta de salida:", out_dir)      # Aviso

    if labels_dir.exists():                                       # Si existe la carpeta labels
        n_txt = len(list(labels_dir.glob("*.txt")))               # Cuenta cuantos txt hay
        print(" - Labels (.txt) OK:", labels_dir, "| cantidad:", n_txt)  # Confirma cantidad
        if n_txt == 0:                                            # Si no hay txt
            print("‚ö†Ô∏è labels/ existe pero no tiene .txt (puede ser que no detect√≥ nada o fall√≥ el guardado).")  # Aviso
    else:
        print("‚ö†Ô∏è No encontr√© carpeta labels/ en:", labels_dir)   # Aviso
        print("‚ÑπÔ∏è Si no existe, revisa que predict se ejecut√≥ con save_txt=True.")  # Gu√≠a

    # Intenta encontrar el video anotado generado y reportarlo
    annotated_candidates = []                                     # Lista para candidatos de video anotado
    for ext in [".mp4", ".mov", ".avi", ".mkv"]:                  # Revisa extensiones comunes
        annotated_candidates += list(out_dir.glob(f"*{ext}"))     # Agrega coincidencias

    if annotated_candidates:                                      # Si hay alg√∫n candidato
        annotated_video = annotated_candidates[0]                 # Toma el primero
        print(" - Video anotado detectado:", annotated_video.name)  # Confirma nombre
    else:
        print("‚ö†Ô∏è No pude detectar un video anotado en la carpeta de salida (a veces YOLO guarda frames en vez de video).")  # Aviso


NameError: name 'DIR_RUNS' is not defined

##
$$\textbf{Bloque 15 ‚Äî Construir detections.csv (detecciones por frame/tiempo):} \
\\\ \text{Lee los .txt generados por YOLO en labels/ y crea una tabla (CSV) con frame, tiempo, clase, confianza y caja (x,y,w,h).}$$


In [None]:
# Crea detections.csv desde los .txt de /content/runs/predict_video/labels (si falta algo, no falla: avisa)
import json                                                     # Sirve para leer salida JSON de ffprobe (fps del video)
import math                                                     # Utilidades matem√°ticas (por si se necesita)

pred_video_name = "predict_video"                               # Debe coincidir con el nombre usado en el Bloque 14
out_dir = DIR_RUNS/pred_video_name                              # Carpeta de salida de la predicci√≥n de video
labels_dir = out_dir/"labels"                                   # Carpeta donde YOLO deja los .txt por frame
det_csv_path = DIR_OUT/"detections.csv"                         # Ruta final del CSV de detecciones

# Intenta detectar el video en /content/in (para calcular tiempo real con fps)
video_path = next((p for p in DIR_IN.iterdir() if p.suffix.lower() in [".mp4", ".mov", ".avi", ".mkv"]), None)  # Busca video subido

# Funci√≥n para obtener FPS real del video usando ffprobe (si falla, devuelve None)
def get_video_fps(path):                                        # Define funci√≥n para leer fps del video
    try:
        cmd = f'ffprobe -v error -select_streams v:0 -show_entries stream=r_frame_rate -of json "{path}"'  # Comando ffprobe
        r = subprocess.run(cmd, shell=True, capture_output=True, text=True)  # Ejecuta ffprobe
        data = json.loads(r.stdout)                              # Parsea JSON
        rate = data["streams"][0]["r_frame_rate"]                # Lee r_frame_rate (ej: "30000/1001")
        num, den = rate.split("/")                               # Separa numerador/denominador
        return float(num) / float(den)                           # Calcula fps como n√∫mero
    except Exception:
        return None                                              # Si algo falla, retorna None

# Chequea prerequisitos sin romper el notebook
if not out_dir.exists():                                        # Si no existe carpeta de predicci√≥n de video
    print("‚ö†Ô∏è No existe la carpeta de predicci√≥n:", out_dir)     # Aviso
    print("‚ÑπÔ∏è Corre el Bloque 14 (predicci√≥n en video) antes de este bloque.")  # Gu√≠a
elif not labels_dir.exists():                                    # Si no existe labels/
    print("‚ö†Ô∏è No existe la carpeta labels/:", labels_dir)        # Aviso
    print("‚ÑπÔ∏è Aseg√∫rate de correr el Bloque 14 con save_txt=True y save_conf=True.")  # Gu√≠a
else:
    # Obtiene fps del video (si no hay video o falla, usa fps=1 como fallback)
    fps = get_video_fps(video_path) if video_path else None      # Calcula fps real si hay video
    if fps is None:                                              # Si no se pudo obtener fps
        fps = 1.0                                                # Fallback para no romper el flujo
        print("‚ö†Ô∏è No pude obtener FPS del video; usar√© fps=1.0 como aproximaci√≥n para time_s.")  # Aviso
    else:
        print("‚úÖ FPS detectado del video:", fps)                 # Confirma fps real

    # Lee todos los .txt de labels/ ordenados por nombre
    txt_files = sorted(labels_dir.glob("*.txt"))                 # Lista txt en labels/
    if len(txt_files) == 0:                                      # Si no hay txt
        print("‚ö†Ô∏è labels/ existe pero no tiene .txt. Puede que no haya detecciones o algo fall√≥.")  # Aviso
    else:
        rows = []                                                # Lista para acumular filas del CSV

        # Recorre cada archivo .txt (cada uno representa un frame/imagen)
        for lf in txt_files:                                     # Recorre cada archivo de detecci√≥n
            stem = lf.stem                                       # Nombre sin extensi√≥n (ej: "000001")
            digits = re.sub(r"\D", "", stem)                     # Extrae solo n√∫meros del nombre
            if digits == "":                                     # Si no hay n√∫meros, salta
                continue                                         # Evita errores de conversi√≥n

            frame_idx = int(digits)                              # Convierte a √≠ndice de frame
            time_s = frame_idx / fps                             # Convierte frame a tiempo en segundos (aprox)

            # Lee cada detecci√≥n dentro del txt (una l√≠nea por detecci√≥n)
            content = lf.read_text(encoding="utf-8").strip()     # Lee el contenido del archivo
            if content == "":                                    # Si est√° vac√≠o, no hay detecciones en ese frame
                continue                                         # Salta

            for line in content.splitlines():                    # Recorre cada l√≠nea del txt
                parts = line.split()                             # Separa por espacios
                if len(parts) < 5:                               # Si no tiene lo m√≠nimo YOLO
                    continue                                     # Salta l√≠neas raras

                cls_id = int(parts[0])                           # ID de clase (0,1,2...)
                x = float(parts[1]); y = float(parts[2])         # Centro x,y normalizado (0-1)
                w = float(parts[3]); h = float(parts[4])         # Ancho/alto normalizado (0-1)

                # confidence solo existe si guardaste save_conf=True
                conf = float(parts[5]) if len(parts) >= 6 else None  # Lee confidence si existe

                # Obtiene nombre de clase si existe lista 'classes' (si no, deja el id)
                class_name = None                                # Inicializa nombre de clase
                if "classes" in globals() and isinstance(classes, list) and cls_id < len(classes):  # Si existe lista classes
                    class_name = classes[cls_id]                 # Traduce id a nombre
                else:
                    class_name = str(cls_id)                     # Fallback: usa el id como texto

                # Agrega una fila a la tabla
                rows.append({                                    # Crea un dict por detecci√≥n
                    "frame": frame_idx,                          # Frame detectado
                    "time_s": time_s,                            # Tiempo aproximado en segundos
                    "class_id": cls_id,                          # ID de clase
                    "class_name": class_name,                    # Nombre de clase (si est√° definido)
                    "conf": conf,                                # Confianza (puede ser None)
                    "x": x, "y": y, "w": w, "h": h               # Caja en formato YOLO normalizado
                })

        # Convierte a DataFrame y guarda CSV
        det_df = pd.DataFrame(rows)                              # Crea tabla con todas las detecciones
        if det_df.empty:                                         # Si qued√≥ vac√≠o
            print("‚ö†Ô∏è No se generaron filas en detections.csv (quiz√°s no hubo detecciones).")  # Aviso
        else:
            det_df = det_df.sort_values(["frame", "conf"], ascending=[True, False])  # Ordena por frame y mejor confianza
            det_df.to_csv(det_csv_path, index=False, encoding="utf-8")               # Guarda el CSV

            print("‚úÖ detections.csv creado en:", det_csv_path)   # Confirma salida
            print("‚úÖ Filas:", len(det_df), "| Frames √∫nicos:", det_df["frame"].nunique())  # Resumen r√°pido
            print("‚úÖ Ejemplo de 5 filas:")                       # T√≠tulo ejemplo
            print(det_df.head(5).to_string(index=False))          # Muestra 5 filas


##
$$\textbf{Bloque 16 ‚Äî Construir events.csv (intervalos/timeline):} \
\\\ \text{Convierte detections.csv en ‚Äúeventos‚Äù por clase: agrupa frames cercanos en intervalos (inicio‚Äìfin) para evitar parpadeos y generar un timeline legible.}$$


In [None]:
# Crea events.csv agrupando detecciones por clase en intervalos (si falta detections.csv, no falla: avisa)
events_csv_path = DIR_OUT/"events.csv"                             # Define d√≥nde se guardar√° el archivo de eventos
det_csv_path = DIR_OUT/"detections.csv"                            # Ruta esperada del detections.csv

# Par√°metros anti-parpadeo (ajustables)
min_conf = 0.35                                                     # Umbral m√≠nimo de confianza para considerar detecci√≥n
gap_frames = 2                                                      # Permite ‚Äúhuecos‚Äù de hasta N frames dentro de un mismo evento
min_len_frames = 3                                                  # Evento m√≠nimo: requiere al menos N frames para existir

# Intenta obtener FPS del video para convertir frames a segundos (si falla, usa 1.0)
video_path = next((p for p in DIR_IN.iterdir() if p.suffix.lower() in [".mp4", ".mov", ".avi", ".mkv"]), None)  # Busca video en /content/in

def get_video_fps_safe(path):                                       # Funci√≥n segura para obtener fps del video
    try:
        import json                                                 # Importa json para parsear ffprobe
        cmd = f'ffprobe -v error -select_streams v:0 -show_entries stream=r_frame_rate -of json "{path}"'  # Comando ffprobe
        r = subprocess.run(cmd, shell=True, capture_output=True, text=True)  # Ejecuta ffprobe
        data = json.loads(r.stdout)                                 # Parsea JSON
        rate = data["streams"][0]["r_frame_rate"]                   # Lee r_frame_rate (ej: "30000/1001")
        num, den = rate.split("/")                                  # Separa numerador/denominador
        return float(num) / float(den)                              # Devuelve fps real
    except Exception:
        return 1.0                                                  # Fallback si falla

fps = get_video_fps_safe(video_path) if video_path else 1.0         # Calcula fps si hay video; si no, usa 1.0
print("‚úÖ FPS usado para convertir frames‚Üísegundos:", fps)            # Confirma fps usado

# Si no existe detections.csv, avisa y termina sin romper el notebook
if not det_csv_path.exists():                                       # Verifica si existe detections.csv
    print("‚ö†Ô∏è No existe detections.csv en:", det_csv_path)          # Aviso
    print("‚ÑπÔ∏è Corre el Bloque 15 (detections.csv) antes de este bloque.")  # Gu√≠a
else:
    # Carga detections.csv (si est√° vac√≠o o corrupto, avisa sin romper)
    try:
        det_df = pd.read_csv(det_csv_path)                          # Lee el CSV de detecciones
        print("‚úÖ detections.csv cargado | filas:", len(det_df))     # Confirma carga
    except Exception as e:
        print("‚ö†Ô∏è No pude leer detections.csv por un error:")       # Aviso
        print("   ", str(e)[:300])                                   # Muestra parte del error
        det_df = pd.DataFrame()                                     # Deja DF vac√≠o para no romper

    # Si no hay datos, avisa y termina
    if det_df.empty:                                                # Revisa si el DataFrame qued√≥ vac√≠o
        print("‚ö†Ô∏è detections.csv est√° vac√≠o; no puedo generar events.csv.")  # Aviso
        print("‚ÑπÔ∏è Esto puede pasar si el modelo no detect√≥ nada en el video.")  # Gu√≠a
    else:
        # Asegura columnas necesarias (si falta alguna, avisa y termina)
        needed = {"frame", "class_name", "conf"}                    # Columnas m√≠nimas requeridas
        if not needed.issubset(set(det_df.columns)):                # Verifica columnas
            print("‚ö†Ô∏è detections.csv no tiene las columnas m√≠nimas:", needed)  # Aviso
            print("‚ÑπÔ∏è Revisa que el Bloque 15 haya generado frame/class_name/conf.")  # Gu√≠a
        else:
            events_rows = []                                        # Lista donde guardaremos eventos (intervalos)

            # Recorre cada clase y crea intervalos de frames consecutivos (con tolerancia de gap)
            for cname in sorted(det_df["class_name"].dropna().unique()):  # Recorre clases detectadas
                sub = det_df[(det_df["class_name"] == cname)]       # Filtra por clase
                sub = sub[sub["conf"].fillna(0) >= min_conf]        # Filtra por confianza m√≠nima (maneja NaN)

                frames = sorted(sub["frame"].dropna().astype(int).unique())  # Lista frames √∫nicos ordenados
                if len(frames) == 0:                                # Si no hay frames para esta clase
                    continue                                        # Pasa a la siguiente clase

                start = frames[0]                                   # Inicio del evento actual
                prev = frames[0]                                    # √öltimo frame visto del evento actual

                for fr in frames[1:]:                               # Recorre frames siguientes
                    if fr <= prev + 1 + gap_frames:                 # Si est√° cerca (con tolerancia de huecos)
                        prev = fr                                   # Extiende el evento actual
                    else:
                        # Cierra evento anterior si cumple largo m√≠nimo
                        if (prev - start + 1) >= min_len_frames:    # Verifica largo m√≠nimo del evento
                            events_rows.append([cname, start, prev])  # Guarda evento (clase, inicio, fin)
                        start = fr                                  # Abre nuevo evento
                        prev = fr                                   # Reinicia √∫ltimo frame

                # Cierra el √∫ltimo evento
                if (prev - start + 1) >= min_len_frames:            # Verifica largo m√≠nimo final
                    events_rows.append([cname, start, prev])         # Guarda √∫ltimo evento

            # Si no hubo eventos (por filtros), avisa y termina sin romper
            if len(events_rows) == 0:                               # Revisa si se gener√≥ algo
                print("‚ö†Ô∏è No se generaron eventos con los par√°metros actuales.")  # Aviso
                print("‚ÑπÔ∏è Prueba bajar min_conf o min_len_frames si te est√° quedando vac√≠o.")  # Gu√≠a
            else:
                # Convierte eventos a DataFrame y calcula tiempos
                ev_df = pd.DataFrame(events_rows, columns=["class_name", "start_frame", "end_frame"])  # Crea tabla de eventos
                ev_df["start_s"] = ev_df["start_frame"] / fps       # Convierte inicio a segundos
                ev_df["end_s"] = ev_df["end_frame"] / fps           # Convierte fin a segundos
                ev_df["duration_s"] = (ev_df["end_s"] - ev_df["start_s"]).clip(lower=0)  # Calcula duraci√≥n no negativa

                # Ordena eventos por tiempo de inicio
                ev_df = ev_df.sort_values(["start_s", "class_name"])  # Ordena cronol√≥gicamente

                # Guarda events.csv
                ev_df.to_csv(events_csv_path, index=False, encoding="utf-8")  # Guarda el CSV final

                # Prints de confirmaci√≥n + resumen
                print("‚úÖ events.csv creado en:", events_csv_path)   # Confirma salida
                print("‚úÖ Eventos:", len(ev_df), "| Clases:", ev_df["class_name"].nunique())  # Resumen
                print("‚úÖ Ejemplo de 10 eventos:")                   # T√≠tulo ejemplo
                print(ev_df.head(10).to_string(index=False))         # Muestra 10 filas

                # Guarda los par√°metros usados para trazabilidad
                params_path = DIR_OUT/"events_params.txt"            # Archivo para guardar par√°metros
                params_text = (                                     # Texto de par√°metros
                    f"min_conf={min_conf}\n"
                    f"gap_frames={gap_frames}\n"
                    f"min_len_frames={min_len_frames}\n"
                    f"fps_used={fps}\n"
                )
                params_path.write_text(params_text, encoding="utf-8")  # Escribe par√°metros
                print("‚úÖ Par√°metros guardados en:", params_path)     # Confirma guardado


#
$$\textbf{Bloques auxiliares}$$

##
$$\textbf{Bloque 3 ‚Äî Subida de archivos (cvat zip, videos, best.pt):} \
\\\ \text{Permite subir archivos desde tu computador a Colab y los deja guardados en content in para usarlos en el flujo.}$$

In [12]:
# Habilita el bot√≥n de subir archivos desde tu PC a Colab
from google.colab import files  # Herramienta de Colab para subir archivos manualmente

# Abre el selector para subir: video.mp4 o images.zip o cvat_yolo_export.zip
uploaded = files.upload()  # Te deja elegir archivos desde tu computador

# Mueve cada archivo subido a la carpeta est√°ndar /content/in
for fname in uploaded.keys():              # Recorre los nombres de lo que subiste
    src = Path("/content")/fname           # Colab lo deja primero en /content
    dst = DIR_IN/fname                     # Destino final en /content/in
    if src.exists():                       # Confirma que el archivo est√°
        shutil.move(str(src), str(dst))    # Lo mueve a /content/in

# Muestra lo que qued√≥ en /content/in para confirmar que est√° OK
print("‚úÖ Archivos guardados en /content/in:")  # Mensaje de confirmaci√≥n
items = list(DIR_IN.iterdir())                 # Lee el contenido de /content/in
if items:                                      # Si hay archivos
    for p in items:                            # Recorre cada archivo
        print(" -", p.name, f"({p.stat().st_size/1e6:.2f} MB)")  # Nombre y tama√±o
else:
    print("‚ö†Ô∏è Carpeta vac√≠a: no se subi√≥ nada a√∫n.")             # Aviso si no hay archivos


Saving cvat t1p2 t10 y t3p2.zip to cvat t1p2 t10 y t3p2.zip
‚úÖ Archivos guardados en /content/in:
 - cvat t1p2 t10 y t3p2.zip (28.30 MB)
 - .ipynb_checkpoints (0.00 MB)


##
$$\textbf{Bloque 6 ‚Äî Video ‚Üí Frames:} \
\\\ \text{Si hay un video, extrae im√°genes (frames) a una frecuencia definida (fps) y las guarda en #/content/work/frames para etiquetarlas despu√©s.}$$


In [None]:
# Busca un video por extensi√≥n com√∫n (si existe)
video = next((p for p in in_files if p.suffix.lower() in [".mp4", ".mov", ".avi", ".mkv"]), None)  # Encuentra el primer video

# Extrae frames desde el video detectado (si no hay video, no falla: solo avisa)
fps_extract = 1.0                                              # Define cu√°ntas im√°genes por segundo extraer (ej: 1.0 = 1 frame/seg)
img_ext = "jpg"                                                # Define el formato de imagen de salida (jpg o png)

# Si no hay video, no hacemos nada y seguimos
if video is None:                                              # Revisa si se detect√≥ un video en /content/in
    print("‚ö†Ô∏è No hay video detectado en /content/in, as√≠ que no se extraen frames todav√≠a.")  # Aviso sin romper el flujo
else:
    # Limpia frames anteriores para no mezclar corridas
    old_frames = list(FRAMES_DIR.glob(f"*.{img_ext}"))          # Busca frames antiguos en la carpeta de frames
    for f in old_frames:                                        # Recorre frames antiguos
        f.unlink()                                              # Borra cada frame antiguo

    # Define el n√∫mero inicial desde el cual deseas comenzar la numeraci√≥n
    start_number = 1  # Puedes poner el n√∫mero que desees

    # Define el patr√≥n de nombres con el n√∫mero de inicio
    out_pattern = str(FRAMES_DIR / f"%06d.{img_ext}")

    # Construye y ejecuta el comando ffmpeg para extraer frames
    cmd = [
    "ffmpeg", "-y",
    "-i", str(video),
    "-vf", f"fps={fps_extract}",
    "-start_number", str(start_number), # <--- ESTO indica d√≥nde empezar
    out_pattern]

    print("‚úÖ Ejecutando FFmpeg para extraer frames:")          # Mensaje de inicio
    print("   ", " ".join(cmd))                                 # Muestra el comando para trazabilidad
    subprocess.run(cmd, check=False)                            # Ejecuta sin romper el notebook si ffmpeg devuelve error

    # Cuenta y muestra resultados
    frames = sorted(FRAMES_DIR.glob(f"*.{img_ext}"))            # Busca los frames generados
    if len(frames) == 0:                                        # Si no se gener√≥ ning√∫n frame
        print("‚ö†Ô∏è No se generaron frames (revisa si el video est√° OK o si fps_extract es muy bajo).")  # Aviso
    else:
        print(f"‚úÖ Frames listos: {len(frames)} en {FRAMES_DIR}")  # Confirma cu√°ntos frames se crearon
        print("   Ejemplo primero/√∫ltimo:", frames[0].name, "|", frames[-1].name)  # Muestra nombres de ejemplo

# Comprime los frames en un ZIP descargable (si no hay frames, no falla: solo avisa)
zip_frames_path = DIR_OUT/"frames.zip"                         # Define d√≥nde quedar√° el zip final

# Busca frames existentes en la carpeta de frames
frame_files = sorted(list(FRAMES_DIR.glob("*.jpg")) + list(FRAMES_DIR.glob("*.png")))  # Re√∫ne frames jpg/png

# Si no hay frames a√∫n, avisa y termina sin error
if len(frame_files) == 0:                                      # Revisa si hay frames para comprimir
    print("‚ö†Ô∏è No hay frames en /content/work/frames, as√≠ que no se puede crear frames.zip todav√≠a.")  # Aviso
else:
    # Si ya exist√≠a un zip antiguo, lo borra para evitar confusiones
    if zip_frames_path.exists():                               # Verifica si el zip ya existe
        zip_frames_path.unlink()                               # Borra el zip anterior

    # Crea el zip con todos los frames
    with zipfile.ZipFile(zip_frames_path, "w", zipfile.ZIP_DEFLATED) as z:  # Abre un zip en modo escritura
        for f in frame_files:                                  # Recorre cada frame
            z.write(f, arcname=f.name)                         # Agrega el archivo al zip con su nombre

    # Confirma que el zip se cre√≥ correctamente
    print("‚úÖ ZIP creado para CVAT:", zip_frames_path)          # Muestra la ruta del zip creado
    print(f"‚úÖ Incluye {len(frame_files)} im√°genes.")          # Indica cu√°ntas im√°genes quedaron dentro

    # Opci√≥n de descarga directa (si quieres)
    try:
        from google.colab import files                         # Importa herramienta de descarga de Colab
        files.download(str(zip_frames_path))                   # Descarga el zip a tu PC
        print("‚úÖ Descarga iniciada (si tu navegador lo permite).")  # Confirmaci√≥n
    except Exception:
        print("‚ö†Ô∏è No pude iniciar descarga autom√°tica, pero el zip qued√≥ en /content/out para descargarlo manualmente.")  # Aviso



‚úÖ Ejecutando FFmpeg para extraer frames:
    ffmpeg -y -i /content/in/TRAMO 3 - PARTE 2.mp4 -vf fps=1.0 -start_number 590 /content/work/frames/%06d.jpg
‚úÖ Frames listos: 296 en /content/work/frames
   Ejemplo primero/√∫ltimo: 000590.jpg | 000885.jpg
‚úÖ ZIP creado para CVAT: /content/out/frames.zip
‚úÖ Incluye 296 im√°genes.


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

‚úÖ Descarga iniciada (si tu navegador lo permite).


##
$$\textbf{Bloque 17 ‚Äî Empaquetar resultados y descargar best pt u otros} \
\\\ \text{Copia best.pt y los CSV (detections/events) a #/content/out, busca el video anotado si existe, arma un ZIP final y lo descarga.}$$


In [None]:
# Empaqueta outputs finales en /content/out y crea final_report.zip (si falta algo, no falla: avisa)
run_name = "train"                                                 # Nombre del entrenamiento usado
pred_video_name = "predict_video"                                  # Nombre de carpeta de predicci√≥n de video

best_path = DIR_RUNS/run_name/"weights/best.pt"                    # Ruta esperada del best.pt
det_csv_path = DIR_OUT/"detections.csv"                            # Ruta esperada del detections.csv
events_csv_path = DIR_OUT/"events.csv"                             # Ruta esperada del events.csv

final_zip_path = DIR_OUT/"final_report.zip"                        # Ruta del zip final
best_out_path = DIR_OUT/"best.pt"                                  # Copia final de best.pt en /out

pred_dir = DIR_RUNS/pred_video_name                                # Carpeta donde quedaron outputs del predict video
annotated_out_path = DIR_OUT/"annotated.mp4"                       # Nombre est√°ndar del video anotado en /out

# Lista de archivos que intentaremos meter al zip
to_zip = []                                                        # Lista de rutas para incluir en el zip

print("‚úÖ Preparando empaquetado de resultados...")                 # Mensaje de inicio

# Copia best.pt a /out si existe
if best_path.exists():                                             # Si existe best.pt
    shutil.copy2(best_path, best_out_path)                          # Copia best.pt a /content/out
    to_zip.append(best_out_path)                                   # Agrega best.pt a lista para zip
    print("‚úÖ best.pt listo en:", best_out_path)                    # Confirma
else:
    print("‚ö†Ô∏è No encontr√© best.pt en:", best_path)                  # Aviso

# Agrega detections.csv si existe
if det_csv_path.exists():                                          # Si existe detections.csv
    to_zip.append(det_csv_path)                                    # Agrega al zip
    print("‚úÖ detections.csv listo en:", det_csv_path)              # Confirma
else:
    print("‚ö†Ô∏è No encontr√© detections.csv en:", det_csv_path)        # Aviso

# Agrega events.csv si existe
if events_csv_path.exists():                                       # Si existe events.csv
    to_zip.append(events_csv_path)                                 # Agrega al zip
    print("‚úÖ events.csv listo en:", events_csv_path)               # Confirma
else:
    print("‚ö†Ô∏è No encontr√© events.csv en:", events_csv_path)         # Aviso

# Intenta detectar un video anotado en la carpeta de predicci√≥n
annotated_video = None                                             # Variable para guardar ruta del video anotado
if pred_dir.exists():                                              # Si existe carpeta predict_video
    candidates = []                                                # Lista de posibles videos generados
    for ext in [".mp4", ".mov", ".avi", ".mkv"]:                   # Extensiones comunes de video
        candidates += list(pred_dir.glob(f"*{ext}"))               # Busca archivos de video en la carpeta
    if candidates:                                                 # Si encontr√≥ alguno
        annotated_video = candidates[0]                            # Toma el primero
        shutil.copy2(annotated_video, annotated_out_path)          # Copia a /content/out con nombre est√°ndar
        to_zip.append(annotated_out_path)                          # Agrega al zip
        print("‚úÖ Video anotado listo en:", annotated_out_path)     # Confirma
    else:
        print("‚ö†Ô∏è No encontr√© video anotado en:", pred_dir)         # Aviso
else:
    print("‚ö†Ô∏è No existe la carpeta de predicci√≥n de video:", pred_dir)  # Aviso

# Si no hay nada para comprimir, avisa y termina sin error
if len(to_zip) == 0:                                               # Revisa si hay archivos en lista
    print("‚ö†Ô∏è No hay archivos suficientes para crear el zip final todav√≠a.")  # Aviso
    print("‚ÑπÔ∏è Corre entrenamiento/predicci√≥n y generaci√≥n de CSV antes de empaquetar.")  # Gu√≠a
else:
    # Borra zip anterior si exist√≠a para evitar confusi√≥n
    if final_zip_path.exists():                                    # Si ya exist√≠a final_report.zip
        final_zip_path.unlink()                                    # Lo borra

    # Crea el zip final con todo lo disponible
    with zipfile.ZipFile(final_zip_path, "w", zipfile.ZIP_DEFLATED) as z:  # Abre zip para escribir
        for p in to_zip:                                           # Recorre archivos a incluir
            z.write(p, arcname=p.name)                              # Agrega con nombre simple dentro del zip

    # Confirma creaci√≥n del zip final
    print("‚úÖ ZIP final creado:", final_zip_path)                   # Confirma ruta del zip
    print("‚úÖ Incluye:", [p.name for p in to_zip])                  # Muestra qu√© incluy√≥

    # Intenta descargar autom√°ticamente el zip
    try:
        from google.colab import files                              # Importa herramienta de descarga
        files.download(str(final_zip_path))                         # Descarga zip
        print("‚úÖ Descarga iniciada (si tu navegador lo permite).")  # Confirmaci√≥n
    except Exception:
        print("‚ö†Ô∏è No pude iniciar descarga autom√°tica, pero el zip qued√≥ en /content/out.")  # Aviso


‚úÖ Preparando empaquetado de resultados...
‚úÖ best.pt listo en: /content/out/best.pt
‚ö†Ô∏è No encontr√© detections.csv en: /content/out/detections.csv
‚ö†Ô∏è No encontr√© events.csv en: /content/out/events.csv
‚ö†Ô∏è No existe la carpeta de predicci√≥n de video: /content/runs/predict_video
‚úÖ ZIP final creado: /content/out/final_report.zip
‚úÖ Incluye: ['best.pt']


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

‚úÖ Descarga iniciada (si tu navegador lo permite).


##
$$\textbf{Bloque 19 ‚Äî Interfaz simple (modo ‚Äúusuario final‚Äù):} \
\\\ \text{Permite subir un modelo best.pt y un video, ejecuta la predicci√≥n y genera final\_report.zip (video anotado + CSVs) en #/content/out.}$$


In [None]:
# Interfaz m√≠nima: subes best.pt + video y el notebook te genera el zip final (si falta algo, no falla: avisa)
from google.colab import files                                  # Herramienta de Colab para subir/descargar archivos

# Define nombres est√°ndar de trabajo
UI_MODEL_NAME = "best.pt"                                       # Nombre esperado para el modelo subido
UI_VIDEO_NAME = None                                            # Nombre del video subido (lo detectamos por extensi√≥n)

# Crea carpetas por si no existen (por seguridad)
for d in [DIR_IN, DIR_RUNS, DIR_OUT]:                           # Asegura carpetas clave
    d.mkdir(parents=True, exist_ok=True)                        # Crea si falta

print("‚úÖ Interfaz simple: sube best.pt y un video (mp4/mov/avi/mkv).")  # Instrucci√≥n amigable

# Subida de archivos (el usuario elige desde su PC)
uploaded = files.upload()                                       # Abre selector para subir archivos

# Mueve lo subido a /content/in para mantener el est√°ndar
for fname in uploaded.keys():                                   # Recorre nombres de archivos subidos
    src = Path("/content")/fname                                # Ruta temporal donde Colab deja los archivos
    dst = DIR_IN/fname                                          # Ruta final en /content/in
    if src.exists():                                            # Verifica existencia
        shutil.move(str(src), str(dst))                         # Mueve a /content/in

# Detecta best.pt y video dentro de /content/in
model_path = DIR_IN/UI_MODEL_NAME                               # Ruta esperada del modelo (best.pt)
video_path = next((p for p in DIR_IN.iterdir() if p.suffix.lower() in [".mp4",".mov",".avi",".mkv"]), None)  # Busca video

# Valida inputs sin romper
if not model_path.exists():                                     # Si no existe el modelo subido
    print("‚ö†Ô∏è No encontr√© best.pt en /content/in.")             # Aviso
    print("‚ÑπÔ∏è Sube un archivo llamado exactamente 'best.pt'.")  # Gu√≠a
elif video_path is None:                                        # Si no se detect√≥ video
    print("‚ö†Ô∏è No encontr√© un video en /content/in.")            # Aviso
    print("‚ÑπÔ∏è Sube un video .mp4/.mov/.avi/.mkv junto al best.pt.")  # Gu√≠a
else:
    # Define carpeta de salida para esta predicci√≥n
    pred_video_name = "predict_video_ui"                        # Nombre del run de predicci√≥n para interfaz
    out_dir = DIR_RUNS/pred_video_name                          # Carpeta donde YOLO guardar√° resultados
    labels_dir = out_dir/"labels"                               # Carpeta donde quedar√°n txt por frame

    # Ejecuta predicci√≥n en video y guarda video + txt + conf
    try:
        print("‚úÖ Ejecutando predicci√≥n (interfaz):")            # Mensaje de inicio
        print(" - Modelo:", model_path)                          # Muestra modelo
        print(" - Video:", video_path.name)                      # Muestra video
        print(" - Salida:", out_dir)                             # Muestra salida

        model = YOLO(str(model_path))                            # Carga el modelo subido
        model.predict(                                           # Ejecuta predicci√≥n
            source=str(video_path),                               # Video de entrada
            save=True,                                            # Guarda salida visual
            save_txt=True,                                        # Guarda txt por frame
            save_conf=True,                                       # Guarda confidence
            project=str(DIR_RUNS),                                # Carpeta base
            name=pred_video_name,                                 # Nombre del run
            exist_ok=True                                         # Reutiliza si existe
        )

        print("‚úÖ Predicci√≥n terminada.")                         # Confirmaci√≥n
    except Exception as e:
        print("‚ö†Ô∏è Fall√≥ la predicci√≥n por un error:")            # Aviso de error
        print("   ", str(e)[:400])                               # Muestra parte del error
        print("‚ÑπÔ∏è Revisa que best.pt sea compatible con tu dataset/clases.")  # Gu√≠a

    # Construye detections.csv si existen labels
    det_csv_path = DIR_OUT/"detections.csv"                      # Ruta detections final
    events_csv_path = DIR_OUT/"events.csv"                       # Ruta events final

    if not labels_dir.exists():                                  # Si no existe labels/
        print("‚ö†Ô∏è No existe labels/ en la salida, as√≠ que no puedo construir CSVs.")  # Aviso
    else:
        # Obtiene fps real para time_s (si falla, usa 1.0)
        def get_video_fps_safe(path):                            # Funci√≥n segura para fps
            try:
                import json                                      # Para parsear JSON
                cmd = f'ffprobe -v error -select_streams v:0 -show_entries stream=r_frame_rate -of json "{path}"'  # ffprobe
                r = subprocess.run(cmd, shell=True, capture_output=True, text=True)  # Ejecuta
                data = json.loads(r.stdout)                      # Parsea
                rate = data["streams"][0]["r_frame_rate"]        # Lee rate
                num, den = rate.split("/")                       # Separa
                return float(num)/float(den)                     # Calcula fps
            except Exception:
                return 1.0                                       # Fallback

        fps = get_video_fps_safe(video_path)                     # FPS para convertir frames a segundos
        print("‚úÖ FPS usado:", fps)                               # Confirma fps

        # Lee txt y arma detections.csv
        txt_files = sorted(labels_dir.glob("*.txt"))             # Lista txt por frame
        rows = []                                                # Filas para detections

        for lf in txt_files:                                     # Recorre cada txt
            digits = re.sub(r"\D", "", lf.stem)                  # Extrae frame desde el nombre
            if digits == "":                                     # Si no hay n√∫mero
                continue                                         # Salta
            frame_idx = int(digits)                              # Frame
            time_s = frame_idx / fps                             # Tiempo en segundos (aprox)
            content = lf.read_text(encoding="utf-8").strip()     # Lee contenido
            if content == "":                                    # Si vac√≠o
                continue                                         # Salta

            for line in content.splitlines():                    # Recorre detecciones
                parts = line.split()                             # Separa
                if len(parts) < 5:                               # Si no cumple m√≠nimo
                    continue                                     # Salta
                cls_id = int(parts[0])                           # Clase id
                x, y, w, h = map(float, parts[1:5])              # Caja
                conf = float(parts[5]) if len(parts) >= 6 else None  # Conf si existe
                rows.append({"frame": frame_idx, "time_s": time_s, "class_id": cls_id, "conf": conf,
                             "x": x, "y": y, "w": w, "h": h})    # Agrega fila

        det_df = pd.DataFrame(rows)                              # Crea DataFrame
        if det_df.empty:                                         # Si no hay detecciones
            print("‚ö†Ô∏è No hubo detecciones, detections.csv quedar√° vac√≠o/no se generar√° events.csv.")  # Aviso
        else:
            det_df = det_df.sort_values(["frame","conf"], ascending=[True, False])  # Ordena
            det_df.to_csv(det_csv_path, index=False, encoding="utf-8")              # Guarda CSV
            print("‚úÖ detections.csv listo en:", det_csv_path)    # Confirma

            # Genera events.csv agrupando por class_id (interfaz simple, sin nombres)
            min_conf = 0.35                                      # Umbral conf
            gap_frames = 2                                       # Huecos tolerados
            min_len_frames = 3                                   # Largo m√≠nimo

            events_rows = []                                     # Lista eventos
            for cid in sorted(det_df["class_id"].unique()):      # Recorre clases
                sub = det_df[(det_df["class_id"] == cid) & (det_df["conf"].fillna(0) >= min_conf)]  # Filtra
                frames = sorted(sub["frame"].unique())           # Frames
                if not frames:                                   # Si vac√≠o
                    continue                                     # Salta
                start = frames[0]; prev = frames[0]              # Inicializa evento
                for fr in frames[1:]:                            # Recorre frames
                    if fr <= prev + 1 + gap_frames:              # Si cercano
                        prev = fr                                # Extiende
                    else:
                        if (prev - start + 1) >= min_len_frames: # Si cumple m√≠nimo
                            events_rows.append([cid, start, prev])  # Guarda
                        start = fr; prev = fr                    # Nuevo evento
                if (prev - start + 1) >= min_len_frames:         # Cierra √∫ltimo
                    events_rows.append([cid, start, prev])        # Guarda

            ev_df = pd.DataFrame(events_rows, columns=["class_id","start_frame","end_frame"])  # Tabla eventos
            if ev_df.empty:                                      # Si no hay eventos
                print("‚ö†Ô∏è No se generaron eventos con los par√°metros actuales.")  # Aviso
            else:
                ev_df["start_s"] = ev_df["start_frame"]/fps      # Inicio s
                ev_df["end_s"] = ev_df["end_frame"]/fps          # Fin s
                ev_df["duration_s"] = (ev_df["end_s"]-ev_df["start_s"]).clip(lower=0)  # Duraci√≥n
                ev_df.to_csv(events_csv_path, index=False, encoding="utf-8")            # Guarda CSV
                print("‚úÖ events.csv listo en:", events_csv_path)  # Confirma

    # Copia video anotado (si existe) y arma zip final
    final_zip_path = DIR_OUT/"final_report.zip"                  # Ruta zip final
    to_zip = []                                                  # Lista archivos para zip

    if model_path.exists():                                      # Si modelo existe
        to_zip.append(model_path)                                # Agrega best.pt
    if det_csv_path.exists():                                    # Si detections existe
        to_zip.append(det_csv_path)                              # Agrega detections
    if events_csv_path.exists():                                 # Si events existe
        to_zip.append(events_csv_path)                           # Agrega events

    # Busca un video anotado en la carpeta de salida y lo copia a /out
    annotated_candidates = []                                    # Lista candidatos
    for ext in [".mp4",".mov",".avi",".mkv"]:                    # Exts video
        annotated_candidates += list(out_dir.glob(f"*{ext}"))     # Busca videos
    if annotated_candidates:                                     # Si encontr√≥
        shutil.copy2(annotated_candidates[0], DIR_OUT/"annotated.mp4")  # Copia a /out
        to_zip.append(DIR_OUT/"annotated.mp4")                   # Agrega al zip
        print("‚úÖ annotated.mp4 listo en /content/out.")          # Confirma
    else:
        print("‚ö†Ô∏è No encontr√© video anotado en la salida.")       # Aviso

    # Crea zip final si hay algo para comprimir
    if len(to_zip) == 0:                                         # Si no hay nada
        print("‚ö†Ô∏è No hay archivos para empaquetar todav√≠a.")      # Aviso
    else:
        if final_zip_path.exists():                              # Si zip existe
            final_zip_path.unlink()                              # Lo borra
        with zipfile.ZipFile(final_zip_path, "w", zipfile.ZIP_DEFLATED) as z:  # Crea zip
            for p in to_zip:                                     # Recorre archivos
                z.write(p, arcname=p.name)                       # Agrega al zip
        print("‚úÖ final_report.zip creado en:", final_zip_path)   # Confirma

        # Descarga zip final
        try:
            files.download(str(final_zip_path))                  # Descarga zip
            print("‚úÖ Descarga iniciada.")                        # Confirmaci√≥n
        except Exception:
            print("‚ö†Ô∏è No pude iniciar descarga autom√°tica, pero qued√≥ en /content/out.")  # Aviso
