In [6]:
import ipywidgets as widgets
from IPython.display import display, clear_output
from pathlib import Path

# --- CONTENEDOR PRINCIPAL ---
main_container = widgets.VBox()
out = widgets.Output()

def iniciar_panel_daich():
    # Variables globales para asegurar que los bloques se comuniquen
    global PATHS

    header = widgets.HTML("""
        <div style="background-color: #1a1a1a; padding: 20px; border-radius: 10px; border-left: 8px solid #007bff; color: white; margin-bottom: 20px;">
            <h1 style="margin: 0; color: #58a6ff; text-align: center;">ü§ñ PANEL DE CONTROL DAICH</h1>
        </div>
    """)

    # --- FUNCI√ìN PARA SUBIDA DIN√ÅMICA (BLOQUE 1.2) ---
    def ejecutar_subida_1_2(contexto="GENERAL"):
        print("üìÇ Selecciona archivos para a√±adir (Video, SRT, CSVs o Modelo)")     # Aviso de carga
        subidos = files.upload()                                                   # Selector de archivos

        for nombre_original in subidos.keys():                                     # Itera sobre los archivos subidos
            nombre_min = nombre_original.lower()                                   # Normaliza a min√∫sculas para comparar

            # --- L√ìGICA DE CLASIFICACI√ìN (Mantiene archivos existentes) ---
            if "losa" in nombre_min and nombre_original.endswith('.csv'):          # Identifica CSV de fondo
                ruta_destino = PATHS["in"] / "losa.csv"                            # Renombra para el motor de fusi√≥n
                print(f"üéØ Identificado como LOSA: {nombre_original}")

            elif "paramento" in nombre_min and nombre_original.endswith('.csv'):   # Identifica CSV de muros
                ruta_destino = PATHS["in"] / "paramento.csv"                       # Renombra para el motor de fusi√≥n
                print(f"üéØ Identificado como PARAMENTO: {nombre_original}")

            elif nombre_original.endswith('.pt'):                                 # Identifica modelos YOLO
                ruta_destino = PATHS["in"] / "best.pt"                             # Estandariza nombre del modelo
                print(f"üß† Modelo cargado/actualizado: {nombre_original}")

            else:                                                                  # Video, SRT y otros
                ruta_destino = PATHS["in"] / nombre_original                       # Conserva nombre original
                print(f"üì¶ Archivo guardado: {nombre_original}")

            # --- GUARDADO EN DISCO ---
            with open(ruta_destino, "wb") as f:                                    # Abre destino sin borrar el resto de /in
                f.write(subidos[nombre_original])                                  # Escribe el nuevo contenido
            # >>> FIN BLOQUE 1.2 <<<

    def vista_principal():
        # Botones con nombres representativos y cortos
        btn_config    = widgets.Button(description="1. Configurar Sistema", button_style='primary', layout={'width': '95%'})
        btn_frames    = widgets.Button(description="2. Extraer Frames", button_style='info', layout={'width': '95%'})
        btn_train_val = widgets.Button(description="3. Entrenar / Validar", button_style='warning', layout={'width': '95%'})
        btn_inspeccion = widgets.Button(description="4. Generar Inspecci√≥n", button_style='success', layout={'width': '95%'})

        # --- BOT√ìN BLOQUE 1.1 ---
        def f_config(b):
            with out:
                clear_output()
                # >>> INICIO BLOQUE 1.1 <<<
                import os, shutil, zipfile, subprocess, glob, re    # Librer√≠as para gesti√≥n de archivos, carpetas y procesos del sistema
                from pathlib import Path                            # Herramienta para manipular rutas de archivos de forma intuitiva
                import pandas as pd                                 # Librer√≠a principal para manipulaci√≥n y an√°lisis de datos (CSVs)
                import numpy as np                                  # Librer√≠a para operaciones matem√°ticas y manejo de arreglos num√©ricos
                import cv2                                          # OpenCV: Librer√≠a para procesamiento de im√°genes y video
                import torch                                        # Framework de Deep Learning para ejecutar el modelo YOLO
                from google.colab import files                      # Utilidad espec√≠fica de Colab para subir y descargar archivos
                import random                                       # Permite generar n√∫meros aleatorios para mezclar datos antes del split

                # Instalaciones de dependencias para el reporte y detecci√≥n
                !pip -q install ultralytics fpdf
                from ultralytics import YOLO
                from fpdf import FPDF

                # --- CONFIGURACI√ìN DE RUTAS MAESTRAS ---
                BASE = Path("/content")

                # Definici√≥n de variables globales
                DIR_IN = BASE/"in"
                DIR_WORK = BASE/"work"
                DIR_OUT = BASE/"out"
                DIR_DATASET = BASE/"dataset"
                DIR_RUNS = BASE/"runs"
                DIR_FRAMES = DIR_WORK/"frames"
                DIR_RAW = DIR_WORK/"dataset_raw"

                # PATHS, para saber que carpetas debe utilizar el entorno
                PATHS = {
                    "in": DIR_IN,
                    "work": DIR_WORK,
                    "out": DIR_OUT,
                    "frames": DIR_FRAMES,
                    "dataset": DIR_DATASET
                }

                # Creaci√≥n f√≠sica de todo el √°rbol de directorios
                for p in [DIR_IN, DIR_WORK, DIR_OUT, DIR_DATASET, DIR_RUNS, DIR_FRAMES, DIR_RAW]:
                    p.mkdir(parents=True, exist_ok=True)

                print(f"‚úÖ Entorno preparado. GPU disponible: {torch.cuda.is_available()}")

                # --- FUNCIONES DE CHEQUEO ---

                def listar_carpeta(ruta, max_items=50):
                    ruta = Path(ruta)
                    print("\nüìÅ", ruta)
                    if not ruta.exists():
                        print("‚ö†Ô∏è No existe todav√≠a.")
                        return
                    items = sorted(list(ruta.iterdir()), key=lambda p: (p.is_file(), p.name.lower()))
                    if len(items) == 0:
                        print("‚ö†Ô∏è Est√° vac√≠a.")
                        return
                    for p in items[:max_items]:
                        tipo = "DIR " if p.is_dir() else "FILE"
                        print(f" - {tipo} {p.name}")

                print("\n‚úÖ Listado r√°pido de carpetas del proyecto:")
                listar_carpeta(BASE)
                listar_carpeta(DIR_IN)

                # Chequeo de espacio y peso
                try:
                    print("\n‚úÖ Espacio en disco:")
                    subprocess.run(["df", "-h", "/content"], check=False)
                except: pass

                # --- DETECCI√ìN AUTOM√ÅTICA DE INPUTS ---
                in_files = list(DIR_IN.iterdir())
                video = next((p for p in in_files if p.suffix.lower() in [".mp4", ".mov", ".avi"]), None)
                zip_cvat = next((p for p in in_files if p.suffix.lower() == ".zip" and "cvat" in p.name.lower()), None)
                zip_images = next((p for p in in_files if p.name.lower() == "images.zip"), None)

                print("\n‚úÖ Resumen de Entradas Detectadas:")
                print(" - Video:", video.name if video else "‚ùå No detectado")
                print(" - Zip CVAT:", zip_cvat.name if zip_cvat else "‚ùå No detectado")
                print(" - images.zip:", zip_images.name if zip_images else "‚ùå No detectado")

                print("\nüöÄ Rutas listas para el procesamiento t√©cnico.")

                # >>> FIN BLOQUE 1.1 <<<

        # --- BOT√ìN 2: BLOQUE 2.1 ---
        def f_frames(b):
            # Busca un video por extensi√≥n com√∫n (si existe)
            video = next((p for p in in_files if p.suffix.lower() in [".mp4", ".mov", ".avi", ".mkv"]), None)  # Encuentra el primer video

            # Extrae frames desde el video detectado (SELECCIONAR MANUALMENTE EN CASO DE VIDEOS M√ÅS GRANDES)
            fps_extract = 1.0                                              # Define cu√°ntas im√°genes por segundo extraer (ej: 1.0 = 1 frame/seg)
            img_ext = "jpg"                                                # Define el formato de imagen de salida (jpg o png)

            # Si no hay video, no hacemos nada y seguimos
            if video is None:                                              # Revisa si se detect√≥ un video en /content/in
                print("‚ö†Ô∏è No hay video detectado en /content/in, as√≠ que no se extraen frames todav√≠a.")  # Aviso sin romper el flujo
            else:
                # Limpia frames anteriores para no mezclar corridas
                old_frames = list(DIR_FRAMES.glob(f"*.{img_ext}"))          # Busca frames antiguos en la carpeta de frames
                for f in old_frames:                                        # Recorre frames antiguos
                    f.unlink()                                              # Borra cada frame antiguo

                # Define el n√∫mero inicial desde el cual deseas comenzar la numeraci√≥n
                start_number = 1262  # Puedes poner el n√∫mero que desees

                # Define el patr√≥n de nombres con el n√∫mero de inicio
                out_pattern = str(DIR_FRAMES / f"%06d.{img_ext}")

                # Construye y ejecuta el comando ffmpeg para extraer frames
                cmd = [
                "ffmpeg", "-y",
                "-i", str(video),
                "-vf", f"fps={fps_extract}",
                "-start_number", str(start_number), # <--- ESTO indica d√≥nde empezar
                out_pattern]

                print("‚úÖ Ejecutando FFmpeg para extraer frames:")          # Mensaje de inicio
                print("   ", " ".join(cmd))                                 # Muestra el comando para trazabilidad
                subprocess.run(cmd, check=False)                            # Ejecuta sin romper el notebook si ffmpeg devuelve error

                # Cuenta y muestra resultados
                frames = sorted(DIR_FRAMES.glob(f"*.{img_ext}"))            # Busca los frames generados
                if len(frames) == 0:                                        # Si no se gener√≥ ning√∫n frame
                    print("‚ö†Ô∏è No se generaron frames (revisa si el video est√° OK o si fps_extract es muy bajo).")  # Aviso
                else:
                    print(f"‚úÖ Frames listos: {len(frames)} en {DIR_FRAMES}")  # Confirma cu√°ntos frames se crearon
                    print("   Ejemplo primero/√∫ltimo:", frames[0].name, "|", frames[-1].name)  # Muestra nombres de ejemplo

            # Comprime los frames en un ZIP descargable (si no hay frames, no falla: solo avisa)
            zip_frames_path = DIR_OUT/"frames.zip"                         # Define d√≥nde quedar√° el zip final

            # Busca frames existentes en la carpeta de frames
            frame_files = sorted(list(DIR_FRAMES.glob("*.jpg")) + list(DIR_FRAMES.glob("*.png")))  # Re√∫ne frames jpg/png

            # Si no hay frames a√∫n, avisa y termina sin error
            if len(frame_files) == 0:                                      # Revisa si hay frames para comprimir
                print("‚ö†Ô∏è No hay frames en /content/work/frames, as√≠ que no se puede crear frames.zip todav√≠a.")  # Aviso
            else:
                # Si ya exist√≠a un zip antiguo, lo borra para evitar confusiones
                if zip_frames_path.exists():                               # Verifica si el zip ya existe
                    zip_frames_path.unlink()                               # Borra el zip anterior

                # Crea el zip con todos los frames
                with zipfile.ZipFile(zip_frames_path, "w", zipfile.ZIP_DEFLATED) as z:  # Abre un zip en modo escritura
                    for f in frame_files:                                  # Recorre cada frame
                        z.write(f, arcname=f.name)                         # Agrega el archivo al zip con su nombre

                # Confirma que el zip se cre√≥ correctamente
                print("‚úÖ ZIP creado para CVAT:", zip_frames_path)          # Muestra la ruta del zip creado
                print(f"‚úÖ Incluye {len(frame_files)} im√°genes.")          # Indica cu√°ntas im√°genes quedaron dentro

                # Opci√≥n de descarga directa (si quieres)
                try:
                    from google.colab import files                         # Importa herramienta de descarga de Colab
                    files.download(str(zip_frames_path))                   # Descarga el zip a tu PC
                    print("‚úÖ Descarga iniciada (si tu navegador lo permite).")  # Confirmaci√≥n
                except Exception:
                    print("‚ö†Ô∏è No pude iniciar descarga autom√°tica, pero el zip qued√≥ en /content/out para descargarlo manualmente.")  # Aviso
                    # >>> FIN BLOQUE 2.1 <<<

        # --- BOT√ìN 3: BLOQUES 2.2, 2.3 Y 2.4 ---
        def f_train_val(b):
            # Descomprime el export de CVAT en /content/work/dataset_raw
            # Nota: Este zip debe llamarse de forma que contenga "cvat" en el nombre

            # Vuelve a buscar un zip que parezca de CVAT
            in_files = list(DIR_IN.iterdir())                                              # Lee archivos en /content/in
            zip_cvat = next((p for p in in_files if p.suffix.lower() == ".zip" and "cvat" in p.name.lower()), None)  # Busca zip con "cvat" en el nombre

            if zip_cvat is None:                                                           # Revisa si existe export de CVAT
                print("‚ö†Ô∏è No detect√© ning√∫n .zip de CVAT en /content/in (debe tener 'cvat' en el nombre).")           # Aviso
                print("‚ÑπÔ∏è Cuando lo tengas, s√∫belo y vuelve a correr este bloque.")         # Gu√≠a
            else:
                if DIR_RAW.exists():                                                       # Revisa si ya existe dataset_raw
                    shutil.rmtree(DIR_RAW)                                                 # Borra dataset_raw anterior completo
                DIR_RAW.mkdir(parents=True, exist_ok=True)                                 # Crea dataset_raw limpio

                # Descomprime el zip de CVAT dentro de dataset_raw
                with zipfile.ZipFile(zip_cvat, "r") as z:                                  # Abre el zip de CVAT
                    z.extractall(DIR_RAW)                                                  # Extrae todo su contenido en DIR_RAW

                # Lista contenido para confirmar que se extrajo algo
                extracted_any = any(DIR_RAW.rglob("*"))                                     # Verifica si hay archivos extra√≠dos
                if not extracted_any:                                                      # Si no se extrajo nada
                    print("‚ö†Ô∏è El zip se descomprimi√≥, pero no veo archivos dentro. Revisa si el zip est√° correcto.")  # Aviso
                else:
                    print("‚úÖ Export CVAT descomprimido en:", DIR_RAW)                      # Confirmaci√≥n
                    # Muestra un vistazo r√°pido de archivos/carpetas extra√≠das
                    top_items = sorted(list(DIR_RAW.iterdir()))                             # Lista el primer nivel de dataset_raw
                    print("‚úÖ Primer nivel dentro de dataset_raw:")                         # T√≠tulo del listado
                    for p in top_items[:30]:                                                # Muestra hasta 30 √≠tems
                        tag = "DIR " if p.is_dir() else "FILE"                              # Marca si es carpeta o archivo
                        print(" -", tag, p.name)                                            # Imprime nombre
                    if len(top_items) > 30:                                                 # Si hay muchos √≠tems
                        print(f" ... y {len(top_items)-30} m√°s")                            # Indica que hay m√°s


            # Detecta im√°genes/labels en dataset_raw y construye dataset YOLO final (train/val) creando .txt vac√≠os para negativos
            import random

            img_exts = {".jpg", ".jpeg", ".png"}                             # Extensiones v√°lidas de im√°genes
            train_ratio = 0.8                                                # Proporci√≥n train/val
            seed = 42                                                        # Semilla para split repetible

            # Define rutas YOLO est√°ndar de salida
            IMG_TRAIN = DIR_DATASET/"images/train"                           # Im√°genes train
            IMG_VAL   = DIR_DATASET/"images/val"                             # Im√°genes val
            LBL_TRAIN = DIR_DATASET/"labels/train"                           # Labels train
            LBL_VAL   = DIR_DATASET/"labels/val"                             # Labels val

            # Crea carpetas de salida
            for d in [IMG_TRAIN, IMG_VAL, LBL_TRAIN, LBL_VAL]:               # Recorre carpetas YOLO
                d.mkdir(parents=True, exist_ok=True)                         # Crea si falta

            # Verifica que exista dataset_raw
            if not DIR_RAW.exists():                                         # Si no existe dataset_raw
                print("‚ö†Ô∏è No existe /content/work/dataset_raw todav√≠a. Corre el Bloque 8 (descomprimir CVAT) primero.")  # Aviso
            else:
                # Busca im√°genes y txt dentro de dataset_raw (recursivo)
                all_imgs = [p for p in DIR_RAW.rglob("*") if p.suffix.lower() in img_exts]   # Todas las im√°genes
                all_txt  = [p for p in DIR_RAW.rglob("*.txt")]                               # Todos los txt

                # Si falta algo, avisa pero no rompe
                if len(all_imgs) == 0:
                    print("‚ö†Ô∏è No encontr√© im√°genes dentro de dataset_raw. Revisa estructura del export (o tu zip).")  # Aviso
                if len(all_txt) == 0:
                    print("‚ö†Ô∏è No encontr√© labels (.txt) dentro de dataset_raw. Ojo: CVAT solo exporta txt con anotaciones.")  # Aviso

                # Detecta carpeta con m√°s im√°genes y carpeta con m√°s txt (candidatas principales)
                img_dir = None                                               # Carpeta candidata de im√°genes
                lbl_dir = None                                               # Carpeta candidata de labels

                if len(all_imgs) > 0:                                        # Si hay im√°genes
                    counts_img_parent = {}                                   # Conteo por carpeta
                    for p in all_imgs:                                       # Recorre im√°genes
                        counts_img_parent[p.parent] = counts_img_parent.get(p.parent, 0) + 1  # Cuenta
                    img_dir = max(counts_img_parent, key=counts_img_parent.get)              # Elige mayor

                if len(all_txt) > 0:                                         # Si hay txt
                    counts_lbl_parent = {}                                   # Conteo por carpeta
                    for p in all_txt:                                        # Recorre txt
                        counts_lbl_parent[p.parent] = counts_lbl_parent.get(p.parent, 0) + 1  # Cuenta
                    lbl_dir = max(counts_lbl_parent, key=counts_lbl_parent.get)              # Elige mayor

                print("\n‚úÖ Rutas detectadas (candidatas principales):")      # Imprime rutas
                print(" - img_dir:", str(img_dir) if img_dir else "No detectado")  # Carpeta im√°genes
                print(" - lbl_dir:", str(lbl_dir) if lbl_dir else "No detectado")  # Carpeta labels

                # Si no se detectaron rutas, termina sin error
                if (img_dir is None) or (lbl_dir is None):
                    print("‚ö†Ô∏è No pude detectar img_dir y/o lbl_dir. Revisa qu√© hay dentro de dataset_raw (Bloque 4 listar carpetas).")  # Aviso
                else:
                    # Crea mapas por stem para hacer match imagen <-> label
                    img_map = {}                                             # stem -> ruta imagen
                    for p in img_dir.iterdir():                              # Recorre archivos en img_dir
                        if p.suffix.lower() in img_exts:                     # Si es imagen
                            img_map[p.stem] = p                              # Guarda

                    lbl_map = {}                                             # stem -> ruta label
                    for p in lbl_dir.iterdir():                              # Recorre archivos en lbl_dir
                        if p.suffix.lower() == ".txt":                       # Si es txt
                            lbl_map[p.stem] = p                              # Guarda

                    # Diagn√≥stico de matching
                    all_stems = sorted(img_map.keys())                       # Todas las im√°genes (incluye negativos)
                    paired = sorted(set(img_map.keys()) & set(lbl_map.keys()))            # Con label
                    missing_lbl = sorted(set(img_map.keys()) - set(lbl_map.keys()))      # Sin label (negativos)
                    missing_img = sorted(set(lbl_map.keys()) - set(img_map.keys()))      # Txt sin imagen

                    print("\n‚úÖ Matching imagen + label (incluyendo negativos):")  # Reporte matching
                    print(" - Total im√°genes:", len(all_stems))              # Total
                    print(" - Con label (.txt):", len(paired))               # Con txt
                    print(" - Sin label (se crear√° .txt vac√≠o):", len(missing_lbl))  # Negativos

                    # Si no hay im√°genes, no se puede construir dataset
                    if len(all_stems) == 0:
                        print("‚ö†Ô∏è No hay im√°genes v√°lidas para construir dataset. Revisa nombres/extensiones.")  # Aviso
                    else:
                        # Limpia salidas anteriores
                        for d in [IMG_TRAIN, IMG_VAL, LBL_TRAIN, LBL_VAL]:   # Recorre carpetas de salida
                            for f in d.glob("*"):                            # Recorre archivos dentro
                                f.unlink()                                   # Borra

            # ------------------------------------------------------------------------------------------------------------------------------------

            # Split train/val sobre TODAS las im√°genes

                        random.seed(seed)                                    # Semilla
                        random.shuffle(all_stems)                             # Mezcla
                        cut = int(len(all_stems) * train_ratio)              # Corte
                        train_ids = all_stems[:cut]                          # Train stems
                        val_ids = all_stems[cut:]                            # Val stems

                        # Copia imagen y label (o crea vac√≠o si falta)
                        def copy_img_and_label(stem, img_dst, lbl_dst):      # Funci√≥n copiar + label
                            img_src = img_map[stem]                          # Imagen fuente
                            shutil.copy2(img_src, img_dst / img_src.name)    # Copia imagen

                            lbl_out = lbl_dst / f"{stem}.txt"                # Label destino
                            if stem in lbl_map:                              # Si existe label real
                                shutil.copy2(lbl_map[stem], lbl_out)         # Copia label
                            else:
                                lbl_out.write_text("", encoding="utf-8")     # Crea label vac√≠o (negativo)

                        # Copia a train
                        for s in train_ids:                                  # Recorre train
                            copy_img_and_label(s, IMG_TRAIN, LBL_TRAIN)      # Copia

                        # Copia a val
                        for s in val_ids:                                    # Recorre val
                            copy_img_and_label(s, IMG_VAL, LBL_VAL)          # Copia

                        # Resumen final
                        n_train_img = len(list(IMG_TRAIN.glob("*")))         # Cuenta imgs train
                        n_train_lbl = len(list(LBL_TRAIN.glob("*.txt")))     # Cuenta labels train
                        n_val_img = len(list(IMG_VAL.glob("*")))             # Cuenta imgs val
                        n_val_lbl = len(list(LBL_VAL.glob("*.txt")))         # Cuenta labels val

                        print("\n‚úÖ Dataset YOLO final creado en:", DIR_DATASET)  # Confirma creaci√≥n
                        print(" - Train: imgs =", n_train_img, "| lbls =", n_train_lbl)  # Resumen train
                        print(" - Val:   imgs =", n_val_img,   "| lbls =", n_val_lbl)    # Resumen val

                        # Chequeo 1 txt por imagen (ideal)
                        if n_train_img != n_train_lbl:
                            print("‚ö†Ô∏è Ojo: TRAIN imgs != txt (deber√≠an ser iguales).")  # Aviso
                        if n_val_img != n_val_lbl:
                            print("‚ö†Ô∏è Ojo: VAL imgs != txt (deber√≠an ser iguales).")    # Aviso

            # ------------------------------------------------------------------------------------------------------------------------------------

            # Crea el archivo data.yaml para YOLO y DEFINE MANUALMENTE las clases

            yaml_path = BASE/"data.yaml"                                    # Define la ruta donde se guardar√° el YAML

            # Define aqu√≠ tus clases EXACTAS y en el MISMO orden que usaste en CVAT - OJO DEBE HACERSE MANUAL
            classes = [
                "falla junta paramento izquierdo",
                "falla junta paramento derecho",
                "falla junta losa fondo",
                "estr√≠a lado izquierdo",
                "estr√≠a lado derecho",
                "estr√≠a centro",
                "da√±o paramento",
                "da√±o losa fondo",
            ]                                                               # Lista de nombres de clases (ed√≠tala t√∫)

            # Verifica que existan carpetas train/val para evitar un YAML apuntando a nada
            train_dir_ok = (DIR_DATASET/"images/train").exists()            # Revisa si existe la carpeta de im√°genes train
            val_dir_ok = (DIR_DATASET/"images/val").exists()                # Revisa si existe la carpeta de im√°genes val

            # Si no hay estructura dataset, avisa y no rompe el notebook
            if not (train_dir_ok and val_dir_ok):                           # Si faltan carpetas b√°sicas del dataset
                print("‚ö†Ô∏è No detecto la estructura de dataset en /content/dataset/images/train y /val.")  # Aviso
                print("‚ÑπÔ∏è Corre el Bloque 10 (normalizaci√≥n + split) antes de crear el data.yaml.")       # Gu√≠a
            else:
                # Si no definiste clases, avisa para que no entrenes con un YAML incompleto
                if len(classes) == 0:                                       # Si la lista de clases est√° vac√≠a
                    print("‚ö†Ô∏è La lista 'classes' est√° vac√≠a. Agrega tus clases en el orden de CVAT antes de entrenar.")  # Aviso
                    print("‚ÑπÔ∏è Igual crear√© el data.yaml, pero NO deber√≠as entrenar hasta completar 'classes'.")          # Gu√≠a

                # Construye el contenido del YAML que YOLO necesita
                yaml_text = f"""path: {DIR_DATASET}
            train: images/train
            val: images/val
            names:
            """                                                             # Texto base del YAML (path + rutas train/val)

                # Agrega las clases con su √≠ndice (0,1,2...) en el orden correcto
                for i, c in enumerate(classes):                              # Recorre clases con √≠ndice
                    yaml_text += f"  {i}: {c}\n"                              # Agrega cada clase al YAML

                # Guarda el archivo data.yaml
                yaml_path.write_text(yaml_text, encoding="utf-8")            # Escribe el YAML en disco

                # Prints de confirmaci√≥n + vista r√°pida del contenido
                print("‚úÖ data.yaml creado en:", yaml_path)                   # Confirma ruta del archivo creado
                print("‚úÖ Contenido de data.yaml:")                           # T√≠tulo del contenido
                print(yaml_text)                                              # Muestra el texto completo
                    # >>> FIN BLOQUE 2.2 <<<

                    # >>> INICIO BLOQUE 2.3 TAL CUAL <<<
                    from google.colab import files  # Necesario para la descarga autom√°tica

                    # 1. Configuraci√≥n de par√°metros
                    data_yaml = "/content/data.yaml"
                    batch_size = 16
                    epochs = 215
                    img_size = 640
                    output_dir = "/content/runs"
                    best_pt_path = Path("/content/in/best.pt") # Ruta de tu "Partida Guardada"

                    # Asegurar que la carpeta /content/in existe
                    best_pt_path.parent.mkdir(parents=True, exist_ok=True)

                    # 2. L√≥gica de carga de modelo (Continuar Partida o Empezar de Cero)
                    if best_pt_path.exists():
                        print(f"üéÆ 'Save Game' detectado. Cargando progreso desde: {best_pt_path}")
                        model = YOLO(str(best_pt_path))
                        lr_inicial = 0.001 # Tasa m√°s baja para no arruinar lo ya aprendido
                    else:
                        print("üÜï No hay partida guardada. Iniciando entrenamiento desde cero (YOLOv8n).")
                        model = YOLO("yolov8n.pt")
                        lr_inicial = 0.01

                    # 3. Entrenamiento
                    print(f"üöÄ Iniciando entrenamiento (M√°ximo {epochs} epochs)...")
                    results = model.train(
                        data=data_yaml,
                        epochs=epochs,
                        imgsz=img_size,
                        batch=batch_size,
                        project=output_dir,
                        name="train_experiment",
                        exist_ok=True,
                        lr0=lr_inicial,
                        patience=30,      # Si deja de mejorar por 30 epochs, se detiene
                        save=True,
                        pretrained=True
                    )

                    # 4. Gesti√≥n de archivos y Auto-Descarga ("Guardado Final")
                    print("‚úÖ Entrenamiento finalizado.")

                    # Ruta donde YOLO acaba de guardar el mejor modelo de esta sesi√≥n
                    new_best_path = Path(output_dir) / "train_experiment" / "weights" / "best.pt"

                    if new_best_path.exists():
                        # 4a. Sobreescribir el Save Game en /content/in (Para la pr√≥xima vez que corras el bloque)
                        shutil.copy2(new_best_path, best_pt_path)
                        print(f"‚≠ê 'Save Game' actualizado localmente en: {best_pt_path}")

                        # 4b. Descargar el archivo al PC autom√°ticamente
                        try:
                            print("üì• Iniciando descarga del modelo 'best.pt' a tu ordenador...")
                            files.download(str(best_pt_path))
                            print("‚úÖ Descarga iniciada. ¬°Guarda bien este archivo!")
                        except Exception as e:
                            print(f"‚ö†Ô∏è No se pudo iniciar la descarga autom√°tica: {e}")
                            print("‚ÑπÔ∏è Puedes descargarlo manualmente desde la carpeta /content/in en el panel izquierdo.")
                    else:
                        print("‚ö†Ô∏è Error: No se encontr√≥ el archivo generado en esta sesi√≥n.")
                    # >>> FIN BLOQUE 2.3 <<<

                    # >>> INICIO BLOQUE 2.4 TAL CUAL <<<
                    # --- 1. CONFIGURACI√ìN DE RUTAS ---
                    base_path = Path("/content")
                    dir_dataset = base_path / "dataset"
                    dir_runs = base_path / "runs"
                    dir_out = base_path / "out"
                    dir_in = base_path / "in"

                    # Ruta del modelo y de las im√°genes
                    best_model_path = dir_in / "best.pt"
                    val_images_path = dir_dataset / "images/val"

                    # Carpeta de salida
                    pred_name = "predict_val"
                    final_pred_dir = dir_runs / pred_name

                    # --- 2. VALIDACI√ìN ---
                    if not best_model_path.exists():
                        print(f"‚ö†Ô∏è No se encuentra el modelo en {best_model_path}. Revisa el Bloque 12.")
                    elif not val_images_path.exists():
                        print(f"‚ö†Ô∏è No existe la carpeta de validaci√≥n en {val_images_path}")
                    else:
                        try:
                            print(f"üöÄ Iniciando predicci√≥n visual con l√≠neas delgadas...")
                            model = YOLO(str(best_model_path))

                            # Ejecutamos la predicci√≥n con ajustes visuales
                            model.predict(
                                source=str(val_images_path),
                                save=True,
                                project=str(dir_runs),
                                name=pred_name,
                                exist_ok=True,
                                conf=0.25,         # Solo muestra lo que tenga > 25% certeza
                                iou=0.3,          # Umbral de solapamiento (ajustar si hay cajas duplicadas)
                                # --- AJUSTES PARA QUE NO SE TAPEN LAS FALLAS ---
                                line_width=3,
                                show_labels=True,  # Muestra el nombre de la falla
                                show_conf=False,   # Quitamos el % de confianza para limpiar la imagen
                                save_txt=False     # No necesitamos los .txt aqu√≠, solo las fotos
                            )

                            print(f"‚úÖ Fotos guardadas en: {final_pred_dir}")

                            # --- 3. CREACI√ìN DE ZIP Y DESCARGA ---
                            zip_file_path = dir_out / "val_predictions_clean.zip"
                            dir_out.mkdir(parents=True, exist_ok=True)

                            # Empaquetamos solo las im√°genes resultantes
                            with zipfile.ZipFile(zip_file_path, 'w', zipfile.ZIP_DEFLATED) as zipf:
                                # Buscamos extensiones comunes de imagen
                                for ext in ['*.jpg', '*.jpeg', '*.png']:
                                    for img_file in final_pred_dir.rglob(ext):
                                        zipf.write(img_file, arcname=img_file.name)

                            if zip_file_path.stat().st_size > 0:
                                print(f"üì¶ ZIP creado: {zip_file_path}")
                                files.download(str(zip_file_path))
                                print("üì• Descarga iniciada.")
                            else:
                                print("‚ö†Ô∏è El ZIP est√° vac√≠o. ¬øSeguro que hubo detecciones?")

                        except Exception as e:
                            print(f"‚ùå Error: {e}")
                    # >>> FIN BLOQUE 2.4 <<<

        # --- BOT√ìN 4: BLOQUE 3 ---
        def f_inspeccion(b):
            # Verificaci√≥n archivos cr√≠ticos
            video = list(PATHS["in"].glob("*.mp4"))
            modelo = (PATHS["in"] / "best.pt").exists()
            csvs = (PATHS["in"] / "losa.csv").exists() and (PATHS["in"] / "paramento.csv").exists()
            if not video or not modelo or not csvs:
                ejecutar_subida_1_2("INSPECCI√ìN (VIDEO + MODELO + CSVs + SRT)")
            else:
                with out:
                    clear_output()
                    # >>> INICIO BLOQUE 3<<<
                    # --- VALIDACI√ìN PREVIA DE ARCHIVOS CR√çTICOS ---
                    archivos_faltantes = []

                    # 1. Verificar Video (.mp4)
                    video_check = list(PATHS["in"].glob("*.mp4"))
                    if not video_check: archivos_faltantes.append("Video (.mp4)")
                    else: print(f"‚úÖ Video detectado: {video_check[0].name}")

                    # 2. Verificar Modelo (best.pt)
                    modelo_path = PATHS["in"] / "best.pt"
                    if not modelo_path.exists(): archivos_faltantes.append("Modelo (best.pt)")
                    else: print(f"‚úÖ Modelo detectado: best.pt")

                    # 3. Verificar Telemetr√≠a (.srt)
                    srt_check = list(PATHS["in"].glob("*.srt"))
                    if not srt_check: archivos_faltantes.append("Telemetr√≠a (.srt)")
                    else: print(f"‚úÖ SRT detectado: {srt_check[0].name}")

                    # 4. Verificar CSV Losa
                    losa_path = PATHS["in"] / "losa.csv"
                    if not losa_path.exists(): archivos_faltantes.append("CSV de Losa (losa.csv)")
                    else: print(f"‚úÖ Datos de Losa detectados")

                    # 5. Verificar CSV Paramento
                    paramento_path = PATHS["in"] / "paramento.csv"
                    if not paramento_path.exists(): archivos_faltantes.append("CSV de Paramento (paramento.csv)")
                    else: print(f"‚úÖ Datos de Paramento detectados")

                    # --- CONTROL DE DETENCI√ìN
                    if archivos_faltantes:
                        print("\n‚ùå ERROR: Faltan los siguientes archivos en la carpeta de entrada:")
                        for arch in archivos_faltantes:
                            print(f"   - {arch}")
                        raise SystemExit("Deteniendo ejecuci√≥n: Faltan requisitos para procesar el reporte.")
                    else:
                        print("\nüöÄ Todos los componentes listos. Iniciando procesamiento...\n" + "-"*50)

                    # ----------------------------------------------------------------------------------------------------------------------------------

                    # Analiza los archivos SRT para datos georeferenciales y CSVs para datos t√©cnicos

                    def procesar_telemetria_srt(ruta_srt):
                        print(f"üìñ Leyendo archivo: {ruta_srt.name}")
                        with open(ruta_srt, 'r', encoding='utf-8-sig', errors='ignore') as f:
                            contenido = f.read()

                        # Captura tiempos como "0:00:01" o "00:00:01,000"
                        patron_tiempo = r'(\d{1,2}:\d{1,2}:\d{1,2}(?:[.,]\d+)?) --> (\d{1,2}:\d{1,2}:\d{1,2}(?:[.,]\d+)?)'
                        tiempos = re.findall(patron_tiempo, contenido)

                        # 2. Dividimos el contenido por las marcas de tiempo para obtener los textos
                        partes = re.split(patron_tiempo, contenido)
                        # Tras el split, los textos quedan en las posiciones 3, 6, 9... (saltando los grupos de captura)
                        textos = partes[3::3]

                        mapeo = []

                        for i, (inicio, fin) in enumerate(tiempos):
                            try:
                                # Procesar el tiempo de inicio a segundos totales
                                partes_hms = inicio.replace(',', '.').split(':')
                                h = int(partes_hms[0])
                                m = int(partes_hms[1])
                                s = float(partes_hms[2])
                                seg_total = h * 3600 + m * 60 + s

                                # Obtener el texto del bloque actual
                                texto_bloque = textos[i] if i < len(textos) else ""

                                # Limpiar etiquetas <i> y sacar el √∫ltimo n√∫mero (el metro)
                                texto_limpio = re.sub(r'<.*?>', '', texto_bloque).strip()
                                numeros = re.findall(r"[-+]?\d*\.\d+|\d+", texto_limpio)

                                if numeros:
                                    # Tomamos el √∫ltimo n√∫mero porque tu SRT dice "TRAMO 2 - Parte 2 - 1343 m"
                                    # El 1343 es el que nos interesa.
                                    m_valor = float(numeros[-1])
                                    mapeo.append({'s': seg_total, 'm': m_valor})
                            except Exception as e:
                                continue

                        df_map = pd.DataFrame(mapeo)

                    print(f"‚úÖ SRT le√≠do correctamente") # Confirmaci√≥n de lectura

                    # --- CONFIGURACI√ìN DE UMBRAL DE DATOS T√âCNICOS (CSV) ---
                    UMBRAL_DISTANCIA = 2.0                                              # L√≠mite de distancia para validar datos (+-2m)

                    def cargar_datos_robot(ruta):                                       # Funci√≥n para leer CSVs del robot
                        try:
                            df = pd.read_csv(ruta, sep=';', decimal=',', encoding='latin-1') # Intenta lectura con codificaci√≥n Latin-1
                        except:
                            df = pd.read_csv(ruta, sep=';', decimal=',', encoding='cp1252') # Si falla, intenta con CP1252
                        return df.loc[:, ~df.columns.str.contains('^Unnamed')]          # Elimina columnas vac√≠as residuales

                    print("üß† Fusionando datos con regla de proximidad estricta (+-2m)...")
                    df_l = cargar_datos_robot(PATHS["in"] / "losa.csv")                 # Carga base de datos de losa
                    df_p = cargar_datos_robot(PATHS["in"] / "paramento.csv")            # Carga base de datos de paramento
                    print(f"‚úÖ CSVs le√≠dos correctamente: losa ({len(df_l)} filas), paramento ({len(df_p)} filas)") # Confirmaci√≥n de lectura

                    datos_finales = []                                                  # Lista para almacenar resultados procesados

                    # ----------------------------------------------------------------------------------------------------------------------------------

                    # Analiza el video usando el Modelo DAICH y se ubica espacialmente usando el SRT

                    # Modelo YOLO analiza video y detecta clases
                    model = YOLO(PATHS["in"] / "best.pt")
                    video_path = next(PATHS["in"].glob("*.mp4"))
                    df_telemetria = procesar_telemetria_srt(next(PATHS["in"].glob("*.srt")))

                    if df_telemetria.empty:
                        print("‚ùå ABORTANDO: El archivo SRT no tiene el formato correcto.")
                    else:
                        cap = cv2.VideoCapture(str(video_path))
                        fps = cap.get(cv2.CAP_PROP_FPS)
                        hallazgos_crudos = []
                        f_count = 0

                        while cap.isOpened():
                            ret, frame = cap.read()
                            if not ret: break
                            if f_count % int(fps) == 0:
                                seg_act = f_count / fps
                                m_act = np.interp(seg_act, df_telemetria['s'], df_telemetria['m'])
                                preds = model.predict(frame, conf=0.25, verbose=False)
                                for r in preds:
                                    if len(r.boxes) > 0:
                                        img_f = f"evidencia_m_{m_act:.2f}.jpg"
                                        cv2.imwrite(str(PATHS["frames"] / img_f), r.plot())
                                        for b in r.boxes:
                                            hallazgos_crudos.append({
                                                'metro': m_act,
                                                'seg_video': seg_act, # <--- GUARDAMOS EL SEGUNDO
                                                'cls': model.names[int(b.cls)],
                                                'img': img_f
                                            })
                                print(f"üîç Escaneando Metro: {m_act:.2f} | Detecciones: {len(hallazgos_crudos)}", end="\r")
                            f_count += 1
                        cap.release()
                        df_vis = pd.DataFrame(hallazgos_crudos)
                        print(f"\n‚úÖ An√°lisis visual terminado. Se encontraron {len(df_vis)} registros.")

                    # ----------------------------------------------------------------------------------------------------------------------------------

                    # Relaciona las detecciones del video con los datos t√©cnicos disponibles (CSVs)

                    for _, det in df_vis.iterrows():                                    # Itera por cada detecci√≥n de la IA
                        clase_ia = det['cls'].lower()                                   # Convierte clase a min√∫sculas para comparar

                        # Selecci√≥n de DB seg√∫n palabras clave en la clase detectada
                        db, origen = (df_l, "losa.csv") if any(k in clase_ia for k in ["estr√≠a", "losa", "fondo"]) else (df_p, "paramento.csv")

                        db['diff'] = (db['Metros'] - det['metro']).abs()                # Calcula distancia absoluta entre IA y Robot
                        cercano = db.nsmallest(1, 'diff').iloc[0]                       # Encuentra el registro m√°s cercano (sin interpolar)
                        distancia_minima = cercano['diff']                              # Guarda la distancia del punto m√°s pr√≥ximo

                        res = {**det, 'csv_usado': origen}                              # Crea diccionario con datos base y origen CSV
                        cols_tecnicas = ['Extensi√≥n (cm)', 'Alto (cm)', '√Årea (m2)', 'Volumen (m3)', 'Profundidad (cm)']

                        if distancia_minima <= UMBRAL_DISTANCIA:                        # VALIDACI√ìN: Si est√° dentro del rango de 2 metros
                            res['tiene_datos'] = True                                   # Marca como hallazgo validado t√©cnicamente
                            for c in cols_tecnicas:
                                res[c] = cercano.get(c, 0)                              # Asigna valores t√©cnicos del robot
                            res['Magnitud'] = cercano.get('Magnitud', 'N/A')            # Captura magnitud de da√±o
                        else:                                                           # Si est√° fuera de rango (ej. 1343 vs 1336)
                            res['tiene_datos'] = False                                  # Marca para omitir datos en el PDF
                            for c in cols_tecnicas: res[c] = 0                          # Setea valores t√©cnicos en cero
                            res['Magnitud'] = "N/A"                                     # Magnitud no disponible

                        datos_finales.append(res)                                       # Agrega el resultado a la lista final

                    df_temp = pd.DataFrame(datos_finales)                               # Convierte resultados a DataFrame temporal
                    df_temp['metro_redondo'] = df_temp['metro'].round(1)                # Redondea metro a 10cm para agrupar c√°maras
                    # Elimina duplicados si coinciden metro y clase (limpieza de doble c√°mara)
                    df_reporte = df_temp.drop_duplicates(subset=['metro_redondo', 'cls'], keep='first').copy()

                    print(f"üìä Fusi√≥n lista. Detecciones totales a reportar: {len(df_reporte)}") # Resumen final del proceso

                    # ----------------------------------------------------------------------------------------------------------------------------------

                    # Construye el documento PDF con las evidencias capturadas y los datos t√©cnicos

                    print("üìÑ Generando reporte final...")
                    pdf = FPDF()
                    pdf.set_auto_page_break(auto=True, margin=15)

                    def clean(val):
                        try:
                            f = float(val)
                            return ('%.4f' % f).rstrip('0').rstrip('.')
                        except: return str(val)

                    for idx, f in df_reporte.iterrows():
                        pdf.add_page()

                        # --- T√çTULO: CLASE
                        pdf.set_font("Arial", 'B', 14)

                        clase_nombre = f['cls'].upper()
                        # L√≥gica de g√©nero para el sufijo
                        sufijo = "DETECTADO/A"

                        # Redondeo de la cifra original a 2 decimales
                        metro_tit = f"{round(f['metro'], 2):.2f}"

                        # Construcci√≥n del t√≠tulo en may√∫sculas
                        titulo_final = f"{clase_nombre} {sufijo} EN KM {metro_tit}"
                        pdf.cell(200, 10, titulo_final, ln=True, align='C')

                        # Imagen de la IA
                        pdf.image(str(PATHS["frames"]/f['img']), x=10, y=30, w=180)

                        # --- SUBT√çTULO: Solo Tiempo y Origen ---
                        pdf.set_y(155)
                        pdf.set_font("Arial", 'B', 10)
                        pdf.set_fill_color(230, 230, 230)

                        m, s = divmod(int(f['seg_video']), 60)
                        info_sub = f" TIEMPO VIDEO: {m}m {s}s | ORIGEN DATOS: {f['csv_usado']}"
                        pdf.cell(190, 10, info_sub, ln=True, fill=True)

                        pdf.set_font("Arial", '', 10)

                        if f['tiene_datos']:
                            # Fila 1: Extensi√≥n y Ancho
                            pdf.cell(95, 8, f" Extensi√≥n: {clean(f.get('Extensi√≥n (cm)', 0))} cm", border=1)
                            pdf.cell(95, 8, f" Ancho: {clean(f.get('Alto (cm)', 0))} cm", border=1, ln=True)

                            # Fila 2: √Årea m¬≤ y Volumen m¬≥
                            area = f.get('√Årea (m2)', f.get('Area (m2)', 0))
                            pdf.cell(95, 8, f" √Årea: {clean(area)} m¬≤", border=1)
                            pdf.cell(95, 8, f" Volumen: {clean(f.get('Volumen (m3)', 0))} m¬≥", border=1, ln=True)

                            # Fila 3: Profundidad y Magnitud
                            pdf.cell(95, 8, f" Profundidad: {clean(f.get('Profundidad (cm)', 0))} cm", border=1)
                            pdf.cell(95, 8, f" Magnitud de da√±o: {f.get('Magnitud', 'N/A')}", border=1, ln=True)
                        else:
                            # Nota roja
                            pdf.set_text_color(200, 0, 0)
                            pdf.set_font("Arial", 'B', 10)
                            msj = "\nAVISO: ESTE HALLAZGO DETECTADO POR EL MODELO NO TIENE COINCIDENCIA T√âCNICA EN LA NUBE DE PUNTOS DEL ROBOT (+-2M)."
                            pdf.multi_cell(190, 8, msj, border=1, align='C')
                            pdf.set_text_color(0, 0, 0)

                    report_name = "Reporte_Inspeccion_Final.pdf"
                    pdf.output(report_name)
                    files.download(report_name)
                    # >>> FIN BLOQUE 3 <<<

        # Asignar eventos
        btn_config.on_click(f_config)
        btn_frames.on_click(f_frames)
        btn_train_val.on_click(f_train_val)
        btn_inspeccion.on_click(f_inspeccion)

        return widgets.VBox([
            btn_config, btn_frames, btn_train_val, btn_inspeccion
        ], layout={'align_items': 'center', 'width': '100%'})

    # Iniciar
    main_container.children = [header, vista_principal(), out]
    display(main_container)

iniciar_panel_daich()

IndentationError: unexpected indent (ipython-input-1014467051.py, line 440)