<a href="https://colab.research.google.com/github/JorgeAccardi/auscultacion-presa/blob/main/Resumen_Estadistico_Auscultacion_Presas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import pandas as pd
import io
from IPython.display import display, clear_output
import ipywidgets as widgets

# Diccionarios para almacenar por tipo de archivo
instrumentos = [
    "puntos_fijos_mi",
    "puntos_fijos_md",
    "inclinometros",
    "asentamiento",
    "piezometros_electricos",
    "piezometros_casagrande",
    "freatimetros",
    "extensometro"
]

datos_csv = {inst: pd.DataFrame() for inst in instrumentos}
datos_xlsx = {inst: pd.DataFrame() for inst in instrumentos}

# Función para detectar tipo de instrumento por nombre
def detectar_instrumento(nombre):
    nombre = nombre.lower()
    if "puntosfijos" in nombre or "pf" in nombre:
        if "mi" in nombre:
            return "puntos_fijos_mi"
        elif "md" in nombre:
            return "puntos_fijos_md"
        else:
            return None  # Puntos fijos sin margen, no válido
    elif "incli" in nombre:
        return "inclinometros"
    elif "as" in nombre:
        return "asentamiento"
    elif "pe" in nombre:
        return "piezometros_electricos"
    elif "pcg" in nombre:
        return "piezometros_casagrande"
    elif "frea" in nombre:
        return "freatimetros"
    elif "ext" in nombre:
        return "extensometro"
    return None

# --- Widget de carga de archivos ---
upload_widget = widgets.FileUpload(
    accept='.csv,.xlsx',
    multiple=True,
    description='Subir archivos',
    style={'button_color': 'lightblue'}
)

output = widgets.Output()

# Función principal de carga
def cargar_archivos(change):
    with output:
        clear_output(wait=True)
        archivos = upload_widget.value

        if not archivos:
            print("⚠️ No se subió ningún archivo.")
            return

        for nombre_archivo, archivo_info in archivos.items():
            try:
                contenido = archivo_info['content']
                extension = nombre_archivo.split('.')[-1].lower()
                instrumento = detectar_instrumento(nombre_archivo)

                if not instrumento:
                    print(f"❌ Instrumento no reconocido o mal nombrado: {nombre_archivo}")
                    continue

                # Cargar el archivo
                if extension == 'csv':
                    df = pd.read_csv(io.BytesIO(contenido), encoding='utf-8')
                    datos_csv[instrumento] = pd.concat([datos_csv[instrumento], df], ignore_index=True)
                    print(f"✅ {nombre_archivo} → {instrumento} (CSV)")
                elif extension == 'xlsx':
                    df = pd.read_excel(io.BytesIO(contenido))
                    datos_xlsx[instrumento] = pd.concat([datos_xlsx[instrumento], df], ignore_index=True)
                    print(f"✅ {nombre_archivo} → {instrumento} (XLSX)")
                else:
                    print(f"❌ Formato no compatible: {nombre_archivo}")
            except Exception as e:
                print(f"❌ Error al procesar {nombre_archivo}: {e}")

        mostrar_menu()

# Función de visualización dinámica
def mostrar_menu():
    opciones = []
    for origen in ['csv', 'xlsx']:
        for instrumento in instrumentos:
            opciones.append(f"{instrumento} ({origen})")

    selector = widgets.Dropdown(
        options=opciones,
        description='Seleccionar DataFrame:',
        style={'description_width': 'initial'},
        layout=widgets.Layout(width='60%')
    )

    def mostrar_datos(change):
        clear_output(wait=True)
        display(upload_widget, output)
        seleccion = selector.value
        instrumento, origen = seleccion.split(" ")
        instrumento = instrumento.strip()
        origen = origen.strip("()")

        print(f"📊 Mostrando: {instrumento.upper()} ({origen.upper()})")
        if origen == "csv":
            display(datos_csv[instrumento].head())
        else:
            display(datos_xlsx[instrumento].head())

    selector.observe(mostrar_datos, names='value')
    display(selector)

# Conectar evento
upload_widget.observe(cargar_archivos, names='value')

# Mostrar interfaz
display(upload_widget)
display(output)

FileUpload(value={}, accept='.csv,.xlsx', description='Subir archivos', multiple=True, style=ButtonStyle(butto…

Output()

In [2]:
import pandas as pd
import io
import base64
from datetime import datetime
from IPython.display import display, clear_output, HTML
import ipywidgets as widgets

# --- Configuración y estilos ---
instrumentos = [
    "puntos_fijos_mi",
    "puntos_fijos_md",
    "inclinometros",
    "asentamiento",
    "piezometros_electricos",
    "piezometros_casagrande",
    "freatimetros",
    "extensometro"
]
datos_csv = {inst: pd.DataFrame() for inst in instrumentos}
datos_xlsx = {inst: pd.DataFrame() for inst in instrumentos}

def detectar_instrumento(nombre):
    nombre = nombre.lower()
    if "puntosfijos" in nombre or "pf" in nombre:
        if "mi" in nombre:
            return "puntos_fijos_mi"
        elif "md" in nombre:
            return "puntos_fijos_md"
        else:
            return "puntos_fijos_mi"
    elif "incli" in nombre:
        return "inclinometros"
    elif "as" in nombre:
        return "asentamiento"
    elif "pe" in nombre:
        return "piezometros_electricos"
    elif "pcg" in nombre:
        return "piezometros_casagrande"
    elif "frea" in nombre:
        return "freatimetros"
    elif "ext" in nombre:
        return "extensometro"
    return None

# Widgets globales para mantener la UI estable
upload_widget = widgets.FileUpload(
    accept='.csv,.xlsx',
    multiple=True,
    description='Subir archivos',
    style={'button_color': 'lightblue'},
    layout=widgets.Layout(width="350px")
)
output_carga = widgets.Output()
output_tabla = widgets.Output()

instrumento_selector = widgets.Dropdown(
    options=instrumentos,
    description='Instrumento:',
    layout=widgets.Layout(width='260px')
)
origen_selector = widgets.Dropdown(
    options=['csv', 'xlsx'],
    description='Origen:',
    layout=widgets.Layout(width='160px')
)
boton_ver = widgets.Button(
    description='👁️ Ver',
    button_style='success',
    icon='eye',
    layout=widgets.Layout(width='100px')
)
boton_descargar = widgets.Button(
    description='💾 Descargar',
    button_style='info',
    icon='download',
    layout=widgets.Layout(width='130px')
)

# --- Función de carga y progreso ---
def cargar_archivos(change):
    with output_carga:
        clear_output(wait=True)
        archivos = upload_widget.value
        if not archivos:
            display(HTML("<div style='color:#b71c1c;font-weight:bold;'>⚠️ No se subió ningún archivo.</div>"))
            return

        barra_progreso = widgets.FloatProgress(
            value=0, min=0, max=100, description='Progreso:', bar_style='info',
            layout=widgets.Layout(width='80%')
        )
        etiqueta_progreso = widgets.Label(value="0% completado")
        display(barra_progreso, etiqueta_progreso)

        total = len(archivos)
        archivos_exitosos = 0

        for i, (nombre_archivo, archivo_info) in enumerate(archivos.items(), start=1):
            try:
                extension = nombre_archivo.split('.')[-1].lower()
                instrumento = detectar_instrumento(nombre_archivo)
                contenido = archivo_info['content']

                if not instrumento:
                    display(HTML(f"<span style='color:#b71c1c;'>❌ Instrumento no reconocido en archivo: {nombre_archivo}</span>"))
                    continue

                if extension == 'csv':
                    try:
                        try:
                            df = pd.read_csv(io.BytesIO(contenido), encoding='utf-8')
                        except UnicodeDecodeError:
                            df = pd.read_csv(io.BytesIO(contenido), encoding='latin-1')
                        if not df.empty:
                            datos_csv[instrumento] = pd.concat([datos_csv[instrumento], df], ignore_index=True)
                            archivos_exitosos += 1
                            display(HTML(f"<span style='color:#388e3c;'>✔️ {nombre_archivo} cargado como CSV ({len(df)} filas)</span>"))
                        else:
                            display(HTML(f"<span style='color:#ffa000;'>⚠️ CSV vacío: {nombre_archivo}</span>"))
                    except Exception as e:
                        display(HTML(f"<span style='color:#b71c1c;'>❌ Error leyendo CSV {nombre_archivo}: {str(e)}</span>"))
                elif extension == 'xlsx':
                    try:
                        df = pd.read_excel(io.BytesIO(contenido))
                        if not df.empty:
                            datos_xlsx[instrumento] = pd.concat([datos_xlsx[instrumento], df], ignore_index=True)
                            archivos_exitosos += 1
                            display(HTML(f"<span style='color:#388e3c;'>✔️ {nombre_archivo} cargado como XLSX ({len(df)} filas)</span>"))
                        else:
                            display(HTML(f"<span style='color:#ffa000;'>⚠️ XLSX vacío: {nombre_archivo}</span>"))
                    except Exception as e:
                        display(HTML(f"<span style='color:#b71c1c;'>❌ Error leyendo XLSX {nombre_archivo}: {str(e)}</span>"))
                else:
                    display(HTML(f"<span style='color:#b71c1c;'>⚠️ Extensión no soportada: {nombre_archivo}</span>"))
            except Exception as e:
                display(HTML(f"<span style='color:#b71c1c;'>❌ Error general en {nombre_archivo}: {str(e)}</span>"))
            porcentaje = (i / total) * 100
            barra_progreso.value = porcentaje
            etiqueta_progreso.value = f"{porcentaje:.0f}% completado"

        barra_progreso.bar_style = 'success'
        etiqueta_progreso.value = f"✅ {archivos_exitosos}/{total} archivos procesados exitosamente"
        resumen = "<ul>"
        for inst in instrumentos:
            csv_count = len(datos_csv[inst])
            xlsx_count = len(datos_xlsx[inst])
            if csv_count > 0 or xlsx_count > 0:
                resumen += f"<li><b>{inst}</b>: {csv_count} filas CSV, {xlsx_count} filas XLSX</li>"
        resumen += "</ul>"
        display(HTML(f"<div style='margin-top:10px;'><b>Resumen de datos:</b>{resumen}</div>"))

# --- Función para mostrar tabla o mensaje ---
def ver_datos(b):
    with output_tabla:
        clear_output(wait=True)
        instrumento = instrumento_selector.value
        origen = origen_selector.value
        df = datos_csv[instrumento] if origen == 'csv' else datos_xlsx[instrumento]
        if df.empty:
            display(HTML("<div style='color:#b71c1c;font-weight:bold;'>⚠️ No hay datos disponibles para el instrumento y origen seleccionados.</div>"))
        else:
            display(HTML(f"<div style='margin-bottom:10px;'><b>{instrumento.replace('_',' ').title()} ({origen.upper()})</b> - <span style='color:#388e3c'>Filas: {len(df)} | Columnas: {len(df.columns)}</span></div>"))
            display(df.head(5))  # AJUSTE: solo 5 registros

# --- Función para descargar con enlace bonito ---
def descargar_datos(b):
    with output_tabla:
        clear_output(wait=True)
        instrumento = instrumento_selector.value
        origen = origen_selector.value
        df = datos_csv[instrumento] if origen == 'csv' else datos_xlsx[instrumento]
        if df.empty:
            display(HTML("<div style='color:#b71c1c;font-weight:bold;'>⚠️ No hay datos para descargar.</div>"))
            return
        fecha_actual = datetime.now().strftime("%Y%m%d_%H%M%S")
        extension = 'csv' if origen == 'csv' else 'xlsx'
        nombre_archivo = f"{instrumento}_{origen}_{fecha_actual}.{extension}"
        buffer = io.BytesIO()
        try:
            if extension == 'csv':
                df.to_csv(buffer, index=False, encoding='utf-8')
                mime = "text/csv"
            else:
                # openpyxl es necesario para xlsx, pero en Colab/Jupyter viene instalado
                df.to_excel(buffer, index=False, engine='openpyxl')
                mime = "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet"
            buffer.seek(0)
            b64 = base64.b64encode(buffer.read()).decode()
            # NOTA: El enlace debe estar en una sola línea sin saltos para funcionar bien
            html = f"""
            <div style='padding:12px 18px;background:#e3f2fd;border:1.5px solid #2196f3;border-radius:7px;max-width:420px;'>
                <b>Descarga lista:</b><br>
                <span style='color:#1565c0'><b>{nombre_archivo}</b></span><br>
                <a download="{nombre_archivo}" href="data:{mime};base64,{b64}" target="_blank" style="display:inline-block;margin-top:10px;padding:10px 18px;background:#2196f3;color:white;text-decoration:none;border-radius:4px;font-weight:bold;">
                   📥 Descargar archivo
                </a>
            </div>
            """
            display(HTML(html))
            display(HTML("<span style='color:#388e3c;'>✔️ Haz clic en el botón para guardar el archivo en tu PC.</span>"))
        except Exception as e:
            display(HTML(f"<span style='color:#b71c1c;'>❌ Error al preparar la descarga: {str(e)}</span>"))

# --- Conectar eventos (solo una vez) ---
upload_widget.observe(cargar_archivos, names='value')
boton_ver.on_click(ver_datos)
boton_descargar.on_click(descargar_datos)

# --- Mostrar interfaz visual limpia y separada ---
display(HTML("""
<div style='margin-bottom:15px;'>
    <h2 style='color:#1976d2;margin:0 0 4px 0;'>📈 Sistema de gestión de datos de instrumentos</h2>
    <span style='color:#555;'>Carga, visualización y descarga de archivos CSV/XLSX</span>
</div>
"""))
display(HTML("<b>1. Subí tus archivos CSV/XLSX:</b>"))
display(upload_widget)
display(output_carga)
display(HTML("<hr style='margin:20px 0 10px 0;'>"))
display(HTML("<b>2. Seleccioná instrumento y origen de datos:</b>"))
display(widgets.HBox([instrumento_selector, origen_selector, boton_ver, boton_descargar]))
display(output_tabla)

FileUpload(value={}, accept='.csv,.xlsx', description='Subir archivos', layout=Layout(width='350px'), multiple…

Output()

HBox(children=(Dropdown(description='Instrumento:', layout=Layout(width='260px'), options=('puntos_fijos_mi', …

Output()

In [3]:
import pandas as pd

# Asume que datos_csv y datos_xlsx ya están definidos

# Diccionario de instrumentos, fecha, ID y variables numéricas (ajusta según tus datos)
instrumentos_info = {
    "Puntos Fijos MI": {"df": datos_csv["puntos_fijos_mi"], "fecha_col": "FECHA", "id_col": "INSTRUMENTO"},
    "Puntos Fijos MD": {"df": datos_csv["puntos_fijos_md"], "fecha_col": "FECHA", "id_col": "INSTRUMENTO"},
    "Piezómetros Eléctricos": {"df": datos_csv["piezometros_electricos"], "fecha_col": "FECHA", "id_col": "PIEZOMETRO"},
    "Piezómetros Casagrande": {"df": datos_csv["piezometros_casagrande"], "fecha_col": "FECHA", "id_col": "PIEZOMETRO"},
    "Inclinómetros": {"df": datos_csv["inclinometros"], "fecha_col": "Fecha", "id_col": "Inclinometro"},
    "Celdas de Asentamiento": {"df": datos_csv["asentamiento"], "fecha_col": "FECHA", "id_col": "CELDA_DE_ASENTAMIENTO"},
    "Freatímetros": {"df": datos_csv["freatimetros"], "fecha_col": "FECHA", "id_col": "FREATIMETRO"},
    "Extensómetros": {"df": datos_csv["extensometro"], "fecha_col": "FECHA", "id_col": "EXTENSOMETRO"}
}

# Recorrer y mostrar resumen estadístico
resumenes = {}

for nombre, info in instrumentos_info.items():
    df = info["df"].copy()
    if df.empty:
        print(f"\n[{nombre}] Sin datos.\n")
        continue
    # Convertir fecha y limpiar
    fecha_col = info["fecha_col"]
    if fecha_col in df.columns:
        df[fecha_col] = pd.to_datetime(df[fecha_col], dayfirst=True, errors='coerce')
    # Seleccionar columnas numéricas útiles
    num_cols = [col for col in df.select_dtypes(include='number').columns]
    # Incluir "Cota Nivel Freático" si existe como texto o COTA_NF
    for extra_col in ["Cota Nivel Freático", "COTA_NF"]:
        if extra_col in df.columns:
            num_cols.append(extra_col)
    num_cols = list(set(num_cols))
    if not num_cols:
        print(f"[{nombre}] Sin variables numéricas relevantes.\n")
        continue
    print(f"\n{'='*50}\nInstrumento: {nombre}\n")
    resumen = df[num_cols].describe(percentiles=[.25, .5, .75]).T
    resumen = resumen.rename(columns={"50%": "mediana", "std": "desv_std", "min": "mínimo", "max": "máximo", "count": "cantidad"})
    display(resumen[["cantidad", "mean", "mediana", "desv_std", "mínimo", "máximo"]].round(4))
    resumenes[nombre] = resumen

# (Opcional) Exportar todos los resúmenes a un solo Excel
with pd.ExcelWriter("resumen_estadistico_instrumentos.xlsx") as writer:
    for nombre, resumen in resumenes.items():
        resumen.to_excel(writer, sheet_name=nombre[:31])  # Sheet name max 31 chars
print("Archivo Excel generado: resumen_estadistico_instrumentos.xlsx")


Instrumento: Puntos Fijos MI



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
TASA_ESTE_(MM/DIA),2727.0,0.0007,0.0,0.055,-1.0435,1.0714
DELTA_COTA_[M],2727.0,0.0004,0.0,0.0072,-0.072,0.06
DISTANCIA_[M],2727.0,0.0054,0.001,0.0089,-0.01,0.1482
DISTANCIA_(MM),2582.0,5.5032,1.0541,8.8498,-10.0,148.1773
DELTA_ESTE_[M],2727.0,-0.0002,0.0,0.0069,-0.071,0.0497
AZIMUT_REF._AL_NORTE,2723.0,178.1805,180.0,137.0568,0.0,360.0
TASA_NORTE_(MM/DIA),2157.0,-0.0072,0.0,0.0647,-0.5938,0.7619
TASA_COTA_(MM/DIA),2727.0,0.0194,0.0,0.1247,-0.5476,1.2143
TASA_DISTANCIA_(MM/DIA),2727.0,0.0281,0.0004,0.0747,-0.0324,1.0714
DELTA_NORTE_[M],2157.0,-0.003,0.0,0.0082,-0.0839,0.1464



Instrumento: Puntos Fijos MD



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
TASA_ESTE_(MM/DIA),2701.0,0.0008,0.0,0.0558,-0.875,0.75
DELTA_COTA_[M],2701.0,-0.0044,0.0,0.012,-0.0763,0.0283
DISTANCIA_[M],2701.0,0.01,0.0065,0.0115,0.0,0.0839
DISTANCIA_(MM),2578.0,10.2326,6.7798,11.5435,0.0,83.9107
DELTA_ESTE_[M],2701.0,-0.0021,0.0,0.0074,-0.0317,0.054
AZIMUT_REF._AL_NORTE,2672.0,229.7453,256.7433,125.6512,0.0,360.0
TASA_NORTE_(MM/DIA),2701.0,-0.0003,0.0002,0.054,-0.6125,0.9286
TASA_COTA_(MM/DIA),2701.0,-0.0011,0.0,0.0974,-0.9286,0.9286
TASA_DISTANCIA_(MM/DIA),2701.0,0.0292,0.0007,0.072,0.0,0.953
DELTA_NORTE_[M],2701.0,0.0031,0.0001,0.0128,-0.0379,0.0801



Instrumento: Piezómetros Eléctricos



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
PRECIPITACIONES_(MM),1476.0,3.1529,0.5,5.8634,0.0,25.4
MCA_1_(FACTOR_G),2205.0,0.1292,-0.2786,2.2811,-3.103,18.8774
LECTURA_CUERDA_VIBRANTE,2205.0,8892.6638,8931.56,139.6979,8317.25,9081.57
TEMPERATURA_(°C),2201.0,10.0261,10.2,2.9784,-0.3,108.0
COTA_RIO_(M.S.N.M),1541.0,192.3122,115.677,3007.2241,114.013,118166.0
MCA_2_(FACTOR_G_Y_K),2205.0,0.15,-0.2536,2.2693,-3.1014,18.8687



Instrumento: Piezómetros Casagrande



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
PRECIPITACIONES_(MM),1099.0,6.2962,2.5,7.9371,0.0,25.4
MCA_1_(FACTOR_G),2085.0,4.8597,0.195,8.9167,-0.962,33.788
LECTURA_CUERDA_VIBRANTE,2085.0,8763.8304,8877.3,304.7772,7756.76,9054.97
TEMPERATURA_(°C),2085.0,10.9949,11.3,0.9701,8.7,13.1
MCA_2_(FACTOR_G_Y_K),2085.0,4.8721,0.1787,8.8928,-0.9699,33.7699



Instrumento: Inclinómetros



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
A-,20880.0,-307.1119,-304.0,142.2225,-768.0,460.0
Profundidad,20880.0,43.75,43.75,25.1149,0.5,87.0
A+,20880.0,300.2049,298.0,142.9397,-488.0,759.0
B-,20880.0,93.0046,98.0,141.1226,-270.0,805.0
B+,20880.0,-19.279,-23.0,140.8536,-701.0,343.0



Instrumento: Celdas de Asentamiento



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
LECTURA_REGLETA_(M),2017.0,0.5786,0.591,0.1743,0.0,0.987
COTA_RELLENO,1992.0,145.309,141.835,6.9911,123.0,160.0
COTA_0_REGLETA_(M),2018.0,127.0643,122.856,8.173,120.441,140.2
COTA_CELDA_(M.S.N.M),2018.0,127.6426,123.397,8.1466,120.691,140.773
PUNTO_FIJO_CASETA,1022.0,127.1635,121.515,8.8073,118.732,139.171
COTA_RIO_(M.S.N.M),1115.0,115.7136,115.629,1.1308,114.069,118.05
ASENTAMIENTO_(CM),2018.0,-10.9335,-7.1,12.5422,-99.9,40.1
MODULO_DEFORMACION_(Ε),0.0,,,,,



Instrumento: Freatímetros



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
PROF_NIVEL_FREATICO_(M),199.0,4.8088,4.86,1.1428,2.73,6.91
CARGA_(M.C.A),199.0,10.9284,10.91,1.1071,8.885,12.95
COTA_NIVEL_FREATICO_(M.S.N.M.),199.0,115.2948,115.444,0.8842,113.873,116.701
COTA_RÌO_(M.S.N.M),180.0,115.905,115.969,1.1325,114.069,117.972
PRECIPITACIONES,125.0,4.768,1.0,7.259,0.0,25.4



Instrumento: Extensómetros



Unnamed: 0,cantidad,mean,mediana,desv_std,mínimo,máximo
ACUMULADO_(MM),764.0,0.2945,0.0,1.2492,0.0,7.0
DIFERENCIAS_(MM),738.0,0.1978,0.0,1.0374,-2.0,7.0
Z/COTA_RELEV.,738.0,114.3182,116.0,5.847,100.5,120.5
COTA_EXCAV._(MSNM),774.0,114.0468,116.0,7.7701,11.3,120.5
COTA_FINAL_EXCAV._(MSNM),197.0,98.7614,96.0,10.2445,87.5,120.0
PROFUNDIDAD,773.0,5.2625,4.0,5.7017,0.0,19.9


Archivo Excel generado: resumen_estadistico_instrumentos.xlsx


In [4]:
import pandas as pd
import ipywidgets as widgets
from IPython.display import display, clear_output

# Asume que datos_csv ya están definidos

instrumentos_info = {
    "Puntos Fijos MI": {"df": datos_csv["puntos_fijos_mi"], "fecha_col": "FECHA", "id_col": "INSTRUMENTO"},
    "Puntos Fijos MD": {"df": datos_csv["puntos_fijos_md"], "fecha_col": "FECHA", "id_col": "INSTRUMENTO"},
    "Piezómetros Eléctricos": {"df": datos_csv["piezometros_electricos"], "fecha_col": "FECHA", "id_col": "PIEZOMETRO"},
    "Piezómetros Casagrande": {"df": datos_csv["piezometros_casagrande"], "fecha_col": "FECHA", "id_col": "PIEZOMETRO"},
    "Inclinómetros": {"df": datos_csv["inclinometros"], "fecha_col": "Fecha", "id_col": "Inclinometro"},
    "Celdas de Asentamiento": {"df": datos_csv["asentamiento"], "fecha_col": "FECHA", "id_col": "CELDA_DE_ASENTAMIENTO"},
    "Freatímetros": {"df": datos_csv["freatimetros"], "fecha_col": "FECHA", "id_col": "FREATIMETRO"},
    "Extensómetros": {"df": datos_csv["extensometro"], "fecha_col": "FECHA", "id_col": "EXTENSOMETRO"}
}

# Selector de instrumento
instrumento_sel = widgets.Dropdown(
    options=list(instrumentos_info.keys()),
    description="Instrumento:"
)

# Placeholder para otros selectores
variable_sel = widgets.Dropdown(description="Variable:")
id_sel = widgets.Dropdown(description="ID/Punto:")
anio_sel = widgets.Dropdown(description="Año:", options=["Todos"], value="Todos")

# Función para actualizar variables y puntos al cambiar instrumento
def actualizar_selectores(*args):
    info = instrumentos_info[instrumento_sel.value]
    df = info["df"]
    if df.empty:
        variable_sel.options = []
        id_sel.options = []
        anio_sel.options = ["Todos"]
        return
    # Variables numéricas
    num_cols = list(df.select_dtypes(include='number').columns)
    # Incluir Cota Nivel Freático si existe
    for extra_col in ["Cota Nivel Freático", "COTA_NF"]:
        if extra_col in df.columns:
            num_cols.append(extra_col)
    variable_sel.options = num_cols
    # IDs/puntos
    id_col = info["id_col"]
    if id_col in df.columns:
        ids = df[id_col].dropna().unique().tolist()
        id_sel.options = ["Todos"] + sorted(ids)
    else:
        id_sel.options = ["Todos"]
    # Años
    fecha_col = info["fecha_col"]
    if fecha_col in df.columns:
        df[fecha_col] = pd.to_datetime(df[fecha_col], errors='coerce')
        años = df[fecha_col].dt.year.dropna().unique()
        años = [str(int(a)) for a in años]
        anio_sel.options = ["Todos"] + sorted(años)
    else:
        anio_sel.options = ["Todos"]

instrumento_sel.observe(actualizar_selectores, names="value")
actualizar_selectores()

# Función de resumen estadístico
def mostrar_resumen(_=None):
    clear_output(wait=True)
    display(instrumento_sel, variable_sel, id_sel, anio_sel, boton)
    info = instrumentos_info[instrumento_sel.value]
    df = info["df"].copy()
    fecha_col = info["fecha_col"]
    id_col = info["id_col"]
    var = variable_sel.value
    if df.empty or var not in df.columns:
        print("No hay datos o variable seleccionada incorrecta.")
        return
    # Filtrar por ID/punto
    if id_sel.value != "Todos" and id_col in df.columns:
        df = df[df[id_col] == id_sel.value]
    # Filtrar por año
    if fecha_col in df.columns:
        df[fecha_col] = pd.to_datetime(df[fecha_col], errors='coerce')
        if anio_sel.value != "Todos":
            df = df[df[fecha_col].dt.year == int(anio_sel.value)]
    # Quitar nulos
    df = df[[fecha_col, var]].dropna()
    if df.empty:
        print("No hay datos para los filtros seleccionados.")
        return
    # Estadísticas
    cantidad = len(df)
    media = df[var].mean()
    mediana = df[var].median()
    desv_std = df[var].std()
    minimo = df[var].min()
    fecha_min = df.loc[df[var].idxmin(), fecha_col]
    maximo = df[var].max()
    fecha_max = df.loc[df[var].idxmax(), fecha_col]
    # Mostrar tabla resumen
    resumen = pd.DataFrame({
        "Cantidad": [cantidad],
        "Media": [media],
        "Mediana": [mediana],
        "Desv. estándar": [desv_std],
        "Mínimo": [minimo],
        "Fecha Mín.": [fecha_min],
        "Máximo": [maximo],
        "Fecha Máx.": [fecha_max]
    })
    display(resumen.round(4))
    # Opcional: mostrar cuartiles
    cuartiles = df[var].quantile([0.25, 0.75])
    print(f"1er cuartil (Q1): {cuartiles.loc[0.25]:.4f}")
    print(f"3er cuartil (Q3): {cuartiles.loc[0.75]:.4f}")

# Botón para ejecutar análisis
boton = widgets.Button(description="Mostrar Resumen")
boton.on_click(mostrar_resumen)

# Mostrar los selectores y botón
display(instrumento_sel, variable_sel, id_sel, anio_sel, boton)

Dropdown(description='Instrumento:', index=7, options=('Puntos Fijos MI', 'Puntos Fijos MD', 'Piezómetros Eléc…

Dropdown(description='Variable:', options=('COTA_EXCAV._(MSNM)', 'PROFUNDIDAD', 'Z/COTA_RELEV.', 'DIFERENCIAS_…

Dropdown(description='ID/Punto:', options=('Todos', 'EX-CH-1a', 'EX-CH-1b', 'EX-CH-1c ', 'EX-CH-1d', 'EX-CH-2a…

Dropdown(description='Año:', options=('Todos', '2022', '2023'), value='Todos')

Button(description='Mostrar Resumen', style=ButtonStyle())

Unnamed: 0,Cantidad,Media,Mediana,Desv. estándar,Mínimo,Fecha Mín.,Máximo,Fecha Máx.
0,328,114.8691,116.0,5.051,102.5,2023-05-09,120.5,2022-11-06


1er cuartil (Q1): 111.3000
3er cuartil (Q3): 120.0000


In [5]:
import pandas as pd
import numpy as np
from scipy import stats
import ipywidgets as widgets
from IPython.display import display, clear_output, HTML

# ========== SELECTORES ==========
instrumentos = [
    "puntos_fijos_mi", "puntos_fijos_md", "inclinometros", "asentamiento",
    "piezometros_electricos", "piezometros_casagrande", "freatimetros", "extensometro"
]

instrumento_dropdown = widgets.Dropdown(
    options=[
        "Puntos Fijos", "Piezómetros Eléctricos", "Piezómetros Casagrande", "Inclinómetros",
        "Celdas de Asentamiento", "Freatímetros", "Extensómetros"
    ],
    value="Puntos Fijos",
    description="Instrumento:"
)
origen_dropdown = widgets.Dropdown(options=["CSV", "XLSX"], value="CSV", description="Origen:")
margen_dropdown = widgets.Dropdown(description="Margen:", options=[])
punto_dropdown = widgets.Dropdown(description="Punto Fijo:", options=[])
variable_pf_dropdown = widgets.Dropdown(description="Variable:", options=[])
anio_pf_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])
progresiva_dropdown = widgets.Dropdown(description="Progresiva:", options=[])
piezometro_dropdown = widgets.Dropdown(description="Piezómetro:", options=[])
variable_pe_dropdown = widgets.Dropdown(description="Variable:", options=[])
anio_pe_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])
margen_cg_dropdown = widgets.Dropdown(description="Margen:", options=[])
pz_cg_dropdown = widgets.Dropdown(description="Piezómetro:", options=[])
variable_cg_dropdown = widgets.Dropdown(description="Variable:", options=[])
anio_cg_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])
inclinometro_dropdown = widgets.Dropdown(description="Inclinómetro:", options=[])
anio_inc_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])
eje_dropdown = widgets.Dropdown(options=["A+", "A-", "B+", "B-"], value="A+", description="Eje:")
progresiva_ca_dropdown = widgets.Dropdown(description="Progresiva:", options=[])
celda_dropdown = widgets.Dropdown(description="Celda:", options=[])
variable_ca_dropdown = widgets.Dropdown(description="Variable:", options=[])
anio_ca_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])
freatimetro_dropdown = widgets.Dropdown(description="Freatímetro:", options=[])
variable_fr_dropdown = widgets.Dropdown(description="Variable:", options=[])
anio_fr_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])
extensometro_dropdown = widgets.Dropdown(description="Extensómetro:", options=[])
variable_ex_dropdown = widgets.Dropdown(description="Variable:", options=[])
anio_ex_dropdown = widgets.Dropdown(description="Año:", options=["Todos"])

boton_estadisticas = widgets.Button(description="Calcular Estadísticas", button_style="primary")
output = widgets.Output()

# === FUNCIONES DE ACTUALIZACIÓN DE SELECTORES (idéntico a tus scripts) ===
def actualizar_opciones_pf(change=None):
    origen = origen_dropdown.value
    df_mi = datos_csv["puntos_fijos_mi"] if origen == "CSV" else datos_xlsx["puntos_fijos_mi"]
    df_md = datos_csv["puntos_fijos_md"] if origen == "CSV" else datos_xlsx["puntos_fijos_md"]
    datasets = {"Margen Izquierda (MI)": df_mi, "Margen Derecha (MD)": df_md}
    datasets = {k: v for k, v in datasets.items() if not v.empty}
    if not datasets:
        margen_dropdown.options = []
        punto_dropdown.options = []
        variable_pf_dropdown.options = []
        anio_pf_dropdown.options = ["Todos"]
        return
    margen_dropdown.options = list(datasets.keys())
    margen = margen_dropdown.value or list(datasets.keys())[0]
    df = datasets[margen].copy()
    if 'FECHA' not in df.columns:
        punto_dropdown.options = []
        variable_pf_dropdown.options = []
        anio_pf_dropdown.options = ["Todos"]
        return
    df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
    variable_pf_dropdown.options = [col for col in df.select_dtypes(include='number').columns if col not in ['FECHA', 'INSTRUMENTO', 'MARGEN']]
    punto_dropdown.options = ["Todos"] + sorted(df['INSTRUMENTO'].dropna().unique().tolist())
    anio_pf_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['FECHA'].dt.year.dropna().unique())]

def actualizar_opciones_pe(change=None):
    df = datos_csv["piezometros_electricos"] if origen_dropdown.value == "CSV" else datos_xlsx["piezometros_electricos"]
    if df.empty or 'PROGRESIVA' not in df.columns or 'FECHA' not in df.columns:
        progresiva_dropdown.options = []
        piezometro_dropdown.options = []
        variable_pe_dropdown.options = []
        anio_pe_dropdown.options = ["Todos"]
        return
    df = df.copy()
    df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
    progresiva_dropdown.options = sorted(df['PROGRESIVA'].dropna().unique().tolist())
    if progresiva_dropdown.options:
        progresiva_dropdown.value = progresiva_dropdown.options[0]
    actualizar_piezometros_pe()
    variable_pe_dropdown.options = [c for c in df.select_dtypes(include='number').columns if c not in ['FECHA', 'PROGRESIVA', 'PIEZOMETRO']]
    anio_pe_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['FECHA'].dt.year.dropna().unique())]

def actualizar_piezometros_pe(change=None):
    df = datos_csv["piezometros_electricos"] if origen_dropdown.value == "CSV" else datos_xlsx["piezometros_electricos"]
    if df.empty or 'PROGRESIVA' not in df.columns or 'PIEZOMETRO' not in df.columns:
        piezometro_dropdown.options = []
        return
    piezos = sorted(df[df['PROGRESIVA'] == progresiva_dropdown.value]['PIEZOMETRO'].dropna().unique().tolist())
    piezometro_dropdown.options = ["Todos"] + list(piezos)

def actualizar_opciones_cg(change=None):
    df = datos_csv["piezometros_casagrande"] if origen_dropdown.value == "CSV" else datos_xlsx["piezometros_casagrande"]
    if df.empty or 'MARGEN' not in df.columns or 'FECHA' not in df.columns:
        margen_cg_dropdown.options = []
        pz_cg_dropdown.options = []
        variable_cg_dropdown.options = []
        anio_cg_dropdown.options = ["Todos"]
        return
    df = df.copy()
    df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
    margen_cg_dropdown.options = sorted(df['MARGEN'].dropna().unique().tolist())
    if margen_cg_dropdown.options:
        margen_cg_dropdown.value = margen_cg_dropdown.options[0]
    actualizar_piezometros_cg()
    variable_cg_dropdown.options = [c for c in df.select_dtypes(include='number').columns if c not in ['FECHA', 'MARGEN', 'PIEZOMETRO']]
    anio_cg_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['FECHA'].dt.year.dropna().unique())]

def actualizar_piezometros_cg(change=None):
    df = datos_csv["piezometros_casagrande"] if origen_dropdown.value == "CSV" else datos_xlsx["piezometros_casagrande"]
    if df.empty or 'MARGEN' not in df.columns or 'PIEZOMETRO' not in df.columns:
        pz_cg_dropdown.options = []
        return
    piezos = sorted(df[df['MARGEN'] == margen_cg_dropdown.value]['PIEZOMETRO'].dropna().unique().tolist())
    pz_cg_dropdown.options = ["Todos"] + list(piezos)

def actualizar_opciones_inc(change=None):
    df = datos_csv["inclinometros"] if origen_dropdown.value == "CSV" else datos_xlsx["inclinometros"]
    if df.empty or 'Inclinometro' not in df.columns or 'Fecha' not in df.columns:
        inclinometro_dropdown.options = []
        anio_inc_dropdown.options = ["Todos"]
        eje_dropdown.options = ["A+", "A-", "B+", "B-"]
        return
    df = df.copy()
    df['Fecha'] = pd.to_datetime(df['Fecha'], dayfirst=True, errors='coerce')
    inclinometro_dropdown.options = ["Todos"] + sorted(df['Inclinometro'].dropna().unique().tolist())
    anio_inc_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['Fecha'].dt.year.dropna().unique())]
    eje_dropdown.options = ["A+", "A-", "B+", "B-"]

def actualizar_opciones_ca(change=None):
    df = datos_csv["asentamiento"] if origen_dropdown.value == "CSV" else datos_xlsx["asentamiento"]
    if df.empty or 'PROGRESIVA' not in df.columns or 'FECHA' not in df.columns:
        progresiva_ca_dropdown.options = []
        celda_dropdown.options = []
        variable_ca_dropdown.options = []
        anio_ca_dropdown.options = ["Todos"]
        return
    df = df.copy()
    df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
    progresiva_ca_dropdown.options = sorted(df['PROGRESIVA'].dropna().unique().tolist())
    if progresiva_ca_dropdown.options:
        progresiva_ca_dropdown.value = progresiva_ca_dropdown.options[0]
    actualizar_celdas_ca()
    variable_ca_dropdown.options = [c for c in df.select_dtypes(include='number').columns if c not in ['FECHA', 'PROGRESIVA', 'CELDA_DE_ASENTAMIENTO']]
    anio_ca_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['FECHA'].dt.year.dropna().unique())]

def actualizar_celdas_ca(change=None):
    df = datos_csv["asentamiento"] if origen_dropdown.value == "CSV" else datos_xlsx["asentamiento"]
    if df.empty or 'PROGRESIVA' not in df.columns or 'CELDA_DE_ASENTAMIENTO' not in df.columns:
        celda_dropdown.options = []
        return
    celdas = sorted(df[df['PROGRESIVA'] == progresiva_ca_dropdown.value]['CELDA_DE_ASENTAMIENTO'].dropna().unique().tolist())
    celda_dropdown.options = ["Todas"] + list(celdas)

def actualizar_opciones_fr(change=None):
    df = datos_csv["freatimetros"] if origen_dropdown.value == "CSV" else datos_xlsx["freatimetros"]
    if df.empty or 'FREATIMETRO' not in df.columns or 'FECHA' not in df.columns:
        freatimetro_dropdown.options = []
        variable_fr_dropdown.options = []
        anio_fr_dropdown.options = ["Todos"]
        return
    df = df.copy()
    df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
    freatimetro_dropdown.options = ["Todos"] + sorted(df['FREATIMETRO'].dropna().unique().tolist())
    variable_fr_dropdown.options = [c for c in df.select_dtypes(include='number').columns if c not in ['FECHA', 'FREATIMETRO']]
    anio_fr_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['FECHA'].dt.year.dropna().unique())]

def actualizar_opciones_ex(change=None):
    df = datos_csv["extensometro"] if origen_dropdown.value == "CSV" else datos_xlsx["extensometro"]
    if df.empty or 'EXTENSOMETRO' not in df.columns or 'FECHA' not in df.columns:
        extensometro_dropdown.options = []
        variable_ex_dropdown.options = []
        anio_ex_dropdown.options = ["Todos"]
        return
    df = df.copy()
    df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
    extensometro_dropdown.options = ["Todos"] + sorted(df['EXTENSOMETRO'].dropna().unique().tolist())
    variable_ex_dropdown.options = [c for c in df.select_dtypes(include='number').columns if c not in ['FECHA', 'EXTENSOMETRO']]
    anio_ex_dropdown.options = ["Todos"] + [str(y) for y in sorted(df['FECHA'].dt.year.dropna().unique())]

def actualizar_controles_visibles(change=None):
    tipo = instrumento_dropdown.value
    for w in [margen_dropdown, punto_dropdown, variable_pf_dropdown, anio_pf_dropdown,
              progresiva_dropdown, piezometro_dropdown, variable_pe_dropdown, anio_pe_dropdown,
              margen_cg_dropdown, pz_cg_dropdown, variable_cg_dropdown, anio_cg_dropdown,
              inclinometro_dropdown, anio_inc_dropdown, eje_dropdown,
              progresiva_ca_dropdown, celda_dropdown, variable_ca_dropdown, anio_ca_dropdown,
              freatimetro_dropdown, variable_fr_dropdown, anio_fr_dropdown,
              extensometro_dropdown, variable_ex_dropdown, anio_ex_dropdown]:
        w.layout.display = 'none'
    if tipo == "Puntos Fijos":
        margen_dropdown.layout.display = 'flex'
        punto_dropdown.layout.display = 'flex'
        variable_pf_dropdown.layout.display = 'flex'
        anio_pf_dropdown.layout.display = 'flex'
        actualizar_opciones_pf()
    elif tipo == "Piezómetros Eléctricos":
        progresiva_dropdown.layout.display = 'flex'
        piezometro_dropdown.layout.display = 'flex'
        variable_pe_dropdown.layout.display = 'flex'
        anio_pe_dropdown.layout.display = 'flex'
        actualizar_opciones_pe()
    elif tipo == "Piezómetros Casagrande":
        margen_cg_dropdown.layout.display = 'flex'
        pz_cg_dropdown.layout.display = 'flex'
        variable_cg_dropdown.layout.display = 'flex'
        anio_cg_dropdown.layout.display = 'flex'
        actualizar_opciones_cg()
    elif tipo == "Inclinómetros":
        inclinometro_dropdown.layout.display = 'flex'
        anio_inc_dropdown.layout.display = 'flex'
        eje_dropdown.layout.display = 'flex'
        actualizar_opciones_inc()
    elif tipo == "Celdas de Asentamiento":
        progresiva_ca_dropdown.layout.display = 'flex'
        celda_dropdown.layout.display = 'flex'
        variable_ca_dropdown.layout.display = 'flex'
        anio_ca_dropdown.layout.display = 'flex'
        actualizar_opciones_ca()
    elif tipo == "Freatímetros":
        freatimetro_dropdown.layout.display = 'flex'
        variable_fr_dropdown.layout.display = 'flex'
        anio_fr_dropdown.layout.display = 'flex'
        actualizar_opciones_fr()
    elif tipo == "Extensómetros":
        extensometro_dropdown.layout.display = 'flex'
        variable_ex_dropdown.layout.display = 'flex'
        anio_ex_dropdown.layout.display = 'flex'
        actualizar_opciones_ex()

# ====== FUNCIÓN DE RESUMEN ESTADÍSTICO (usa los filtros activos y .copy()) ======
def calcular_estadisticas(b=None):
    with output:
        clear_output(wait=True)
        tipo = instrumento_dropdown.value
        origen = origen_dropdown.value
        fecha_col = 'FECHA'
        variable = None
        df = None
        titulo = ""

        if tipo == "Puntos Fijos":
            df = datos_csv["puntos_fijos_mi"] if origen == "CSV" else datos_xlsx["puntos_fijos_mi"]
            if margen_dropdown.value == "Margen Derecha (MD)":
                df = datos_csv["puntos_fijos_md"] if origen == "CSV" else datos_xlsx["puntos_fijos_md"]
            variable = variable_pf_dropdown.value
            df = df.copy()
            if anio_pf_dropdown.value != "Todos":
                df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
                df = df[df['FECHA'].dt.year == int(anio_pf_dropdown.value)].copy()
            if punto_dropdown.value != "Todos":
                df = df[df['INSTRUMENTO'] == punto_dropdown.value].copy()
            titulo = f"{margen_dropdown.value}: {variable}"
        elif tipo == "Piezómetros Eléctricos":
            df = datos_csv["piezometros_electricos"] if origen == "CSV" else datos_xlsx["piezometros_electricos"]
            variable = variable_pe_dropdown.value
            df = df.copy()
            if progresiva_dropdown.value != "Todos":
                df = df[df['PROGRESIVA'] == progresiva_dropdown.value].copy()
            if piezometro_dropdown.value != "Todos":
                df = df[df['PIEZOMETRO'] == piezometro_dropdown.value].copy()
            if anio_pe_dropdown.value != "Todos":
                df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
                df = df[df['FECHA'].dt.year == int(anio_pe_dropdown.value)].copy()
            titulo = f"{progresiva_dropdown.value} – {variable}"
        elif tipo == "Piezómetros Casagrande":
            df = datos_csv["piezometros_casagrande"] if origen == "CSV" else datos_xlsx["piezometros_casagrande"]
            variable = variable_cg_dropdown.value
            df = df.copy()
            if margen_cg_dropdown.value != "Todos":
                df = df[df['MARGEN'] == margen_cg_dropdown.value].copy()
            if pz_cg_dropdown.value != "Todos":
                df = df[df['PIEZOMETRO'] == pz_cg_dropdown.value].copy()
            if anio_cg_dropdown.value != "Todos":
                df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
                df = df[df['FECHA'].dt.year == int(anio_cg_dropdown.value)].copy()
            titulo = f"{margen_cg_dropdown.value} – {variable}"
        elif tipo == "Inclinómetros":
            df = datos_csv["inclinometros"] if origen == "CSV" else datos_xlsx["inclinometros"]
            fecha_col = 'Fecha'
            variable = eje_dropdown.value
            df = df.copy()
            if inclinometro_dropdown.value != "Todos":
                df = df[df['Inclinometro'] == inclinometro_dropdown.value].copy()
            if anio_inc_dropdown.value != "Todos":
                df['Fecha'] = pd.to_datetime(df['Fecha'], dayfirst=True, errors='coerce')
                df = df[df['Fecha'].dt.year == int(anio_inc_dropdown.value)].copy()
            titulo = f"{inclinometro_dropdown.value} – {variable}"
        elif tipo == "Celdas de Asentamiento":
            df = datos_csv["asentamiento"] if origen == "CSV" else datos_xlsx["asentamiento"]
            variable = variable_ca_dropdown.value
            df = df.copy()
            if progresiva_ca_dropdown.value != "Todos":
                df = df[df['PROGRESIVA'] == progresiva_ca_dropdown.value].copy()
            if celda_dropdown.value != "Todas":
                df = df[df['CELDA_DE_ASENTAMIENTO'] == celda_dropdown.value].copy()
            if anio_ca_dropdown.value != "Todos":
                df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
                df = df[df['FECHA'].dt.year == int(anio_ca_dropdown.value)].copy()
            titulo = f"{progresiva_ca_dropdown.value} – {variable}"
        elif tipo == "Freatímetros":
            df = datos_csv["freatimetros"] if origen == "CSV" else datos_xlsx["freatimetros"]
            variable = variable_fr_dropdown.value
            df = df.copy()
            if freatimetro_dropdown.value != "Todos":
                df = df[df['FREATIMETRO'] == freatimetro_dropdown.value].copy()
            if anio_fr_dropdown.value != "Todos":
                df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
                df = df[df['FECHA'].dt.year == int(anio_fr_dropdown.value)].copy()
            titulo = f"{freatimetro_dropdown.value} – {variable}"
        elif tipo == "Extensómetros":
            df = datos_csv["extensometro"] if origen == "CSV" else datos_xlsx["extensometro"]
            variable = variable_ex_dropdown.value
            df = df.copy()
            if extensometro_dropdown.value != "Todos":
                df = df[df['EXTENSOMETRO'] == extensometro_dropdown.value].copy()
            if anio_ex_dropdown.value != "Todos":
                df['FECHA'] = pd.to_datetime(df['FECHA'], dayfirst=True, errors='coerce')
                df = df[df['FECHA'].dt.year == int(anio_ex_dropdown.value)].copy()
            titulo = f"{extensometro_dropdown.value} – {variable}"
        else:
            print("⚠️ Instrumento no reconocido."); return

        if variable not in df.columns:
            print(f"⚠️ La variable {variable} no está disponible en los datos."); return

        df[variable] = pd.to_numeric(df[variable], errors='coerce')
        df[fecha_col] = pd.to_datetime(df[fecha_col], dayfirst=True, errors='coerce')
        df = df.dropna(subset=[variable, fecha_col])
        if df.empty:
            print(f"⚠️ No hay datos válidos para la variable {variable} después de filtrar."); return

        datos = df[variable]
        conteo = datos.count()
        media = datos.mean()
        mediana = datos.median()
        moda = stats.mode(datos, keepdims=True)[0][0] if len(datos) > 0 else np.nan
        varianza = datos.var()
        desv_est = datos.std()
        minimo = datos.min()
        maximo = datos.max()
        idx_min = datos.idxmin()
        fecha_min = df.loc[idx_min, fecha_col] if idx_min in df.index else np.nan
        idx_max = datos.idxmax()
        fecha_max = df.loc[idx_max, fecha_col] if idx_max in df.index else np.nan
        q1 = datos.quantile(0.25)
        q3 = datos.quantile(0.75)

        print(f"📊 Estadísticas Descriptivas para {titulo}\n")
        print(f"Cantidad de datos: {conteo}")
        print(f"Media: {media:.4f}")
        print(f"Mediana: {mediana:.4f}")
        print(f"Moda: {moda:.4f}")
        print(f"Varianza: {varianza:.4f}")
        print(f"Desviación estándar: {desv_est:.4f}")
        print(f"Mínimo: {minimo:.4f} (Fecha: {fecha_min.date() if pd.notnull(fecha_min) else 'N/A'})")
        print(f"Máximo: {maximo:.4f} (Fecha: {fecha_max.date() if pd.notnull(fecha_max) else 'N/A'})")
        print(f"Primer cuartil (Q1): {q1:.4f}")
        print(f"Tercer cuartil (Q3): {q3:.4f}")

# ========== CONEXIONES Y DISPLAY ==========
instrumento_dropdown.observe(actualizar_controles_visibles, names='value')
origen_dropdown.observe(actualizar_controles_visibles, names='value')
margen_dropdown.observe(actualizar_opciones_pf, names='value')
progresiva_dropdown.observe(actualizar_piezometros_pe, names='value')
margen_cg_dropdown.observe(actualizar_piezometros_cg, names='value')
progresiva_ca_dropdown.observe(actualizar_celdas_ca, names='value')
boton_estadisticas.on_click(calcular_estadisticas)

display(HTML("<h3 style='color:#1866a3'>Resumen Estadístico de Instrumentos de Auscultación</h3>"))
display(widgets.HBox([instrumento_dropdown, origen_dropdown]))
display(widgets.HBox([
    margen_dropdown, punto_dropdown,
    progresiva_dropdown, piezometro_dropdown,
    margen_cg_dropdown, pz_cg_dropdown,
    inclinometro_dropdown,
    progresiva_ca_dropdown, celda_dropdown,
    freatimetro_dropdown,
    extensometro_dropdown
]))
display(widgets.HBox([
    variable_pf_dropdown, variable_pe_dropdown, variable_cg_dropdown,
    anio_pf_dropdown, anio_pe_dropdown, anio_cg_dropdown,
    anio_inc_dropdown, eje_dropdown,
    variable_ca_dropdown, anio_ca_dropdown,
    variable_fr_dropdown, anio_fr_dropdown,
    variable_ex_dropdown, anio_ex_dropdown
]))
display(boton_estadisticas)
display(output)

# Inicializar controles
actualizar_controles_visibles()

HBox(children=(Dropdown(description='Instrumento:', options=('Puntos Fijos', 'Piezómetros Eléctricos', 'Piezóm…

HBox(children=(Dropdown(description='Margen:', options=(), value=None), Dropdown(description='Punto Fijo:', op…

HBox(children=(Dropdown(description='Variable:', options=(), value=None), Dropdown(description='Variable:', op…

Button(button_style='primary', description='Calcular Estadísticas', style=ButtonStyle())

Output()