<a href="https://colab.research.google.com/github/gbenvenuto54/floreria-floreser/blob/main/Untitled6.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [7]:
# ============================
# 0. INSTALAR DEPENDENCIAS
# ============================
!pip install -q gradio pandas numpy seaborn matplotlib scipy xlsxwriter

# ============================
# 1. IMPORTS Y ESTADO GLOBAL
# ============================
import io
import datetime as dt

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import gradio as gr
from scipy import stats

sns.set(style="whitegrid")

STATE = {
    "df_original": None,
    "df_trabajo": None,
    "log": []
}

# ============================
# 2. LOG DE OPERACIONES
# ============================
def registrar_evento(etapa, descripcion, detalles=None):
    timestamp = dt.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    STATE["log"].append({
        "timestamp": timestamp,
        "etapa": etapa,
        "descripcion": descripcion,
        "detalles": detalles or {}
    })

def generar_log_texto():
    lineas = []
    lineas.append("REPORTE AUTOMÁTICO DE PROCESAMIENTO DE DATOS")
    lineas.append(f"Fecha y hora de generación: {dt.datetime.now()}")
    lineas.append("-" * 60)

    if STATE["df_original"] is not None:
        df0 = STATE["df_original"]
        lineas.append(
            f"Datos originales: {df0.shape[0]} filas, {df0.shape[1]} columnas."
        )
    if STATE["df_trabajo"] is not None:
        df = STATE["df_trabajo"]
        lineas.append(
            f"Datos finales: {df.shape[0]} filas, {df.shape[1]} columnas."
        )

    lineas.append("")
    lineas.append("Resumen de operaciones realizadas:")
    for ev in STATE["log"]:
        lineas.append(f"[{ev['timestamp']}] {ev['etapa']}: {ev['descripcion']}")

    lineas.append("")
    lineas.append("Interpretación general:")
    lineas.append(
        "- Los datos fueron sometidos a procesos de limpieza "
        "(tratamiento de nulos, normalización y outliers), "
        "y se generaron estadísticas descriptivas y visualizaciones "
        "para apoyar la toma de decisiones."
    )
    return "\n".join(lineas)

# ============================
# 3. CARGA DE ARCHIVO
# ============================
def cargar_archivo_gradio(archivo, separador, tiene_header):
    if archivo is None:
        return (gr.update(value=None),
                "Error: Debes seleccionar un archivo.",
                "Sin vista previa")

    nombre = archivo.name
    extension = nombre.split(".")[-1].lower()

    try:
        if extension == "csv":
            sep = {",": ",", ";": ";", "tab": "\t", "espacio": " "}.get(
                separador, ","
            )
            try:
                df = pd.read_csv(
                    archivo.name,
                    sep=sep,
                    header=0 if tiene_header else None,
                    encoding="utf-8"
                )
            except UnicodeDecodeError:
                df = pd.read_csv(
                    archivo.name,
                    sep=sep,
                    header=0 if tiene_header else None,
                    encoding="latin1"
                )
        elif extension in ["xls", "xlsx"]:
            df = pd.read_excel(
                archivo.name,
                header=0 if tiene_header else None
            )
        else:
            return (gr.update(value=None),
                    "Error: Solo se permiten archivos CSV o Excel.",
                    "Sin vista previa")
    except Exception as e:
        return (gr.update(value=None),
                f"Error al leer el archivo: {e}",
                "Sin vista previa")

    # Validación flexible
    tipos = df.dtypes
    hay_numericas = tipos.apply(lambda t: np.issubdtype(t, np.number)).any()
    hay_no_numericas = (~tipos.apply(lambda t: np.issubdtype(t, np.number))).any()

    mensaje_extra = ""
    if not (hay_numericas and hay_no_numericas):
        mensaje_extra = (
            "\n**Advertencia:** el archivo no contiene al menos una columna "
            "numérica y una categórica. Algunas funciones podrían no estar "
            "disponibles."
        )

    STATE["df_original"] = df.copy()
    STATE["df_trabajo"] = df.copy()
    STATE["log"] = []

    registrar_evento(
        "Carga de archivo",
        f"Archivo '{nombre}' cargado correctamente.",
        {"filas": int(df.shape[0]), "columnas": int(df.shape[1])}
    )

    vista_previa = df.head(30)
    mensaje = (
        f"Archivo '{nombre}' cargado correctamente. "
        f"Filas: {df.shape[0]}, Columnas: {df.shape[1]}."
        f"{mensaje_extra}"
    )
    return gr.update(value=vista_previa), mensaje, "Vista previa generada."

# ============================
# 4. ANÁLISIS POR COLUMNAS
# ============================
def obtener_analisis_columnas():
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", None

    tipos = df.dtypes
    resumen = pd.DataFrame({
        "Columna": tipos.index,
        "Tipo detectado": tipos.astype(str).values,
    })
    sugerido = ["Numérica" if np.issubdtype(t, np.number)
                else "Categórica/Textual" for t in tipos]
    resumen["Tipo sugerido"] = sugerido

    texto = (
        f"Columnas totales: {df.shape[1]}  |  "
        f"Numéricas: {sum(np.issubdtype(tipos, np.number))}  |  "
        f"No numéricas: {sum(~np.issubdtype(tipos, np.number))}"
    )
    return texto, resumen

# ============================
# 5. NULOS
# ============================
def analizar_nulos():
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", None

    total = len(df)
    nulos = df.isna().sum()
    resumen = pd.DataFrame({
        "Columna": nulos.index,
        "Nulos": nulos.values,
        "Porcentaje": (nulos.values / total * 100).round(2)
    })
    texto = f"Se encontraron valores nulos en {sum(nulos > 0)} columnas."
    return texto, resumen

def procesar_nulos(metodo, columnas_texto):
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", ""

    columnas = [c.strip() for c in columnas_texto.split(",") if c.strip()]
    if not columnas:
        columnas = [c for c in df.columns if df[c].isna().any()]
    if len(columnas) == 0:
        return "No hay columnas con valores nulos.", ""

    df_mod = df.copy()
    filas_antes = len(df_mod)

    for col in columnas:
        if metodo == "eliminar":
            df_mod = df_mod[df_mod[col].notna()]
        else:
            serie = df_mod[col]
            if metodo == "cero":
                valor = 0
            elif metodo == "promedio":
                valor = serie.mean()
            elif metodo == "mediana":
                valor = serie.median()
            elif metodo == "maximo":
                valor = serie.max()
            elif metodo == "minimo":
                valor = serie.min()
            elif metodo == "moda":
                valor = serie.mode().iloc[0] if not serie.mode().empty else 0
            else:
                valor = 0
            df_mod[col] = serie.fillna(valor)

    filas_despues = len(df_mod)
    STATE["df_trabajo"] = df_mod

    registrar_evento(
        "Tratamiento de nulos",
        f"Método '{metodo}' aplicado a columnas: {columnas}.",
        {"filas_antes": filas_antes, "filas_despues": filas_despues}
    )

    msg = (
        f"Tratamiento de nulos aplicado con método '{metodo}'. "
        f"Filas antes: {filas_antes}, después: {filas_despues}."
    )
    return msg, f"Operación completada sobre columnas: {', '.join(columnas)}"

# ============================
# 6. NORMALIZACIÓN
# ============================
def normalizar_columnas(metodo, modo_salida, columnas_texto):
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", None

    columnas = [c.strip() for c in columnas_texto.split(",") if c.strip()]
    if not columnas:
        return "Debes escribir al menos una columna numérica.", None

    df_mod = df.copy()
    resumen = []

    for col in columnas:
        if col not in df_mod.columns:
            continue
        serie = df_mod[col].astype(float)
        if metodo == "minmax":
            minimo, maximo = serie.min(), serie.max()
            if maximo - minimo == 0:
                continue
            nueva = (serie - minimo) / (maximo - minimo)
            detalle = {"min": minimo, "max": maximo}
        else:
            media, std = serie.mean(), serie.std(ddof=0)
            if std == 0:
                continue
            nueva = (serie - media) / std
            detalle = {"media": media, "std": std}

        nuevo_nombre = col if modo_salida == "reemplazar" else f"{col}_norm"
        df_mod[nuevo_nombre] = nueva
        resumen.append({"Columna": col, "Método": metodo, **detalle})

    STATE["df_trabajo"] = df_mod

    registrar_evento(
        "Normalización",
        f"Normalización '{metodo}' aplicada a columnas: {columnas}.",
        {}
    )

    resumen_df = pd.DataFrame(resumen) if resumen else None
    return "Normalización aplicada correctamente.", resumen_df

# ============================
# 7. OUTLIERS
# ============================
def analizar_outliers():
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", None

    numericas = df.select_dtypes(include=np.number)
    if numericas.empty:
        return "No hay columnas numéricas.", None

    resumen = []
    for col in numericas.columns:
        serie = numericas[col].dropna()
        if serie.empty:
            continue
        q1, q3 = np.percentile(serie, [25, 75])
        iqr = q3 - q1
        li, ls = q1 - 1.5 * iqr, q3 + 1.5 * iqr
        n_out = int(((serie < li) | (serie > ls)).sum())
        resumen.append({
            "Columna": col,
            "Q1": q1,
            "Q3": q3,
            "IQR": iqr,
            "Límite inf": li,
            "Límite sup": ls,
            "Outliers": n_out
        })

    if not resumen:
        return "No se encontraron outliers mediante IQR.", None

    return "Análisis de outliers completado.", pd.DataFrame(resumen)

def procesar_outliers(metodo, columnas_texto):
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", ""

    columnas = [c.strip() for c in columnas_texto.split(",") if c.strip()]
    if not columnas:
        return "Debes escribir al menos una columna.", ""

    df_mod = df.copy()
    total_afectadas = 0

    for col in columnas:
        if col not in df_mod.columns:
            continue
        serie = df_mod[col].astype(float)
        q1, q3 = np.percentile(serie.dropna(), [25, 75])
        iqr = q3 - q1
        li, ls = q1 - 1.5 * iqr, q3 + 1.5 * iqr
        mask = (serie < li) | (serie > ls)
        afectados = int(mask.sum())
        total_afectadas += afectados

        if metodo == "eliminar":
            df_mod = df_mod[~mask]
        elif metodo == "reemplazar_limite":
            serie[serie < li] = li
            serie[serie > ls] = ls
            df_mod[col] = serie
        elif metodo == "mediana":
            med = serie.median()
            serie[mask] = med
            df_mod[col] = serie
        elif metodo == "marcar":
            marca_col = f"{col}_is_outlier"
            df_mod[marca_col] = mask.astype(int)

    STATE["df_trabajo"] = df_mod

    registrar_evento(
        "Tratamiento de outliers (IQR)",
        f"Método '{metodo}' aplicado.",
        {"total_afectadas": total_afectadas}
    )
    return (
        f"Tratamiento '{metodo}' aplicado. Registros afectados: {total_afectadas}.",
        ""
    )

# ============================
# 8. ANÁLISIS ESTADÍSTICO Y GRÁFICOS
# ============================
def generar_analisis_estadistico(columnas_texto, x_reg, y_reg):
    df = STATE["df_trabajo"]
    if df is None:
        return "No hay datos cargados.", None, None, "", None

    columnas = [c.strip() for c in columnas_texto.split(",") if c.strip()]
    if not columnas:
        return "Debes escribir al menos una columna numérica.", None, None, "", None

    num_df = df[columnas].select_dtypes(include=np.number)
    if num_df.empty:
        return "Las columnas seleccionadas no son numéricas.", None, None, "", None

    desc = num_df.describe().T
    desc["Curtosis"] = num_df.apply(stats.kurtosis, fisher=False)
    desc["Asimetría"] = num_df.apply(stats.skew)
    desc = desc.round(4)

    corr = num_df.corr()

    interpretacion = []
    umbral = 0.7
    for i, c1 in enumerate(corr.columns):
        for c2 in corr.columns[i+1:]:
            valor = corr.loc[c1, c2]
            if abs(valor) >= umbral:
                interpretacion.append(
                    f"- Fuerte correlación entre {c1} y {c2} (r = {valor:.2f})."
                )

    for col in num_df.columns:
        k = desc.loc[col, "Curtosis"]
        s = desc.loc[col, "Asimetría"]
        if k > 3:
            interpretacion.append(
                f"- {col}: colas más pesadas que una normal (curtosis = {k:.2f})."
            )
        if abs(s) > 0.5:
            lado = "positiva" if s > 0 else "negativa"
            interpretacion.append(
                f"- {col}: asimetría {lado} (skew = {s:.2f})."
            )

    grafico = None
    if x_reg and y_reg and x_reg in num_df.columns and y_reg in num_df.columns:
        plt.figure(figsize=(5, 4))
        sns.regplot(x=num_df[x_reg], y=num_df[y_reg], line_kws={"color": "red"})
        plt.title(f"Regresión lineal: {x_reg} vs {y_reg}")
        buf = io.BytesIO()
        plt.tight_layout()
        plt.savefig(buf, format="png")
        plt.close()
        buf.seek(0)
        grafico = buf
        registrar_evento(
            "Análisis estadístico",
            f"Descriptivos, correlaciones y regresión {x_reg}~{y_reg}."
        )
    else:
        registrar_evento(
            "Análisis estadístico",
            "Descriptivos y correlaciones sin regresión específica."
        )

    texto = "\n".join(interpretacion) if interpretacion else \
        "No se observaron correlaciones muy fuertes ni asimetrías significativas."
    return "Análisis generado correctamente.", desc, corr, texto, grafico

def generar_grafico(tipo, columnas_texto, col_categoria):
    df = STATE["df_trabajo"]
    if df is None:
        return None, "No hay datos cargados."

    num_cols = df.select_dtypes(include=np.number).columns.tolist()
    if not num_cols:
        return None, "No hay columnas numéricas disponibles."

    columnas = [c.strip() for c in columnas_texto.split(",") if c.strip()]

    if tipo == "Pairplot simple":
        if len(num_cols) < 2:
            return None, "Se requieren al menos 2 columnas numéricas."
        subset = num_cols[:4]
        g = sns.pairplot(df[subset].dropna())
        buf = io.BytesIO()
        g.fig.suptitle("Pairplot de variables numéricas", y=1.02)
        g.fig.savefig(buf, format="png", bbox_inches="tight")
        buf.seek(0)
        plt.close("all")
        return buf, "Pairplot generado."

    plt.figure(figsize=(6, 4))
    if tipo == "Histograma":
        if not columnas:
            return None, "Escribe al menos una columna numérica."
        for col in columnas:
            if col in num_cols:
                sns.histplot(df[col].dropna(), kde=True, label=col, alpha=0.5)
        plt.legend()
        plt.title("Histogramas con KDE")
    elif tipo == "Boxplot":
        if not columnas:
            return None, "Escribe al menos una columna numérica."
        cols_validas = [c for c in columnas if c in num_cols]
        sns.boxplot(data=df[cols_validas])
        plt.title("Boxplots por columna")
    elif tipo == "Distribución por categoría":
        if (not columnas) or (not col_categoria):
            return None, "Escribe una numérica y una categórica."
        num_col = columnas[0]
        if num_col not in num_cols or col_categoria not in df.columns:
            return None, "Las columnas seleccionadas no son válidas."
        sns.boxplot(x=df[col_categoria], y=df[num_col])
        plt.title(f"Distribución de {num_col} por {col_categoria}")
    elif tipo == "Heatmap de correlación":
        corr = df[num_cols].corr()
        sns.heatmap(corr, annot=False, cmap="coolwarm", center=0)
        plt.title("Matriz de correlación")
    else:
        return None, "Tipo de gráfico no soportado."

    buf = io.BytesIO()
    plt.tight_layout()
    plt.savefig(buf, format="png")
    buf.seek(0)
    plt.close()
    return buf, f"Gráfico '{tipo}' generado correctamente."

# ============================
# 9. EXPORTACIÓN
# ============================
def exportar_datos(formato):
    df = STATE["df_trabajo"]
    if df is None:
        return None, None, "No hay datos procesados para exportar."

    if formato == "csv":
        buffer = io.StringIO()
        df.to_csv(buffer, index=False)
        datos_bytes = buffer.getvalue().encode("utf-8")
        nombre_datos = "datos_procesados.csv"
    else:
        buffer = io.BytesIO()
        with pd.ExcelWriter(buffer, engine="xlsxwriter") as writer:
            df.to_excel(writer, index=False, sheet_name="Datos")
        datos_bytes = buffer.getvalue()
        nombre_datos = "datos_procesados.xlsx"

    log_text = generar_log_texto()
    log_bytes = log_text.encode("utf-8")
    nombre_log = "reporte_log.txt"

    registrar_evento("Exportación",
                     f"Datos exportados en formato {formato}.")

    return (datos_bytes, nombre_datos), (log_bytes, nombre_log), \
        "Datos y log generados correctamente."

# ============================
# 10. INTERFAZ GRADIO
# ============================
tema = gr.themes.Soft(primary_hue="blue", secondary_hue="blue")

def _map_sep(sep_label):
    if "Punto y coma" in sep_label:
        return ";"
    if "Tabulación" in sep_label:
        return "tab"
    if "Espacio" in sep_label:
        return "espacio"
    return ","

with gr.Blocks(
    title="Aplicación Interactiva de Minería de Datos",
    theme=tema,
    css="""
    .gradio-container { max-width: 1200px !important; margin: auto !important; }
    """
) as demo:
    gr.Markdown(
        "## Aplicación Interactiva de Minería de Datos\n"
        "Cargá, limpiá, analizá y exportá tus datos con un flujo guiado."
    )

    with gr.Tabs():
        # TAB 1
        with gr.TabItem("Subir Archivo"):
            gr.Markdown(
                "### Cargar archivo de datos (CSV / Excel)\n"
                "Sube un archivo para comenzar."
            )
            with gr.Row():
                separador = gr.Radio(
                    ["Coma (,)", "Punto y coma (;)", "Tabulación (tab)", "Espacio"],
                    value="Coma (,)",
                    label="Separador del CSV"
                )
                tiene_header = gr.Checkbox(
                    value=True,
                    label="La primera fila contiene encabezados"
                )
            archivo = gr.File(
                label="Archivo Excel o CSV",
                file_types=[".csv", ".xlsx", ".xls"]
            )
            boton_cargar = gr.Button("Cargar y previsualizar", variant="primary")
            vista_previa = gr.Dataframe(
                label="Vista previa (primeras 30 filas)",
                interactive=False
            )
            mensaje_carga = gr.Markdown()
            detalle_carga = gr.Markdown()

            boton_cargar.click(
                fn=lambda f, s, h: cargar_archivo_gradio(f, _map_sep(s), h),
                inputs=[archivo, separador, tiene_header],
                outputs=[vista_previa, mensaje_carga, detalle_carga]
            )

        # TAB 2
        with gr.TabItem("Análisis por Columna"):
            gr.Markdown("### Análisis por columna")
            boton_analizar_cols = gr.Button("Analizar columnas", variant="primary")
            resumen_cols_txt = gr.Markdown()
            resumen_cols_df = gr.Dataframe(
                label="Resumen de columnas", interactive=False
            )
            boton_analizar_cols.click(
                fn=obtener_analisis_columnas,
                inputs=None,
                outputs=[resumen_cols_txt, resumen_cols_df]
            )

        # TAB 3
        with gr.TabItem("Datos Nulos"):
            gr.Markdown("### Análisis y tratamiento de valores nulos")
            boton_analizar_nulos = gr.Button(
                "Analizar valores nulos", variant="secondary"
            )
            resumen_nulos_txt = gr.Markdown()
            resumen_nulos_df = gr.Dataframe(
                label="Resumen de nulos por columna", interactive=False
            )
            boton_analizar_nulos.click(
                fn=analizar_nulos,
                inputs=None,
                outputs=[resumen_nulos_txt, resumen_nulos_df]
            )

            gr.Markdown("#### Tratamiento de valores nulos")
            metodo_nulos = gr.Radio(
                choices=[
                    ("Reemplazar con cero", "cero"),
                    ("Reemplazar con promedio", "promedio"),
                    ("Reemplazar con mediana", "mediana"),
                    ("Reemplazar con máximo", "maximo"),
                    ("Reemplazar con mínimo", "minimo"),
                    ("Reemplazar con moda", "moda"),
                    ("Eliminar registros con nulos", "eliminar")
                ],
                value="promedio",
                label="Método de tratamiento"
            )
            columnas_nulos = gr.Textbox(
                label="Columnas a tratar (coma separada, vacío = todas)",
                placeholder="ej: edad, ingreso_mensual"
            )
            boton_procesar_nulos = gr.Button(
                "Procesar valores nulos", variant="primary"
            )
            mensaje_nulos = gr.Markdown()
            detalle_nulos = gr.Markdown()
            boton_procesar_nulos.click(
                fn=procesar_nulos,
                inputs=[metodo_nulos, columnas_nulos],
                outputs=[mensaje_nulos, detalle_nulos]
            )

        # TAB 4
        with gr.TabItem("Normalización"):
            gr.Markdown("### Normalización de datos numéricos")
            metodo_norm = gr.Radio(
                [("Min-Max", "minmax"), ("Z-Score", "zscore")],
                value="minmax",
                label="Método de normalización"
            )
            modo_salida = gr.Radio(
                [("Reemplazar columnas existentes", "reemplazar"),
                 ("Crear nuevas columnas", "nuevas")],
                value="nuevas",
                label="Tratamiento de columnas"
            )
            columnas_norm = gr.Textbox(
                label="Columnas numéricas a normalizar (coma separada)",
                placeholder="ej: ingreso_mensual, edad"
            )
            boton_norm = gr.Button("Normalizar columnas", variant="primary")
            mensaje_norm = gr.Markdown()
            resumen_norm_df = gr.Dataframe(
                label="Resumen de normalización", interactive=False
            )
            boton_norm.click(
                fn=normalizar_columnas,
                inputs=[metodo_norm, modo_salida, columnas_norm],
                outputs=[mensaje_norm, resumen_norm_df]
            )

        # TAB 5
        with gr.TabItem("Outliers"):
            gr.Markdown("### Análisis de valores atípicos (Outliers)")
            boton_analizar_out = gr.Button(
                "Analizar outliers (IQR)", variant="secondary"
            )
            resumen_out_txt = gr.Markdown()
            resumen_out_df = gr.Dataframe(
                label="Resumen de outliers por columna", interactive=False
            )
            boton_analizar_out.click(
                fn=analizar_outliers,
                inputs=None,
                outputs=[resumen_out_txt, resumen_out_df]
            )

            metodo_out = gr.Radio(
                [
                    ("Eliminar registros con outliers", "eliminar"),
                    ("Reemplazar con límite inferior/superior", "reemplazar_limite"),
                    ("Reemplazar con mediana", "mediana"),
                    ("Marcar con columna indicador", "marcar")
                ],
                value="eliminar",
                label="Método para tratar outliers"
            )
            columnas_out = gr.Textbox(
                label="Columnas a tratar (coma separada)",
                placeholder="ej: ingreso_mensual"
            )
            boton_proc_out = gr.Button("Procesar outliers", variant="primary")
            mensaje_out = gr.Markdown()
            detalle_out = gr.Markdown()
            boton_proc_out.click(
                fn=procesar_outliers,
                inputs=[metodo_out, columnas_out],
                outputs=[mensaje_out, detalle_out]
            )

        # TAB 6
        with gr.TabItem("Análisis Descriptivo"):
            gr.Markdown("### Análisis estadístico y visualizaciones")
            with gr.Row():
                with gr.Column():
                    columnas_analisis = gr.Textbox(
                        label="Columnas numéricas a analizar (coma separada)",
                        placeholder="ej: edad, ingreso_mensual, satisfaccion"
                    )
                    x_reg = gr.Textbox(label="Variable X para regresión (opcional)")
                    y_reg = gr.Textbox(label="Variable Y para regresión (opcional)")
                    boton_analisis = gr.Button(
                        "Generar análisis numérico", variant="primary"
                    )
                    mensaje_analisis = gr.Markdown()
                    desc_df = gr.Dataframe(
                        label="Estadísticos descriptivos extendidos",
                        interactive=False
                    )
                    corr_df = gr.Dataframe(
                        label="Matriz de correlación",
                        interactive=False
                    )
                    interpretacion_txt = gr.Markdown()
                    grafico_reg = gr.Image(label="Regresión lineal (opcional)",
                                           interactive=False)
                    boton_analisis.click(
                        fn=generar_analisis_estadistico,
                        inputs=[columnas_analisis, x_reg, y_reg],
                        outputs=[mensaje_analisis, desc_df, corr_df,
                                 interpretacion_txt, grafico_reg]
                    )
                with gr.Column():
                    tipo_grafico = gr.Radio(
                        ["Histograma", "Boxplot", "Distribución por categoría",
                         "Heatmap de correlación", "Pairplot simple"],
                        value="Histograma",
                        label="Tipo de gráfico"
                    )
                    columnas_graf = gr.Textbox(
                        label="Columnas numéricas (coma separada)",
                        placeholder="ej: edad, ingreso_mensual"
                    )
                    columna_cat = gr.Textbox(
                        label="Columna categórica (para 'Distribución por categoría')",
                        placeholder="ej: segmento"
                    )
                    boton_grafico = gr.Button(
                        "Generar gráfico", variant="secondary"
                    )
                    grafico_generado = gr.Image(
                        label="Gráfico generado", interactive=False
                    )
                    mensaje_grafico = gr.Markdown()
                    boton_grafico.click(
                        fn=generar_grafico,
                        inputs=[tipo_grafico, columnas_graf, columna_cat],
                        outputs=[grafico_generado, mensaje_grafico]
                    )

        # TAB 7
        with gr.TabItem("Descargar Archivo"):
            gr.Markdown("### Exportar datos procesados y reporte de log")
            formato_export = gr.Radio(
                [("CSV", "csv"), ("Excel", "excel")],
                value="csv",
                label="Formato de descarga"
            )
            boton_export = gr.Button(
                "Generar archivos para descargar", variant="primary"
            )
            archivo_salida = gr.File(label="Datos procesados")
            archivo_log = gr.File(label="Registro de Log")
            mensaje_export = gr.Markdown()

            def _exportar(formato):
                datos, log, msj = exportar_datos(formato)
                datos_file = None
                log_file = None
                if datos is not None:
                    datos_file = gr.update(
                        value=io.BytesIO(datos[0]), label=datos[1]
                    )
                if log is not None:
                    log_file = gr.update(
                        value=io.BytesIO(log[0]), label=log[1]
                    )
                return datos_file, log_file, msj

            boton_export.click(
                fn=_exportar,
                inputs=[formato_export],
                outputs=[archivo_salida, archivo_log, mensaje_export]
            )

demo.launch(debug=True)

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://88edbbb733527b9a3b.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


ERROR:    Exception in ASGI application
Traceback (most recent call last):
  File "/usr/local/lib/python3.12/dist-packages/uvicorn/protocols/http/h11_impl.py", line 403, in run_asgi
    result = await app(  # type: ignore[func-returns-value]
             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/uvicorn/middleware/proxy_headers.py", line 60, in __call__
    return await self.app(scope, receive, send)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/usr/local/lib/python3.12/dist-packages/fastapi/applications.py", line 1134, in __call__
    await super().__call__(scope, receive, send)
  File "/usr/local/lib/python3.12/dist-packages/starlette/applications.py", line 107, in __call__
    await self.middleware_stack(scope, receive, send)
  File "/usr/local/lib/python3.12/dist-packages/starlette/middleware/errors.py", line 186, in __call__
    raise exc
  File "/usr/local/lib/python3.12/dist-packages/starlette/middleware/errors.py",

Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7860 <> https://88edbbb733527b9a3b.gradio.live


