In [1]:
import os
import pandas as pd

# Ruta de la carpeta que contiene los CSVs
ruta_carpeta = './'

# Cargar todos los archivos CSV
dfs = []
for archivo in os.listdir(ruta_carpeta):
    if archivo.endswith('.csv'):
        df = pd.read_csv(os.path.join(ruta_carpeta, archivo))
        df['Fuente'] = archivo  # Agregamos una columna para identificar el origen
        dfs.append(df)

# Combinar todos los DataFrames en uno solo
df_todos = pd.concat(dfs, ignore_index=True)


In [17]:
import pandas as pd
import os
import numpy as np

# Definir las métricas deseadas
METRICAS = ['SMAPE', 'MAE', 'MSE']

def load_results(filename):
    """
    Carga el CSV y extrae el número de intervalo a partir de la columna 'Intervalos Acumulados'.
    Se asume que la cadena tiene el formato 'Intervalos 1 a X'.
    """
    df = pd.read_csv(filename)
    # Extraer el número final del intervalo para usarlo como índice
    df['Intervalo'] = df['Intervalos Acumulados'].str.extract(r'a (\d+)').astype(int)
    df.set_index('Intervalo', inplace=True)
    return df

def extraer_metricas(df, metricas=METRICAS):
    """
    Asegura que el DataFrame tenga las columnas indicadas en 'metricas'.
    Si falta alguna, se agrega con valores NaN.
    Se reordena el DataFrame según el orden especificado en 'metricas'.
    """
    for met in metricas:
        if met not in df.columns:
            df[met] = np.nan
    return df[metricas]

def obtener_tabla(horizonte):
    # Diccionario para almacenar DataFrames de cada modelo
    tablas = {}

    # Archivos para los modelos LSTM
    lstm_files = {
        'LSTM-7': f"lstm_7_{horizonte}.csv",
        'LSTM-14': f"lstm_14_{horizonte}.csv",
        'LSTM-21': f"lstm_21_{horizonte}.csv"
    }
    
    for key, file in lstm_files.items():
        if os.path.exists(file):
            df = load_results(file)
            tablas[key] = extraer_metricas(df, METRICAS)
        else:
            raise FileNotFoundError(f"Archivo no encontrado: {file}")
    
    # Archivo para TimesFM
    timesfm_file = f"timesfm_{horizonte}.csv"
    if not os.path.exists(timesfm_file):
        raise FileNotFoundError(f"Archivo no encontrado: {timesfm_file}")
    df_timesfm = load_results(timesfm_file)
    tablas['TimesFM'] = extraer_metricas(df_timesfm, METRICAS)
    
    # Combinar todos los DataFrames en uno con columnas de MultiIndex
    tabla_resumen = pd.concat(tablas, axis=1)
    tabla_resumen.index.name = 'Intervalo'
    return tabla_resumen

def stack_table(tabla):
    """
    Convierte la tabla de formato ancho (con columnas MultiIndex: Modelo y Métrica)
    a un formato "apilado" donde cada fila representa un intervalo y una métrica,
    y las columnas corresponden a los modelos.
    """
    # Apilamos el segundo nivel (las métricas) en el índice
    tabla_apilada = tabla.stack(level=1)
    tabla_apilada.index.names = ['Intervalo', 'Métrica']
    return tabla_apilada

def highlight_min_max(row):
    """
    Función para aplicar estilos condicionales a una fila:
      - La celda con el valor mínimo se resalta en azul (fondo azul, texto blanco).
      - La celda con el valor máximo se resalta en rojo (fondo rojo, texto blanco).
      - Las demás celdas quedan con el fondo predeterminado (cadena vacía).
    """
    min_val = row.min()
    max_val = row.max()
    
    estilos = []
    for v in row:
        # Si todos son iguales, ni mínimo ni máximo, se deja sin estilo
        if v == min_val and v == max_val:
            estilos.append("")
        elif v == min_val:
            estilos.append("background-color: blue; color: white")
        elif v == max_val:
            estilos.append("background-color: red; color: white")
        else:
            estilos.append("")
    return estilos

def style_stacked(tabla,horizonte):
    """
    Aplica formato y estilos condicionales a la tabla apilada.
    Cada fila representa un Intervalo y una Métrica, y las columnas son los modelos.
    Se formatean los números y se aplican los estilos para resaltar el mínimo (azul)
    y máximo (rojo) en cada fila.
    """
    return (tabla.style
            .format("{:.2f}")
            .apply(highlight_min_max, axis=1)
            .set_caption(f"Comparación de Modelos por Métrica (por fila: mínimo azul, máximo rojo) - {horizonte} días"))

# Obtener las tablas para los distintos horizontes
tabla_15 = obtener_tabla(15)
tabla_30 = obtener_tabla(30)

# Reorganizar la tabla (apilando las métricas en el índice)
tabla_15_apilada = stack_table(tabla_15)
tabla_30_apilada = stack_table(tabla_30)

# Mostrar las tablas con estilo en Jupyter Notebook
display(style_stacked(tabla_15_apilada, '15'))
display(style_stacked(tabla_30_apilada, '30'))

# Opcional: guardar las tablas a CSV (sin aplicar el estilo)
tabla_15_apilada.to_csv('tabla_apilada_horizonte_15.csv')
tabla_30_apilada.to_csv('tabla_apilada_horizonte_30.csv')


  tabla_apilada = tabla.stack(level=1)
  tabla_apilada = tabla.stack(level=1)


Unnamed: 0_level_0,Unnamed: 1_level_0,LSTM-7,LSTM-14,LSTM-21,TimesFM
Intervalo,Métrica,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,SMAPE,28.99,16.72,20.46,49.96
1,MAE,137.06,63.39,86.96,161.83
1,MSE,35813.06,7687.78,13861.79,39464.28
2,SMAPE,19.43,20.49,23.32,41.53
2,MAE,98.81,103.82,116.41,182.36
2,MSE,13173.48,16553.57,22308.73,49539.47
3,SMAPE,28.38,28.23,29.4,36.13
3,MAE,265.69,263.16,273.11,325.83
3,MSE,120316.7,117025.21,126224.4,181618.79
4,SMAPE,50.13,34.32,27.06,74.47


Unnamed: 0_level_0,Unnamed: 1_level_0,LSTM-7,LSTM-14,LSTM-21,TimesFM
Intervalo,Métrica,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,SMAPE,21.07,17.36,17.44,106.3
1,MAE,53.57,44.23,43.1,198.98
1,MSE,6115.01,4383.23,4339.46,63915.79
2,SMAPE,17.39,20.11,18.86,49.26
2,MAE,79.96,91.75,86.43,187.61
2,MSE,9806.46,15033.82,12697.87,54042.86
3,SMAPE,29.65,25.74,27.58,45.57
3,MAE,215.6,187.92,202.43,316.34
3,MSE,82027.88,64077.22,75768.3,172432.14
4,SMAPE,187.54,44.41,18.52,194.29
