AutoGluon - Predicci√≥n de ventas (tn) por producto para febrero 2020

In [1]:
# üì¶ 1. Importar librer√≠as
import os
import pandas as pd
from datetime import datetime
import time
import json
import re

In [2]:
# üí¨ Instalar AutoGluon y kaggle si es necesario
%pip install autogluon.timeseries
%pip install kaggle

from autogluon.timeseries import TimeSeriesPredictor, TimeSeriesDataFrame
from autogluon.common import space as ag_space

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.0.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip

[notice] A new release of pip is available: 25.0.1 -> 25.1.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Note: you may need to restart the kernel to use updated packages.


  from .autonotebook import tqdm as notebook_tqdm


In [3]:
# üìÑ 2. Cargar datasets
df_sellin = pd.read_csv("sell-in.txt", sep="\t")
df_productos = pd.read_csv("tb_productos.txt", sep="\t")

In [4]:
# üìÑ Leer lista de productos a predecir
with open("productos_pred.txt", "r") as f:
    product_ids = [int(line.strip()) for line in f if line.strip().isdigit()]

In [5]:
# üßπ 3. Preprocesamiento
# Convertir periodo a datetime
df_sellin['timestamp'] = pd.to_datetime(df_sellin['periodo'], format='%Y%m')

In [6]:
# Filtrar hasta dic 2019 y productos requeridos
df_filtered = df_sellin[
    (df_sellin['timestamp'] <= '2019-12-01') &
    (df_sellin['product_id'].isin(product_ids))
]

In [7]:
# Agregar tn por periodo, cliente y producto
df_grouped = df_filtered.groupby(['timestamp', 'customer_id', 'product_id'], as_index=False)['tn'].sum()

In [8]:
# Agregar tn total por periodo y producto
df_monthly_product = df_grouped.groupby(['timestamp', 'product_id'], as_index=False)['tn'].sum()

In [9]:
# Agregar columna 'item_id' para AutoGluon
df_monthly_product['item_id'] = df_monthly_product['product_id']

In [10]:
# ‚è∞ 4. Crear TimeSeriesDataFrame
ts_data = TimeSeriesDataFrame.from_data_frame(
    df_monthly_product,
    id_column='item_id',
    timestamp_column='timestamp'
)

In [11]:
# Completar valores faltantes
ts_data = ts_data.fill_missing_values()

# Convertir columnas num√©ricas float64 a float32
def convert_float64_to_float32(df):
    for col in df.select_dtypes(include=['float64']).columns:
        df[col] = df[col].astype('float32')
    return df

# Aplicar conversi√≥n a los dataframes relevantes
df_sellin = convert_float64_to_float32(df_sellin)
df_productos = convert_float64_to_float32(df_productos)
df_grouped = convert_float64_to_float32(df_grouped) if 'df_grouped' in locals() else None
df_monthly_product = convert_float64_to_float32(df_monthly_product) if 'df_monthly_product' in locals() else None

# üîç Validaci√≥n de datos antes del entrenamiento
print("üîç Validando datos de entrada...")
print(f"üìä Forma de los datos: {ts_data.shape}")
print(f"üìÖ Rango de fechas: {ts_data.index.get_level_values('timestamp').min()} - {ts_data.index.get_level_values('timestamp').max()}")
print(f"üè∑Ô∏è N√∫mero de productos √∫nicos: {ts_data.index.get_level_values('item_id').nunique()}")
print(f"üìà Valores nulos en target: {ts_data['tn'].isnull().sum()}")

# Verificar que tenemos suficientes datos
if ts_data.empty:
    raise ValueError("‚ùå Error: Los datos est√°n vac√≠os")
if ts_data['tn'].isnull().all():
    raise ValueError("‚ùå Error: Todos los valores target son nulos")
if ts_data.index.get_level_values('item_id').nunique() == 0:
    raise ValueError("‚ùå Error: No hay productos en los datos")

print("‚úÖ Validaci√≥n de datos completada exitosamente")

üîç Validando datos de entrada...
üìä Forma de los datos: (22349, 2)
üìÖ Rango de fechas: 2017-01-01 00:00:00 - 2019-12-01 00:00:00
üè∑Ô∏è N√∫mero de productos √∫nicos: 780
üìà Valores nulos en target: 0
‚úÖ Validaci√≥n de datos completada exitosamente


In [12]:
# üîß 5. Funciones auxiliares para el bucle iterativo
def get_kaggle_score():
    """Obtiene el score m√°s reciente de Kaggle"""
    try:
        output = os.popen('kaggle competitions submissions -c labo-iii-edicion-2025-v').read()
        lines = output.strip().split('\n')
        if len(lines) > 2:
            # La segunda l√≠nea contiene la submission m√°s reciente
            recent_line = lines[2]
            print(lines[2])
            # Extraer el score con un patr√≥n m√°s robusto
            # Buscar n√∫meros decimales que podr√≠an ser el score
            score_matches = re.findall(r'(\d+\.\d+)', recent_line)
            if score_matches:
                # Tomar el √∫ltimo n√∫mero decimal encontrado (generalmente es el score)
                return float(score_matches[-1])
            # Si no hay decimales, buscar n√∫meros enteros
            int_matches = re.findall(r'\b(\d+)\b', recent_line)
            if int_matches:
                return float(int_matches[-1])
    except Exception as e:
        print(f"‚ö†Ô∏è Error obteniendo score de Kaggle: {e}")
    return None

In [13]:
def submit_to_kaggle(resultado, iteration):
    """Sube predicci√≥n a Kaggle y retorna el score"""
    timestamp_str = datetime.now().strftime("%Y%m%d_%H%M%S")
    output_filename = f"predicciones_iter_{iteration}_{timestamp_str}.csv"
    resultado.to_csv(output_filename, index=False)

    message = f"Iteraci√≥n {iteration} - Mejora autom√°tica {timestamp_str}"
    os.system(f'kaggle competitions submit -c labo-iii-edicion-2025-v -f {output_filename} -m "{message}"')

    # Esperar m√°s tiempo para que Kaggle procese
    print(f"‚è≥ Esperando 3 minutos para que Kaggle procese la submission...")
    time.sleep(180)  # Incrementar a 3 minutos
    return get_kaggle_score()

In [14]:
def get_improved_hyperparameters(iteration, best_score, current_score):
    """Ajusta hiperpar√°metros bas√°ndose en el rendimiento"""
    import random

    # Print informaci√≥n de estado actual
    print(f"üîß Ajustando hiperpar√°metros para iteraci√≥n {iteration}")
    print(f"üìä Score actual: {current_score if current_score else 'N/A'}")
    print(f"üèÜ Mejor score hasta ahora: {best_score if best_score != float('inf') else 'N/A'}")

    # Determinar si vamos mejorando
    improving = False
    if current_score and best_score != float('inf'):
        improving = current_score < best_score
        improvement_diff = best_score - current_score if improving else current_score - best_score
        if improving:
            print(f"üìà Tendencia: MEJORANDO (diferencia: {improvement_diff:.6f}) - Explorando modelos m√°s complejos")
        else:
            print(f"üìâ Tendencia: SIN MEJORAR (diferencia: {improvement_diff:.6f}) - Ajustando estrategia")
    else:
        print("üéØ Primera iteraci√≥n - Explorando configuraci√≥n base")

    # Acceder a variables globales para detectar estancamiento
    global iterations_without_improvement
    current_stagnation = iterations_without_improvement if 'iterations_without_improvement' in globals() else 0

    if current_stagnation > 0:
        print(f"üîÑ Detectado estancamiento de {current_stagnation} iteraciones - Aplicando cambios DR√ÅSTICOS")

    # Usar iteraci√≥n y estancamiento para cambios M√ÅS AGRESIVOS
    random.seed(iteration * 123 + current_stagnation * 456)  # M√°s variaci√≥n en la semilla

    # RANGOS DRAM√ÅTICAMENTE EXPANDIDOS - Siempre usar rangos amplios
    epochs_range = [50, 100, 150, 200, 250, 300, 400, 500, 600]  # √âpocas mucho m√°s altas
    lr_range = [1e-1, 5e-2, 1e-2, 5e-3, 1e-3, 5e-4, 1e-4, 5e-5, 1e-5, 1e-6]  # Rangos extremos
    hidden_sizes = [64, 128, 256, 512, 768, 1024, 1536, 2048]  # Tama√±os m√°s grandes
    layers_range = [2, 3, 4, 5, 6, 7, 8, 10, 12]  # M√°s capas profundas
    dropout_range = [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7]  # Rango completo

    # Con estancamiento, usar TODOS los valores disponibles
    if current_stagnation > 3:
        print("üí• MODO EXTREMO: Usando rangos m√°ximos por estancamiento")
        epochs_range.extend([700, 800, 1000])  # √âpocas extremas
        hidden_sizes.extend([3072, 4096])  # Tama√±os gigantes
        layers_range.extend([15, 20])  # Capas muy profundas
        lr_range.extend([2e-1, 5e-6, 1e-7])  # LR extremos

    # Seleccionar MUCHAS m√°s combinaciones - m√≠nimo 5-8 opciones
    variation_factor = max(3, current_stagnation)
    epoch_choices = random.sample(epochs_range, min(6 + variation_factor, len(epochs_range)))
    lr_choices = random.sample(lr_range, min(6 + variation_factor, len(lr_range)))
    hidden_choices = random.sample(hidden_sizes, min(5 + variation_factor, len(hidden_sizes)))
    layer_choices = random.sample(layers_range, min(5 + variation_factor, len(layers_range)))
    dropout_choices = random.sample(dropout_range, min(5 + variation_factor, len(dropout_range)))

    print(f"‚öôÔ∏è Epochs seleccionados: {sorted(epoch_choices)}")
    print(f"‚öôÔ∏è Learning rates: {sorted(lr_choices, reverse=True)}")
    print(f"‚öôÔ∏è Hidden sizes: {sorted(hidden_choices)}")
    print(f"‚öôÔ∏è Layers: {sorted(layer_choices)}")
    print(f"‚öôÔ∏è Dropout rates: {sorted(dropout_choices)}")

    # Configuraciones espec√≠ficas por modelo con M√ÅXIMA variaci√≥n
    deepar_epochs = random.sample([100, 150, 200, 300, 400, 500, 600, 800], min(6, 8))
    tft_epochs = random.sample([50, 100, 150, 200, 300, 400, 500], min(5, 7))
    patch_epochs = random.sample([50, 100, 150, 200, 300, 400, 500], min(5, 7))

    # Variaciones EXTREMAS en patch lengths y strides
    patch_lens = random.sample([4, 8, 12, 16, 24, 32, 48, 64, 96, 128], min(6, 10))
    strides = random.sample([2, 4, 6, 8, 12, 16, 24, 32, 48, 64], min(6, 10))
    attention_heads = random.sample([4, 6, 8, 12, 16, 20, 24, 32], min(5, 8))

    # Configuraciones base SIEMPRE con modelos complejos
    base_hyperparameters = {
        'DeepAR': {
            'epochs': ag_space.Categorical(*deepar_epochs),
            'learning_rate': ag_space.Categorical(*lr_choices),
            'hidden_size': ag_space.Categorical(*hidden_choices),
            'num_layers': ag_space.Categorical(*layer_choices),
            'dropout_rate': ag_space.Categorical(*dropout_choices)
        },
        'TemporalFusionTransformer': {
            'epochs': ag_space.Categorical(*tft_epochs),
            'learning_rate': ag_space.Categorical(*lr_choices),
            'hidden_size': ag_space.Categorical(*hidden_choices),
            'num_attention_heads': ag_space.Categorical(*attention_heads)
        },
        'PatchTST': {
            'epochs': ag_space.Categorical(*patch_epochs),
            'learning_rate': ag_space.Categorical(*lr_choices),
            'patch_len': ag_space.Categorical(*patch_lens),
            'stride': ag_space.Categorical(*strides)
        }
    }

    # SIEMPRE agregar modelos experimentales desde iteraci√≥n 2
    if iteration >= 2:
        print("üöÄ Agregando TODOS los modelos experimentales disponibles")

        # TiDE con configuraciones agresivas
        tide_epochs = random.sample([150, 200, 300, 400, 500, 600, 800], min(5, 7))
        tide_hidden = random.sample([512, 768, 1024, 1536, 2048, 3072], min(5, 6))
        tide_layers = random.sample([4, 6, 8, 10, 12, 15], min(4, 6))

        base_hyperparameters.update({
            'TiDE': {
                'epochs': ag_space.Categorical(*tide_epochs),
                'learning_rate': ag_space.Categorical(*lr_choices),
                'hidden_size': ag_space.Categorical(*tide_hidden),
                'num_layers': ag_space.Categorical(*tide_layers),
                'dropout': ag_space.Categorical(*dropout_choices)
            }
        })

        # Chronos con TODOS los tama√±os
        chronos_sizes = ['tiny', 'mini', 'small', 'base', 'large'] if iteration > 5 else ['tiny', 'mini', 'small', 'base']
        base_hyperparameters.update({
            'Chronos': {
                'model_size': ag_space.Categorical(*chronos_sizes)
            }
        })

        # NPTS con contextos variables
        context_lengths = random.sample([24, 36, 48, 60, 72, 96, 120], min(5, 7))
        base_hyperparameters.update({
            'NPTS': {
                'context_length': ag_space.Categorical(*context_lengths)
            }
        })

        print(f"   ‚îú‚îÄ TiDE epochs: {sorted(tide_epochs)}")
        print(f"   ‚îú‚îÄ TiDE hidden sizes: {sorted(tide_hidden)}")
        print(f"   ‚îú‚îÄ Chronos sizes: {chronos_sizes}")
        print(f"   ‚îî‚îÄ NPTS context lengths: {sorted(context_lengths)}")

    # Modelos baseline con configuraciones mejoradas
    baseline_models = ['AutoETS', 'DynamicOptimizedTheta', 'SeasonalNaive', 'DirectTabular', 'RecursiveTabular']
    base_hyperparameters.update({
        'AutoETS': {},
        'DynamicOptimizedTheta': {},
        'SeasonalNaive': {},
        'DirectTabular': {'ag_args_fit': {'num_gpus': 0, 'verbosity': 2}},
        'RecursiveTabular': {'ag_args_fit': {'num_gpus': 0, 'verbosity': 2}}
    })

    print(f"üéØ Total de modelos configurados: {len(base_hyperparameters)}")
    print(f"üìã Modelos complejos: {[k for k in base_hyperparameters.keys() if k not in baseline_models]}")
    print(f"üìã Modelos baseline: {baseline_models}")
    print(f"üî• Nivel de AGRESIVIDAD M√ÅXIMA aplicado: {min(current_stagnation + 5, 10)}/10")
    print("-" * 50)

    return base_hyperparameters

In [None]:
# üîÑ 6. Bucle iterativo de mejora
print("üöÄ Iniciando bucle iterativo de mejora de modelo")
print("=" * 60)

# Variables para tracking
best_score = float('inf')
best_iteration = 0
scores_history = []
models_history = []
iterations_without_improvement = 0  # Contador de iteraciones sin mejora
last_improvement_iteration = 0  # √öltima iteraci√≥n con mejora

for iteration in range(1, 81):  # 80 iteraciones
    print(f"\nüîÑ ITERACI√ìN {iteration}/80")
    print("-" * 40)

    try:
        # Crear predictor para esta iteraci√≥n
        predictor = TimeSeriesPredictor(
            prediction_length=2,
            target='tn',
            freq='MS',
            eval_metric='MASE',
            path=f'AutogluonModels/iteration_{iteration}'
        )

        # PRIMERA ITERACI√ìN: Usar configuraci√≥n por defecto SIN hiperpar√°metros espec√≠ficos
        if iteration == 1:
            print("üéØ PRIMERA ITERACI√ìN - Entrenamiento con configuraci√≥n por defecto")
            print("üìã Usando modelos base de AutoGluon sin hiperpar√°metros espec√≠ficos")

            # Configuraci√≥n simple para la primera iteraci√≥n
            hyperparameters = None  # Usar defaults de AutoGluon
            hyperparameter_tune_kwargs = None  # Sin b√∫squeda de hiperpar√°metros

            # Tiempo base m√°s corto para la primera iteraci√≥n (1 hora)
            adjusted_time = 3600  # 1 hora
            print(f"‚è∞ Tiempo de entrenamiento inicial: {adjusted_time/3600:.1f} hora")

        else:
            # ITERACIONES 2+: Usar l√≥gica de hiperpar√°metros existente
            print(f"üîß ITERACI√ìN {iteration} - Optimizaci√≥n avanzada con hiperpar√°metros")

            # Obtener hiperpar√°metros mejorados
            current_score = scores_history[-1] if scores_history else None
            hyperparameters = get_improved_hyperparameters(iteration, best_score, current_score)

            # Ajustar trials bas√°ndose en las iteraciones sin mejora - M√ÅS AGRESIVO
            base_trials = min(10 + iteration * 5, 150)  # Incrementar trials base significativamente
            if iterations_without_improvement > 3:
                # Incrementar trials DRAM√ÅTICAMENTE si no hay mejoras
                trials_multiplier = min(3 + (iterations_without_improvement // 2), 6)
                adjusted_trials = min(base_trials * trials_multiplier, 300)  # Hasta 300 trials
                print(f"‚ö° Sin mejoras por {iterations_without_improvement} iteraciones - Incrementando trials a {adjusted_trials}")
            else:
                adjusted_trials = base_trials

            # Configurar b√∫squeda de hiperpar√°metros
            hyperparameter_tune_kwargs = {
                'num_trials': adjusted_trials,
                'scheduler': 'local',
                'searcher': 'random'
            }

            print(f"üìä Entrenando con {len(hyperparameters)} modelos...")
            print(f"üîç Trials de hiperpar√°metros: {hyperparameter_tune_kwargs['num_trials']}")

            # TIEMPOS DE ENTRENAMIENTO DRAM√ÅTICAMENTE M√ÅS LARGOS
            # Tiempo base mucho m√°s alto: m√≠nimo 4 horas, m√°ximo 24 horas
            base_time_hours = 4 + (iteration * 0.5)  # Incrementar 30 min por iteraci√≥n
            base_time = int(base_time_hours * 3600)  # Convertir a segundos

            # Multiplicadores agresivos por estancamiento
            if iterations_without_improvement > 8:
                time_multiplier = 5.0  # 5x m√°s tiempo si est√° muy estancado
                adjusted_time = min(int(base_time * time_multiplier), 24 * 3600)  # M√°ximo 24 horas
                print(f"üí• ESTANCAMIENTO EXTREMO - Tiempo de entrenamiento: {adjusted_time/3600:.1f} horas")
            elif iterations_without_improvement > 5:
                time_multiplier = 3.0  # 3x m√°s tiempo si est√° estancado
                adjusted_time = min(int(base_time * time_multiplier), 20 * 3600)  # M√°ximo 20 horas
                print(f"üö® ESTANCAMIENTO PROLONGADO - Tiempo de entrenamiento: {adjusted_time/3600:.1f} horas")
            elif iterations_without_improvement > 2:
                time_multiplier = 2.0  # 2x m√°s tiempo si no mejora
                adjusted_time = min(int(base_time * time_multiplier), 16 * 3600)  # M√°ximo 16 horas
                print(f"‚ö° Sin mejoras detectadas - Tiempo de entrenamiento: {adjusted_time/3600:.1f} horas")
            else:
                adjusted_time = base_time
                print(f"‚è∞ Tiempo de entrenamiento base: {adjusted_time/3600:.1f} horas")

        print(f"üïê Tiempo estimado de finalizaci√≥n: {(datetime.now() + pd.Timedelta(seconds=adjusted_time)).strftime('%H:%M:%S')}")
        print(f"üìÖ Fecha estimada de finalizaci√≥n: {(datetime.now() + pd.Timedelta(seconds=adjusted_time)).strftime('%Y-%m-%d')}")

        # Entrenar modelo con configuraci√≥n espec√≠fica por iteraci√≥n
        start_time = time.time()

        if iteration == 1:
            # Primera iteraci√≥n: entrenamiento simple
            predictor.fit(
                train_data=ts_data,
                time_limit=adjusted_time
            )
        else:
            # Iteraciones 2+: entrenamiento con hiperpar√°metros
            predictor.fit(
                train_data=ts_data,
                hyperparameters=hyperparameters,
                hyperparameter_tune_kwargs=hyperparameter_tune_kwargs,
                time_limit=adjusted_time
            )

        training_time = time.time() - start_time

        print(f"‚è±Ô∏è Tiempo de entrenamiento REAL: {training_time/3600:.2f} horas ({training_time/60:.1f} minutos)")

        # Comparar tiempo real vs planificado
        time_efficiency = (training_time / adjusted_time) * 100
        print(f"üìä Eficiencia de tiempo: {time_efficiency:.1f}% del tiempo asignado")

        if time_efficiency < 50:
            print("‚ö†Ô∏è El entrenamiento termin√≥ mucho antes del tiempo asignado - considera modelos m√°s complejos")
        elif time_efficiency > 95:
            print("‚úÖ Uso completo del tiempo asignado - entrenamiento exhaustivo")

        # Generar predicci√≥n
        print("üîÆ Generando predicciones...")
        forecast = predictor.predict(ts_data)

        # Verificar que forecast contiene datos v√°lidos
        if forecast is None or 'mean' not in forecast:
            print("‚ùå Error: No se pudo generar predicci√≥n v√°lida")
            scores_history.append(None)
            models_history.append({
                'iteration': iteration,
                'score': None,
                'training_time': training_time,
                'best_model': 'Error',
                'error': 'No prediction generated'
            })
            continue

        # Procesar resultados
        resultado = forecast['mean'].reset_index()

        # Verificar que tenemos datos para febrero 2020
        feb_2020_data = resultado[resultado['timestamp'] == '2020-02-01']
        if feb_2020_data.empty:
            print("‚ö†Ô∏è Advertencia: No hay predicciones para febrero 2020, usando primer mes disponible")
            # Usar el primer mes disponible
            unique_timestamps = resultado['timestamp'].unique()
            if len(unique_timestamps) > 0:
                feb_2020_data = resultado[resultado['timestamp'] == unique_timestamps[0]]

        if feb_2020_data.empty:
            print("‚ùå Error: No hay predicciones disponibles")
            scores_history.append(None)
            continue

        resultado = feb_2020_data[['item_id', 'mean']].copy()
        resultado.columns = ['product_id', 'tn']

        # Validar que tenemos predicciones v√°lidas
        if resultado.empty or resultado['tn'].isna().all():
            print("‚ùå Error: Predicciones vac√≠as o inv√°lidas")
            scores_history.append(None)
            continue

        print(f"üìà Productos predichos: {len(resultado)}")
        print(f"üìä Rango de predicciones: {resultado['tn'].min():.2f} - {resultado['tn'].max():.2f}")

        # Subir a Kaggle y obtener score
        print("‚¨ÜÔ∏è Subiendo a Kaggle...")
        kaggle_score = submit_to_kaggle(resultado, iteration)

        if kaggle_score:
            scores_history.append(kaggle_score)
            print(f"üéØ Score obtenido: {kaggle_score}")

            # Verificar si es el mejor score
            if kaggle_score < best_score:
                best_score = kaggle_score
                best_iteration = iteration
                last_improvement_iteration = iteration
                iterations_without_improvement = 0  # Resetear contador
                print(f"üèÜ ¬°NUEVO MEJOR SCORE! Mejora: {best_score}")
                print(f"‚ú® Reseteando contador de iteraciones sin mejora")
            else:
                iterations_without_improvement += 1
                print(f"üìâ No mejor√≥. Mejor score sigue siendo: {best_score} (iteraci√≥n {best_iteration})")
                print(f"‚è≥ Iteraciones sin mejora: {iterations_without_improvement}")

                # Estrategias adicionales cuando no hay mejora
                if iterations_without_improvement >= 3:
                    print(f"üîß Activando estrategias de recuperaci√≥n (sin mejora por {iterations_without_improvement} iteraciones)")

                if iterations_without_improvement >= 5:
                    print("üö® Considerando cambios dr√°sticos en pr√≥ximas iteraciones")

                if iterations_without_improvement >= 10:
                    print("üí• Implementando b√∫squeda exhaustiva - esto puede tomar m√°s tiempo")
        else:
            print("‚ö†Ô∏è No se pudo obtener score de Kaggle")
            scores_history.append(None)
            iterations_without_improvement += 1

        # Guardar informaci√≥n del modelo
        try:
            model_info = predictor.leaderboard()
            best_model = model_info.iloc[0]['model'] if not model_info.empty else 'Unknown'
            leaderboard_records = model_info.to_dict('records') if not model_info.empty else []
        except Exception as e:
            print(f"‚ö†Ô∏è Error obteniendo leaderboard: {e}")
            best_model = 'Unknown'
            leaderboard_records = []

        models_history.append({
            'iteration': iteration,
            'score': kaggle_score,
            'training_time': training_time,
            'best_model': best_model,
            'leaderboard': leaderboard_records
        })

        print(f"ü•á Mejor modelo local: {best_model}")

        # Guardar progreso
        progress_data = {
            'scores_history': scores_history,
            'models_history': models_history,
            'best_score': best_score,
            'best_iteration': best_iteration,
            'last_updated': datetime.now().isoformat()
        }

        try:
            with open(f'iteration_progress_{datetime.now().strftime("%Y%m%d")}.json', 'w') as f:
                json.dump(progress_data, f, indent=2, default=str)
            print(f"üíæ Progreso guardado exitosamente")
        except Exception as e:
            print(f"‚ö†Ô∏è Error guardando progreso: {e}")

    except Exception as e:
        print(f"‚ùå Error en iteraci√≥n {iteration}: {e}")
        scores_history.append(None)
        models_history.append({
            'iteration': iteration,
            'score': None,
            'training_time': 0,
            'best_model': 'Error',
            'error': str(e)
        })
        continue

üöÄ Iniciando bucle iterativo de mejora de modelo

üîÑ ITERACI√ìN 1/80
----------------------------------------


Beginning AutoGluon training... Time limit = 3600s
AutoGluon will save models to 'G:\Mi unidad\Maestr√≠a\Data Science\Laboratorio de Implementaci√≥n III\Proyectos\labo3-2025v\AutogluonModels\iteration_1'


üéØ PRIMERA ITERACI√ìN - Entrenamiento con configuraci√≥n por defecto
üìã Usando modelos base de AutoGluon sin hiperpar√°metros espec√≠ficos
‚è∞ Tiempo de entrenamiento inicial: 1.0 hora
üïê Tiempo estimado de finalizaci√≥n: 17:29:44
üìÖ Fecha estimada de finalizaci√≥n: 2025-07-20


AutoGluon Version:  1.3.1
Python Version:     3.12.6
Operating System:   Windows
Platform Machine:   AMD64
Platform Version:   10.0.26100
CPU Count:          12
GPU Count:          0
Memory Avail:       4.91 GB / 15.71 GB (31.2%)
Disk Space Avail:   20.20 GB / 100.00 GB (20.2%)

Fitting with arguments:
{'enable_ensemble': True,
 'eval_metric': MASE,
 'freq': 'MS',
 'hyperparameters': 'default',
 'known_covariates_names': [],
 'num_val_windows': 1,
 'prediction_length': 2,
 'quantile_levels': [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9],
 'random_seed': 123,
 'refit_every_n_windows': 1,
 'refit_full': False,
 'skip_model_selection': False,
 'target': 'tn',
 'time_limit': 3600,
 'verbosity': 2}

train_data with frequency 'IRREG' has been resampled to frequency 'MS'.
Provided train_data has 22375 rows (NaN fraction=0.1%), 780 time series. Median time series length is 36 (min=4, max=36). 
	Removing 46 short time series from train_data. Only series with length >= 7 will be used for trainin

In [None]:
# üìä 7. Resumen final
print("\n" + "=" * 60)
print("üìä RESUMEN FINAL DE MEJORAS")
print("=" * 60)

for i, score in enumerate(scores_history, 1):
    if score:
        status = "üèÜ MEJOR" if i == best_iteration else ""
        print(f"Iteraci√≥n {i}: {score} {status}")
    else:
        print(f"Iteraci√≥n {i}: Sin score")

if best_iteration > 0:
    improvement = scores_history[0] - best_score if scores_history[0] else 0
    print(f"\nüéØ Mejor resultado: Iteraci√≥n {best_iteration} con score {best_score}")
    if improvement > 0:
        print(f"üìà Mejora total: {improvement:.6f}")
else:
    print("\n‚ö†Ô∏è No se pudo determinar el mejor modelo")

print(f"\nüìÅ Progreso guardado en: iteration_progress_{datetime.now().strftime('%Y%m%d')}.json")
