# APRENDIZAJE PROFUNDO Y SERIES TEMPORALES

## por: Marco Cajamarca, Adrian Campoverde y Pablo Bravo

A continuaci√≥n, se desarrollar√° una funci√≥n que utiliza una para predecir la demanda de productos a partir de datos hist√≥ricos reales. Este enfoque permitir√° anticipar las necesidades de inventario y tomar decisiones informadas basadas en el comportamiento temporal de las ventas. 

`source ~/tf-env/bin/activate`
`mlflow ui --backend-store-uri file:mlruns`

In [None]:
# Imports
import pandas as pd
from pathlib import Path
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error, mean_absolute_error
import matplotlib.pyplot as plt
import numpy as np
from datetime import datetime, timedelta
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Embedding, Concatenate
from IPython.display import display
import mlflow
import joblib
import os


# Configuracion de mlflow

In [None]:
notebook_dir = os.path.dirname(os.path.abspath(__file__)) if '__file__' in globals() else os.getcwd()
mlflow_tracking_dir = os.path.join(notebook_dir, 'mlruns')

os.makedirs(mlflow_tracking_dir, exist_ok=True)

mlflow.set_tracking_uri(f'file://{mlflow_tracking_dir}')

experiment_name = 'stock_demand_forecasting'
mlflow.set_experiment(experiment_name)

# Obtener informaci√≥n del experimento
experiment = mlflow.get_experiment_by_name(experiment_name)
print(f"Experimento: {experiment_name}")
print(f"Tracking URI: {mlflow.get_tracking_uri()}")
print(f"Directorio MLflow: {mlflow_tracking_dir}")
print(f"Experiment ID: {experiment.experiment_id}")

mlflow.keras.autolog(log_models=True, log_datasets=True, disable=False, exclusive=False)

print("\n‚úÖ MLflow configurado correctamente")
print("üí° Para ver la UI, ejecuta en terminal: mlflow ui --backend-store-uri file://./mlruns")

### configuracion b√°sica de tensorflow para uso optimo de gpu

In [None]:
gpus = tf.config.list_physical_devices('GPU')
if gpus:
    try:
        for g in gpus:
            tf.config.experimental.set_memory_growth(g, True)
    except Exception as e:
        print("GPU config error:", e)

# Habilitar XLA JIT para acelerar operaciones
tf.config.optimizer.set_jit(True)

# Ajustar hilos para aprovechar CPU en preprocesamiento
ncpu = os.cpu_count() or 4
tf.config.threading.set_intra_op_parallelism_threads(ncpu)
tf.config.threading.set_inter_op_parallelism_threads(ncpu)


# Fase 1:
An√°lisis y Preparaci√≥n del Dataset

Objetivo:
Cargar, explorar y preparar el dataset para el entrenamiento de modelos de aprendizaje profundo.
En esta fase se realiza una inspecci√≥n inicial de los datos, identificaci√≥n de valores faltantes, an√°lisis de las variables y creaci√≥n de caracter√≠sticas temporales relevantes para el modelado de series temporales.

In [None]:
# Cargar el archivo CSV real
ruta = Path('practica_completo.csv')
df = pd.read_csv(ruta)

# Mostrar columnas y primeras filas
print("Columnas:", df.columns.tolist())
display(df.head())

# Tipos de datos y valores faltantes
print("\nTipos de datos:")
display(df.dtypes)
print("\nValores faltantes por columna:")
display(df.isnull().sum())

# Mostrar rango de fechas del dataset
print("Primer registro:", df['created_at'].min())
print("√öltimo registro:", df['created_at'].max())

In [None]:
# Eliminar filas con valores nulos cr√≠ticos
df = df.dropna(subset=['created_at', 'product_id', 'salida'])

# Eliminar duplicados si existen
df = df.drop_duplicates()

# Convertir fechas a datetime
df['created_at'] = pd.to_datetime(df['created_at'])
df['last_order_date'] = pd.to_datetime(df['last_order_date'], errors='coerce')

# Revisar valores extremos en ventas
print("Ventas (salida) - resumen estad√≠stico:")
display(df['salida'].describe())

In [None]:
# Crear variables temporales
df['dia_semana'] = df['created_at'].dt.dayofweek
df['mes'] = df['created_at'].dt.month
df['fin_semana'] = df['dia_semana'].isin([5,6]).astype(int)

# Feriados (ajusta seg√∫n tu pa√≠s)
feriados = [
    '2024-01-01', '2024-02-12', '2024-02-13', '2024-03-29', '2024-05-01',
    '2024-05-24', '2024-08-10', '2024-10-09', '2024-11-02', '2024-11-03', '2024-12-25'
]
df['fecha'] = df['created_at'].dt.date.astype(str)
df['feriado'] = df['fecha'].isin(feriados).astype(int)

# Antig√ºedad del producto (en d√≠as)
df['antiguedad_producto'] = (df['created_at'] - df.groupby('product_id')['created_at'].transform('min')).dt.days

# Ratio vendida/stock (si aplica)
df['ratio_vendida_stock'] = df['salida'] / (df['quantity_on_hand'] + 1e-6)

# Mostrar ejemplo
display(df.head())

In [None]:
# Variables a usar en la secuencia
features = ['salida', 'dia_semana', 'mes', 'fin_semana', 'feriado', 'quantity_on_hand', 'unit_cost']
ventana = 7  # d√≠as de historial

def crear_ventanas_con_producto(df, features, ventana=7):
    """Crea secuencias manteniendo el product_id y prediciendo stock"""
    X_seq, y_stock, product_ids, fechas = [], [], [], []
    
    for product_id, grupo in df.groupby('product_id'):
        grupo = grupo.sort_values('created_at')
        datos = grupo[features].values
        stock = grupo['quantity_on_hand'].values
        fechas_grupo = grupo['created_at'].values
        
        for i in range(len(datos) - ventana):
            X_seq.append(datos[i:i+ventana])
            y_stock.append(stock[i+ventana])
            product_ids.append(product_id)
            fechas.append(fechas_grupo[i+ventana])
    
    return np.array(X_seq), np.array(y_stock), np.array(product_ids), np.array(fechas)

X_seq, y_seq, product_ids, fechas = crear_ventanas_con_producto(df, features, ventana=ventana)
print("Forma de X_seq:", X_seq.shape)
print("Forma de y_seq (stock):", y_seq.shape)
print("Productos √∫nicos:", len(np.unique(product_ids)))


# Fase 2:
## Desarrollo y Entrenamiento del Modelo

### Objetivo:
Implementar un modelo de Deep Learning usando RNN (por ejemplo, LSTM o GRU) para predecir la demanda futura.

Limpieza y normalizacion de datos

In [None]:
from sklearn.preprocessing import RobustScaler
from scipy import stats

n_samples, ventana, n_features = X_seq.shape

# Filtrar productos con stock muy bajo o cero
print(f"üìä Filtrando datos con stock bajo...")
print(f"   Muestras originales: {len(y_seq)}")
mask_stock_valido = y_seq >= 10  # Solo stock >= 10 unidades
X_seq_filtrado = X_seq[mask_stock_valido]
y_seq_filtrado = y_seq[mask_stock_valido]
product_ids_filtrado = product_ids[mask_stock_valido]
print(f"   Muestras despu√©s de filtrar (stock >= 10): {len(y_seq_filtrado)}")
print(f"   Removidos: {len(y_seq) - len(y_seq_filtrado)} ({(len(y_seq) - len(y_seq_filtrado))/len(y_seq)*100:.2f}%)")

# Transformaci√≥n logar√≠tmica del target para mejorar distribuci√≥n
y_seq_log = np.log1p(y_seq_filtrado)  # log(1 + x) para evitar log(0)

# Codificar product_ids
le = LabelEncoder()
product_ids_encoded = le.fit_transform(product_ids_filtrado)
joblib.dump(le, 'product_encoder.joblib')

# Normalizar secuencias
scaler = RobustScaler()
X_seq_reshaped = X_seq_filtrado.reshape(-1, n_features)
X_seq_scaled = scaler.fit_transform(np.nan_to_num(X_seq_reshaped, nan=0))
X_seq_scaled = X_seq_scaled.reshape(-1, ventana, n_features)

# Split inicial con target logar√≠tmico
X_train_raw, X_val, y_train_log_raw, y_val_log, pid_train_raw, pid_val = train_test_split(
    X_seq_scaled, y_seq_log, product_ids_encoded, test_size=0.2, random_state=42
)

# Eliminar outliers en escala logar√≠tmica (m√°s suave)
z_scores = np.abs(stats.zscore(y_train_log_raw))
mask_no_outliers = z_scores < 3.5
X_train = X_train_raw[mask_no_outliers]
y_train_log = y_train_log_raw[mask_no_outliers]
pid_train = pid_train_raw[mask_no_outliers]

outliers_removed = len(y_train_log_raw) - len(y_train_log)
print(f"\nüìä Limpieza de outliers:")
print(f"   Outliers removidos: {outliers_removed} ({outliers_removed/len(y_train_log_raw)*100:.2f}%)")
print(f"   Train: {len(y_train_log)}, Val: {len(y_val_log)}")
print(f"   Stock (escala log) - Min: {y_train_log.min():.3f}, Max: {y_train_log.max():.3f}, Media: {y_train_log.mean():.3f}")
print(f"   Stock (escala real) - Min: {np.expm1(y_train_log).min():.1f}, Max: {np.expm1(y_train_log).max():.1f}")


# Creaci√≥n del modelo con embedding de productos


In [None]:
n_productos = len(df['product_id'].unique())
embedding_dim = 32  # Baseline dimension

# Input de secuencia temporal
seq_input = keras.layers.Input(shape=(X_train.shape[1], X_train.shape[2]), name='sequence')
product_input = keras.layers.Input(shape=(1,), name='product_id')

# Embedding del producto
product_embedding = Embedding(
    input_dim=n_productos + 1,
    output_dim=embedding_dim,
    name='product_embedding'
)(product_input)
product_embedding = keras.layers.Flatten()(product_embedding)

# Procesamiento de secuencia temporal - arquitectura baseline simplificada
x = keras.layers.Bidirectional(keras.layers.GRU(
    128, 
    return_sequences=True,
    kernel_regularizer=keras.regularizers.l2(0.0001)
))(seq_input)
x = keras.layers.BatchNormalization()(x)
x = keras.layers.Dropout(0.3)(x)

x = keras.layers.Bidirectional(keras.layers.GRU(
    64, 
    return_sequences=False,
    kernel_regularizer=keras.regularizers.l2(0.0001)
))(x)
x = keras.layers.BatchNormalization()(x)
x = keras.layers.Dropout(0.2)(x)

# Combinar informaci√≥n de producto + secuencia temporal
combined = Concatenate()([x, product_embedding])

# Capas densas
x = keras.layers.Dense(128, activation='relu', kernel_regularizer=keras.regularizers.l2(0.0001))(combined)
x = keras.layers.BatchNormalization()(x)
x = keras.layers.Dropout(0.2)(x)
x = keras.layers.Dense(64, activation='relu')(x)

# Output en escala logar√≠tmica
output = keras.layers.Dense(1, name='stock_log_predicho')(x)

model = keras.Model(inputs=[seq_input, product_input], outputs=output)

# Custom weighted loss que da m√°s importancia a valores altos de stock
@tf.function
def weighted_huber_loss(y_true, y_pred, delta=1.0, high_stock_threshold=5.3):
    """
    Huber loss con pesos adaptativos basados en el valor del stock (en escala log)
    high_stock_threshold en escala log: log1p(200) ‚âà 5.3
    """
    # Calcular error
    error = y_true - y_pred
    abs_error = tf.abs(error)
    
    # Huber loss b√°sico
    quadratic = tf.minimum(abs_error, delta)
    linear = abs_error - quadratic
    loss = 0.5 * quadratic**2 + delta * linear
    
    # Calcular pesos adaptativos: mayor peso para stock alto
    # Stock alto (log >= 5.3): peso 2.5x
    # Stock medio (log 3.9-5.3): peso 1.5x  
    # Stock bajo (log < 3.9): peso 1.0x
    weights = tf.where(
        y_true >= high_stock_threshold,
        2.5,  # Stock >= 200 unidades (log1p(200) ‚âà 5.3)
        tf.where(
            y_true >= 3.9,  # Stock >= 50 unidades (log1p(50) ‚âà 3.9)
            1.5,
            1.0
        )
    )
    
    # Aplicar pesos a la loss
    weighted_loss = loss * weights
    
    return tf.reduce_mean(weighted_loss)

# Learning rate schedule m√°s conservador
initial_learning_rate = 0.001
lr_schedule = keras.optimizers.schedules.CosineDecayRestarts(
    initial_learning_rate=initial_learning_rate,
    first_decay_steps=100,
    t_mul=2.0,
    m_mul=0.9,
    alpha=0.0001
)

optimizer = keras.optimizers.Adam(
    learning_rate=lr_schedule,
    clipnorm=1.0
)

# Compilar con loss personalizada
model.compile(
    optimizer=optimizer, 
    loss=weighted_huber_loss,
    metrics=['mae', keras.metrics.RootMeanSquaredError(name='rmse')]
)

# Callbacks
early_stopping = keras.callbacks.EarlyStopping(
    monitor='val_loss', 
    patience=25,
    restore_best_weights=True,
    verbose=1,
    min_delta=1e-5,
    mode='min'
)

model_checkpoint = keras.callbacks.ModelCheckpoint(
    'best_model_v2.keras',
    monitor='val_loss',
    save_best_only=True,
    save_weights_only=False,
    mode='min',
    verbose=1
)

tensorboard = keras.callbacks.TensorBoard(
    log_dir='./logs',
    histogram_freq=1,
    write_graph=True,
    update_freq='epoch'
)

run_params = {
    'ventana': ventana,
    'n_features': n_features,
    'n_productos': n_productos,
    'embedding_dim': embedding_dim,
    'architecture': 'Baseline_BiGRU_WeightedLoss',
    'total_params': model.count_params(),
    'optimizer': 'adam_with_cosine_decay',
    'initial_learning_rate': initial_learning_rate,
    'loss_function': 'weighted_huber',
    'loss_weights': 'high_stock_2.5x_medium_1.5x_low_1.0x',
    'target_transform': 'log1p',
    'output_activation': 'linear',
    'scaler': 'RobustScaler',
    'outlier_removal': 'z_score_3.5',
    'min_stock_threshold': 10,
    'outliers_removed': outliers_removed,
    'batch_size': 256,
    'epochs': 150,
    'prediction_target': 'quantity_on_hand_log',
    'enhancements': 'weighted_loss_for_high_stock+batch_norm'
}

with mlflow.start_run(run_name=f'stock_weighted_{datetime.now().strftime("%Y%m%d_%H%M%S")}') as run:
    mlflow.log_params(run_params)
    mlflow.log_param('train_samples', len(X_train))
    mlflow.log_param('val_samples', len(X_val))
    
    model_summary = []
    model.summary(print_fn=lambda x: model_summary.append(x))
    model_summary_str = '\n'.join(model_summary)
    
    with open('model_summary.txt', 'w') as f:
        f.write(model_summary_str)
    mlflow.log_artifact('model_summary.txt')
    
    print(f"\nRun ID: {run.info.run_id}")
    print(f"Estrategia: Weighted Loss - Stock alto (>=200) peso 2.5x, medio (50-200) peso 1.5x")
    
    history = model.fit(
        [X_train, pid_train],
        y_train_log,
        validation_data=([X_val, pid_val], y_val_log),
        epochs=run_params['epochs'],
        batch_size=run_params['batch_size'],
        callbacks=[early_stopping, model_checkpoint, tensorboard],
        verbose=1,
        shuffle=True
    )
    
    scaler_path = 'scaler.joblib'
    joblib.dump(scaler, scaler_path)
    mlflow.log_artifact(scaler_path)
    mlflow.log_artifact('product_encoder.joblib')
    
    if os.path.exists('best_model_v2.keras'):
        mlflow.log_artifact('best_model_v2.keras')
    
    fig, axes = plt.subplots(2, 2, figsize=(15, 10))
    
    axes[0, 0].plot(history.history['loss'], label='Train Loss', linewidth=2)
    axes[0, 0].plot(history.history['val_loss'], label='Val Loss', linewidth=2)
    axes[0, 0].set_title('Model Loss (Weighted Huber en escala log)')
    axes[0, 0].set_xlabel('Epoch')
    axes[0, 0].set_ylabel('Loss')
    axes[0, 0].legend()
    axes[0, 0].grid(True, alpha=0.3)
    
    axes[0, 1].plot(history.history['mae'], label='Train MAE', linewidth=2)
    axes[0, 1].plot(history.history['val_mae'], label='Val MAE', linewidth=2)
    axes[0, 1].set_title('Mean Absolute Error (escala log)')
    axes[0, 1].set_xlabel('Epoch')
    axes[0, 1].set_ylabel('MAE')
    axes[0, 1].legend()
    axes[0, 1].grid(True, alpha=0.3)
    
    axes[1, 0].plot(history.history['rmse'], label='Train RMSE', linewidth=2)
    axes[1, 0].plot(history.history['val_rmse'], label='Val RMSE', linewidth=2)
    axes[1, 0].set_title('RMSE (escala log)')
    axes[1, 0].set_xlabel('Epoch')
    axes[1, 0].set_ylabel('RMSE')
    axes[1, 0].legend()
    axes[1, 0].grid(True, alpha=0.3)
    
    axes[1, 1].text(0.5, 0.5, 
                   f'GRU Bidireccional Baseline\n{n_productos} productos\nEmbedding: {embedding_dim}D\nTarget: log1p(stock)\nWeighted Huber Loss\nAlto: 2.5x | Medio: 1.5x | Bajo: 1.0x', 
                   ha='center', va='center', transform=axes[1, 1].transAxes, fontsize=10)
    axes[1, 1].set_title('Configuraci√≥n del Modelo')
    axes[1, 1].axis('off')
    
    plt.tight_layout()
    plt.savefig('training_history.png', dpi=150, bbox_inches='tight')
    mlflow.log_artifact('training_history.png')
    plt.show()


In [None]:
# Evaluar el modelo
print("üî¨ Evaluando modelo en conjunto de validaci√≥n...")
y_pred_log = model.predict([X_val, pid_val], batch_size=256)
y_pred_log = np.asarray(y_pred_log).ravel().astype(np.float32)

# Convertir de escala logar√≠tmica a escala real
y_pred = np.expm1(y_pred_log)  # Inversa de log1p
y_val_real = np.expm1(y_val_log)

# Asegurar que no hay predicciones negativas
y_pred = np.maximum(y_pred, 0)

# Calcular m√©tricas en escala real
rmse = np.sqrt(mean_squared_error(y_val_real, y_pred))
mae = mean_absolute_error(y_val_real, y_pred)
median_ae = np.median(np.abs(y_val_real - y_pred))

# MAPE solo para stock >= 10
threshold = 10
mask_mape = y_val_real >= threshold
if np.sum(mask_mape) > 0:
    mape = np.mean(np.abs((y_val_real[mask_mape] - y_pred[mask_mape]) / y_val_real[mask_mape])) * 100
else:
    mape = 0.0

# R¬≤
r2 = 1 - (np.sum((y_val_real - y_pred)**2) / np.sum((y_val_real - y_val_real.mean())**2))

# M√©tricas por rangos de stock
mask_bajo = (y_val_real >= 10) & (y_val_real < 50)
mask_medio = (y_val_real >= 50) & (y_val_real < 200)
mask_alto = y_val_real >= 200

print(f"\nüìä M√©tricas Finales (Predicci√≥n de Stock):")
print(f"  RMSE: {rmse:.2f}")
print(f"  MAE: {mae:.2f}")
print(f"  Median AE: {median_ae:.2f}")
print(f"  MAPE (stock >= {threshold}): {mape:.2f}%")
print(f"  R¬≤: {r2:.4f}")
print(f"\nüìà Precisi√≥n por rango:")
if np.sum(mask_bajo) > 0:
    mape_bajo = np.mean(np.abs((y_val_real[mask_bajo] - y_pred[mask_bajo]) / y_val_real[mask_bajo])) * 100
    print(f"  Stock bajo (10-50): MAPE={mape_bajo:.2f}% | N={np.sum(mask_bajo)}")
if np.sum(mask_medio) > 0:
    mape_medio = np.mean(np.abs((y_val_real[mask_medio] - y_pred[mask_medio]) / y_val_real[mask_medio])) * 100
    print(f"  Stock medio (50-200): MAPE={mape_medio:.2f}% | N={np.sum(mask_medio)}")
if np.sum(mask_alto) > 0:
    mape_alto = np.mean(np.abs((y_val_real[mask_alto] - y_pred[mask_alto]) / y_val_real[mask_alto])) * 100
    print(f"  Stock alto (>=200): MAPE={mape_alto:.2f}% | N={np.sum(mask_alto)}")

print(f"\nüîç An√°lisis de predicciones:")
print(f"  Rango predicciones: [{y_pred.min():.1f}, {y_pred.max():.1f}]")
print(f"  Rango reales: [{y_val_real.min():.1f}, {y_val_real.max():.1f}]")
print(f"  Media predicciones: {y_pred.mean():.1f}")
print(f"  Media reales: {y_val_real.mean():.1f}")

try:
    with mlflow.start_run(run_id=run.info.run_id):
        mlflow.log_metric('final_rmse', float(rmse))
        mlflow.log_metric('final_mae', float(mae))
        mlflow.log_metric('final_median_ae', float(median_ae))
        mlflow.log_metric('final_mape', float(mape))
        mlflow.log_metric('final_r2', float(r2))
        
        fig, axes = plt.subplots(2, 2, figsize=(16, 10))
        
        # Predicci√≥n vs Real
        axes[0, 0].plot(y_val_real[:100], 'o-', label='Real', alpha=0.7, markersize=4)
        axes[0, 0].plot(y_pred[:100], 's-', label='Predicci√≥n', alpha=0.7, markersize=3)
        axes[0, 0].set_title('Predicci√≥n vs Valor Real (Stock) - Primeros 100')
        axes[0, 0].set_xlabel('Ejemplo')
        axes[0, 0].set_ylabel('Stock (unidades)')
        axes[0, 0].legend()
        axes[0, 0].grid(True, alpha=0.3)
        
        # Scatter plot
        axes[0, 1].scatter(y_val_real, y_pred, alpha=0.3, s=10)
        axes[0, 1].plot([y_val_real.min(), y_val_real.max()], [y_val_real.min(), y_val_real.max()], 
                     'r--', lw=2, label='Predicci√≥n Perfecta')
        axes[0, 1].set_xlabel('Stock Real')
        axes[0, 1].set_ylabel('Stock Predicho')
        axes[0, 1].set_title(f'Correlaci√≥n (R¬≤={r2:.3f}, MAPE={mape:.1f}%)')
        axes[0, 1].legend()
        axes[0, 1].grid(True, alpha=0.3)
        
        # Distribuci√≥n de residuos
        residuos = y_val_real - y_pred
        axes[1, 0].hist(residuos, bins=50, edgecolor='black', alpha=0.7, color='steelblue')
        axes[1, 0].axvline(x=0, color='r', linestyle='--', linewidth=2, label='Error = 0')
        axes[1, 0].axvline(x=np.median(residuos), color='green', linestyle='--', linewidth=2, 
                          label=f'Mediana={np.median(residuos):.1f}')
        axes[1, 0].set_title(f'Distribuci√≥n de Residuos (Œº={residuos.mean():.1f}, œÉ={residuos.std():.1f})')
        axes[1, 0].set_xlabel('Residuo (Real - Predicci√≥n)')
        axes[1, 0].set_ylabel('Frecuencia')
        axes[1, 0].legend()
        axes[1, 0].grid(True, alpha=0.3)
        
        # Error porcentual absoluto
        error_pct = np.abs((y_val_real - y_pred) / (y_val_real + 1)) * 100
        error_pct_filtrado = error_pct[error_pct < 100]
        axes[1, 1].hist(error_pct_filtrado, bins=50, edgecolor='black', alpha=0.7, color='coral')
        axes[1, 1].axvline(x=np.median(error_pct_filtrado), color='darkred', 
                          linestyle='--', linewidth=2, label=f'Mediana={np.median(error_pct_filtrado):.1f}%')
        axes[1, 1].axvline(x=np.mean(error_pct_filtrado), color='darkblue', 
                          linestyle='--', linewidth=2, label=f'Media={np.mean(error_pct_filtrado):.1f}%')
        axes[1, 1].set_title(f'Error Porcentual Absoluto (< 100%)')
        axes[1, 1].set_xlabel('Error %')
        axes[1, 1].set_ylabel('Frecuencia')
        axes[1, 1].legend()
        axes[1, 1].grid(True, alpha=0.3)
        
        plt.tight_layout()
        plt.savefig('prediction_analysis.png', dpi=150, bbox_inches='tight')
        mlflow.log_artifact('prediction_analysis.png')
        plt.show()
        
        print(f"\n‚úÖ M√©tricas guardadas en MLflow (Run ID: {run.info.run_id})")
        
except Exception as e:
    print(f'‚ö†Ô∏è Error al registrar m√©tricas: {e}')


# Funci√≥n de Predicci√≥n para Uso en Producci√≥n

In [None]:
import numpy as np
import pandas as pd
from datetime import datetime, timedelta

def predecir_stock_futuro(model, scaler, label_encoder, df, product_id, fecha_objetivo, ventana=7):
    """
    Predice el stock para un producto en una fecha espec√≠fica
    
    Args:
        model: Modelo entrenado (predice en escala log)
        scaler: RobustScaler ajustado
        label_encoder: LabelEncoder para product_ids
        df: DataFrame con datos hist√≥ricos
        product_id: ID del producto
        fecha_objetivo: Fecha para la predicci√≥n (datetime o string)
        ventana: D√≠as de historial necesarios (default: 7)
    
    Returns:
        dict con product_id, fecha, stock_predicho, stock_actual
    """
    if isinstance(fecha_objetivo, str):
        fecha_objetivo = pd.to_datetime(fecha_objetivo)
    
    # Filtrar datos del producto
    df_producto = df[df['product_id'] == product_id].sort_values('created_at')
    
    if len(df_producto) == 0:
        raise ValueError(f"Producto {product_id} no encontrado")
    
    # Obtener √∫ltimos 'ventana' d√≠as antes de la fecha objetivo
    datos_recientes = df_producto[df_producto['created_at'] < fecha_objetivo].tail(ventana)
    
    if len(datos_recientes) < ventana:
        raise ValueError(f"No hay suficiente historial para producto {product_id} (necesita {ventana} d√≠as)")
    
    # Preparar input de secuencia
    X_input = datos_recientes[features].values.reshape(1, ventana, -1)
    X_scaled = scaler.transform(X_input.reshape(-1, len(features))).reshape(1, ventana, -1)
    
    # Preparar input de product_id
    try:
        product_id_encoded = label_encoder.transform([product_id])[0]
    except ValueError:
        raise ValueError(f"Producto {product_id} no fue visto durante el entrenamiento")
    
    product_id_array = np.array([[product_id_encoded]])
    
    # Predecir en escala logar√≠tmica y convertir a escala real
    stock_log_predicho = model.predict([X_scaled, product_id_array], verbose=0)[0][0]
    stock_predicho = np.expm1(stock_log_predicho)  # Inversa de log1p
    
    return {
        'product_id': product_id,
        'fecha': fecha_objetivo,
        'stock_predicho': max(0, float(stock_predicho)),
        'stock_actual': float(datos_recientes['quantity_on_hand'].iloc[-1]),
        'ultima_fecha_datos': datos_recientes['created_at'].iloc[-1]
    }

# Ejemplo de uso
print("\n" + "="*60)
print("EJEMPLO DE PREDICCI√ìN")
print("="*60)

# Seleccionar un producto aleatorio
producto_ejemplo = df['product_id'].value_counts().index[0]
fecha_futura = datetime.now() + timedelta(days=3)

try:
    resultado = predecir_stock_futuro(
        model=model,
        scaler=scaler,
        label_encoder=le,
        df=df,
        product_id=producto_ejemplo,
        fecha_objetivo=fecha_futura,
        ventana=ventana
    )
    
    print(f"\nüì¶ Producto ID: {resultado['product_id']}")
    print(f"üìÖ Fecha de predicci√≥n: {resultado['fecha'].strftime('%Y-%m-%d')}")
    print(f"üìä Stock actual (√∫ltimo dato): {resultado['stock_actual']:.0f} unidades")
    print(f"üîÆ Stock predicho: {resultado['stock_predicho']:.0f} unidades")
    print(f"üìå √öltima fecha con datos: {resultado['ultima_fecha_datos'].strftime('%Y-%m-%d')}")
    
    diferencia = resultado['stock_predicho'] - resultado['stock_actual']
    if diferencia > 0:
        print(f"üìà Tendencia: +{diferencia:.0f} unidades")
    else:
        print(f"üìâ Tendencia: {diferencia:.0f} unidades")
    
except Exception as e:
    print(f"‚ö†Ô∏è Error: {e}")


# Predicci√≥n para M√∫ltiples Productos

In [None]:
def predecir_stock_multiple(model, scaler, label_encoder, df, product_ids, fecha_objetivo, ventana=7):
    """
    Predice stock para m√∫ltiples productos
    
    Args:
        product_ids: Lista de product_ids
        fecha_objetivo: Fecha para predicci√≥n
    
    Returns:
        DataFrame con predicciones
    """
    resultados = []
    
    for pid in product_ids:
        try:
            res = predecir_stock_futuro(model, scaler, label_encoder, df, pid, fecha_objetivo, ventana)
            resultados.append(res)
        except Exception as e:
            print(f"‚ö†Ô∏è Error con producto {pid}: {e}")
    
    return pd.DataFrame(resultados)

# Ejemplo: predecir para los 5 productos m√°s vendidos
top_productos = df['product_id'].value_counts().head(5).index.tolist()
fecha_prediccion = datetime.now() + timedelta(days=7)

print(f"\nüîÆ Predicci√≥n de stock para {len(top_productos)} productos")
print(f"üìÖ Fecha objetivo: {fecha_prediccion.strftime('%Y-%m-%d')}")
print("-" * 80)

predicciones_df = predecir_stock_multiple(
    model=model,
    scaler=scaler,
    label_encoder=le,
    df=df,
    product_ids=top_productos,
    fecha_objetivo=fecha_prediccion,
    ventana=7
)

display(predicciones_df)

# Visualizaci√≥n
if len(predicciones_df) > 0:
    fig, ax = plt.subplots(figsize=(12, 6))
    
    x = np.arange(len(predicciones_df))
    width = 0.35
    
    ax.bar(x - width/2, predicciones_df['stock_actual'], width, label='Stock Actual', alpha=0.8)
    ax.bar(x + width/2, predicciones_df['stock_predicho'], width, label='Stock Predicho', alpha=0.8)
    
    ax.set_xlabel('Producto ID')
    ax.set_ylabel('Stock')
    ax.set_title(f'Predicci√≥n de Stock para {fecha_prediccion.strftime("%Y-%m-%d")}')
    ax.set_xticks(x)
    ax.set_xticklabels(predicciones_df['product_id'], rotation=45)
    ax.legend()
    ax.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.savefig('multi_product_prediction.png', dpi=150, bbox_inches='tight')
    plt.show()
