In [None]:
# ‚öôÔ∏è Preparaci√≥n de entorno y rutas
# Si esta celda tarda demasiado o se cuelga:
# 1) Abre la paleta de comandos (Ctrl+Shift+P)
# 2) "Jupyter: Restart Kernel"
# 3) "Run All Above/Below" o ejecuta desde la primera celda

import sys
from pathlib import Path

# Detectar ra√≠z del repo (buscando pyproject.toml o carpeta src)
_candidates = [Path.cwd(), *Path.cwd().parents]
_repo_root = None
for _p in _candidates:
    if (_p / 'pyproject.toml').exists() or (_p / 'src').exists():
        _repo_root = _p
        break
if _repo_root is None:
    _repo_root = Path.cwd()

if str(_repo_root) not in sys.path:
    sys.path.insert(0, str(_repo_root))

print(f"‚úÖ Entorno listo. Ra√≠z del repo: {_repo_root}")

# DS-02: An√°lisis de Estacionalidad y Tendencias en Demanda

## üìã Contexto del Caso de Negocio

**Empresa:** "RetailFlow Analytics" - Cadena de retail omnicanal con 120 tiendas f√≠sicas y plataforma eCommerce, facturaci√≥n anual $280M.

**Situaci√≥n:** El equipo de S&OP enfrenta desaf√≠os cr√≠ticos en planificaci√≥n de demanda:
- **Forecast impreciso:** Error MAPE del 35% en meses con eventos especiales
- **Stockouts:** 18% en temporada alta (Black Friday, Navidad) por subestimaci√≥n
- **Overstock:** 22% post-temporada por no anticipar ca√≠da de demanda
- **Variabilidad por canal:** Online crece 15% mensual, tiendas f√≠sicas decrecen 3%
- **Impacto financiero:** $8.2M anuales en costos de inventario excesivo y ventas perdidas

**Objetivo:** Implementar un **sistema de an√°lisis de estacionalidad** que:
- Descomponga series temporales en tendencia, estacionalidad y residuos
- Identifique patrones estacionales por canal (online, retail, wholesale)
- Cuantifique magnitud de picos estacionales (√≠ndices de estacionalidad)
- Genere pron√≥sticos ajustados por estacionalidad (reducir MAPE a <20%)

---

## üéØ Qu√© - Por qu√© - Para qu√© - Cu√°ndo - C√≥mo

### ‚ùì ¬øQU√â estamos haciendo?
Construyendo un **sistema de detecci√≥n y cuantificaci√≥n de estacionalidad** que:
- **Descompone series temporales:** Usando STL (Seasonal-Trend decomposition using LOESS)
- **Detecta patrones:** Estacionalidad semanal (fin de semana), mensual (quincenas) y anual (temporadas)
- **Cuantifica magnitud:** √çndices de estacionalidad (% sobre media anual)
- **Visualiza componentes:** Gr√°ficos de tendencia, estacionalidad y residuos
- **Genera pron√≥sticos:** Forecast baseline ajustado por componente estacional

**Componentes de an√°lisis:**
1. **Tendencia:** Direcci√≥n de largo plazo (crecimiento/decrecimiento)
2. **Estacionalidad:** Patrones repetitivos (diario, semanal, mensual, anual)
3. **Residuos:** Variaci√≥n no explicada (eventos aleatorios, promociones)

### üîç ¬øPOR QU√â es importante?
- **Precisi√≥n de forecast:** Modelos con estacionalidad reducen error 40-60%
- **Optimizaci√≥n de inventario:** Ajustar stock de seguridad por temporada
- **Planificaci√≥n de capacidad:** Staffing, almacenes, transporte
- **Estrategia comercial:** Timing de promociones alineado con picos naturales

### üéÅ ¬øPARA QU√â sirve?
- **S&OP mejorado:** Planes de demanda m√°s precisos por canal y categor√≠a
- **Gesti√≥n de inventario:** Safety stock variable seg√∫n estacionalidad
- **Pricing din√°mico:** Precios premium en temporada alta
- **Marketing efectivo:** Campa√±as en momentos de mayor receptividad
- **Supply chain resiliente:** Anticipar picos y valles de demanda

### ‚è∞ ¬øCU√ÅNDO aplicarlo?
- **Ciclo S&OP mensual:** Actualizar pron√≥sticos con √∫ltimos datos
- **Pre-temporadas:** Antes de Black Friday, Navidad, Back to School
- **Nuevos SKUs:** Transferir patrones de productos similares
- **Cambios de canal:** Analizar estacionalidad de online vs offline
- **Post-promociones:** Descontar efectos para ver estacionalidad real

### üõ†Ô∏è ¬øC√ìMO lo hacemos?
1. **Preparar datos:** Agregar √≥rdenes por fecha y canal
2. **Descomponer series:** STL para separar tendencia, estacionalidad, residuos
3. **Calcular √≠ndices:** √çndice estacional (% sobre media)
4. **Detectar patrones:** Autocorrelaci√≥n, picos recurrentes
5. **Visualizar insights:** Heatmaps estacionales, gr√°ficos de componentes
6. **Generar forecast:** Proyecci√≥n con componente estacional
7. **Validar precisi√≥n:** Backtesting vs datos reales

# Contexto de Negocio y Marco de Trabajo

## Empresa y situaci√≥n
Retail omnicanal con picos en promociones y fines de semana. Objetivo: cuantificar estacionalidad por canal y categor√≠a.

## Qu√© / Por qu√© / Para qu√© / Cu√°ndo / C√≥mo
- Qu√©: An√°lisis de estacionalidad semanal/mensual y tendencia.
- Por qu√©: Mejorar la precisi√≥n del forecast y planificar capacidad.
- Para qu√©: Ajustar pol√≠ticas de inventario y staffing.
- Cu√°ndo: Mensual, previo a campa√±as y temporadas.
- C√≥mo: Series temporales, agregaciones por canal, descomposici√≥n y visualizaci√≥n.

---
id: "DS-02"
title: "Detecci√≥n de estacionalidad y tendencias en demanda por canal"
specialty: "Data Science"
process: "Plan"
level: "Intermediate"
tags: ["seasonality", "forecast", "timeseries", "channels"]
estimated_time_min: 45
---

## üéØ Contexto del Notebook

### ¬øQu√©?
An√°lisis de componentes estacionales y tendencias en series de demanda usando descomposici√≥n STL.

### ¬øPor qu√©?
Entender patrones estacionales mejora pron√≥sticos y planificaci√≥n de inventario (ej: picos en festivos).

### ¬øPara qu√©?
- Ajustar modelos de forecast con componente estacional
- Planificar promociones y abastecimiento
- Identificar SKUs con alta variabilidad

### ¬øCu√°ndo?
Al inicio de ciclo de S&OP, antes de generar pron√≥sticos para el pr√≥ximo trimestre.

### ¬øC√≥mo?
1. Agregar √≥rdenes por fecha
2. Aplicar STL decomposition
3. Visualizar tendencia, estacionalidad y residuos

In [None]:
# Imports necesarios
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from statsmodels.tsa.seasonal import STL, seasonal_decompose
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from pathlib import Path
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n visual
plt.rcParams['figure.figsize'] = (14, 6)
sns.set_palette('Set2')
np.random.seed(42)

print("‚úÖ Librer√≠as cargadas correctamente")

In [None]:
## üì• Paso 1: Cargar y Preparar Datos Temporales

# Cargar datos
data_path = Path('../../data/raw')
df_orders = pd.read_csv(data_path / 'orders.csv')
df_orders['date'] = pd.to_datetime(df_orders['date'])

print(f"üì¶ Datos cargados: {len(df_orders):,} √≥rdenes")
print(f"   Per√≠odo: {df_orders['date'].min()} a {df_orders['date'].max()}")
print(f"   Canales: {df_orders['channel'].unique()}")
print(f"   Columnas: {list(df_orders.columns)}")

# Agregar por fecha (serie diaria total)
ts_daily = df_orders.groupby('date')['qty'].sum().reset_index()
ts_daily = ts_daily.set_index('date').asfreq('D', fill_value=0)
ts_daily.columns = ['demand']

# Agregar por canal
ts_by_channel = df_orders.groupby(['date', 'channel'])['qty'].sum().reset_index()
ts_by_channel = ts_by_channel.pivot(index='date', columns='channel', values='qty').fillna(0)

print(f"\nüìä Serie temporal preparada:")
print(f"   Total d√≠as: {len(ts_daily)}")
print(f"   Demanda promedio: {ts_daily['demand'].mean():.1f} unidades/d√≠a")
print(f"   Desviaci√≥n est√°ndar: {ts_daily['demand'].std():.1f}")
print(f"   Coef. variaci√≥n: {(ts_daily['demand'].std() / ts_daily['demand'].mean() * 100):.1f}%")

# Visualizaci√≥n inicial
fig, axes = plt.subplots(2, 1, figsize=(16, 8))

# Serie completa
axes[0].plot(ts_daily.index, ts_daily['demand'], linewidth=1.5, color='steelblue', alpha=0.8)
axes[0].set_title('Serie Temporal de Demanda Diaria - Total', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Fecha', fontsize=11)
axes[0].set_ylabel('Unidades', fontsize=11)
axes[0].grid(alpha=0.3)
axes[0].axhline(y=ts_daily['demand'].mean(), color='red', linestyle='--', linewidth=2, label='Media')
axes[0].legend()

# Por canal
ts_by_channel.plot(ax=axes[1], linewidth=2, alpha=0.7)
axes[1].set_title('Demanda Diaria por Canal', fontsize=14, fontweight='bold')
axes[1].set_xlabel('Fecha', fontsize=11)
axes[1].set_ylabel('Unidades', fontsize=11)
axes[1].legend(title='Canal', loc='upper left')
axes[1].grid(alpha=0.3)

plt.tight_layout()
plt.show()

print("\n‚úÖ Paso 1 completado: Datos cargados y visualizados")

In [None]:
## üîç Paso 2: Descomposici√≥n STL (Seasonal-Trend using LOESS)

# Aplicar STL decomposition con per√≠odo semanal (7 d√≠as)
stl = STL(ts_daily['demand'], seasonal=7, period=7)
result_stl = stl.fit()

# Extraer componentes
trend = result_stl.trend
seasonal = result_stl.seasonal
resid = result_stl.resid

# Estad√≠sticas de componentes
print("üìä COMPONENTES DESCOMPUESTOS:")
print(f"\n1. TENDENCIA:")
trend_start = trend.iloc[0]
if trend_start != 0:
    growth_pct = ((trend.iloc[-1] - trend_start) / trend_start * 100)
else:
    growth_pct = np.nan
print(f"   Media: {trend.mean():.1f} unidades/d√≠a")
print(f"   Crecimiento total: {growth_pct:.1f}%" if not np.isnan(growth_pct) else "   Crecimiento total: N/A")
print(f"   Pendiente promedio: {(trend.diff().mean()):.2f} unidades/d√≠a")

print(f"\n2. ESTACIONALIDAD:")
print(f"   Amplitud (pico-valle): {seasonal.max() - seasonal.min():.1f} unidades")
print(f"   % sobre media: {((seasonal.max() - seasonal.min()) / max(trend.mean(), 1e-6) * 100):.1f}%")
print(f"   D√≠a con mayor demanda: {seasonal.idxmax().strftime('%A')}")
print(f"   D√≠a con menor demanda: {seasonal.idxmin().strftime('%A')}")

print(f"\n3. RESIDUOS (Variaci√≥n no explicada):")
print(f"   Desv. est√°ndar: {resid.std():.1f}")
print(f"   % de varianza total: {(resid.var() / max(ts_daily['demand'].var(), 1e-6) * 100):.1f}%")

# Visualizar descomposici√≥n
fig = result_stl.plot()
fig.set_size_inches(16, 10)
fig.suptitle('Descomposici√≥n STL - Demanda Diaria', fontsize=16, fontweight='bold', y=0.995)
plt.tight_layout()
plt.show()

# Varianza explicada por cada componente
var_original = ts_daily['demand'].var()
var_trend = trend.var()
var_seasonal = seasonal.var()
var_resid = resid.var()

print(f"\nüìä VARIANZA EXPLICADA:")
print(f"   Tendencia: {(var_trend / max(var_original, 1e-6) * 100):.1f}%")
print(f"   Estacionalidad: {(var_seasonal / max(var_original, 1e-6) * 100):.1f}%")
print(f"   Residuos: {(var_resid / max(var_original, 1e-6) * 100):.1f}%")

print("\n‚úÖ Paso 2 completado: Descomposici√≥n STL realizada")

In [None]:
## üìà Paso 3: C√°lculo de √çndices de Estacionalidad

# Calcular demanda promedio anual
mean_annual = ts_daily['demand'].mean()

# Extraer el componente estacional y calcular √≠ndices
seasonal_index = (seasonal / mean_annual * 100 + 100).round(2)

print("üìä √çNDICES DE ESTACIONALIDAD (100 = media anual)")
print(f"\n{'D√≠a':<12} {'√çndice':<10} {'Interpretaci√≥n'}")
print("-" * 50)

# Agrupar por d√≠a de la semana
ts_daily['dow'] = ts_daily.index.dayofweek
ts_daily['seasonal_component'] = seasonal

seasonal_by_dow = ts_daily.groupby('dow')['seasonal_component'].mean()
days_names = ['Lunes', 'Martes', 'Mi√©rcoles', 'Jueves', 'Viernes', 'S√°bado', 'Domingo']

for i, day_name in enumerate(days_names):
    idx = (seasonal_by_dow.iloc[i] / mean_annual * 100 + 100)
    interpretation = "üìà ALTA" if idx > 105 else "üìâ BAJA" if idx < 95 else "‚öñÔ∏è  NORMAL"
    print(f"{day_name:<12} {idx:>6.1f}     {interpretation}")

# √çndices por mes
ts_daily['month'] = ts_daily.index.month
seasonal_by_month = ts_daily.groupby('month')['seasonal_component'].mean()

print(f"\nüìÖ ESTACIONALIDAD MENSUAL:")
months = ['Ene', 'Feb', 'Mar', 'Abr', 'May', 'Jun', 'Jul', 'Ago', 'Sep', 'Oct', 'Nov', 'Dic']
for i, month_name in enumerate(months, start=1):
    if i in seasonal_by_month.index:
        idx = (seasonal_by_month.loc[i] / mean_annual * 100 + 100)
        interpretation = "üî• PICO" if idx > 110 else "‚ùÑÔ∏è  VALLE" if idx < 90 else "‚ûñ NORMAL"
        print(f"{month_name}: {idx:>6.1f}  {interpretation}")

# Visualizaci√≥n de √≠ndices
fig, axes = plt.subplots(1, 2, figsize=(16, 5))

# Gr√°fico 1: √çndices por d√≠a de semana
dow_indices = [(seasonal_by_dow.iloc[i] / mean_annual * 100 + 100) for i in range(7)]
colors_dow = ['#2ecc71' if x > 105 else '#e74c3c' if x < 95 else '#95a5a6' for x in dow_indices]
axes[0].bar(days_names, dow_indices, color=colors_dow, alpha=0.7, edgecolor='black')
axes[0].axhline(100, color='red', linestyle='--', linewidth=2, label='Media (100)')
axes[0].set_title('√çndices de Estacionalidad - D√≠a de Semana', fontsize=14, fontweight='bold')
axes[0].set_ylabel('√çndice (100 = media)', fontsize=12)
axes[0].set_ylim(85, 115)
axes[0].legend()
axes[0].grid(axis='y', alpha=0.3)

# Gr√°fico 2: √çndices por mes
month_indices = [(seasonal_by_month.loc[i] / mean_annual * 100 + 100) if i in seasonal_by_month.index else 100 for i in range(1, 13)]
colors_month = ['#2ecc71' if x > 110 else '#e74c3c' if x < 90 else '#95a5a6' for x in month_indices]
axes[1].bar(months, month_indices, color=colors_month, alpha=0.7, edgecolor='black')
axes[1].axhline(100, color='red', linestyle='--', linewidth=2, label='Media (100)')
axes[1].set_title('√çndices de Estacionalidad - Mes', fontsize=14, fontweight='bold')
axes[1].set_ylabel('√çndice (100 = media)', fontsize=12)
axes[1].set_ylim(80, 120)
axes[1].legend()
axes[1].grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.show()

print("\n‚úÖ Paso 3 completado: √çndices de estacionalidad calculados")

In [None]:
## üî¨ Paso 4: An√°lisis de Autocorrelaci√≥n (ACF/PACF)

from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# Crear figura con ACF y PACF
fig, axes = plt.subplots(2, 2, figsize=(16, 10))

# ACF/PACF para la serie original
plot_acf(ts_daily['demand'].dropna(), lags=30, ax=axes[0, 0])
axes[0, 0].set_title('ACF - Demanda Original', fontsize=14, fontweight='bold')
axes[0, 0].set_xlabel('Lag (d√≠as)', fontsize=11)

plot_pacf(ts_daily['demand'].dropna(), lags=30, ax=axes[0, 1])
axes[0, 1].set_title('PACF - Demanda Original', fontsize=14, fontweight='bold')
axes[0, 1].set_xlabel('Lag (d√≠as)', fontsize=11)

# ACF/PACF para los residuos (serie desestacionalizada)
plot_acf(resid.dropna(), lags=30, ax=axes[1, 0])
axes[1, 0].set_title('ACF - Residuos (Desestacionalizada)', fontsize=14, fontweight='bold')
axes[1, 0].set_xlabel('Lag (d√≠as)', fontsize=11)

plot_pacf(resid.dropna(), lags=30, ax=axes[1, 1])
axes[1, 1].set_title('PACF - Residuos (Desestacionalizada)', fontsize=14, fontweight='bold')
axes[1, 1].set_xlabel('Lag (d√≠as)', fontsize=11)

plt.tight_layout()
plt.show()

# Calcular autocorrelaciones significativas
from statsmodels.tsa.stattools import acf
acf_values = acf(ts_daily['demand'].dropna(), nlags=30)
significant_lags = [i for i in range(1, 31) if abs(acf_values[i]) > 1.96 / np.sqrt(len(ts_daily))]

print("üìä AUTOCORRELACIONES SIGNIFICATIVAS:")
print(f"\nLags con autocorrelaci√≥n significativa (Œ±=0.05): {len(significant_lags)}")
print(f"Primeros 10 lags: {significant_lags[:10]}")
print(f"\nInterpretaci√≥n:")
print(f"  ‚Ä¢ Lag 7 presente: {'‚úÖ S√ç' if 7 in significant_lags else '‚ùå NO'} ‚Üí Patr√≥n semanal")
print(f"  ‚Ä¢ Lag 30 presente: {'‚úÖ S√ç' if 30 in significant_lags else '‚ùå NO'} ‚Üí Patr√≥n mensual")

# Test de estacionariedad (Dickey-Fuller)
from statsmodels.tsa.stattools import adfuller
adf_result = adfuller(ts_daily['demand'].dropna())

print(f"\nüî¨ TEST DE ESTACIONARIEDAD (Augmented Dickey-Fuller):")
print(f"  ADF Statistic: {adf_result[0]:.4f}")
print(f"  p-value: {adf_result[1]:.4f}")
print(f"  Conclusi√≥n: {'‚úÖ ESTACIONARIA' if adf_result[1] < 0.05 else '‚ùå NO ESTACIONARIA'} (Œ±=0.05)")

# Test sobre residuos
adf_resid = adfuller(resid.dropna())
print(f"\nüî¨ TEST SOBRE RESIDUOS (Despu√©s de desestacionalizar):")
print(f"  ADF Statistic: {adf_resid[0]:.4f}")
print(f"  p-value: {adf_resid[1]:.4f}")
print(f"  Conclusi√≥n: {'‚úÖ ESTACIONARIA' if adf_resid[1] < 0.05 else '‚ùå NO ESTACIONARIA'} (Œ±=0.05)")

print("\n‚úÖ Paso 4 completado: An√°lisis de autocorrelaci√≥n realizado")

In [None]:
## üéØ Paso 5: Forecasting con Ajuste Estacional

from sklearn.metrics import mean_absolute_error, mean_squared_error

# Crear conjunto de entrenamiento (80%) y prueba (20%)
train_size = int(len(ts_daily) * 0.8)
train = ts_daily[:train_size].copy()
test = ts_daily[train_size:].copy()

print(f"üìä DIVISI√ìN DE DATOS:")
print(f"  Training: {train.index[0].strftime('%Y-%m-%d')} a {train.index[-1].strftime('%Y-%m-%d')} ({len(train)} d√≠as)")
print(f"  Test: {test.index[0].strftime('%Y-%m-%d')} a {test.index[-1].strftime('%Y-%m-%d')} ({len(test)} d√≠as)")

# Modelo 1: Forecast ingenuo (baseline)
# Simplemente usar el promedio hist√≥rico
baseline_forecast = np.full(len(test), train['demand'].mean())

# Modelo 2: Forecast con estacionalidad
# Usar STL para predecir con componentes
stl_train = STL(train['demand'], seasonal=7, period=7).fit()

# Extrapolar tendencia linealmente
trend_train = stl_train.trend.dropna()
x_train = np.arange(len(trend_train))
coeffs = np.polyfit(x_train, trend_train, 1)
x_forecast = np.arange(len(trend_train), len(trend_train) + len(test))
trend_forecast = np.polyval(coeffs, x_forecast)

# Repetir componente estacional (patr√≥n de 7 d√≠as)
seasonal_pattern = stl_train.seasonal[-7:].values
seasonal_forecast = np.tile(seasonal_pattern, int(np.ceil(len(test) / 7)))[:len(test)]

# Forecast final = trend + seasonal
seasonal_forecast_values = trend_forecast + seasonal_forecast

# Modelo 3: Suavizado exponencial simple con estacionalidad
from statsmodels.tsa.holtwinters import ExponentialSmoothing
model_hw = ExponentialSmoothing(
    train['demand'],
    seasonal_periods=7,
    trend='add',
    seasonal='add'
).fit()
hw_forecast = model_hw.forecast(len(test))

# Calcular m√©tricas (robustas a demanda = 0)
def calculate_metrics(actual, predicted, model_name):
    actual = np.asarray(actual)
    predicted = np.asarray(predicted)
    mae = mean_absolute_error(actual, predicted)
    rmse = np.sqrt(mean_squared_error(actual, predicted))
    mask = actual != 0
    if mask.any():
        mape = np.mean(np.abs((actual[mask] - predicted[mask]) / actual[mask])) * 100
    else:
        mape = np.nan
    return {'model': model_name, 'MAE': mae, 'RMSE': rmse, 'MAPE': mape}

metrics = []
metrics.append(calculate_metrics(test['demand'], baseline_forecast, 'Baseline (Promedio)'))
metrics.append(calculate_metrics(test['demand'], seasonal_forecast_values, 'STL Descomposici√≥n'))
metrics.append(calculate_metrics(test['demand'], hw_forecast, 'Holt-Winters'))

# Mostrar resultados
import pandas as pd
df_metrics = pd.DataFrame(metrics)
print(f"\nüìä COMPARACI√ìN DE MODELOS:")
print(df_metrics.to_string(index=False))

# Encontrar mejor modelo
best_row = df_metrics.loc[df_metrics['MAPE'].idxmin()] if df_metrics['MAPE'].notna().any() else df_metrics.loc[df_metrics['RMSE'].idxmin()]
best_model = best_row['model']
best_mape = best_row['MAPE']
print(f"\nüèÜ MEJOR MODELO: {best_model} (MAPE = {best_mape:.2f}% si aplica)")

# Visualizaci√≥n de forecasts
fig, axes = plt.subplots(2, 1, figsize=(16, 10))

# Gr√°fico 1: Serie completa con forecasts
axes[0].plot(train.index, train['demand'], label='Training', color='#3498db', linewidth=2)
axes[0].plot(test.index, test['demand'], label='Real (Test)', color='black', linewidth=2, linestyle='--')
axes[0].plot(test.index, baseline_forecast, label=f'Baseline (MAPE={metrics[0]["MAPE"]:.1f}%)', color='#95a5a6', alpha=0.7)
axes[0].plot(test.index, seasonal_forecast_values, label=f'STL (MAPE={metrics[1]["MAPE"]:.1f}%)', color='#e74c3c', alpha=0.7)
axes[0].plot(test.index, hw_forecast, label=f'Holt-Winters (MAPE={metrics[2]["MAPE"]:.1f}%)', color='#2ecc71', linewidth=2)
axes[0].set_title('Forecasting - Comparaci√≥n de Modelos', fontsize=14, fontweight='bold')
axes[0].set_ylabel('Demanda (unidades)', fontsize=11)
axes[0].legend(loc='upper left')
axes[0].grid(alpha=0.3)

# Gr√°fico 2: Zoom en per√≠odo de test
axes[1].plot(test.index, test['demand'], label='Real', color='black', linewidth=3, marker='o', markersize=4)
axes[1].plot(test.index, hw_forecast, label=f'{best_model}', color='#2ecc71', linewidth=2, marker='s', markersize=3)
axes[1].fill_between(test.index, test['demand'], hw_forecast, alpha=0.3, color='orange', label='Error')
axes[1].set_title(f'Detalle Per√≠odo Test - {best_model}', fontsize=14, fontweight='bold')
axes[1].set_ylabel('Demanda (unidades)', fontsize=11)
axes[1].set_xlabel('Fecha', fontsize=11)
axes[1].legend()
axes[1].grid(alpha=0.3)

plt.tight_layout()
plt.show()

# C√°lculo de mejora vs situaci√≥n actual
current_mape = 35.0  # MAPE actual del negocio
improved_mape = best_mape if pd.notna(best_mape) else np.nan
reduction = current_mape - improved_mape if pd.notna(improved_mape) else np.nan

print(f"\nüí∞ IMPACTO DE MEJORA:")
print(f"  MAPE Actual: {current_mape:.1f}%")
print(f"  MAPE Mejorado: {improved_mape if pd.notna(improved_mape) else 'N/A'}")
print(f"  Reducci√≥n: {reduction if pd.notna(reduction) else 'N/A'}")
print(f"  Mejora relativa: {((reduction / current_mape * 100):.1f}% si aplica)" if pd.notna(reduction) else "  Mejora relativa: N/A")

print("\n‚úÖ Paso 5 completado: Forecasting con ajuste estacional realizado")

In [None]:
## üìä Paso 6: Dashboard Ejecutivo - Estacionalidad por Canal

# Preparar datos agregados por canal
# (usar df_orders y columna 'date' del dataset cargado en el Paso 1)
ts_channel = df_orders.groupby(['date', 'channel']).agg({'qty': 'sum'}).reset_index()
ts_channel.columns = ['date', 'channel', 'demand']

# Crear dashboard con 6 paneles
fig = plt.figure(figsize=(20, 12))
gs = fig.add_gridspec(3, 2, hspace=0.3, wspace=0.25)

# Panel 1: Serie temporal por canal
ax1 = fig.add_subplot(gs[0, :])
for channel in ts_channel['channel'].unique():
    channel_data = ts_channel[ts_channel['channel'] == channel]
    ax1.plot(channel_data['date'], channel_data['demand'], label=channel, linewidth=2, marker='o', markersize=3, alpha=0.7)
ax1.set_title('1Ô∏è‚É£ Serie Temporal de Demanda por Canal', fontsize=14, fontweight='bold', pad=15)
ax1.set_ylabel('Demanda (unidades)', fontsize=11)
ax1.legend(loc='upper left', fontsize=10)
ax1.grid(alpha=0.3)

# Panel 2: Distribuci√≥n de demanda por canal (boxplot)
ax2 = fig.add_subplot(gs[1, 0])
channels = ts_channel['channel'].unique()
channel_demands = [ts_channel[ts_channel['channel'] == ch]['demand'].values for ch in channels]
bp = ax2.boxplot(channel_demands, labels=channels, patch_artist=True)
for patch, color in zip(bp['boxes'], ['#3498db', '#2ecc71', '#e74c3c', '#f39c12'][:len(channels)]):
    patch.set_facecolor(color)
    patch.set_alpha(0.6)
ax2.set_title('2Ô∏è‚É£ Distribuci√≥n de Demanda por Canal', fontsize=14, fontweight='bold', pad=15)
ax2.set_ylabel('Demanda (unidades)', fontsize=11)
ax2.grid(axis='y', alpha=0.3)

# Panel 3: Participaci√≥n por canal (pie chart)
ax3 = fig.add_subplot(gs[1, 1])
channel_totals = ts_channel.groupby('channel')['demand'].sum()
colors_pie = ['#3498db', '#2ecc71', '#e74c3c', '#f39c12'][:len(channel_totals)]
wedges, texts, autotexts = ax3.pie(
    channel_totals, 
    labels=channel_totals.index, 
    autopct='%1.1f%%',
    colors=colors_pie,
    startangle=90,
    textprops={'fontsize': 11, 'fontweight': 'bold'}
)
ax3.set_title('3Ô∏è‚É£ Participaci√≥n de Canales en Demanda Total', fontsize=14, fontweight='bold', pad=15)

# Panel 4: Heatmap estacionalidad semanal por canal
ax4 = fig.add_subplot(gs[2, 0])
ts_channel['dow'] = pd.to_datetime(ts_channel['date']).dt.dayofweek
heatmap_data = ts_channel.pivot_table(values='demand', index='channel', columns='dow', aggfunc='mean')
heatmap_data.columns = ['Lun', 'Mar', 'Mi√©', 'Jue', 'Vie', 'S√°b', 'Dom']
sns.heatmap(heatmap_data, annot=True, fmt='.0f', cmap='RdYlGn', cbar_kws={'label': 'Demanda Media'}, ax=ax4)
ax4.set_title('4Ô∏è‚É£ Heatmap: Demanda Media por D√≠a y Canal', fontsize=14, fontweight='bold', pad=15)
ax4.set_xlabel('D√≠a de Semana', fontsize=11)
ax4.set_ylabel('Canal', fontsize=11)

# Panel 5: Coeficiente de variaci√≥n por canal
ax5 = fig.add_subplot(gs[2, 1])
cv_by_channel = ts_channel.groupby('channel').agg({'demand': lambda x: (x.std() / x.mean() * 100)}).reset_index()
cv_by_channel.columns = ['channel', 'CV']
colors_cv = ['#2ecc71' if cv < 30 else '#f39c12' if cv < 50 else '#e74c3c' for cv in cv_by_channel['CV']]
ax5.bar(cv_by_channel['channel'], cv_by_channel['CV'], color=colors_cv, alpha=0.7, edgecolor='black')
ax5.axhline(30, color='green', linestyle='--', linewidth=2, alpha=0.5, label='CV bajo (< 30%)')
ax5.axhline(50, color='orange', linestyle='--', linewidth=2, alpha=0.5, label='CV medio (30-50%)')
ax5.set_title('5Ô∏è‚É£ Coeficiente de Variaci√≥n por Canal', fontsize=14, fontweight='bold', pad=15)
ax5.set_ylabel('CV (%)', fontsize=11)
ax5.set_xlabel('Canal', fontsize=11)
ax5.legend(fontsize=9)
ax5.grid(axis='y', alpha=0.3)

plt.suptitle('üìä DASHBOARD EJECUTIVO - AN√ÅLISIS DE ESTACIONALIDAD POR CANAL', 
             fontsize=18, fontweight='bold', y=0.995)
plt.show()

# Resumen estad√≠stico
print("üìä RESUMEN ESTAD√çSTICO POR CANAL:")
print("\n" + "="*70)
for channel in channels:
    ch_data = ts_channel[ts_channel['channel'] == channel]['demand']
    print(f"\n{channel.upper()}:")
    print(f"  Media diaria: {ch_data.mean():.1f} unidades")
    print(f"  Desv. est√°ndar: {ch_data.std():.1f}")
    print(f"  CV: {(ch_data.std() / ch_data.mean() * 100):.1f}%")
    print(f"  Min: {ch_data.min():.0f} | Max: {ch_data.max():.0f}")
    print(f"  Participaci√≥n: {(ch_data.sum() / ts_channel['demand'].sum() * 100):.1f}%")

print("\n‚úÖ Paso 6 completado: Dashboard ejecutivo generado")