## 1. Configuraci√≥n e Instalaci√≥n de Dependencias

In [None]:
# Instalar Prophet si no est√° instalado
# !pip install prophet matplotlib seaborn plotly

In [None]:
# Importar librer√≠as
import warnings
warnings.filterwarnings('ignore')

# PySpark
from pyspark.sql import SparkSession
from pyspark.sql import functions as F
from pyspark.sql.window import Window

# Pandas y Prophet
import pandas as pd
import numpy as np
from prophet import Prophet
from prophet.diagnostics import cross_validation, performance_metrics
from prophet.plot import plot_plotly, plot_components_plotly

# Visualizaci√≥n
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from datetime import datetime, timedelta

# Configurar estilo
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')

print("‚úì Librer√≠as importadas correctamente")

## 2. Cargar Datos con PySpark

In [None]:
# Crear sesi√≥n de Spark
spark = SparkSession.builder \
    .appName("Olist Demand Forecasting") \
    .config("spark.driver.memory", "4g") \
    .config("spark.sql.shuffle.partitions", "100") \
    .getOrCreate()

print(f"‚úì Sesi√≥n Spark creada: {spark.version}")

In [None]:
# Cargar dataset unificado
df_spark = spark.read.parquet("Data/olist_unified_dataset.parquet")

print(f"Registros totales: {df_spark.count():,}")
print(f"Columnas: {len(df_spark.columns)}")

## 3. Preparaci√≥n de Datos para Series de Tiempo (PySpark)

In [None]:
print("=" * 70)
print("PREPARACI√ìN DE DATOS PARA SERIES DE TIEMPO")
print("=" * 70)

# Seleccionar columnas relevantes y filtrar datos v√°lidos
df_ts = df_spark.select(
    F.col('order_purchase_timestamp').alias('fecha'),
    F.col('payment_value').alias('ventas')
).filter(
    (F.col('order_purchase_timestamp').isNotNull()) & 
    (F.col('payment_value').isNotNull()) &
    (F.col('payment_value') > 0)
)

# Ver rango de fechas
date_range = df_ts.agg(
    F.min('fecha').alias('fecha_min'),
    F.max('fecha').alias('fecha_max'),
    F.count('*').alias('total_registros')
).collect()[0]

print(f"\nRango de fechas: {date_range['fecha_min']} a {date_range['fecha_max']}")
print(f"Total de registros v√°lidos: {date_range['total_registros']:,}")

# Calcular diferencia en d√≠as
days_diff = (date_range['fecha_max'] - date_range['fecha_min']).days
print(f"D√≠as de datos: {days_diff} (~{days_diff/365:.1f} a√±os)")

In [None]:
# Agregar ventas por SEMANA (recomendado para Prophet)
# Usamos la funci√≥n date_trunc para agrupar por semana
df_weekly = df_ts.withColumn(
    'semana',
    F.date_trunc('week', 'fecha')
).groupBy('semana') \
 .agg(
     F.sum('ventas').alias('ventas_total'),
     F.count('*').alias('num_ordenes'),
     F.avg('ventas').alias('ventas_promedio')
 ) \
 .orderBy('semana')

print("\nVentas agregadas por semana:")
df_weekly.show(10)

print(f"\nTotal de semanas: {df_weekly.count()}")

## 4. Convertir a Pandas para Prophet

In [None]:
# Convertir a Pandas DataFrame
df_pd = df_weekly.select('semana', 'ventas_total').toPandas()

# Renombrar columnas al formato requerido por Prophet: 'ds' (fecha) y 'y' (valor)
df_pd.columns = ['ds', 'y']

# Asegurar que 'ds' sea datetime
df_pd['ds'] = pd.to_datetime(df_pd['ds'])

# Ordenar por fecha
df_pd = df_pd.sort_values('ds').reset_index(drop=True)

print("Dataset convertido a Pandas para Prophet:")
print(f"Shape: {df_pd.shape}")
print(f"\nPrimeras filas:")
display(df_pd.head(10))

print(f"\n√öltimas filas:")
display(df_pd.tail(10))

# Estad√≠sticas b√°sicas
print(f"\nEstad√≠sticas de ventas semanales:")
print(df_pd['y'].describe())

## 5. An√°lisis Exploratorio de la Serie de Tiempo

In [None]:
# Visualizaci√≥n de la serie de tiempo
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_pd['ds'],
    y=df_pd['y'],
    mode='lines+markers',
    name='Ventas Semanales',
    line=dict(color='#1f77b4', width=2),
    marker=dict(size=4)
))

fig.update_layout(
    title='Serie de Tiempo: Ventas Semanales',
    xaxis_title='Fecha',
    yaxis_title='Ventas Totales (R$)',
    height=500,
    hovermode='x unified'
)

fig.show()

print("‚úì Gr√°fico de serie de tiempo generado")

In [None]:
# An√°lisis de tendencia y estacionalidad visual
df_pd['year'] = df_pd['ds'].dt.year
df_pd['month'] = df_pd['ds'].dt.month
df_pd['week'] = df_pd['ds'].dt.isocalendar().week

# Ventas por mes
fig, axes = plt.subplots(2, 2, figsize=(16, 10))

# 1. Tendencia general
axes[0, 0].plot(df_pd['ds'], df_pd['y'], linewidth=1.5)
axes[0, 0].set_title('Tendencia General de Ventas', fontsize=14, fontweight='bold')
axes[0, 0].set_xlabel('Fecha')
axes[0, 0].set_ylabel('Ventas (R$)')
axes[0, 0].grid(True, alpha=0.3)

# 2. Distribuci√≥n de ventas
axes[0, 1].hist(df_pd['y'], bins=30, edgecolor='black', alpha=0.7)
axes[0, 1].set_title('Distribuci√≥n de Ventas Semanales', fontsize=14, fontweight='bold')
axes[0, 1].set_xlabel('Ventas (R$)')
axes[0, 1].set_ylabel('Frecuencia')
axes[0, 1].grid(True, alpha=0.3)

# 3. Boxplot por a√±o
df_pd.boxplot(column='y', by='year', ax=axes[1, 0])
axes[1, 0].set_title('Ventas por A√±o', fontsize=14, fontweight='bold')
axes[1, 0].set_xlabel('A√±o')
axes[1, 0].set_ylabel('Ventas (R$)')
plt.sca(axes[1, 0])
plt.xticks(rotation=0)

# 4. Ventas promedio por mes
monthly_avg = df_pd.groupby('month')['y'].mean()
axes[1, 1].bar(monthly_avg.index, monthly_avg.values, color='steelblue', alpha=0.7)
axes[1, 1].set_title('Ventas Promedio por Mes', fontsize=14, fontweight='bold')
axes[1, 1].set_xlabel('Mes')
axes[1, 1].set_ylabel('Ventas Promedio (R$)')
axes[1, 1].set_xticks(range(1, 13))
axes[1, 1].grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

print("‚úì An√°lisis exploratorio completado")

In [None]:
# An√°lisis de estacionalidad - promedio por mes del a√±o
print("\nVentas promedio por mes (agregado de todos los a√±os):")
monthly_sales = df_pd.groupby('month')['y'].agg(['mean', 'std', 'count'])
monthly_sales.index = ['Ene', 'Feb', 'Mar', 'Abr', 'May', 'Jun', 
                       'Jul', 'Ago', 'Sep', 'Oct', 'Nov', 'Dic']
display(monthly_sales)

## 6. Divisi√≥n de Datos: Train/Test

In [None]:
# Dividir en train/test
# Reservar √∫ltimas 13 semanas (~3 meses) para test
test_weeks = 13
train_size = len(df_pd) - test_weeks

df_train = df_pd.iloc[:train_size].copy()
df_test = df_pd.iloc[train_size:].copy()

print("=" * 70)
print("DIVISI√ìN TRAIN/TEST")
print("=" * 70)
print(f"\nTotal de datos: {len(df_pd)} semanas")
print(f"Train: {len(df_train)} semanas ({df_train['ds'].min()} a {df_train['ds'].max()})")
print(f"Test: {len(df_test)} semanas ({df_test['ds'].min()} a {df_test['ds'].max()})")
print(f"\nPorcentaje train: {len(df_train)/len(df_pd)*100:.1f}%")
print(f"Porcentaje test: {len(df_test)/len(df_pd)*100:.1f}%")

## 7. Entrenamiento del Modelo Prophet

In [None]:
print("=" * 70)
print("ENTRENAMIENTO DEL MODELO PROPHET")
print("=" * 70)

# Crear modelo Prophet con configuraci√≥n optimizada para e-commerce
model = Prophet(
    seasonality_mode='multiplicative',  # Mejor para series con estacionalidad proporcional
    yearly_seasonality=True,            # Capturar patrones anuales
    weekly_seasonality=True,            # Capturar patrones semanales
    daily_seasonality=False,            # No necesario para datos semanales
    changepoint_prior_scale=0.05,       # Flexibilidad moderada para cambios de tendencia
    seasonality_prior_scale=10,         # Peso para estacionalidad
    interval_width=0.95,                # Intervalos de confianza al 95%
    n_changepoints=25                   # N√∫mero de puntos de cambio potenciales
)

# Agregar holidays brasile√±os (importantes para e-commerce)
model.add_country_holidays(country_name='BR')

print("\n‚úì Modelo Prophet configurado")
print("\nConfiguraciones clave:")
print("  - Estacionalidad: multiplicativa")
print("  - Estacionalidad anual: activada")
print("  - Estacionalidad semanal: activada")
print("  - Holidays de Brasil: incluidos")
print("  - Intervalo de confianza: 95%")

# Entrenar el modelo
print("\nEntrenando modelo...")
model.fit(df_train)
print("‚úì Modelo entrenado exitosamente")

## 8. Predicci√≥n en Test Set

In [None]:
# Hacer predicciones en el conjunto de test
forecast_test = model.predict(df_test[['ds']])

# Comparar predicciones con valores reales
df_comparison = pd.DataFrame({
    'fecha': df_test['ds'].values,
    'real': df_test['y'].values,
    'prediccion': forecast_test['yhat'].values,
    'limite_inferior': forecast_test['yhat_lower'].values,
    'limite_superior': forecast_test['yhat_upper'].values
})

print("\nComparaci√≥n de predicciones vs valores reales (Test Set):")
display(df_comparison)

# Calcular m√©tricas de error
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

mae = mean_absolute_error(df_comparison['real'], df_comparison['prediccion'])
rmse = np.sqrt(mean_squared_error(df_comparison['real'], df_comparison['prediccion']))
mape = np.mean(np.abs((df_comparison['real'] - df_comparison['prediccion']) / df_comparison['real'])) * 100
r2 = r2_score(df_comparison['real'], df_comparison['prediccion'])

print("\n" + "=" * 70)
print("M√âTRICAS DE EVALUACI√ìN EN TEST SET")
print("=" * 70)
print(f"MAE (Error Absoluto Medio): R$ {mae:,.2f}")
print(f"RMSE (Ra√≠z del Error Cuadr√°tico Medio): R$ {rmse:,.2f}")
print(f"MAPE (Error Porcentual Absoluto Medio): {mape:.2f}%")
print(f"R¬≤ (Coeficiente de Determinaci√≥n): {r2:.4f}")
print("\nInterpretaci√≥n:")
print(f"  - En promedio, las predicciones se desv√≠an R$ {mae:,.2f} del valor real")
print(f"  - El error porcentual promedio es {mape:.1f}%")
print(f"  - El modelo explica {r2*100:.1f}% de la varianza de los datos")

In [None]:
# Visualizaci√≥n de predicciones vs reales en test set
fig = go.Figure()

# Valores reales
fig.add_trace(go.Scatter(
    x=df_comparison['fecha'],
    y=df_comparison['real'],
    mode='lines+markers',
    name='Valores Reales',
    line=dict(color='blue', width=3),
    marker=dict(size=8)
))

# Predicciones
fig.add_trace(go.Scatter(
    x=df_comparison['fecha'],
    y=df_comparison['prediccion'],
    mode='lines+markers',
    name='Predicciones',
    line=dict(color='red', width=3, dash='dash'),
    marker=dict(size=8)
))

# Intervalo de confianza
fig.add_trace(go.Scatter(
    x=df_comparison['fecha'],
    y=df_comparison['limite_superior'],
    mode='lines',
    name='IC 95% Superior',
    line=dict(width=0),
    showlegend=False
))

fig.add_trace(go.Scatter(
    x=df_comparison['fecha'],
    y=df_comparison['limite_inferior'],
    mode='lines',
    name='Intervalo Confianza 95%',
    fill='tonexty',
    fillcolor='rgba(255, 0, 0, 0.1)',
    line=dict(width=0)
))

fig.update_layout(
    title='Predicciones vs Valores Reales (Test Set)',
    xaxis_title='Fecha',
    yaxis_title='Ventas (R$)',
    height=600,
    hovermode='x unified'
)

fig.show()

## 9. Predicci√≥n para el Pr√≥ximo Trimestre (13 semanas)

In [None]:
print("=" * 70)
print("PREDICCI√ìN PARA EL PR√ìXIMO TRIMESTRE")
print("=" * 70)

# Reentrenar el modelo con TODOS los datos disponibles
print("\nReentrenando modelo con todos los datos...")
model_full = Prophet(
    seasonality_mode='multiplicative',
    yearly_seasonality=True,
    weekly_seasonality=True,
    daily_seasonality=False,
    changepoint_prior_scale=0.05,
    seasonality_prior_scale=10,
    interval_width=0.95,
    n_changepoints=25
)

model_full.add_country_holidays(country_name='BR')
model_full.fit(df_pd)
print("‚úì Modelo reentrenado con dataset completo")

# Crear dataframe futuro para 13 semanas (1 trimestre)
future_weeks = 13
future = model_full.make_future_dataframe(periods=future_weeks, freq='W')

# Hacer predicci√≥n
forecast = model_full.predict(future)

# Extraer solo las predicciones futuras
forecast_future = forecast.iloc[-future_weeks:][['ds', 'yhat', 'yhat_lower', 'yhat_upper']]
forecast_future.columns = ['Fecha', 'Predicci√≥n', 'L√≠mite Inferior (95%)', 'L√≠mite Superior (95%)']

print(f"\nPredicciones para las pr√≥ximas {future_weeks} semanas:")
print(f"Desde: {forecast_future['Fecha'].min()}")
print(f"Hasta: {forecast_future['Fecha'].max()}")
print("\n")
display(forecast_future)

# Calcular totales del trimestre
total_predicho = forecast_future['Predicci√≥n'].sum()
total_inferior = forecast_future['L√≠mite Inferior (95%)'].sum()
total_superior = forecast_future['L√≠mite Superior (95%)'].sum()

print("\n" + "=" * 70)
print("PRON√ìSTICO TRIMESTRAL TOTAL")
print("=" * 70)
print(f"Ventas esperadas (pr√≥ximo trimestre): R$ {total_predicho:,.2f}")
print(f"Escenario pesimista (l√≠mite inferior): R$ {total_inferior:,.2f}")
print(f"Escenario optimista (l√≠mite superior): R$ {total_superior:,.2f}")
print(f"\nRango de variaci√≥n: R$ {total_superior - total_inferior:,.2f}")

# Comparar con trimestre anterior
last_13_weeks_actual = df_pd.iloc[-13:]['y'].sum()
growth_pct = ((total_predicho - last_13_weeks_actual) / last_13_weeks_actual) * 100

print(f"\nVentas del √∫ltimo trimestre real: R$ {last_13_weeks_actual:,.2f}")
print(f"Crecimiento esperado: {growth_pct:+.2f}%")

## 10. Visualizaciones del Pron√≥stico

In [None]:
# Gr√°fico completo de pron√≥stico con Prophet
fig1 = model_full.plot(forecast, figsize=(16, 6))
plt.title('Pron√≥stico de Ventas con Prophet', fontsize=16, fontweight='bold')
plt.xlabel('Fecha', fontsize=12)
plt.ylabel('Ventas (R$)', fontsize=12)
plt.tight_layout()
plt.show()

print("‚úì Gr√°fico de pron√≥stico generado")

In [None]:
# Componentes del modelo (tendencia, estacionalidad)
fig2 = model_full.plot_components(forecast, figsize=(16, 10))
plt.tight_layout()
plt.show()

print("‚úì Componentes del modelo visualizados")
print("\nInterpretaci√≥n de componentes:")
print("  1. Trend: Tendencia general de ventas a lo largo del tiempo")
print("  2. Weekly: Patr√≥n semanal (d√≠as con m√°s/menos ventas)")
print("  3. Yearly: Estacionalidad anual (meses con m√°s/menos ventas)")
print("  4. Holidays: Impacto de d√≠as festivos brasile√±os en las ventas")

In [None]:
# Visualizaci√≥n interactiva con Plotly - Hist√≥rico + Pron√≥stico
fig = go.Figure()

# Datos hist√≥ricos
fig.add_trace(go.Scatter(
    x=df_pd['ds'],
    y=df_pd['y'],
    mode='lines+markers',
    name='Hist√≥rico',
    line=dict(color='blue', width=2),
    marker=dict(size=4)
))

# Pron√≥stico futuro
fig.add_trace(go.Scatter(
    x=forecast_future['Fecha'],
    y=forecast_future['Predicci√≥n'],
    mode='lines+markers',
    name='Pron√≥stico',
    line=dict(color='red', width=3, dash='dash'),
    marker=dict(size=8, symbol='diamond')
))

# Intervalo de confianza
fig.add_trace(go.Scatter(
    x=forecast_future['Fecha'],
    y=forecast_future['L√≠mite Superior (95%)'],
    mode='lines',
    line=dict(width=0),
    showlegend=False,
    hoverinfo='skip'
))

fig.add_trace(go.Scatter(
    x=forecast_future['Fecha'],
    y=forecast_future['L√≠mite Inferior (95%)'],
    mode='lines',
    name='Intervalo Confianza 95%',
    fill='tonexty',
    fillcolor='rgba(255, 0, 0, 0.2)',
    line=dict(width=0)
))

fig.update_layout(
    title='Pron√≥stico de Ventas: Hist√≥rico + Pr√≥ximo Trimestre',
    xaxis_title='Fecha',
    yaxis_title='Ventas Semanales (R$)',
    height=600,
    hovermode='x unified',
    legend=dict(x=0.01, y=0.99)
)

fig.show()

## 11. An√°lisis de Cambios de Tendencia (Changepoints)

In [None]:
# Visualizar puntos de cambio detectados por Prophet
from prophet.plot import add_changepoints_to_plot

fig = model_full.plot(forecast, figsize=(16, 6))
a = add_changepoints_to_plot(fig.gca(), model_full, forecast)
plt.title('Puntos de Cambio de Tendencia Detectados', fontsize=16, fontweight='bold')
plt.xlabel('Fecha', fontsize=12)
plt.ylabel('Ventas (R$)', fontsize=12)
plt.tight_layout()
plt.show()

print("\n‚úì Puntos de cambio visualizados")
print("\nLas l√≠neas verticales rojas indican momentos donde el modelo detect√≥")
print("cambios significativos en la tendencia de ventas.")

## 12. Validaci√≥n Cruzada (Cross-Validation)

In [None]:
# Realizar validaci√≥n cruzada
# Esto puede tomar varios minutos
print("Realizando validaci√≥n cruzada (esto puede tomar unos minutos)...")

df_cv = cross_validation(
    model_full,
    initial='365 days',    # Periodo inicial de entrenamiento
    period='90 days',      # Frecuencia de validaci√≥n
    horizon='90 days'      # Horizonte de predicci√≥n
)

print("‚úì Validaci√≥n cruzada completada")

# Calcular m√©tricas de performance
df_performance = performance_metrics(df_cv)

print("\nM√©tricas de validaci√≥n cruzada:")
display(df_performance.head())

# Visualizar m√©tricas
fig, axes = plt.subplots(2, 2, figsize=(16, 10))

axes[0, 0].plot(df_performance['horizon'], df_performance['mape'], 'o-')
axes[0, 0].set_xlabel('Horizonte (d√≠as)')
axes[0, 0].set_ylabel('MAPE (%)')
axes[0, 0].set_title('Error Porcentual vs Horizonte')
axes[0, 0].grid(True, alpha=0.3)

axes[0, 1].plot(df_performance['horizon'], df_performance['rmse'], 'o-', color='orange')
axes[0, 1].set_xlabel('Horizonte (d√≠as)')
axes[0, 1].set_ylabel('RMSE')
axes[0, 1].set_title('RMSE vs Horizonte')
axes[0, 1].grid(True, alpha=0.3)

axes[1, 0].plot(df_performance['horizon'], df_performance['mae'], 'o-', color='green')
axes[1, 0].set_xlabel('Horizonte (d√≠as)')
axes[1, 0].set_ylabel('MAE')
axes[1, 0].set_title('MAE vs Horizonte')
axes[1, 0].grid(True, alpha=0.3)

axes[1, 1].plot(df_performance['horizon'], df_performance['coverage'], 'o-', color='red')
axes[1, 1].set_xlabel('Horizonte (d√≠as)')
axes[1, 1].set_ylabel('Coverage')
axes[1, 1].set_title('Cobertura del Intervalo de Confianza')
axes[1, 1].axhline(y=0.95, color='black', linestyle='--', label='95% esperado')
axes[1, 1].legend()
axes[1, 1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("\n‚úì M√©tricas de validaci√≥n cruzada visualizadas")

## 13. Resumen Ejecutivo y Recomendaciones

In [None]:
print("=" * 70)
print("RESUMEN EJECUTIVO - MODELO DE PREDICCI√ìN DE DEMANDA")
print("=" * 70)

print(f"\nüìä DATOS UTILIZADOS")
print(f"  ‚Ä¢ Periodo: {df_pd['ds'].min().strftime('%Y-%m-%d')} a {df_pd['ds'].max().strftime('%Y-%m-%d')}")
print(f"  ‚Ä¢ Total de semanas: {len(df_pd)}")
print(f"  ‚Ä¢ Granularidad: Semanal")
print(f"  ‚Ä¢ Variable objetivo: payment_value (ventas totales)")

print(f"\nü§ñ MODELO")
print(f"  ‚Ä¢ Algoritmo: Prophet (Meta/Facebook)")
print(f"  ‚Ä¢ Estacionalidad: Multiplicativa")
print(f"  ‚Ä¢ Componentes: Tendencia + Anual + Semanal + Holidays BR")

print(f"\nüìà PERFORMANCE EN TEST SET")
print(f"  ‚Ä¢ MAPE: {mape:.2f}%")
print(f"  ‚Ä¢ MAE: R$ {mae:,.2f}")
print(f"  ‚Ä¢ RMSE: R$ {rmse:,.2f}")
print(f"  ‚Ä¢ R¬≤: {r2:.4f}")

print(f"\nüéØ PRON√ìSTICO PR√ìXIMO TRIMESTRE")
print(f"  ‚Ä¢ Periodo: {forecast_future['Fecha'].min().strftime('%Y-%m-%d')} a {forecast_future['Fecha'].max().strftime('%Y-%m-%d')}")
print(f"  ‚Ä¢ Ventas esperadas: R$ {total_predicho:,.2f}")
print(f"  ‚Ä¢ Escenario pesimista: R$ {total_inferior:,.2f}")
print(f"  ‚Ä¢ Escenario optimista: R$ {total_superior:,.2f}")
print(f"  ‚Ä¢ Crecimiento vs trimestre anterior: {growth_pct:+.2f}%")

print(f"\nüí° INSIGHTS CLAVE")
# Identificar mes con mayores ventas en el pron√≥stico
forecast_future_copy = forecast_future.copy()
forecast_future_copy['Mes'] = pd.to_datetime(forecast_future_copy['Fecha']).dt.month
best_month = forecast_future_copy.groupby('Mes')['Predicci√≥n'].sum().idxmax()
month_names = {1:'Enero', 2:'Febrero', 3:'Marzo', 4:'Abril', 5:'Mayo', 6:'Junio',
               7:'Julio', 8:'Agosto', 9:'Septiembre', 10:'Octubre', 11:'Noviembre', 12:'Diciembre'}

print(f"  ‚Ä¢ Mes con mayores ventas proyectadas: {month_names.get(best_month, best_month)}")
print(f"  ‚Ä¢ Tendencia general: {'Crecimiento' if growth_pct > 0 else 'Decrecimiento'}")

print(f"\nüì¶ RECOMENDACIONES PARA INVENTARIO")
weekly_avg_forecast = total_predicho / 13
print(f"  1. Preparar inventario para ~R$ {weekly_avg_forecast:,.2f} en ventas semanales")
print(f"  2. Considerar escenario optimista (+{((total_superior-total_predicho)/total_predicho*100):.1f}%) para productos de alta rotaci√≥n")
print(f"  3. Mantener buffer de seguridad para variaciones estacionales")
print(f"  4. Priorizar stock en {month_names.get(best_month, best_month)} (mes de mayor demanda proyectada)")

print("\n" + "=" * 70)
print("‚úì An√°lisis de predicci√≥n de demanda completado")
print("=" * 70)

## 14. Exportar Resultados

In [None]:
# Guardar pron√≥stico en CSV
forecast_future.to_csv('Data/pronostico_trimestral.csv', index=False)
print("‚úì Pron√≥stico guardado en: Data/pronostico_trimestral.csv")

# Guardar m√©tricas
metrics_summary = pd.DataFrame({
    'M√©trica': ['MAPE (%)', 'MAE (R$)', 'RMSE (R$)', 'R¬≤', 'Ventas Proyectadas Trimestre', 'Crecimiento (%)'],
    'Valor': [mape, mae, rmse, r2, total_predicho, growth_pct]
})
metrics_summary.to_csv('Data/metricas_modelo_demanda.csv', index=False)
print("‚úì M√©tricas guardadas en: Data/metricas_modelo_demanda.csv")

print("\n‚úì Todos los resultados exportados exitosamente")

---

## üìä Visualizaci√≥n de Resultados: Streamlit vs Power BI

### **Recomendaci√≥n: STREAMLIT** ‚úÖ

#### ¬øPor qu√© Streamlit?

**Ventajas para este proyecto:**
1. ‚úÖ **Integraci√≥n Python nativa** - Ya tienes todo en Python
2. ‚úÖ **R√°pido desarrollo** - Dashboard en 30-60 minutos
3. ‚úÖ **Interactividad** - Filtros din√°micos, gr√°ficos interactivos
4. ‚úÖ **Deploy gratuito** - Streamlit Cloud (gratis)
5. ‚úÖ **Visualizaciones con Plotly** - Mismo c√≥digo que usaste aqu√≠
6. ‚úÖ **Actualizaci√≥n en tiempo real** - Re-entrena modelo con nuevos datos
7. ‚úÖ **Portafolio profesional** - URL compartible para mostrar tu trabajo

**C√≥digo ejemplo para Streamlit:**
```python
import streamlit as st
import plotly.express as px

st.title('üìà Predicci√≥n de Demanda - Olist')
st.plotly_chart(fig_forecast, use_container_width=True)
st.metric('Ventas Proyectadas', f'R$ {total_predicho:,.2f}', f'{growth_pct:+.1f}%')
```

---

### Power BI (Alternativa)

**Ventajas:**
- ‚úÖ M√°s conocido en empresas
- ‚úÖ Mejores dashboards est√°ticos
- ‚úÖ Integraci√≥n con Excel/SQL

**Desventajas:**
- ‚ùå No ejecuta modelos Python directamente
- ‚ùå Necesitas exportar predicciones a CSV
- ‚ùå Menos flexible para actualizaciones
- ‚ùå Licencia de pago para compartir online

---

### **Decisi√≥n Final: Streamlit**

Para un proyecto acad√©mico/portafolio con modelos de ML, **Streamlit es superior** porque:
- Muestra tu c√≥digo Python en acci√≥n
- Es m√°s impresionante para reclutadores tech
- Gratis y f√°cil de compartir
- Deploy en minutos

**¬øQuieres que cree el dashboard de Streamlit ahora?**