# üìä OfficeMax M√©xico - Pron√≥stico de Ventas Back-to-School

## An√°lisis y Modelos Predictivos con Snowflake ML

Este notebook complementa el **Quickstart de OfficeMax** y demuestra c√≥mo usar Machine Learning en SQL para crear modelos de pron√≥stico de ventas para la temporada escolar.

### Objetivos:
- üéØ Crear modelos predictivos para productos Back-to-School
- üìà Analizar tendencias de ventas por categor√≠a
- üîÆ Generar pron√≥sticos para optimizaci√≥n de inventario
- üí° Proporcionar insights accionables para el negocio

### Datos utilizados:
- Productos de temporada escolar (Mochilas, Papeler√≠a, Tecnolog√≠a, Arte)
- Ventas hist√≥ricas de m√∫ltiples sucursales
- Datos de inventario y clientes
- Informaci√≥n de marketing y promociones

---
**Prerrequisitos**: Haber ejecutado el script `officemax-setup.sql` previamente.


In [None]:
# Configuraci√≥n inicial y conexi√≥n a Snowflake
import snowflake.connector
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

# Configurar estilo de gr√°ficos con colores corporativos OfficeMax
plt.style.use('seaborn-v0_8')
officemax_colors = ['#003366', '#CC0000', '#0066CC', '#FF6600', '#669933', '#9966CC']

# Configuraci√≥n de la conexi√≥n (ajustar seg√∫n tu entorno)
conn_params = {
    'user': 'TU_USUARIO',
    'password': 'TU_PASSWORD',
    'account': 'TU_CUENTA.region',
    'warehouse': 'OFFICEMAX_WH',
    'database': 'OFFICEMAX_ANALYTICS',
    'schema': 'ANALYTICS'
}

# Establecer conexi√≥n
print("üîå Conectando a Snowflake...")
try:
    conn = snowflake.connector.connect(**conn_params)
    print("‚úÖ Conexi√≥n exitosa a Snowflake")
except Exception as e:
    print(f"‚ùå Error de conexi√≥n: {e}")
    print("üìù Recuerda ajustar los par√°metros de conexi√≥n seg√∫n tu entorno")


## üìä Exploraci√≥n de Datos

Comenzemos explorando los datos disponibles para entender los patrones de ventas de productos Back-to-School.


In [None]:
# Cargar datos principales desde Snowflake
def ejecutar_query(query, descripcion=""):
    """Funci√≥n helper para ejecutar queries y retornar DataFrames"""
    if descripcion:
        print(f"üìã {descripcion}")
    
    cursor = conn.cursor()
    try:
        df = pd.read_sql(query, conn)
        print(f"‚úÖ Query ejecutada exitosamente - {len(df)} registros obtenidos")
        return df
    except Exception as e:
        print(f"‚ùå Error en query: {e}")
        return pd.DataFrame()
    finally:
        cursor.close()

# 1. Resumen de productos disponibles
query_productos = """
SELECT 
    CATEGORIA,
    SUB_CATEGORIA,
    COUNT(*) as TOTAL_PRODUCTOS,
    AVG(PRECIO_UNITARIO) as PRECIO_PROMEDIO,
    MIN(PRECIO_UNITARIO) as PRECIO_MIN,
    MAX(PRECIO_UNITARIO) as PRECIO_MAX
FROM RAW_DATA.PRODUCTOS 
WHERE TEMPORADA = 'Back-to-School'
GROUP BY CATEGORIA, SUB_CATEGORIA
ORDER BY CATEGORIA, PRECIO_PROMEDIO DESC
"""

df_productos = ejecutar_query(query_productos, "Cargando informaci√≥n de productos...")
print("\nüì¶ Resumen de Productos por Categor√≠a:")
print(df_productos)
