# 2.1 Fundamentos de Window Functions

**Resumen Ejecutivo**: Las funciones de ventana (`OVER()`) permiten c√°lculos fila-a-fila (rankings, acumulados, comparaciones con filas anteriores) sin colapsar las filas como `GROUP BY`, manteniendo el detalle original.

---

## üéØ Objetivos de Aprendizaje
- Diferenciar `GROUP BY` vs. funciones de ventana y cu√°ndo usar cada una.
- Aplicar `RANK()`, `DENSE_RANK()`, `ROW_NUMBER()` para rankings.
- Usar `LAG/LEAD` para comparaciones temporales (per√≠odo anterior/siguiente).
- Calcular acumulados y promedios m√≥viles con `ROWS BETWEEN`.

## üß∞ Prerrequisitos
- Haber completado Level 1 y ejecutado `dataset_setup.sql`.
- Conocer agregaciones (`SUM`, `AVG`) y particionamiento conceptual.
- Familiaridad con `fact_ventas` y columnas de fecha.

---

## üìö Conceptos Clave
- **OVER()**: define la "ventana" de filas para c√°lculos sin colapsar.
- **PARTITION BY**: reinicia c√°lculo por grupo (similar a `GROUP BY` pero sin agregar).
- **ORDER BY**: especifica orden para c√°lculos secuenciales (LAG, acumulados).
- **ROWS/RANGE**: delimita rango de filas para funciones agregadas (promedios m√≥viles).

> ‚ö†Ô∏è Olvidar `PARTITION BY` calcula sobre toda la tabla; `ORDER BY` incorrecto en `LAG/LEAD` devuelve filas inesperadas.

## ¬øPor qu√© usar Window Functions?

Las funciones de ventana (window functions) permiten realizar c√°lculos sobre conjuntos de filas **relacionadas** con la fila actual, SIN colapsar las filas como hace GROUP BY.

**Problema con GROUP BY:**
```sql
SELECT producto_id, SUM(cantidad) AS total
FROM fact_ventas
GROUP BY producto_id;
```
**Resultado:** Una fila por producto (colapsa todas las ventas de ese producto en una sola l√≠nea).

**Soluci√≥n con Window Functions:**
```sql
SELECT producto_id, fecha, cantidad,
       SUM(cantidad) OVER (PARTITION BY producto_id) AS total_producto
FROM fact_ventas;
```
**Resultado:** Todas las filas originales + columna calculada con el total del producto.

**Para qu√©:**
- Rankings sin eliminar filas (top 10 productos manteniendo todas sus ventas)
- Acumulados running totals (ventas acumuladas d√≠a a d√≠a)
- Comparaciones per√≠odo anterior (LAG: ventas de hoy vs ayer)
- Promedios m√≥viles (√∫ltimos 7 d√≠as)

**C√≥mo:**
- **OVER():** Define la "ventana" de filas para el c√°lculo
- **PARTITION BY:** Reinicia c√°lculo por cada grupo (como GROUP BY pero sin colapsar)
- **ORDER BY:** Define orden para c√°lculos secuenciales (LAG, acumulados)
- **ROWS/RANGE:** Especifica rango de filas para funciones agregadas

## Tipos de Window Functions

### 1. Funciones de Ranking

#### RANK()
Asigna posici√≥n con saltos cuando hay empates.
```sql
SELECT producto_id, ventas,
       RANK() OVER (ORDER BY ventas DESC) AS ranking
FROM productos_ventas;
```
**Ejemplo:** 1, 2, 2, 4 (dos productos empatados en 2do lugar, siguiente es 4to)

#### DENSE_RANK()
Asigna posici√≥n sin saltos.
```sql
DENSE_RANK() OVER (ORDER BY ventas DESC) AS ranking
```
**Ejemplo:** 1, 2, 2, 3 (siguiente al empate es 3ro, no 4to)

#### ROW_NUMBER()
Asigna n√∫mero secuencial √∫nico (desempata arbitrariamente).
```sql
ROW_NUMBER() OVER (ORDER BY ventas DESC) AS fila
```
**Ejemplo:** 1, 2, 3, 4 (no hay empates, desempata por orden interno)

**¬øCu√°l usar?**
- **ROW_NUMBER():** Cuando necesitas IDs √∫nicos o paginar resultados
- **RANK():** Cuando quieres mostrar saltos en ranking (como en deportes)
- **DENSE_RANK():** Cuando quieres posiciones consecutivas (top 10 productos puede incluir m√°s de 10 si hay empates)

### 2. Funciones de Acceso (LAG/LEAD)

#### LAG() - Valor de fila anterior
```sql
SELECT fecha, ventas,
       LAG(ventas, 1, 0) OVER (ORDER BY fecha) AS ventas_ayer
FROM ventas_diarias;
```
**Par√°metros:**
- `LAG(columna, offset, default)`
- `offset`: cu√°ntas filas atr√°s (1 = fila anterior, 2 = dos filas atr√°s)
- `default`: valor si no hay fila anterior (primera fila)

#### LEAD() - Valor de fila siguiente
```sql
SELECT fecha, ventas,
       LEAD(ventas) OVER (ORDER BY fecha) AS ventas_manana
FROM ventas_diarias;
```

**Caso de uso: Variaci√≥n porcentual**
```sql
SELECT fecha, ventas,
       LAG(ventas) OVER (ORDER BY fecha) AS ventas_previas,
       CASE 
         WHEN LAG(ventas) OVER (ORDER BY fecha) > 0 
         THEN (ventas - LAG(ventas) OVER (ORDER BY fecha)) * 100.0 / LAG(ventas) OVER (ORDER BY fecha)
         ELSE NULL
       END AS variacion_pct
FROM ventas_diarias;
```

### 3. Funciones Agregadas con OVER()

#### Running Total (Acumulado)
```sql
SELECT fecha, ventas,
       SUM(ventas) OVER (ORDER BY fecha ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS acumulado
FROM ventas_diarias;
```
**ROWS BETWEEN:**
- `UNBOUNDED PRECEDING`: desde el inicio
- `CURRENT ROW`: hasta la fila actual
- `UNBOUNDED FOLLOWING`: hasta el final

#### Promedio M√≥vil (Moving Average)
```sql
SELECT fecha, ventas,
       AVG(ventas) OVER (ORDER BY fecha ROWS BETWEEN 6 PRECEDING AND CURRENT ROW) AS promedio_7dias
FROM ventas_diarias;
```
**Interpretaci√≥n:** Promedio de √∫ltimos 7 d√≠as (fila actual + 6 anteriores)

## PARTITION BY - Reiniciar por Grupo

Sin PARTITION BY:
```sql
SELECT producto_id, fecha, cantidad,
       SUM(cantidad) OVER (ORDER BY fecha) AS acumulado_global
FROM fact_ventas;
```
**Resultado:** Acumulado de TODOS los productos juntos

Con PARTITION BY:
```sql
SELECT producto_id, fecha, cantidad,
       SUM(cantidad) OVER (PARTITION BY producto_id ORDER BY fecha) AS acumulado_producto
FROM fact_ventas;
```
**Resultado:** Acumulado reinicia para cada producto (acumulado por producto)

**Analog√≠a:** PARTITION BY es como hacer m√∫ltiples c√°lculos independientes, uno por cada valor de la columna especificada.

## Errores Comunes

1. **Olvidar PARTITION BY cuando se necesita:**
   ```sql
   -- INCORRECTO: ranking global cuando quer√≠as ranking por categor√≠a
   RANK() OVER (ORDER BY ventas DESC)
   
   -- CORRECTO: ranking dentro de cada categor√≠a
   RANK() OVER (PARTITION BY categoria ORDER BY ventas DESC)
   ```

2. **ORDER BY incorrecto en LAG/LEAD:**
   Si comparas "ventas de hoy vs ayer", ORDER BY debe ser por `fecha`, no por `ventas`.

3. **Llamar window function m√∫ltiples veces:**
   ```sql
   -- INEFICIENTE:
   LAG(ventas) OVER (...), 
   (ventas - LAG(ventas) OVER (...)) / LAG(ventas) OVER (...)
   
   -- MEJOR: calcular LAG una vez en subconsulta o CTE
   ```

4. **Divisi√≥n por cero en variaciones:**
   Siempre usar CASE para verificar denominador > 0 antes de dividir.

In [None]:
-- Ranking de productos por unidades vendidas (desc)
SELECT producto_id, SUM(cantidad) AS unidades,
       RANK() OVER (ORDER BY SUM(cantidad) DESC) AS rk
FROM dbo.fact_ventas
GROUP BY producto_id;

In [None]:
-- Ventas por d√≠a y acumulado
SELECT fecha, SUM(cantidad) AS unidades_dia,
       SUM(SUM(cantidad)) OVER (ORDER BY fecha ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS unidades_acumuladas
FROM dbo.fact_ventas
GROUP BY fecha
ORDER BY fecha;

üü¢ Ejercicio: Agregar DENSE_RANK por margen total de producto.

In [None]:
SELECT p.producto_id, p.nombre,
       SUM(fv.cantidad*(p.precio_unitario-p.costo_unitario)) AS margen_total,
       DENSE_RANK() OVER (ORDER BY SUM(fv.cantidad*(p.precio_unitario-p.costo_unitario)) DESC) AS drk
FROM dbo.fact_ventas fv
JOIN dbo.dim_productos p ON fv.producto_id = p.producto_id
GROUP BY p.producto_id, p.nombre;

---

## üß™ Ejercicios Guiados
- üü¢ Agregar `DENSE_RANK` por margen total de producto (sin saltos en posiciones).
- üü† Usar `LAG` para comparar unidades de cada producto vs d√≠a anterior.
- üî¥ Calcular variaci√≥n porcentual robusta evitando divisi√≥n por cero (usar `CASE`).

---

## ‚úÖ Conclusiones
- Window functions mantienen el detalle de filas mientras calculan agregaciones/rankings contextuales.
- `PARTITION BY` segmenta c√°lculos; `ORDER BY` especifica secuencia para `LAG/LEAD` y acumulados.
- Preferir CTEs para evitar repetir l√≥gica de funciones de ventana y mejorar legibilidad.

---

## üöÄ Aplicaci√≥n Pr√°ctica
- Rankings de productos/clientes sin perder detalle de transacciones individuales.
- Acumulados (running totals) para dashboards de ventas d√≠a a d√≠a.
- Comparaciones per√≠odo anterior (LAG) para calcular crecimiento semanal/mensual.

---

## üíº Perspectiva de Negocio
- Rankings din√°micos permiten segmentar top performers sin agregar datos manualmente.
- Acumulados visibilizan cumplimiento de metas progresivas (ventas YTD, QTD).
- Comparaciones temporales (`LAG`) detectan tendencias y anomal√≠as en tiempo real.

In [None]:
SELECT producto_id, fecha, SUM(cantidad) AS unidades_dia,
       LAG(SUM(cantidad)) OVER (PARTITION BY producto_id ORDER BY fecha) AS unidades_previas
FROM dbo.fact_ventas
GROUP BY producto_id, fecha
ORDER BY producto_id, fecha;

---

## üîñ Pie Editorial

**Curso**: Fundamentos de SQL Server - Nivel 2  
**M√≥dulo**: 2.1 Fundamentos de Window Functions  
**Versi√≥n**: 2.0 (Actualizado Enero 2025)  
**Autor**: lraigosov / LuisRai  
**Licencia**: Uso educativo - Atribuci√≥n requerida

> üí° Nota sobre IA: Este material fue estructurado con asistencia de modelos de lenguaje (OpenAI GPT-4, Anthropic Claude); el contenido fue validado y curado por especialistas para evitar alucinaciones y asegurar aplicabilidad pr√°ctica.

---
## Navegaci√≥n
[Siguiente ‚û°Ô∏è](02_ctes_recursivas.ipynb)
---
