
# ü™ü Gu√≠a r√°pida de **Window Functions** en SQL

Este **Jupyter Notebook** est√° pensado para estudiar de forma clara y pr√°ctica las *window functions*.
Incluye explicaciones en **Markdown** y ejemplos en **SQL** (puedes copiar y pegar en tu motor SQL).

> **Compatibilidad (general):** PostgreSQL, SQL Server, Oracle, MySQL 8+, SQLite 3.25+. Algunos detalles de sintaxis pueden variar levemente entre motores.

---



## 1) ¬øQu√© es una *window function*?

Una *window function* **calcula algo mirando un conjunto de filas (la *ventana*)** y **escribe el resultado al lado de cada fila sin agrupar ni eliminar filas**. 

Se escriben con la sintaxis:

```sql
<funci√≥n_de_ventana>() OVER (
  PARTITION BY ...   -- define "subgrupos l√≥gicos" (opcional)
  ORDER BY ...       -- define el orden en la ventana (opcional)
  [frame clause]     -- define el marco de filas que se miran (opcional)
)
```

- `PARTITION BY` crea **grupos l√≥gicos** sin reducir el n√∫mero de filas.
- `ORDER BY` define el **orden** dentro de cada partici√≥n (clave para ranking, LAG/LEAD, acumulados, etc.).
- El **marco** (`ROWS` o `RANGE`) afina **exactamente qu√© filas** se consideran alrededor de la fila actual.



## 2) Tabla de ejemplo

Usaremos una tabla **ventas** con las columnas clave:

```sql
-- Esquema sugerido (ad√°ptalo a tu motor)
CREATE TABLE ventas (
  vendedor   VARCHAR(50),
  fecha      DATE,
  monto      DECIMAL(10,2),
  region     VARCHAR(50)
);

-- Datos de ejemplo
INSERT INTO ventas (vendedor, fecha, monto, region) VALUES
('Ana',  '2024-01-05', 100, 'Norte'),
('Ana',  '2024-01-10', 200, 'Norte'),
('Ana',  '2024-02-02', 150, 'Sur'),
('Luis', '2024-01-07', 300, 'Norte'),
('Luis', '2024-01-20', 120, 'Sur'),
('Luis', '2024-02-11', 180, 'Sur'),
('Mia',  '2024-01-15', 130, 'Norte'),
('Mia',  '2024-02-01', 220, 'Norte');
```



## 3) `SUM()` con `OVER()` ‚Äî Total por vendedor **sin perder filas**

Calcula el total de ventas por vendedor y lo repite en cada fila del vendedor.


In [None]:

-- Total por vendedor (sin agrupar filas)
SELECT
  vendedor,
  fecha,
  monto,
  SUM(monto) OVER (PARTITION BY vendedor) AS total_por_vendedor
FROM ventas
ORDER BY vendedor, fecha;



## 4) Acumulado (running total) por vendedor

Usa `ORDER BY` para calcular el acumulado en el tiempo dentro de cada vendedor.


In [None]:

-- Acumulado por vendedor ordenado por fecha
SELECT
  vendedor,
  fecha,
  monto,
  SUM(monto) OVER (
    PARTITION BY vendedor
    ORDER BY fecha
    ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS acumulado_vendedor
FROM ventas
ORDER BY vendedor, fecha;



## 5) Promedio m√≥vil (ventana deslizante)

Promedio de los **√∫ltimos 3 registros** (incluyendo el actual) por vendedor.


In [None]:

-- Promedio m√≥vil de 3 filas por vendedor
SELECT
  vendedor,
  fecha,
  monto,
  AVG(monto) OVER (
    PARTITION BY vendedor
    ORDER BY fecha
    ROWS BETWEEN 2 PRECEDING AND CURRENT ROW
  ) AS promedio_movil_3
FROM ventas
ORDER BY vendedor, fecha;



## 6) % del total por regi√≥n

Divide el monto de cada fila entre el total de su regi√≥n.


In [None]:

-- Porcentaje del total regional
SELECT
  region,
  vendedor,
  fecha,
  monto,
  monto * 1.0 / SUM(monto) OVER (PARTITION BY region) AS pct_region
FROM ventas
ORDER BY region, vendedor, fecha;



## 7) `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`

- `ROW_NUMBER()` numera sin empates (1, 2, 3, ...)
- `RANK()` deja huecos cuando hay empates (1, 1, 3, ...)
- `DENSE_RANK()` no deja huecos (1, 1, 2, ...)

Ejemplo: ranking por monto dentro de cada regi√≥n (mayor monto primero).


In [None]:

-- Ranking por regi√≥n
SELECT
  region,
  vendedor,
  fecha,
  monto,
  ROW_NUMBER()  OVER (PARTITION BY region ORDER BY monto DESC) AS rn,
  RANK()        OVER (PARTITION BY region ORDER BY monto DESC) AS rnk,
  DENSE_RANK()  OVER (PARTITION BY region ORDER BY monto DESC) AS drnk
FROM ventas
ORDER BY region, rnk, vendedor;



## 8) `LAG()` y `LEAD()` ‚Äî valores anterior y siguiente

Comparar la venta actual con la anterior por vendedor.


In [None]:

-- Diferencia vs la venta anterior por vendedor
SELECT
  vendedor,
  fecha,
  monto,
  LAG(monto) OVER (PARTITION BY vendedor ORDER BY fecha) AS monto_anterior,
  monto - LAG(monto) OVER (PARTITION BY vendedor ORDER BY fecha) AS diferencia_vs_anterior
FROM ventas
ORDER BY vendedor, fecha;



## 9) `NTILE(n)` ‚Äî dividir en cuantiles

Divide las filas ordenadas en **n** grupos del mismo tama√±o (o casi).


In [None]:

-- Cuartiles de monto a nivel global
SELECT
  vendedor,
  fecha,
  monto,
  NTILE(4) OVER (ORDER BY monto) AS cuartil
FROM ventas
ORDER BY monto;



## 10) `ROWS` vs `RANGE` en el marco de ventana

- `ROWS` cuenta **filas f√≠sicas**.
- `RANGE` agrupa **valores iguales** en la misma marca cuando hay orden por una sola columna num√©rica.

> Dependiendo del motor, `RANGE` puede requerir `ORDER BY` en una sola expresi√≥n y tener diferencias sutiles.


In [None]:

-- Ejemplo conceptual (tu motor puede variar)
-- Acumulado por fecha global, contando filas f√≠sicas
SELECT
  fecha,
  monto,
  SUM(monto) OVER (
    ORDER BY fecha
    ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS acum_rows
FROM ventas
ORDER BY fecha;

-- Similar con RANGE: agrupa valores con mismo ORDER BY (si aplica y si tu motor lo soporta como esperas)
SELECT
  fecha,
  monto,
  SUM(monto) OVER (
    ORDER BY fecha
    RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS acum_range
FROM ventas
ORDER BY fecha;



## 11) Top-N por grupo con `ROW_NUMBER()`

Quedarse con la **venta m√°s alta por vendedor**.


In [None]:

-- Top 1 por vendedor (mayor monto)
WITH ranked AS (
  SELECT
    vendedor,
    fecha,
    monto,
    ROW_NUMBER() OVER (PARTITION BY vendedor ORDER BY monto DESC) AS rn
  FROM ventas
)
SELECT *
FROM ranked
WHERE rn = 1
ORDER BY vendedor;



## 12) Particiones m√∫ltiples (vendedor + regi√≥n)

Acumulado por **vendedor y regi√≥n**.


In [None]:

-- Acumulado por vendedor y regi√≥n
SELECT
  vendedor,
  region,
  fecha,
  monto,
  SUM(monto) OVER (
    PARTITION BY vendedor, region
    ORDER BY fecha
    ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS acumulado_vend_region
FROM ventas
ORDER BY vendedor, region, fecha;



## 13) Nota: `DISTINCT` y *window functions*

`DISTINCT` **no** se aplica dentro de las funciones de ventana como `SUM() OVER (...)`. 
Si necesitas una agregaci√≥n con `DISTINCT`, normalmente debes hacerlo en una subconsulta o CTE y luego aplicar la *window function* sobre ese resultado.



## 14) Consejos pr√°cticos y diferencias entre motores

- **PostgreSQL / SQL Server / Oracle**: soporte muy completo de *window functions* y marcos (`ROWS`/`RANGE`).
- **MySQL**: desde **8.0** soporta *window functions*. Versiones anteriores **no**.
- **SQLite**: desde **3.25** (2018) tiene *window functions* b√°sicas; revisa limitaciones de `RANGE`.
- **Performance**: agrega √≠ndices que soporten el `PARTITION BY`/`ORDER BY` cuando sea posible.
- **`ORDER BY` es clave** para resultados deterministas, sobre todo con `ROW_NUMBER`, `LAG/LEAD` y acumulados.



## 15) Retos para practicar

1. Calcula el **% de contribuci√≥n** de cada vendedor dentro de su **regi√≥n y mes**.
2. Obt√©n el **top 2** de ventas por **regi√≥n** usando `ROW_NUMBER()`.
3. Calcula la **variaci√≥n porcentual** vs la venta anterior por vendedor: `(monto - LAG(monto)) / LAG(monto)`.
4. Saca una **media m√≥vil de 7 d√≠as** por vendedor.
5. Usa `NTILE(3)` para clasificar a cada venta en **bajo/medio/alto** dentro de cada regi√≥n.



---

### ‚úîÔ∏è Resumen r√°pido
- *Window functions* **no reducen filas**, agregan informaci√≥n fila a fila.
- `PARTITION BY` define **subgrupos**, `ORDER BY` define **orden**, y el **marco** (`ROWS`/`RANGE`) define **exactamente qu√© filas** se consideran.
- Herramientas clave: `SUM/AVG/COUNT` con `OVER`, `ROW_NUMBER`, `RANK/DENSE_RANK`, `LAG/LEAD`, `NTILE`, acumulados y promedios m√≥viles.

¬øQuieres que adapte los ejemplos a tu motor (PostgreSQL, SQL Server, MySQL, etc.) o a tu propio esquema de datos?
