# 1.6 Agregaciones y KPIs

- Objetivo: calcular m√©tricas agregadas (SUM, AVG, COUNT) y KPIs de negocio.
- Prerrequisitos: entender GROUP BY, funciones agregadas, diferencia entre COUNT(*) y COUNT(DISTINCT).
- Ejercicios: ingreso bruto, margen, ticket promedio, top productos.
- Reto: KPIs complejos con m√∫ltiples niveles de agregaci√≥n.
- Errores comunes: olvidar DISTINCT en conteos, mezclar granularidades.

## ¬øPor qu√© calcular KPIs con SQL?

Los **KPIs (Key Performance Indicators)** son m√©tricas que resumen el desempe√±o del negocio. SQL es la herramienta ideal para calcularlos porque:

- Procesa millones de registros eficientemente
- Centraliza l√≥gica de negocio (todos usan la misma definici√≥n de "ticket promedio")
- Alimenta dashboards en tiempo real (Power BI, Tableau, Looker)

**Para qu√©:**
- Monitorear salud del negocio (ingresos diarios, margen, tasa de conversi√≥n)
- Comparar per√≠odos (mes actual vs mes anterior)
- Identificar outliers (d√≠as con ventas anormalmente bajas)

**C√≥mo:**
- **SUM:** Total acumulado (ingresos totales, unidades vendidas)
- **AVG:** Promedio (ticket promedio, descuento promedio)
- **COUNT:** Conteo (n√∫mero de transacciones, clientes √∫nicos)
- **MIN/MAX:** Extremos (venta m√≠nima, fecha m√°s reciente)

## Funciones de Agregaci√≥n

### SUM - Suma Total
```sql
SELECT SUM(cantidad) AS unidades_totales
FROM fact_ventas;
```
**Uso:** Ingresos totales, unidades vendidas, costo total de inventario.

### AVG - Promedio
```sql
SELECT AVG(precio_unitario) AS precio_promedio
FROM dim_productos;
```
**Cuidado:** AVG(cantidad*precio) NO es lo mismo que SUM(cantidad*precio) / COUNT(*). Usar subconsultas cuando sea necesario.

### COUNT - Conteo
```sql
-- Transacciones totales
SELECT COUNT(*) FROM fact_ventas;

-- Clientes √∫nicos que compraron
SELECT COUNT(DISTINCT cliente_id) FROM fact_ventas;
```
**COUNT(*):** Todas las filas (incluyendo duplicados)
**COUNT(DISTINCT col):** Valores √∫nicos de columna (elimina duplicados)
**COUNT(col):** Cuenta solo valores no NULL

### GROUP BY - Agrupar por Dimensi√≥n
```sql
SELECT fecha, SUM(cantidad) AS unidades_dia
FROM fact_ventas
GROUP BY fecha;
```
**Regla:** Toda columna en SELECT que no est√© en funci√≥n agregada DEBE estar en GROUP BY.

## KPIs de Negocio Comunes

### Ticket Promedio
**Definici√≥n:** Ingreso promedio por transacci√≥n

```sql
SELECT AVG(cantidad * precio_unitario * (1 - descuento_pct/100)) AS ticket_promedio
FROM fact_ventas v
JOIN dim_productos p ON v.producto_id = p.producto_id;
```

### Margen Bruto
**Definici√≥n:** Ingresos - Costos

```sql
SELECT 
  SUM(cantidad * precio_unitario * (1 - descuento_pct/100)) AS ingresos,
  SUM(cantidad * costo_unitario) AS costos,
  SUM(cantidad * precio_unitario * (1 - descuento_pct/100)) - SUM(cantidad * costo_unitario) AS margen_bruto
FROM fact_ventas v
JOIN dim_productos p ON v.producto_id = p.producto_id;
```

### Tasa de Conversi√≥n (Clientes que compraron / Total visitantes)
*Requiere tabla de visitas*

### Churn Rate (Clientes que dejaron de comprar)
*An√°lisis de cohortes, tema avanzado*

## Errores Comunes

1. **Olvidar DISTINCT en conteos de clientes √∫nicos:**
   ```sql
   -- INCORRECTO: cuenta transacciones, no clientes
   SELECT COUNT(cliente_id) FROM fact_ventas;
   
   -- CORRECTO: clientes √∫nicos
   SELECT COUNT(DISTINCT cliente_id) FROM fact_ventas;
   ```

2. **Mezclar granularidades:**
   ```sql
   -- INCORRECTO: margen_pct debe calcularse DESPU√âS de sumar
   SELECT AVG(margen_pct) FROM productos;  -- Promedio de promedios (mal)
   
   -- CORRECTO: sumar ingresos y costos, luego dividir
   SELECT SUM(ingresos) / SUM(costos) AS margen_pct;
   ```

3. **No separar costos de ingresos:**
   Calcular margen como `SUM(precio - costo)` puede ocultar problemas (alto ingreso con alto costo vs bajo ingreso con bajo costo).

4. **Promediar promedios:**
   Si tienes ingreso promedio diario, el promedio mensual NO es `AVG(ingreso_promedio_dia)` sino `SUM(ingresos_mes) / d√≠as_mes`.

In [None]:
-- Unidades totales y clientes distintos por d√≠a
SELECT fecha, SUM(cantidad) AS unidades_totales, COUNT(DISTINCT cliente_id) AS clientes_distintos
FROM dbo.fact_ventas
GROUP BY fecha
ORDER BY fecha;

In [None]:
-- Ticket promedio (ingreso promedio por venta)
SELECT AVG(v.cantidad * p.precio_unitario * (1 - v.descuento_pct/100)) AS ticket_promedio
FROM dbo.fact_ventas v
JOIN dbo.dim_productos p ON v.producto_id = p.producto_id;

üü¢ Ejercicio: Ingreso bruto por d√≠a y su promedio diario global.

In [None]:
SELECT fecha, SUM(v.cantidad * p.precio_unitario * (1 - v.descuento_pct/100)) AS ingreso_bruto
FROM dbo.fact_ventas v
JOIN dbo.dim_productos p ON v.producto_id = p.producto_id
GROUP BY fecha
ORDER BY fecha;

SELECT AVG(x.ingreso_bruto) AS ingreso_diario_promedio
FROM (SELECT fecha, SUM(v.cantidad * p.precio_unitario * (1 - v.descuento_pct/100)) AS ingreso_bruto
      FROM dbo.fact_ventas v JOIN dbo.dim_productos p ON v.producto_id = p.producto_id
      GROUP BY fecha) x;

üü† Ejercicio: Margen bruto total (ingreso - costo).

In [None]:
SELECT SUM(v.cantidad * p.precio_unitario * (1 - v.descuento_pct/100)) - SUM(v.cantidad * p.costo_unitario) AS margen_total
FROM dbo.fact_ventas v
JOIN dbo.dim_productos p ON v.producto_id = p.producto_id;

üî¥ Reto: Top 3 productos por ingreso acumulado.

In [None]:
SELECT TOP 3 p.producto_id, p.nombre, SUM(v.cantidad * p.precio_unitario) AS ingreso
FROM dbo.fact_ventas v
JOIN dbo.dim_productos p ON v.producto_id = p.producto_id
GROUP BY p.producto_id, p.nombre
ORDER BY ingreso DESC;

Errores comunes: olvidar DISTINCT en conteos; no separar costos vs ingresos; mezclar granularidades.