# 2.3 Subconsultas Avanzadas

**Resumen Ejecutivo**: Las subconsultas correlacionadas y `EXISTS/NOT EXISTS` permiten filtros contextuales complejos; aprende cu√°ndo usarlas y cu√°ndo reescribirlas con JOINs o CTEs para mejorar rendimiento y legibilidad.

---

## üéØ Objetivos de Aprendizaje
- Aplicar subconsultas correlacionadas para comparaciones con promedios segmentados.
- Usar `EXISTS` para verificar existencia sin traer datos.
- Reescribir subconsultas con CTEs/JOINs cuando mejore claridad o rendimiento.

## üß∞ Prerrequisitos
- Haber completado `02_ctes_recursivas.ipynb`.
- Dominar JOINs y agregaciones (`GROUP BY`, `HAVING`).
- Conocer el impacto de √≠ndices en columnas filtradas.

---

## üìö Conceptos Clave
- **Subconsulta correlacionada**: subconsulta que referencia tabla externa (se ejecuta por cada fila).
- **EXISTS**: verifica existencia de filas (eficiente con √≠ndices, retorna booleano).
- **NOT EXISTS**: filtro negativo (filas sin coincidencias).
- **Reescritura**: convertir correlaciones en JOINs/CTEs para evitar ejecuciones repetidas.

> ‚ö†Ô∏è Subconsultas correlacionadas profundas degradan rendimiento; falta de √≠ndices en columnas filtradas amplifica el problema.

In [None]:
-- Subconsulta correlacionada: productos con margen total > promedio global
SELECT p.producto_id, p.nombre
FROM dbo.dim_productos p
WHERE (SELECT SUM(fv.cantidad*(p.precio_unitario-p.costo_unitario))
       FROM dbo.fact_ventas fv
       WHERE fv.producto_id = p.producto_id) > (
          SELECT AVG(sub.margen_prod)
          FROM (SELECT producto_id, SUM(cantidad*(precio_unitario-costo_unitario)) AS margen_prod
                FROM dbo.fact_ventas fv2
                JOIN dbo.dim_productos p2 ON fv2.producto_id = p2.producto_id
                GROUP BY producto_id) sub
      );

In [None]:
-- EXISTS: productos con al menos una venta con descuento >30%
SELECT p.producto_id, p.nombre
FROM dbo.dim_productos p
WHERE EXISTS (SELECT 1 FROM dbo.fact_ventas fv WHERE fv.producto_id = p.producto_id AND fv.descuento_pct > 30);

---

## üß™ Ejercicios Guiados
- üü¢ Productos con ventas en todos los d√≠as registrados (comparar `COUNT(DISTINCT fecha)`).
- üü† Clientes cuyo total de unidades supera el promedio de su segmento (subconsulta correlacionada).
- üî¥ Reescribir ejercicio anterior con CTE y JOIN evitando subconsulta correlacionada.

In [None]:
SELECT p.producto_id, p.nombre
FROM dbo.dim_productos p
WHERE (SELECT COUNT(DISTINCT fecha) FROM dbo.fact_ventas fv WHERE fv.producto_id = p.producto_id) = (SELECT COUNT(DISTINCT fecha) FROM dbo.fact_ventas);

In [None]:
SELECT c.cliente_id, c.nombre, c.segmento
FROM dbo.dim_clientes c
WHERE (SELECT SUM(fv.cantidad) FROM dbo.fact_ventas fv WHERE fv.cliente_id = c.cliente_id) > (
    SELECT AVG(sub.total_unidades)
    FROM (SELECT cliente_id, SUM(cantidad) AS total_unidades
          FROM dbo.fact_ventas fv2
          GROUP BY cliente_id) sub
    JOIN dbo.dim_clientes c2 ON sub.cliente_id = c2.cliente_id
    WHERE c2.segmento = c.segmento
);

---

## ‚ö†Ô∏è Errores Comunes
- Subconsultas innecesarias cuando un JOIN cumple el mismo prop√≥sito y es m√°s eficiente.
- Correlaciones profundas sin √≠ndices adecuados degradan rendimiento exponencialmente.
- Olvidar que `EXISTS` solo verifica existencia; si necesitas datos, usa JOIN.
- No validar planes de ejecuci√≥n para identificar cuellos de botella en subconsultas.

---

## ‚úÖ Conclusiones
- Subconsultas correlacionadas resuelven comparaciones contextuales pero pueden degradar rendimiento.
- `EXISTS/NOT EXISTS` es eficiente para verificaciones booleanas con √≠ndices adecuados.
- Reescribir con CTEs/JOINs mejora legibilidad y a menudo rendimiento; validar planes de ejecuci√≥n.

---

## üöÄ Aplicaci√≥n Pr√°ctica
- Identificar productos con ventas consistentes (todos los d√≠as).
- Segmentar clientes por comportamiento relativo a su cohorte.
- Detectar outliers (clientes/productos con m√©tricas at√≠picas vs. su segmento).

---

## üíº Perspectiva de Negocio
- Comparaciones segmentadas permiten identificar top performers dentro de cada categor√≠a.
- Detecci√≥n de anomal√≠as contextuales (vs. promedio de segmento) previene alertas falsas.
- Refactorizaci√≥n proactiva de subconsultas costosas reduce costos de infraestructura y mejora UX en dashboards.

---

## üîñ Pie Editorial

**Curso**: Fundamentos de SQL Server - Nivel 2  
**M√≥dulo**: 2.3 Subconsultas Avanzadas  
**Versi√≥n**: 2.0 (Actualizado Enero 2025)  
**Autor**: lraigosov / LuisRai  
**Licencia**: Uso educativo - Atribuci√≥n requerida

> üí° Nota sobre IA: Este material fue estructurado con asistencia de modelos de lenguaje (OpenAI GPT-4, Anthropic Claude); el contenido fue validado y curado por especialistas para evitar alucinaciones y asegurar aplicabilidad pr√°ctica.

---
## Navegaci√≥n
[‚¨ÖÔ∏è Anterior](02_ctes_recursivas.ipynb) | [Siguiente ‚û°Ô∏è](04_modelado_dimensional_basico.ipynb)
---
