# 3.6 Planes de Ejecuci√≥n - Leer y Optimizar Query Plans

## üéØ ¬øPara qu√©?
El **plan de ejecuci√≥n** es el "mapa" que SQL Server crea para ejecutar tu consulta. Muestra:
- Qu√© √≠ndices usa (o si hace table scan)
- En qu√© orden hace los JOINs
- D√≥nde est√°n los cuellos de botella (operadores costosos)

Leer planes de ejecuci√≥n es la habilidad #1 para optimizar queries complejas.

## üìö ¬øPor qu√© importa?
SQL Server no ejecuta tu query textualmente. El **optimizador de queries** genera m√∫ltiples planes posibles y elige el menos costoso (basado en estad√≠sticas). A veces elige mal ‚Üí necesitas entender el plan para corregirlo.

## üîß ¬øC√≥mo obtener un plan de ejecuci√≥n?

En SQL Server Management Studio:
1. **Plan estimado** (Ctrl+L): predicci√≥n sin ejecutar
2. **Plan actual** (Ctrl+M, luego ejecutar): plan real usado

En VS Code/Azure Data Studio:
- `.explain` antes de la query (estimado)
- Ejecutar con "Enable Execution Plan"

In [None]:
-- Consulta que genera plan de ejecuci√≥n interesante
SET SHOWPLAN_TEXT ON; -- Muestra plan en texto (alternativa a gr√°fico)
GO

SELECT c.nombre, p.nombre AS producto, SUM(v.cantidad) AS unidades
FROM dbo.fact_ventas v
INNER JOIN dbo.dim_clientes c ON v.cliente_id = c.cliente_id
INNER JOIN dbo.dim_productos p ON v.producto_id = p.producto_id
WHERE v.fecha >= '2024-01-01'
GROUP BY c.nombre, p.nombre
ORDER BY unidades DESC;
GO

SET SHOWPLAN_TEXT OFF;
GO

/*
üìä Elementos clave del plan (lee de derecha a izquierda, abajo hacia arriba):

1. **Table Scan vs Index Seek**:
   - Table Scan (üî¥): lee TODA la tabla, lento en tablas grandes
   - Index Seek (üü¢): usa √≠ndice, solo lee filas necesarias
   - Index Scan (üü†): escanea √≠ndice completo (mejor que table scan pero no √≥ptimo)

2. **Operadores de JOIN**:
   - Nested Loop (üü¢): r√°pido para datasets peque√±os
   - Hash Match (üü†): para tablas grandes sin √≠ndices
   - Merge Join (üü¢): eficiente si ambas entradas ordenadas

3. **Sort**: costoso, intenta evitarlo con √≠ndices ordenados

4. **Costo relativo**: % al lado de cada operador (busca los >20%)
*/

## Patrones comunes en planes problem√°ticos

### üî¥ **Table Scan en tabla grande**
```
Clustered Index Scan (fact_ventas) Cost: 85%
```
**Problema**: lee 10M filas sin √≠ndice  
**Soluci√≥n**: crear √≠ndice en columna filtrada en WHERE

### üî¥ **Key Lookup** (Bookmark Lookup)
```
Index Seek ‚Üí Key Lookup ‚Üí Nested Loops Cost: 60%
```
**Problema**: √≠ndice no cubre todas las columnas del SELECT, hace idas extras a la tabla  
**Soluci√≥n**: agregar columnas a INCLUDE en el √≠ndice

### üî¥ **Hash Match en JOINs peque√±os**
```
Hash Match (Inner Join) Cost: 45%
```
**Problema**: SQL Server eligi√≥ hash en vez de nested loop (¬øestad√≠sticas desactualizadas?)  
**Soluci√≥n**: UPDATE STATISTICS o crear √≠ndice en columna de JOIN

### üî¥ **Sort costoso**
```
Sort (ORDER BY ...) Cost: 30%
```
**Problema**: no hay √≠ndice ordenado por la columna de ORDER BY  
**Soluci√≥n**: √≠ndice con esa columna al final (permite sort-free execution)

## üü¢ Ejercicio B√°sico
Ejecuta esta consulta con plan de ejecuci√≥n activado:
```sql
SELECT * FROM fact_ventas WHERE cliente_id = 5;
```
¬øHace Table Scan o Index Seek? Si hace scan, ¬øqu√© √≠ndice recomendar√≠as?

## üü† Ejercicio Intermedio
Analiza el plan de esta query:
```sql
SELECT c.nombre, COUNT(*) AS num_ventas
FROM fact_ventas v
JOIN dim_clientes c ON v.cliente_id = c.cliente_id
WHERE v.fecha >= '2024-01-01'
GROUP BY c.nombre
ORDER BY num_ventas DESC;
```
Identifica:
1. ¬øQu√© operador de JOIN usa? (Nested Loop, Hash Match, Merge Join)
2. ¬øHay Sort al final? ¬øCu√°nto cuesta?
3. Prop√≥n un √≠ndice que elimine el Sort

## üî¥ Ejercicio Avanzado
Optimiza esta query problem√°tica analizando su plan:
```sql
SELECT p.nombre, AVG(v.cantidad) AS promedio
FROM dim_productos p
LEFT JOIN fact_ventas v ON p.producto_id = v.producto_id
WHERE v.fecha >= '2023-01-01'
GROUP BY p.nombre
HAVING AVG(v.cantidad) > 10;
```
**Problemas a detectar:**
- ¬øHace Table Scan en qu√© tabla?
- ¬øEl filtro WHERE se aplica antes o despu√©s del JOIN? (mira orden de operadores)
- ¬øHay Key Lookups?

**Entregables:**
- Screenshot del plan con operadores costosos marcados
- Query refactorizada
- 2-3 √≠ndices propuestos con justificaci√≥n

---

## Hints (pistas al optimizador)

A veces quieres forzar un comportamiento (uso avanzado):

```sql
-- Forzar uso de √≠ndice espec√≠fico
SELECT * FROM fact_ventas WITH (INDEX(idx_ventas_fecha))
WHERE fecha >= '2024-01-01';

-- Forzar tipo de JOIN
SELECT * FROM tabla1 t1
INNER HASH JOIN tabla2 t2 ON t1.id = t2.id;

-- Evitar paralelismo (√∫til en debug)
SELECT * FROM tabla OPTION (MAXDOP 1);
```

‚ö†Ô∏è **Cuidado**: hints pueden hacer que el optimizador elija plan sub√≥ptimo si los datos cambian.

---

## Errores Comunes

‚ùå **No mirar el plan**: "est√° lento, agrego √≠ndice random" ‚Üí puede empeorar
‚ùå **Solo mirar costo total**: un operador al 90% es el cuello de botella, no el todo
‚ùå **Ignorar advertencias**: iconos amarillos (‚ö†Ô∏è) indican problemas (estad√≠sticas faltantes, implicit conversions)
‚ùå **Hints en producci√≥n sin justificar**: el optimizador suele ser m√°s inteligente que t√∫
‚ùå **No actualizar estad√≠sticas**: plan se basa en stats antiguas, elige mal

**Siguiente:** `07_query_tuning.ipynb` ‚Üí t√©cnicas avanzadas de optimizaci√≥n

# Cr√©ditos

Este material fue revisado y enriquecido parcialmente mediante asistencia de IA (OpenAI y Claude); la validaci√≥n y decisiones editoriales finales son humanas.

---
## Navegaci√≥n
[‚¨ÖÔ∏è Anterior](05_transacciones_bloqueos.ipynb) | [Siguiente ‚û°Ô∏è](07_query_tuning.ipynb)
---
