## üü¢ Ejercicio B√°sico
Refactoriza esta query eliminando la subconsulta correlacionada:
```sql
SELECT p.nombre,
       (SELECT AVG(v.cantidad) FROM fact_ventas v WHERE v.producto_id = p.producto_id) AS promedio
FROM dim_productos p;
```

## üü† Ejercicio Intermedio
Optimiza esta consulta con OR:
```sql
SELECT * FROM fact_ventas
WHERE (cliente_id = 10 AND fecha >= '2024-01-01')
   OR (cliente_id = 20 AND fecha >= '2024-06-01');
```
Reescribe con UNION ALL y mide la mejora de performance.

## üî¥ Ejercicio Avanzado
Diagnostica y optimiza esta query que tarda >30 segundos:
```sql
SELECT c.nombre, p.categoria, 
       SUM(v.cantidad * p.precio_unitario) AS ingresos
FROM fact_ventas v
JOIN dim_clientes c ON v.cliente_id = c.cliente_id
JOIN dim_productos p ON v.producto_id = p.producto_id
WHERE MONTH(v.fecha) = 12
  AND UPPER(c.nombre) LIKE '%CORP%'
GROUP BY c.nombre, p.categoria
ORDER BY ingresos DESC;
```

**An√°lisis requerido:**
1. Plan de ejecuci√≥n (captura operadores costosos)
2. Identificar violaciones de sargability
3. Proponer 3 √≠ndices estrat√©gicos
4. Refactorizar query (eliminar funciones en WHERE)
5. Medir mejora (antes/despu√©s en reads y elapsed time)

---

## T√©cnica 6: Uso Estrat√©gico de CTEs vs Subqueries

**CTE**: SQL Server puede materializarla o no (decisi√≥n del optimizador)
**Subquery**: usualmente inlined (integrada en el plan principal)

```sql
-- CTE puede ser m√°s legible pero no siempre m√°s r√°pido
WITH ventas_grandes AS (
  SELECT cliente_id, SUM(cantidad) AS total
  FROM fact_ventas
  GROUP BY cliente_id
  HAVING SUM(cantidad) > 1000
)
SELECT c.nombre, v.total
FROM dim_clientes c
JOIN ventas_grandes v ON c.cliente_id = v.cliente_id;
```

üí° **Tip**: compara planes de CTE vs subquery. A veces CTE se ejecuta m√∫ltiples veces si se referencia m√°s de una vez.

---

## Errores Comunes

‚ùå **Optimizar sin medir**: "agregu√© √≠ndice" pero no verificaste que se use
‚ùå **SELECT * en producci√≥n**: lees columnas innecesarias, rompe covering indexes
‚ùå **NOT IN con NULLs**: si subquery puede retornar NULL, NOT IN falla l√≥gicamente (usa NOT EXISTS)
‚ùå **Ignorar parameter sniffing**: primer valor de par√°metro define plan cacheado (puede ser sub√≥ptimo para otros valores)
‚ùå **Demasiados √≠ndices**: cada √≠ndice cuesta en INSERT/UPDATE, m√°s espacio, stats a mantener

**Siguiente:** `09_observabilidad_monitoreo.ipynb` ‚Üí m√©tricas y alertas en producci√≥n

### T√©cnica 3: Paginaci√≥n Eficiente con OFFSET-FETCH

‚ùå **Malo (paginaci√≥n naive):**
```sql
SELECT TOP 20 * FROM fact_ventas ORDER BY fecha DESC;
-- P√°gina 1000: lee 20,000 filas y descarta 19,980
```

‚úÖ **Bueno (OFFSET con √≠ndice ordenado):**
```sql
SELECT * FROM fact_ventas
ORDER BY fecha DESC
OFFSET 20000 ROWS FETCH NEXT 20 ROWS ONLY;
-- Con √≠ndice en (fecha DESC), salta directamente a la fila 20,001
```

### T√©cnica 4: Evitar Funciones en WHERE (Sargability)

‚ùå **Malo (funci√≥n en columna indexada):**
```sql
WHERE YEAR(fecha) = 2024  -- No usa √≠ndice en fecha
WHERE UPPER(nombre) = 'ACME'  -- No usa √≠ndice en nombre
```

‚úÖ **Bueno (predicado sargable):**
```sql
WHERE fecha >= '2024-01-01' AND fecha < '2025-01-01'  -- Usa √≠ndice
WHERE nombre = 'ACME'  -- Usa √≠ndice (asume collation case-insensitive)
```

### T√©cnica 5: Filtrar Antes de JOIN

‚ùå **Malo (JOIN grande, luego filtrar):**
```sql
SELECT * FROM fact_ventas v
JOIN dim_productos p ON v.producto_id = p.producto_id
WHERE v.fecha >= '2024-01-01';  -- Filtra DESPU√âS de unir 10M filas
```

‚úÖ **Bueno (filtrar primero con CTE/subquery):**
```sql
WITH ventas_2024 AS (
  SELECT * FROM fact_ventas WHERE fecha >= '2024-01-01'  -- Reduce a 100K filas
)
SELECT * FROM ventas_2024 v
JOIN dim_productos p ON v.producto_id = p.producto_id;
```

### T√©cnica 1: Eliminar Subconsultas Correlacionadas

‚ùå **Malo (N+1 queries):**
```sql
SELECT c.nombre,
       (SELECT COUNT(*) FROM fact_ventas v WHERE v.cliente_id = c.cliente_id) AS ventas
FROM dim_clientes c;
-- Por cada cliente, ejecuta una subquery ‚Üí 100 clientes = 100 scans de fact_ventas
```

‚úÖ **Bueno (1 query con JOIN):**
```sql
SELECT c.nombre, COUNT(v.venta_id) AS ventas
FROM dim_clientes c
LEFT JOIN fact_ventas v ON c.cliente_id = v.cliente_id
GROUP BY c.cliente_id, c.nombre;
-- Un solo scan de fact_ventas
```

### T√©cnica 2: Reescribir OR con UNION

‚ùå **Malo (OR impide uso eficiente de √≠ndices):**
```sql
SELECT * FROM fact_ventas
WHERE cliente_id = 5 OR producto_id = 101;
-- SQL Server no puede usar √≠ndices simult√°neamente en ambas columnas
```

‚úÖ **Bueno (UNION ALL usa ambos √≠ndices):**
```sql
SELECT * FROM fact_ventas WHERE cliente_id = 5
UNION ALL
SELECT * FROM fact_ventas WHERE producto_id = 101 AND cliente_id <> 5;
-- Dos index seeks, luego concatena resultados
```

# 3.7 Query Tuning - T√©cnicas Avanzadas de Optimizaci√≥n

## üéØ ¬øPara qu√©?
Ya sabes medir performance, leer planes y crear √≠ndices. Ahora: **t√©cnicas quir√∫rgicas** para consultas problem√°ticas que no responden a soluciones obvias.

## üìö ¬øPor qu√© un enfoque sistem√°tico?

Optimizar "por feeling" falla:
- Agregas √≠ndice que no se usa
- Refactorizas sin medir (¬ømejor√≥?)
- Optimizas la parte equivocada (el 5% del costo)

**M√©todo cient√≠fico:**
1. Medir baseline (tiempo, reads, CPU)
2. Identificar cuello de botella (plan de ejecuci√≥n)
3. Aplicar t√©cnica espec√≠fica
4. Medir again (¬ømejor√≥? ¬øcu√°nto?)
5. Iterar o revertir

## üîß T√©cnicas de Query Tuning

# Cr√©ditos

Este material fue revisado y enriquecido parcialmente mediante asistencia de IA (OpenAI y Claude); la validaci√≥n y decisiones editoriales finales son humanas.