# 5.3 Lab: Optimizar Consultas Pr√°ctico

- Objetivo: refactorizar consultas eliminando JOINs innecesarios, usando √≠ndices, midiendo tiempos.
- Prerrequisitos: conocimiento de √≠ndices y planes de ejecuci√≥n.
- Entregables: consultas con comentarios de mejora (plan estimado/real).
- Errores comunes: JOIN sin ON, √≠ndices no cubiertos, no medir impacto real.

## ¬øPor qu√© optimizar consultas?

Una consulta mal escrita puede tardar segundos o minutos cuando deber√≠a ejecutarse en milisegundos. Esto impacta:
- **Experiencia de usuario:** dashboards lentos, reportes que no cargan
- **Costos de infraestructura:** mayor CPU/RAM necesaria
- **Escalabilidad:** sistema que funciona con 1000 registros colapsa con 1 mill√≥n

**Para qu√©:** Reducir tiempos de respuesta, mejorar concurrencia (m√°s usuarios simult√°neos), disminuir costos operativos.

**C√≥mo:** Eliminando JOINs innecesarios, creando √≠ndices estrat√©gicos, evitando funciones en WHERE sobre columnas indexadas, usando EXISTS en lugar de IN para grandes vol√∫menes.

## T√©cnicas de Optimizaci√≥n

### 1. Eliminar JOINs innecesarios
Si solo necesitas datos de fact_ventas, no hagas JOIN con dim_productos. Usa JOIN √∫nicamente cuando necesites columnas de m√∫ltiples tablas.

### 2. √çndices cubiertos (covering indexes)
Un √≠ndice que contiene todas las columnas del SELECT + WHERE + ORDER BY evita acceso a la tabla base (bookmark lookup).

### 3. Medir con SET STATISTICS
```sql
SET STATISTICS TIME ON;
SET STATISTICS IO ON;
-- Tu consulta aqu√≠
```
Esto muestra lecturas l√≥gicas (p√°ginas le√≠das de cach√©) y tiempo de CPU/transcurrido.

### 4. Analizar plan de ejecuci√≥n
En SSMS: Ctrl+M (plan estimado) o Ctrl+L (plan actual). Busca:
- Table Scan (malo) vs Index Seek (bueno)
- Costos relativos altos (> 50%)
- Warnings (conversiones impl√≠citas, falta de estad√≠sticas)

In [None]:
-- Conteo de ventas sin JOIN innecesario
SELECT COUNT(*) AS ventas_totales FROM dbo.fact_ventas;

-- Consulta que aprovecha √≠ndice compuesto (conceptual)
SELECT producto_id, SUM(cantidad) AS unidades
FROM dbo.fact_ventas
WHERE fecha BETWEEN '2024-01-01' AND '2024-12-31' AND producto_id IN (101,102)
GROUP BY producto_id;

## Ejercicios Pr√°cticos

üü¢ **B√°sico:** Comparar tiempo de ejecuci√≥n de `SELECT *` vs `SELECT columnas_espec√≠ficas` en fact_ventas (100k registros)

üü† **Intermedio:** Refactorizar consulta que hace JOIN con dim_clientes solo para filtrar por segmento='Premium', moviendo filtro a WHERE con subconsulta

üî¥ **Avanzado:** Analizar plan de ejecuci√≥n de agregaci√≥n con m√∫ltiples JOINs, identificar tabla con mayor costo y proponer √≠ndice compuesto

‚öôÔ∏è **Reto Senior:** Crear benchmark comparando 3 enfoques para mismo resultado: subconsulta correlacionada vs CTE vs tabla temporal, documentando lecturas l√≥gicas y tiempo CPU de cada uno

# Cr√©ditos

Este material fue revisado y enriquecido parcialmente mediante asistencia de IA (OpenAI y Claude); la validaci√≥n y decisiones editoriales finales son humanas.