# 3.8 Almacenamiento y Mantenimiento

- Objetivo: estrategias de mantenimiento de √≠ndices, estad√≠sticas y archivos de BD.
- Prerrequisitos: √≠ndices creados en tablas de hechos.
- Ejercicios: calcular fragmentaci√≥n, rebuild vs reorganize (conceptual).
- Reto: calendario de mantenimiento preventivo.
- Errores comunes: rebuild innecesario de √≠ndices peque√±os, no actualizar estad√≠sticas, ventanas de mantenimiento inadecuadas.

## Fragmentaci√≥n de √≠ndices (conceptual)

In [None]:
-- Consulta de fragmentaci√≥n (requiere permisos VIEW DATABASE STATE)
-- SELECT object_name(ips.object_id) AS tabla, i.name AS indice,
--        ips.avg_fragmentation_in_percent, ips.page_count
-- FROM sys.dm_db_index_physical_stats(DB_ID(), NULL, NULL, NULL, 'LIMITED') ips
-- JOIN sys.indexes i ON ips.object_id = i.object_id AND ips.index_id = i.index_id
-- WHERE ips.avg_fragmentation_in_percent > 10 AND ips.page_count > 100;

üü¢ Ejercicio: Reglas de decisi√≥n para rebuild vs reorganize (fragmentaci√≥n >30% rebuild; 10-30% reorganize).

üü† Ejercicio: Actualizaci√≥n de estad√≠sticas (UPDATE STATISTICS conceptual).

üî¥ Reto: Dise√±ar calendario de mantenimiento semanal considerando ventanas de baja carga y prioridades (√≠ndices cr√≠ticos primero).

## ¬øPor qu√© mantener √≠ndices y estad√≠sticas?

Con el tiempo, las bases de datos se **degradan** en rendimiento sin mantenimiento:

1. **Fragmentaci√≥n de √≠ndices:** Las p√°ginas de datos se desorganizan, causando m√°s I/O (lectura de disco) para obtener mismos datos
2. **Estad√≠sticas desactualizadas:** El optimizador de consultas toma decisiones basadas en distribuci√≥n de datos que ya no refleja la realidad
3. **Crecimiento de logs:** Logs de transacciones sin respaldo pueden llenar el disco

**Para qu√©:**
- Mantener tiempos de respuesta consistentes (consulta que tardaba 2s no debe tardar 20s despu√©s de 6 meses)
- Evitar costos de I/O innecesarios (AWS RDS cobra por IOPS)
- Prevenir fallos por falta de espacio en disco
- Optimizar ventanas de backup y recuperaci√≥n

**C√≥mo:**
- **Rebuild de √≠ndices:** Reconstruye √≠ndice completo, elimina fragmentaci√≥n, compacta p√°ginas
- **Reorganize de √≠ndices:** Reordena p√°ginas existentes, menos intensivo que rebuild
- **Update Statistics:** Recalcula distribuci√≥n de datos para optimizador de consultas
- **Shrink Files (con cuidado):** Reduce tama√±o de archivos, puede causar fragmentaci√≥n externa

## Fragmentaci√≥n de √çndices

### ¬øQu√© es fragmentaci√≥n?

Cuando insertas, actualizas y eliminas registros, SQL Server puede:
- **Fragmentaci√≥n l√≥gica:** P√°ginas desordenadas (p√°gina 10 en disco f√≠sico contiene datos que deber√≠an estar entre p√°gina 5 y 6)
- **Fragmentaci√≥n de extensiones:** Extensiones (8 p√°ginas) no contiguas en disco

**Impacto:**
- Lectura secuencial (range scan) requiere saltos aleatorios en disco (muy lento en discos mec√°nicos)
- Mayor uso de memoria (p√°ginas fragmentadas ocupan m√°s cach√©)

### Medir Fragmentaci√≥n

```sql
SELECT 
  OBJECT_NAME(ips.object_id) AS tabla,
  i.name AS indice,
  ips.avg_fragmentation_in_percent AS fragmentacion_pct,
  ips.page_count AS num_paginas,
  ips.avg_page_space_used_in_percent AS espacio_usado_pct
FROM sys.dm_db_index_physical_stats(DB_ID(), NULL, NULL, NULL, 'LIMITED') ips
JOIN sys.indexes i ON ips.object_id = i.object_id AND ips.index_id = i.index_id
WHERE ips.index_id > 0  -- Excluir heaps (tablas sin clustered index)
ORDER BY ips.avg_fragmentation_in_percent DESC;
```

**Interpretaci√≥n:**
- **< 10%:** Fragmentaci√≥n insignificante, no requiere acci√≥n
- **10-30%:** Fragmentaci√≥n moderada ‚Üí REORGANIZE (online, menos intrusivo)
- **> 30%:** Fragmentaci√≥n alta ‚Üí REBUILD (offline en Standard Edition, online en Enterprise)

### Rebuild vs Reorganize

| Aspecto | REORGANIZE | REBUILD |
|---------|------------|---------|
| **Intensidad** | Baja (online siempre) | Alta (offline en Standard, online en Enterprise) |
| **Bloqueos** | M√≠nimos (permite lecturas/escrituras) | Shared/exclusive (bloquea escrituras en Standard) |
| **Fragmentaci√≥n** | Reduce moderadamente | Elimina completamente |
| **Estad√≠sticas** | No actualiza | Actualiza autom√°ticamente (con FULLSCAN) |
| **Umbral** | 10-30% fragmentaci√≥n | > 30% fragmentaci√≥n |
| **Uso de disco** | No requiere espacio extra | Requiere ~1.5x tama√±o del √≠ndice |

**Comando REORGANIZE:**
```sql
ALTER INDEX IX_fact_ventas_fecha ON dbo.fact_ventas REORGANIZE;
```

**Comando REBUILD:**
```sql
-- Standard Edition (offline)
ALTER INDEX IX_fact_ventas_fecha ON dbo.fact_ventas REBUILD;

-- Enterprise Edition (online, permite consultas durante rebuild)
ALTER INDEX IX_fact_ventas_fecha ON dbo.fact_ventas REBUILD WITH (ONLINE = ON);
```

**Rebuild todos los √≠ndices de una tabla:**
```sql
ALTER INDEX ALL ON dbo.fact_ventas REBUILD;
```

## Estad√≠sticas

### ¬øQu√© son las estad√≠sticas?

Histogramas que describen la distribuci√≥n de valores en columnas indexadas. SQL Server los usa para estimar:
- Cu√°ntas filas devolver√° un filtro (`WHERE fecha = '2024-01-01'` ‚Üí ~1000 filas)
- Qu√© √≠ndice usar (√≠ndice en fecha vs √≠ndice en cliente_id)
- Orden de JOINs (tabla peque√±a ‚Üí tabla grande)

### Problemas de estad√≠sticas desactualizadas

Si insertaste 1 mill√≥n de registros pero estad√≠sticas no se actualizaron:
- Optimizador cree que tabla tiene 100 registros
- Elige plan de ejecuci√≥n para tabla peque√±a (index seek)
- Plan real requiere table scan (lent√≠simo con 1 mill√≥n de registros)

### Actualizar estad√≠sticas

```sql
-- Estad√≠sticas de una tabla (sampleo autom√°tico)
UPDATE STATISTICS dbo.fact_ventas;

-- Estad√≠sticas con FULLSCAN (m√°s preciso, m√°s lento)
UPDATE STATISTICS dbo.fact_ventas WITH FULLSCAN;

-- Estad√≠sticas de todo el esquema
EXEC sp_updatestats;
```

**Frecuencia recomendada:**
- Tablas transaccionales (< 1M registros): AUTO_UPDATE_STATISTICS (activado por defecto)
- Tablas de hechos (> 10M registros): Manualmente despu√©s de cargas masivas
- Tablas particionadas: Actualizar por partici√≥n

## Estrategia de Mantenimiento

### Calendario T√≠pico (Entorno 24/7)

**Diario (ventana de 2-4 AM, baja carga):**
- Backup de logs de transacciones (cada 1-2 horas en producci√≥n)
- Reorganize de √≠ndices con fragmentaci√≥n 10-30% en tablas cr√≠ticas (< 1 hora)

**Semanal (domingo 1-6 AM):**
- Rebuild de √≠ndices con fragmentaci√≥n > 30%
- Update Statistics con FULLSCAN en tablas de hechos
- Verificaci√≥n de integridad (DBCC CHECKDB)

**Mensual:**
- An√°lisis de crecimiento de archivos (proyectar necesidades de espacio)
- Revisi√≥n de √≠ndices no utilizados (sys.dm_db_index_usage_stats)
- Limpieza de √≠ndices duplicados o redundantes

### Script de Mantenimiento Automatizado (Conceptual)

```sql
-- Identificar √≠ndices que necesitan mantenimiento
DECLARE @sql NVARCHAR(MAX);

SELECT @sql = STRING_AGG(
  CASE 
    WHEN avg_fragmentation_in_percent > 30 AND page_count > 1000
    THEN 'ALTER INDEX ' + i.name + ' ON ' + OBJECT_SCHEMA_NAME(ips.object_id) + '.' + OBJECT_NAME(ips.object_id) + ' REBUILD;'
    WHEN avg_fragmentation_in_percent > 10 AND page_count > 1000
    THEN 'ALTER INDEX ' + i.name + ' ON ' + OBJECT_SCHEMA_NAME(ips.object_id) + '.' + OBJECT_NAME(ips.object_id) + ' REORGANIZE;'
  END, CHAR(13))
FROM sys.dm_db_index_physical_stats(DB_ID(), NULL, NULL, NULL, 'LIMITED') ips
JOIN sys.indexes i ON ips.object_id = i.object_id AND ips.index_id = i.index_id
WHERE ips.index_id > 0 AND page_count > 100;

-- Ejecutar comandos generados
EXEC sp_executesql @sql;
```

**Herramientas profesionales:**
- **SQL Server Maintenance Plans:** GUI para configurar tareas recurrentes
- **Ola Hallengren scripts:** Scripts open-source est√°ndar de la industria (https://ola.hallengren.com)
- **Azure SQL Database:** Mantenimiento autom√°tico incluido

## Errores Comunes

1. **Rebuild innecesario de √≠ndices peque√±os:**
   √çndices con < 100 p√°ginas no se benefician de rebuild (overhead mayor que beneficio).

2. **No verificar espacio disponible antes de REBUILD:**
   REBUILD requiere ~1.5x el tama√±o del √≠ndice en disco. Puede fallar por falta de espacio.

3. **Ejecutar mantenimiento en horario pico:**
   REBUILD offline bloquea tabla. Programar en ventanas de baja carga.

4. **No actualizar estad√≠sticas despu√©s de cargas masivas:**
   Insertar 10M registros sin UPDATE STATISTICS puede causar planes de ejecuci√≥n p√©simos.

5. **Usar SHRINK DATABASE regularmente:**
   Shrink causa fragmentaci√≥n externa. Usar solo despu√©s de eliminar grandes vol√∫menes de datos (no como mantenimiento rutinario).

# Cr√©ditos

Este material fue revisado y enriquecido parcialmente mediante asistencia de IA (OpenAI y Claude); la validaci√≥n y decisiones editoriales finales son humanas.

---
## Navegaci√≥n
[‚¨ÖÔ∏è Anterior](07_query_tuning.ipynb) | [Siguiente ‚û°Ô∏è](09_observabilidad_monitoreo.ipynb)
---
