# Documentación: Data Base Indexes (Indices en Bases de Datos)

## Introducción

Un **índice** en una base de datos es una estructura de datos que mejora la velocidad de las operaciones de recuperación de datos en una tabla. Los índices son similares a los índices de un libro: en lugar de revisar todas las páginas para encontrar un tema específico, puedes ir directamente a la página correcta usando el índice.

## ¿Por qué son importantes los índices?

- **Mejoran el rendimiento de las consultas**: Al usar un índice, la base de datos puede encontrar y recuperar datos más rápidamente.
- **Reducen el tiempo de búsqueda**: En lugar de escanear toda la tabla (lo que se conoce como "full table scan"), la base de datos puede acceder directamente a los registros relevantes.
- **Optimizan las operaciones de JOIN**: Cuando se unen tablas, los índices pueden acelerar significativamente el proceso.

## Tipos de Índices

### 1. **Índice Único (Unique Index)**
   - Garantiza que no haya dos filas con el mismo valor en la columna indexada.
   - Útil para columnas como IDs o correos electrónicos.

### 2. **Índice Compuesto (Composite Index)**
   - Se crea sobre múltiples columnas.
   - Útil cuando las consultas filtran por varias columnas.

### 3. **Índice de Texto Completo (Full-Text Index)**
   - Diseñado para búsquedas de texto en grandes volúmenes de datos.
   - Permite búsquedas de palabras clave en columnas de texto.

### 4. **Índice Clusterizado (Clustered Index)**
   - Reorganiza físicamente la tabla según el orden del índice.
   - Solo puede haber un índice clusterizado por tabla.

### 5. **Índice No Clusterizado (Non-Clustered Index)**
   - No reorganiza la tabla físicamente.
   - Puede haber múltiples índices no clusterizados por tabla.

## Creación de Índices en SQL

### Sintaxis Básica

```sql
CREATE INDEX nombre_indice
ON nombre_tabla (columna1, columna2, ...);
```

### Ejemplo Práctico

```sql
CREATE INDEX idx_apellido
ON empleados (apellido);
```

Este índice acelerará las consultas que filtren por la columna `apellido` en la tabla `empleados`.

## Consideraciones al Usar Índices

### Ventajas
- **Rendimiento**: Mejoran la velocidad de las consultas.
- **Eficiencia**: Reducen el tiempo de búsqueda en grandes volúmenes de datos.

### Desventajas
- **Espacio en Disco**: Los índices ocupan espacio adicional.
- **Overhead en Operaciones de Escritura**: Las operaciones de inserción, actualización y eliminación pueden ser más lentas porque la base de datos debe mantener actualizados los índices.

## Cuándo Usar Índices

- **Columnas Frecuentemente Filtradas**: Si una columna se usa a menudo en cláusulas `WHERE`, es candidata para un índice.
- **Columnas con Valores Únicos**: Las columnas con alta selectividad (muchos valores únicos) se benefician más de los índices.
- **JOINs Frecuentes**: Las columnas usadas en operaciones `JOIN` deben estar indexadas.

## Cuándo No Usar Índices

- **Tablas Pequeñas**: En tablas pequeñas, el overhead de mantener un índice puede no justificar la mejora en el rendimiento.
- **Columnas con Muchos Valores Repetidos**: Las columnas con baja selectividad (muchos valores repetidos) no se benefician tanto de los índices.

## Ejemplo



In [1]:
import sqlite3

# Conectar a la base de datos (o crearla si no existe)
conn = sqlite3.connect('empresa.db')
cursor = conn.cursor()

# Crear una tabla de empleados
cursor.execute('''
CREATE TABLE IF NOT EXISTS empleados (
    id INTEGER PRIMARY KEY,
    nombre TEXT,
    apellido TEXT,
    departamento TEXT
)
''')

# Insertar algunos datos
cursor.execute("INSERT INTO empleados (nombre, apellido, departamento) VALUES ('Juan', 'Pérez', 'Ventas')")
cursor.execute("INSERT INTO empleados (nombre, apellido, departamento) VALUES ('Ana', 'Gómez', 'Marketing')")
cursor.execute("INSERT INTO empleados (nombre, apellido, departamento) VALUES ('Luis', 'Martínez', 'Ventas')")

# Crear un índice en la columna 'apellido'
cursor.execute('CREATE INDEX idx_apellido ON empleados (apellido)')

# Consultar usando el índice
cursor.execute("SELECT * FROM empleados WHERE apellido = 'Pérez'")
resultados = cursor.fetchall()
print(resultados)

# Cerrar la conexión
conn.close()

[(1, 'Juan', 'Pérez', 'Ventas')]


### Explicación del Código

1. **Conexión a la Base de Datos**: Se conecta a una base de datos SQLite llamada `empresa.db`.
2. **Creación de la Tabla**: Se crea una tabla `empleados` con columnas `id`, `nombre`, `apellido` y `departamento`.
3. **Inserción de Datos**: Se insertan algunos registros en la tabla.
4. **Creación del Índice**: Se crea un índice en la columna `apellido`.
5. **Consulta con Índice**: Se realiza una consulta que aprovecha el índice para buscar rápidamente un empleado por su apellido.
6. **Cierre de la Conexión**: Se cierra la conexión a la base de datos.

## Conclusión

Los índices son una herramienta poderosa para optimizar el rendimiento de las consultas en una base de datos. Sin embargo, es importante usarlos con cuidado, ya que pueden tener un impacto en el espacio en disco y en el rendimiento de las operaciones de escritura. Al diseñar una base de datos, es crucial identificar las columnas que se beneficiarán más de la indexación y crear índices estratégicamente.