# Index Management - Ungraph

Este notebook demuestra c√≥mo gestionar √≠ndices en Neo4j para optimizar las b√∫squedas.

## Objetivos

1. **Crear √≠ndices vectoriales** - Para b√∫squeda por similitud sem√°ntica
2. **Crear √≠ndices full-text** - Para b√∫squeda por texto completo
3. **Crear √≠ndices regulares** - Para b√∫squedas por propiedades espec√≠ficas
4. **Verificar √≠ndices existentes** - Listar y verificar √≠ndices
5. **Eliminar √≠ndices** - Gesti√≥n de √≠ndices
6. **Limpieza del grafo** - Eliminar datos y resetear

**Referencias:**
- [Neo4j Indexes](https://neo4j.com/docs/cypher-manual/current/indexes/)


In [None]:
def add_src_to_path(path_folder: str):
    import sys
    from pathlib import Path
    base_path = Path().resolve()
    for parent in [base_path] + list(base_path.parents):
        candidate = parent / path_folder
        if candidate.exists():
            parent_dir = candidate.parent
            if str(parent_dir) not in sys.path:
                sys.path.insert(0, str(parent_dir))
            if str(candidate) not in sys.path:
                sys.path.append(str(candidate))
            return

add_src_to_path(path_folder="src")
add_src_to_path(path_folder="src/utils")

try:
    import ungraph
except ImportError:
    import src
    ungraph = src

from infrastructure.services.neo4j_index_service import Neo4jIndexService
from src.utils.graph_operations import graph_session

print(f"üì¶ Ungraph version: {ungraph.__version__}")


## Parte 1: Crear √çndices

Creemos los diferentes tipos de √≠ndices necesarios para las b√∫squedas.


In [None]:
# Crear servicio de √≠ndices
index_service = Neo4jIndexService()

# Crear todos los √≠ndices necesarios
print("üîß Configurando todos los √≠ndices...\n")
index_service.setup_all_indexes()

print("‚úÖ √çndices configurados:")
print("   - √çndice vectorial: chunk_embeddings (384 dimensiones)")
print("   - √çndice full-text: chunk_content")
print("   - √çndice regular: chunk_consecutive_idx")


## Parte 2: Verificar √çndices Existentes

Listemos los √≠ndices que existen en la base de datos.


In [None]:
# Listar √≠ndices existentes
driver = graph_session()
try:
    with driver.session() as session:
        # √çndices regulares y full-text
        result = session.run("SHOW INDEXES")
        print("üìä √çndices en la base de datos:\n")
        for record in result:
            print(f"  - {record.get('name', 'N/A')}: {record.get('type', 'N/A')}")
            print(f"    Estado: {record.get('state', 'N/A')}")
            print()
        
        # √çndices vectoriales
        result = session.run("SHOW INDEXES YIELD name, type WHERE type = 'VECTOR'")
        vector_indexes = list(result)
        if vector_indexes:
            print("üìä √çndices vectoriales:")
            for record in vector_indexes:
                print(f"  - {record['name']}")
finally:
    driver.close()


## Parte 3: Crear √çndices Individuales

Podemos crear √≠ndices espec√≠ficos seg√∫n nuestras necesidades.


In [None]:
# Crear √≠ndice vectorial personalizado
print("üîß Creando √≠ndice vectorial personalizado...")
index_service.setup_vector_index(
    index_name="custom_embeddings",
    node_label="Chunk",
    property_name="embeddings",
    dimensions=384
)

# Crear √≠ndice full-text con analyzer espec√≠fico
print("üîß Creando √≠ndice full-text con analyzer ingl√©s...")
index_service.setup_fulltext_index(
    index_name="chunk_content_en",
    node_label="Chunk",
    property_name="page_content",
    analyzer="english"
)

print("‚úÖ √çndices personalizados creados")


## Parte 4: Eliminar √çndices

Podemos eliminar √≠ndices que ya no necesitamos.


In [None]:
# Eliminar un √≠ndice espec√≠fico
index_to_drop = "custom_embeddings"  # Cambiar seg√∫n necesidad

print(f"üóëÔ∏è  Eliminando √≠ndice: {index_to_drop}")
try:
    index_service.drop_index(index_to_drop)
    print(f"‚úÖ √çndice '{index_to_drop}' eliminado")
except Exception as e:
    print(f"‚ö†Ô∏è  Error eliminando √≠ndice: {e}")


## Parte 5: Limpieza del Grafo

Podemos limpiar el grafo eliminando nodos espec√≠ficos o todo el contenido.


In [None]:
# Limpiar nodos espec√≠ficos (ejemplo: solo Chunks)
print("‚ö†Ô∏è  ADVERTENCIA: Esto eliminar√° todos los Chunks del grafo")
print("   Descomenta la siguiente l√≠nea para ejecutar:\n")

# index_service.clean_graph(node_labels=["Chunk"])

# Para limpiar todo el grafo:
# index_service.clean_graph()  # Elimina todos los nodos

print("üí° Usa clean_graph() con cuidado. Aseg√∫rate de tener backups.")


## Resumen y Mejores Pr√°cticas

### Tipos de √çndices

1. **Vectorial**: Para b√∫squeda por similitud sem√°ntica (embeddings)
2. **Full-text**: Para b√∫squeda por texto completo (page_content)
3. **Regular**: Para b√∫squedas r√°pidas por propiedades espec√≠ficas

### Mejores Pr√°cticas

1. **Crear √≠ndices antes de ingerir**: Mejora el rendimiento de la ingesta
2. **Usar setup_all_indexes()**: Crea todos los √≠ndices necesarios de una vez
3. **Verificar √≠ndices**: Usa SHOW INDEXES para verificar el estado
4. **Eliminar √≠ndices no usados**: Libera espacio y mejora rendimiento
5. **Limpieza cuidadosa**: clean_graph() elimina datos permanentemente

## Referencias

- [Neo4j Indexes](https://neo4j.com/docs/cypher-manual/current/indexes/)
- [Vector Indexes](https://neo4j.com/docs/cypher-manual/current/indexes-for-vector-search/)
