# Testing Graph Patterns - Ungraph

Este notebook prueba sistem√°ticamente todas las funcionalidades del sistema de patrones de grafo:

1. **Value Objects**: NodeDefinition, RelationshipDefinition, GraphPattern
2. **Patrones Predefinidos**: FILE_PAGE_CHUNK_PATTERN
3. **PatternService**: Validaci√≥n y generaci√≥n de queries Cypher
4. **Patrones de B√∫squeda GraphRAG**: Todos los patrones disponibles
5. **Integraci√≥n Completa**: Uso end-to-end con datos reales

## Objetivo

Validar que todas las funcionalidades funcionan correctamente y documentar su uso.


In [1]:
def add_src_to_path(path_folder: str):
    ''' 
    Helper function for adding the "path_folder" directory to the path.
    in order to work on notebooks and scripts
    '''
    import sys
    from pathlib import Path

    base_path = Path().resolve()
    for parent in [base_path] + list(base_path.parents):
        candidate = parent / path_folder
        if candidate.exists():
            # Agregar el directorio padre para que sea un paquete Python
            parent_dir = candidate.parent
            if str(parent_dir) not in sys.path:
                sys.path.insert(0, str(parent_dir))
                print(f"Path Folder parent added: {parent_dir}")
            if str(candidate) not in sys.path:
                sys.path.append(str(candidate))
                print(f"Path Folder {path_folder} added: {candidate}")
            return
    print(f"Not found '{path_folder}' folder on the hierarchy of directories")

# Agregar carpetas necesarias al path
add_src_to_path(path_folder="src")
add_src_to_path(path_folder="src/utils")
add_src_to_path(path_folder="src/data")


Path Folder parent added: D:\projects\Ungraph
Path Folder src added: D:\projects\Ungraph\src
Path Folder src/utils added: D:\projects\Ungraph\src\utils
Path Folder src/data added: D:\projects\Ungraph\src\data


In [2]:
# Importar librer√≠as necesarias
import sys
from pathlib import Path
from typing import Dict, Any

# Importar handlers desde utils
from src.utils.handlers import find_in_project

# Importar ungraph
try:
    import ungraph
    print("‚úÖ Ungraph importado como paquete instalado")
except ImportError:
    import src
    ungraph = src
    print("‚úÖ Ungraph importado desde src/ (modo desarrollo)")

print(f"üì¶ Ungraph version: {ungraph.__version__}")


  from .autonotebook import tqdm as notebook_tqdm


‚úÖ Ungraph importado desde src/ (modo desarrollo)
üì¶ Ungraph version: 0.1.0


## Parte 1: Value Objects - NodeDefinition

Probamos la creaci√≥n y validaci√≥n de NodeDefinition.


In [3]:
# Importar Value Objects
from domain.value_objects.graph_pattern import (
    NodeDefinition,
    RelationshipDefinition,
    GraphPattern
)

print("‚úÖ Value Objects importados correctamente")


‚úÖ Value Objects importados correctamente


In [4]:
# Test 1.1: Crear NodeDefinition v√°lido
print("\nüìù Test 1.1: Crear NodeDefinition v√°lido")
print("=" * 60)

file_node = NodeDefinition(
    label="File",
    required_properties={"filename": str},
    optional_properties={"createdAt": int},
    indexes=["filename"]
)

print(f"‚úÖ NodeDefinition creado:")
print(f"   Label: {file_node.label}")
print(f"   Propiedades requeridas: {list(file_node.required_properties.keys())}")
print(f"   Propiedades opcionales: {list(file_node.optional_properties.keys())}")
print(f"   √çndices: {file_node.indexes}")



üìù Test 1.1: Crear NodeDefinition v√°lido
‚úÖ NodeDefinition creado:
   Label: File
   Propiedades requeridas: ['filename']
   Propiedades opcionales: ['createdAt']
   √çndices: ['filename']


In [5]:
# Test 1.2: Validar que NodeDefinition rechaza labels inv√°lidos
print("\nüìù Test 1.2: Validar formato de labels")
print("=" * 60)

try:
    invalid_node = NodeDefinition(label="file")  # Debe empezar con may√∫scula
    print("‚ùå ERROR: Deber√≠a haber fallado")
except ValueError as e:
    print(f"‚úÖ Validaci√≥n funcionando: {e}")

try:
    invalid_node2 = NodeDefinition(label="File-Name")  # No puede tener guiones
    print("‚ùå ERROR: Deber√≠a haber fallado")
except ValueError as e:
    print(f"‚úÖ Validaci√≥n funcionando: {e}")



üìù Test 1.2: Validar formato de labels
‚úÖ Validaci√≥n funcionando: Invalid label format: file. Labels must start with uppercase letter and contain only letters, numbers, and underscores.
‚úÖ Validaci√≥n funcionando: Invalid label format: File-Name. Labels must start with uppercase letter and contain only letters, numbers, and underscores.


## Parte 2: Value Objects - RelationshipDefinition

Probamos la creaci√≥n y validaci√≥n de RelationshipDefinition.


In [6]:
# Test 2.1: Crear RelationshipDefinition v√°lido
print("\nüìù Test 2.1: Crear RelationshipDefinition v√°lido")
print("=" * 60)

contains_rel = RelationshipDefinition(
    from_node="File",
    to_node="Page",
    relationship_type="CONTAINS",
    direction="OUTGOING"
)

print(f"‚úÖ RelationshipDefinition creado:")
print(f"   From: {contains_rel.from_node}")
print(f"   To: {contains_rel.to_node}")
print(f"   Type: {contains_rel.relationship_type}")
print(f"   Direction: {contains_rel.direction}")



üìù Test 2.1: Crear RelationshipDefinition v√°lido
‚úÖ RelationshipDefinition creado:
   From: File
   To: Page
   Type: CONTAINS
   Direction: OUTGOING


## Parte 3: Value Objects - GraphPattern

Probamos la creaci√≥n y validaci√≥n de GraphPattern completo.


In [7]:
# Test 3.1: Crear GraphPattern completo
print("\nüìù Test 3.1: Crear GraphPattern completo")
print("=" * 60)

# Crear nodos
file_node = NodeDefinition(
    label="File",
    required_properties={"filename": str},
    indexes=["filename"]
)

page_node = NodeDefinition(
    label="Page",
    required_properties={"filename": str, "page_number": int},
    indexes=["filename"]
)

# Crear relaci√≥n
contains_rel = RelationshipDefinition(
    from_node="File",
    to_node="Page",
    relationship_type="CONTAINS"
)

# Crear patr√≥n
test_pattern = GraphPattern(
    name="TEST_FILE_PAGE",
    description="Patr√≥n de prueba: File contiene Page",
    node_definitions=[file_node, page_node],
    relationship_definitions=[contains_rel]
)

print(f"‚úÖ GraphPattern creado:")
print(f"   Nombre: {test_pattern.name}")
print(f"   Descripci√≥n: {test_pattern.description}")
print(f"   Nodos: {len(test_pattern.node_definitions)}")
print(f"   Relaciones: {len(test_pattern.relationship_definitions)}")



üìù Test 3.1: Crear GraphPattern completo
‚úÖ GraphPattern creado:
   Nombre: TEST_FILE_PAGE
   Descripci√≥n: Patr√≥n de prueba: File contiene Page
   Nodos: 2
   Relaciones: 1


## Parte 4: Patrones Predefinidos

Probamos el patr√≥n predefinido FILE_PAGE_CHUNK_PATTERN.


In [8]:
# Test 4.1: Importar y examinar FILE_PAGE_CHUNK_PATTERN
print("\nüìù Test 4.1: Examinar FILE_PAGE_CHUNK_PATTERN")
print("=" * 60)

from domain.value_objects.predefined_patterns import FILE_PAGE_CHUNK_PATTERN

pattern = FILE_PAGE_CHUNK_PATTERN

print(f"‚úÖ Patr√≥n predefinido cargado:")
print(f"   Nombre: {pattern.name}")
print(f"   Descripci√≥n: {pattern.description}")
print(f"\n   Nodos ({len(pattern.node_definitions)}):")
for node in pattern.node_definitions:
    print(f"     - {node.label}: {len(node.required_properties)} props requeridas, {len(node.optional_properties)} opcionales")

print(f"\n   Relaciones ({len(pattern.relationship_definitions)}):")
for rel in pattern.relationship_definitions:
    print(f"     - {rel.from_node} -[:{rel.relationship_type}]-> {rel.to_node}")



üìù Test 4.1: Examinar FILE_PAGE_CHUNK_PATTERN
‚úÖ Patr√≥n predefinido cargado:
   Nombre: FILE_PAGE_CHUNK
   Descripci√≥n: Patr√≥n b√°sico: File contiene Pages, Pages contienen Chunks. Chunks tienen relaciones NEXT_CHUNK entre consecutivos.

   Nodos (3):
     - File: 1 props requeridas, 1 opcionales
     - Page: 2 props requeridas, 0 opcionales
     - Chunk: 4 props requeridas, 3 opcionales

   Relaciones (3):
     - File -[:CONTAINS]-> Page
     - Page -[:HAS_CHUNK]-> Chunk
     - Chunk -[:NEXT_CHUNK]-> Chunk


In [9]:
# Test 4.2: Validar estructura del patr√≥n predefinido
print("\nüìù Test 4.2: Validar estructura del patr√≥n")
print("=" * 60)

pattern = FILE_PAGE_CHUNK_PATTERN

# Verificar que tiene los 3 nodos esperados
node_labels = {node.label for node in pattern.node_definitions}
expected_nodes = {"File", "Page", "Chunk"}

assert node_labels == expected_nodes, f"Nodos esperados: {expected_nodes}, encontrados: {node_labels}"
print(f"‚úÖ Nodos correctos: {node_labels}")

# Verificar relaciones
rel_types = {rel.relationship_type for rel in pattern.relationship_definitions}
expected_rels = {"CONTAINS", "HAS_CHUNK", "NEXT_CHUNK"}

assert rel_types == expected_rels, f"Relaciones esperadas: {expected_rels}, encontradas: {rel_types}"
print(f"‚úÖ Relaciones correctas: {rel_types}")

# Verificar propiedades del nodo Chunk
chunk_node = next(node for node in pattern.node_definitions if node.label == "Chunk")
required_chunk_props = {"chunk_id", "page_content", "embeddings", "embeddings_dimensions"}
assert set(chunk_node.required_properties.keys()) == required_chunk_props
print(f"‚úÖ Propiedades de Chunk correctas: {list(chunk_node.required_properties.keys())}")



üìù Test 4.2: Validar estructura del patr√≥n
‚úÖ Nodos correctos: {'Chunk', 'File', 'Page'}
‚úÖ Relaciones correctas: {'CONTAINS', 'NEXT_CHUNK', 'HAS_CHUNK'}
‚úÖ Propiedades de Chunk correctas: ['chunk_id', 'page_content', 'embeddings', 'embeddings_dimensions']


## Parte 5: PatternService - Validaci√≥n

Probamos el servicio PatternService para validar patrones.


In [10]:
# Test 5.1: Crear instancia de PatternService
print("\nüìù Test 5.1: Crear PatternService")
print("=" * 60)

from infrastructure.services.neo4j_pattern_service import Neo4jPatternService

service = Neo4jPatternService(database="neo4j")
print(f"‚úÖ Neo4jPatternService creado")
print(f"   Database: {service.database}")



üìù Test 5.1: Crear PatternService
‚úÖ Neo4jPatternService creado
   Database: neo4j


In [11]:
# Test 5.2: Validar patr√≥n predefinido
print("\nüìù Test 5.2: Validar FILE_PAGE_CHUNK_PATTERN")
print("=" * 60)

is_valid = service.validate_pattern(FILE_PAGE_CHUNK_PATTERN)
print(f"‚úÖ Validaci√≥n: {'V√ÅLIDO' if is_valid else 'INV√ÅLIDO'}")
assert is_valid, "El patr√≥n predefinido debe ser v√°lido"



üìù Test 5.2: Validar FILE_PAGE_CHUNK_PATTERN
‚úÖ Validaci√≥n: V√ÅLIDO


## Parte 6: PatternService - Generaci√≥n de Cypher

Probamos la generaci√≥n din√°mica de queries Cypher.


In [12]:
# Test 6.1: Generar query Cypher para patr√≥n simple
print("\nüìù Test 6.1: Generar query Cypher")
print("=" * 60)

# Crear patr√≥n simple
simple_node = NodeDefinition(
    label="TestNode",
    required_properties={"id": str, "name": str},
    optional_properties={"value": int}
)

simple_pattern = GraphPattern(
    name="SIMPLE",
    description="Simple pattern",
    node_definitions=[simple_node],
    relationship_definitions=[]
)

cypher_query = service.generate_cypher(simple_pattern, "create")

print("‚úÖ Query Cypher generado:")
print(cypher_query)

# Verificar que usa par√°metros
assert "$id" in cypher_query, "Debe usar par√°metros"
assert "$name" in cypher_query
assert "$value" in cypher_query
print("\n‚úÖ Query usa par√°metros correctamente")



üìù Test 6.1: Generar query Cypher
‚úÖ Query Cypher generado:
MERGE (n0:TestNode {id: $id, name: $name})
ON CREATE SET n0.value = $value

‚úÖ Query usa par√°metros correctamente


In [13]:
# Test 6.2: Generar query Cypher con relaciones
print("\nüìù Test 6.2: Generar query con relaciones")
print("=" * 60)

# Patr√≥n con dos nodos y una relaci√≥n
node1 = NodeDefinition(label="Node1", required_properties={"id": str})
node2 = NodeDefinition(label="Node2", required_properties={"id": str})
rel = RelationshipDefinition(
    from_node="Node1",
    to_node="Node2",
    relationship_type="RELATES_TO"
)

pattern_with_rel = GraphPattern(
    name="RELATED",
    description="Two related nodes",
    node_definitions=[node1, node2],
    relationship_definitions=[rel]
)

cypher_query = service.generate_cypher(pattern_with_rel, "create")

print("‚úÖ Query Cypher generado:")
print(cypher_query)

# Verificar que incluye la relaci√≥n
assert "RELATES_TO" in cypher_query
assert "->" in cypher_query
print("\n‚úÖ Query incluye relaciones correctamente")



üìù Test 6.2: Generar query con relaciones
‚úÖ Query Cypher generado:
MERGE (n0:Node1 {id: $id})
MERGE (n1:Node2 {id: $id})
MERGE (n0)-[:RELATES_TO]->(n1)

‚úÖ Query incluye relaciones correctamente


## Parte 7: Crear Patr√≥n Personalizado

Probamos la creaci√≥n de patrones personalizados y su uso.


In [14]:
# Test 7.1: Crear patr√≥n personalizado simple
print("\nüìù Test 7.1: Crear patr√≥n personalizado")
print("=" * 60)

# Patr√≥n simple: solo chunks sin File/Page
simple_chunk_node = NodeDefinition(
    label="Chunk",
    required_properties={
        "chunk_id": str,
        "content": str
    },
    indexes=["chunk_id"]
)

simple_chunk_pattern = GraphPattern(
    name="SIMPLE_CHUNK",
    description="Solo chunks, sin estructura File-Page",
    node_definitions=[simple_chunk_node],
    relationship_definitions=[]
)

print(f"‚úÖ Patr√≥n personalizado creado:")
print(f"   Nombre: {simple_chunk_pattern.name}")
print(f"   Nodos: {[n.label for n in simple_chunk_pattern.node_definitions]}")
print(f"   Relaciones: {len(simple_chunk_pattern.relationship_definitions)}")

# Validar el patr√≥n
is_valid = service.validate_pattern(simple_chunk_pattern)
print(f"\n‚úÖ Validaci√≥n: {'V√ÅLIDO' if is_valid else 'INV√ÅLIDO'}")

# Generar query Cypher
cypher = service.generate_cypher(simple_chunk_pattern, "create")
print(f"\nüìù Query Cypher generado:")
print(cypher)



üìù Test 7.1: Crear patr√≥n personalizado
‚úÖ Patr√≥n personalizado creado:
   Nombre: SIMPLE_CHUNK
   Nodos: ['Chunk']
   Relaciones: 0

‚úÖ Validaci√≥n: V√ÅLIDO

üìù Query Cypher generado:
MERGE (n0:Chunk {chunk_id: $chunk_id, content: $content})


## Parte 8: Resumen de Tests

Resumen de todas las funcionalidades probadas.


In [15]:
print("\n" + "=" * 60)
print("üìä RESUMEN DE TESTS")
print("=" * 60)

tests_summary = {
    "Value Objects": {
        "NodeDefinition": "‚úÖ Creado y validado",
        "RelationshipDefinition": "‚úÖ Creado y validado",
        "GraphPattern": "‚úÖ Creado y validado"
    },
    "Patrones Predefinidos": {
        "FILE_PAGE_CHUNK_PATTERN": "‚úÖ Cargado y validado"
    },
    "PatternService": {
        "Validaci√≥n": "‚úÖ Funciona correctamente",
        "Generaci√≥n Cypher": "‚úÖ Genera queries v√°lidos",
        "Aplicaci√≥n de patrones": "‚è≥ Pendiente (requiere Neo4j)"
    },
    "Patrones Personalizados": {
        "Creaci√≥n": "‚úÖ Funciona correctamente",
        "Validaci√≥n": "‚úÖ Funciona correctamente",
        "Generaci√≥n Cypher": "‚úÖ Funciona correctamente"
    }
}

for category, items in tests_summary.items():
    print(f"\n{category}:")
    for item, status in items.items():
        print(f"  - {item}: {status}")

print("\n" + "=" * 60)
print("‚úÖ Fase 1 completada exitosamente")
print("üìã Pr√≥ximos pasos: Fase 2 - Integraci√≥n con casos de uso")
print("=" * 60)



üìä RESUMEN DE TESTS

Value Objects:
  - NodeDefinition: ‚úÖ Creado y validado
  - RelationshipDefinition: ‚úÖ Creado y validado
  - GraphPattern: ‚úÖ Creado y validado

Patrones Predefinidos:
  - FILE_PAGE_CHUNK_PATTERN: ‚úÖ Cargado y validado

PatternService:
  - Validaci√≥n: ‚úÖ Funciona correctamente
  - Generaci√≥n Cypher: ‚úÖ Genera queries v√°lidos
  - Aplicaci√≥n de patrones: ‚è≥ Pendiente (requiere Neo4j)

Patrones Personalizados:
  - Creaci√≥n: ‚úÖ Funciona correctamente
  - Validaci√≥n: ‚úÖ Funciona correctamente
  - Generaci√≥n Cypher: ‚úÖ Funciona correctamente

‚úÖ Fase 1 completada exitosamente
üìã Pr√≥ximos pasos: Fase 2 - Integraci√≥n con casos de uso


## Referencias

- [Plan de Patrones de Grafo](../../_PLAN_PATRONES_GRAFO.md)
- [Documentaci√≥n de Patrones](../../docs/concepts/graph-patterns.md)
- [Documentaci√≥n de B√∫squeda GraphRAG](../../docs/api/search-patterns.md)
- [GraphRAG Pattern Catalog](https://graphrag.com/reference/)
- [Neo4j Cypher Manual](https://neo4j.com/docs/cypher-manual/)
