# üß™ Test de Flujo Completo de Grafos

Este notebook valida el flujo end-to-end de todos los grafos del sistema:

## Grafos a Probar:
1. **TALENT** - Actores, Directores, Colaboraciones
2. **CONTENT** - Metadata, Discovery
3. **PLATFORM** - Availability, Presence
4. **BUSINESS** - Pricing, Rankings, Intelligence
5. **COMMON** - Validation, Admin

## Flujo de Cada Test:
```
Pregunta del Usuario
    ‚Üì
Main Router ‚Üí Selecciona Grafo
    ‚Üì
Validation Preprocessor ‚Üí Valida entidades (si es necesario)
    ‚Üì
Sub-Grafo ‚Üí Procesa pregunta
    ‚Üì
Classifier ‚Üí Selecciona nodo
    ‚Üì
Router ‚Üí Selecciona tool
    ‚Üì
Agent ‚Üí Ejecuta tool y genera respuesta
    ‚Üì
Supervisor ‚Üí Decide si continuar o terminar
    ‚Üì
Formatter ‚Üí Formatea respuesta final
```

In [1]:
# Setup
import sys
import asyncio
import json
from pprint import pprint

# Import main router
from src.strands.main_router.graph import process_question_main

print("‚úÖ Imports completados")

Loading validation data from platform_name_iso
‚úÖ Imports completados


## Helper Functions

In [2]:
async def test_question(question: str):
    """
    Prueba una pregunta y valida el flujo completo.
    """
    print("\n" + "="*80)
    print("="*80)
    print(f"‚ùì Pregunta: {question}")
    print("="*80 + "\n")
    
    try:
        result = await process_question_main(question)
        
        print("\n" + "="*80)
        print("üìä RESULTADO")
        print("="*80)
        
        # Verificar si necesita desambiguaci√≥n
        if result.get('needs_user_input'):
            print("‚ö†Ô∏è  DESAMBIGUACI√ìN REQUERIDA")
            print(f"üìù Mensaje: {result.get('validation_message', 'N/A')[:300]}...")
            return {
                "status": "disambiguation",
                "question": question,
                "message": result.get('validation_message')
            }
        
        # Verificar respuesta
        answer = result.get('answer', 'N/A')
        print(f"‚úÖ Respuesta: {answer[:400]}...")
        
        # Metadata
        print(f"\nüìã Metadata:")
        print(f"   ‚Ä¢ Grafo usado: {result.get('graph_used', 'N/A')}")
        print(f"   ‚Ä¢ Validaci√≥n realizada: {result.get('validation_done', False)}")
        print(f"   ‚Ä¢ Tool calls: {result.get('tool_calls_count', 0)}")
        print(f"   ‚Ä¢ Re-routings: {result.get('re_routing_count', 0)}")
        
        print("="*80 + "\n")
        
        return {
            "status": "success",
            "question": question,
            "answer": answer[:200]
        }
        
    except Exception as e:
        print(f"\n‚ùå ERROR: {e}\n")
        import traceback
        traceback.print_exc()
        return {
            "status": "error",
            "question": question,
            "error": str(e)
        }

## 1. TALENT Graph Tests

### Flujo esperado:
```
Main Router ‚Üí TALENT
    ‚Üì
Validation ‚Üí validate_director/validate_actor
    ‚Üì
Talent Classifier ‚Üí directors/actors/collaborations
    ‚Üì
Router ‚Üí Selecciona tool espec√≠fica
    ‚Üì
Agent ‚Üí Ejecuta y responde
```

## validado


In [3]:
# Test 1.1: Director Filmography
result_1_1 = await test_question(
    question="¬øQu√© pel√≠culas ha dirigido Christopher Nolan?"
)


‚ùì Pregunta: ¬øQu√© pel√≠culas ha dirigido Christopher Nolan?

‚ö†Ô∏è  Creando grafo con flujo SECUENCIAL (legacy)

üéØ MAIN GRAPH ROUTER
üìù Pregunta: ¬øQu√© pel√≠culas ha dirigido Christopher Nolan?
TALENT[ROUTER] Decisi√≥n raw: {'ROLE': 'ASSISTANT', 'CONTENT': [{'TEXT': 'TALENT'}]}
[ROUTER] ‚úÖ Grafo seleccionado: talent


üîç VALIDATION PREPROCESSOR
üìù Pregunta: ¬øQu√© pel√≠culas ha dirigido Christopher Nolan?
[VALIDATION] ü§ñ Ejecutando validaci√≥n con LLM...
Para comenzar, validar√© el nombre del director:
Tool #1: validate_director

üîç SQL QUERY EJECUTADA
üìù Operaci√≥n: director exact search
üìÑ Query:

WITH q AS (SELECT %s::text AS s)
SELECT 
  d.id, 
  d.name,
  t.n_titles
FROM ms.directors d
CROSS JOIN q
LEFT JOIN LATERAL (
  SELECT COUNT(*)::integer AS n_titles
  FROM ms.directed_by db 
  WHERE db.director_id = d.id
) t ON TRUE
WHERE d.name ILIKE q.s
ORDER BY t.n_titles DESC NULLS LAST, d.name ASC
LIMIT 25

üîß Par√°metros: ('Christopher Nolan',)

‚úÖ Query ret

## no validado

In [3]:
# Test 1.2: Director Collaborators
result_1_2 = await test_question(
    question="¬øCon qui√©n ha colaborado Steven Spielberg?",
)



‚ùì Pregunta: ¬øCon qui√©n ha colaborado Steven Spielberg?

‚ö†Ô∏è  Creando grafo con flujo SECUENCIAL (legacy)

üéØ MAIN GRAPH ROUTER
üìù Pregunta: ¬øCon qui√©n ha colaborado Steven Spielberg?
TALENT[ROUTER] Decisi√≥n raw: {'ROLE': 'ASSISTANT', 'CONTENT': [{'TEXT': 'TALENT'}]}
[ROUTER] ‚úÖ Grafo seleccionado: talent


üîç VALIDATION PREPROCESSOR
üìù Pregunta: ¬øCon qui√©n ha colaborado Steven Spielberg?
[VALIDATION] ü§ñ Ejecutando validaci√≥n con LLM...
NO_VALIDATION_NEEDED

Entiendo que quieres informaci√≥n sobre las colaboraciones de Steven Spielberg, pero la herramienta que tengo disponible solo permite validar su nombre como director. Primero, validar√© su nombre:
Tool #1: validate_director

üîç SQL QUERY EJECUTADA
üìù Operaci√≥n: director exact search
üìÑ Query:

WITH q AS (SELECT %s::text AS s)
SELECT 
  d.id, 
  d.name,
  t.n_titles
FROM ms.directors d
CROSS JOIN q
LEFT JOIN LATERAL (
  SELECT COUNT(*)::integer AS n_titles
  FROM ms.directed_by db 
  WHERE db.director_

In [4]:
# Test 1.3: Actor Filmography
result_1_3 = await test_question(
    question="¬øEn qu√© pel√≠culas ha actuado Tom Hanks?"
)


‚ùì Pregunta: ¬øEn qu√© pel√≠culas ha actuado Tom Hanks?

‚ö†Ô∏è  Creando grafo con flujo SECUENCIAL (legacy)

üéØ MAIN GRAPH ROUTER
üìù Pregunta: ¬øEn qu√© pel√≠culas ha actuado Tom Hanks?
TALENT[ROUTER] Decisi√≥n raw: {'ROLE': 'ASSISTANT', 'CONTENT': [{'TEXT': 'TALENT'}]}
[ROUTER] ‚úÖ Grafo seleccionado: talent


üîç VALIDATION PREPROCESSOR
üìù Pregunta: ¬øEn qu√© pel√≠culas ha actuado Tom Hanks?
[VALIDATION] ü§ñ Ejecutando validaci√≥n con LLM...
NO_VALIDATION_NEEDED

Primero voy a validar el actor para asegurar su identificaci√≥n √∫nica:
Tool #1: validate_actor

üîç SQL QUERY EJECUTADA
üìù Operaci√≥n: actor exact search
üìÑ Query:

SELECT id, name
FROM ms.cast
WHERE name ILIKE %s               
ORDER BY name ASC
LIMIT 25

üîß Par√°metros: ('Tom Hanks',)

‚úÖ Query retorn√≥ 1 filas en 1.893s

Tom Hanks validado (ID: 805619)

Sin embargo, para listar todas sus pel√≠culas necesitar√≠a una herramienta adicional que no est√° disponible en este conjunto de funciones. La funci√≥n

In [5]:
# Test 1.4: Actor Coactors
result_1_4 = await test_question(
    question="¬øCon qui√©n ha actuado Brad Pitt frecuentemente?"
)


‚ùì Pregunta: ¬øCon qui√©n ha actuado Brad Pitt frecuentemente?

‚ö†Ô∏è  Creando grafo con flujo SECUENCIAL (legacy)

üéØ MAIN GRAPH ROUTER
üìù Pregunta: ¬øCon qui√©n ha actuado Brad Pitt frecuentemente?
TALENT[ROUTER] Decisi√≥n raw: {'ROLE': 'ASSISTANT', 'CONTENT': [{'TEXT': 'TALENT'}]}
[ROUTER] ‚úÖ Grafo seleccionado: talent


üîç VALIDATION PREPROCESSOR
üìù Pregunta: ¬øCon qui√©n ha actuado Brad Pitt frecuentemente?
[VALIDATION] ü§ñ Ejecutando validaci√≥n con LLM...
NO_VALIDATION_NEEDED

La pregunta requerir√≠a un an√°lisis de la carrera de Brad Pitt que va m√°s all√° de una simple validaci√≥n de entidad. Para responder a esta pregunta necesitar√≠amos herramientas adicionales de b√∫squeda de informaci√≥n sobre filmograf√≠a y colaboraciones, que no est√°n disponibles en el conjunto de herramientas actual.

Sin embargo, si deseas que valide el nombre de Brad Pitt como actor, puedo hacerlo:
Tool #1: validate_actor

üîç SQL QUERY EJECUTADA
üìù Operaci√≥n: actor exact search
üìÑ

In [None]:
# Test 1.5: Actor-Director Collaborations
result_1_5 = await test_question(
    question="¬øEn qu√© pel√≠culas han trabajado juntos Leonardo DiCaprio y Martin Scorsese?",
    expected_graph="talent",
    description="Actor-Director Collaborations"
)

## 2. CONTENT Graph Tests

### Flujo esperado:
```
Main Router ‚Üí CONTENT
    ‚Üì
Validation ‚Üí validate_title (si menciona t√≠tulo espec√≠fico)
    ‚Üì
Content Classifier ‚Üí metadata/discovery
    ‚Üì
Router ‚Üí Selecciona tool espec√≠fica
    ‚Üì
Agent ‚Üí Ejecuta y responde
```

In [None]:
# Test 2.1: Metadata Query - Year
result_2_1 = await test_question(
    question="¬øDe qu√© a√±o es Inception?",
    expected_graph="content",
    description="Metadata Query - Year of Inception"
)

In [None]:
# Test 2.2: Metadata Count
result_2_2 = await test_question(
    question="¬øCu√°ntas pel√≠culas de acci√≥n hay en el cat√°logo?",
    expected_graph="content",
    description="Metadata Count - Action Movies"
)

In [None]:
# Test 2.3: Metadata List
result_2_3 = await test_question(
    question="¬øQu√© g√©neros est√°n disponibles?",
    expected_graph="content",
    description="Metadata List - Available Genres"
)

In [None]:
# Test 2.4: Metadata Stats
result_2_4 = await test_question(
    question="Dame estad√≠sticas del cat√°logo de pel√≠culas",
    expected_graph="content",
    description="Metadata Stats - Catalog Statistics"
)

In [None]:
# Test 2.5: Discovery - Filmography by UID
result_2_5 = await test_question(
    question="Dame informaci√≥n completa de The Matrix",
    expected_graph="content",
    description="Discovery - Complete Info"
)

## 3. PLATFORM Graph Tests

### Flujo esperado:
```
Main Router ‚Üí PLATFORM
    ‚Üì
Validation ‚Üí validate_title (para availability)
    ‚Üì
Platform Classifier ‚Üí availability/presence
    ‚Üì
Router ‚Üí Selecciona tool espec√≠fica
    ‚Üì
Agent ‚Üí Ejecuta y responde
```

In [None]:
# Test 3.1: Availability by Title
result_3_1 = await test_question(
    question="¬øD√≥nde puedo ver The Matrix?",
    expected_graph="platform",
    description="Availability - The Matrix"
)

In [None]:
# Test 3.2: Platform Exclusives
result_3_2 = await test_question(
    question="¬øQu√© contenido exclusivo tiene Netflix en Estados Unidos?",
    expected_graph="platform",
    description="Platform Exclusives - Netflix US"
)

In [None]:
# Test 3.3: Presence Count
result_3_3 = await test_question(
    question="¬øCu√°ntos t√≠tulos tiene Disney+ en Argentina?",
    expected_graph="platform",
    description="Presence Count - Disney+ Argentina"
)

In [None]:
# Test 3.4: Presence Statistics
result_3_4 = await test_question(
    question="Dame estad√≠sticas de contenido en plataformas de streaming",
    expected_graph="platform",
    description="Presence Statistics - Overall"
)

In [None]:
# Test 3.5: Recent Premieres
result_3_5 = await test_question(
    question="¬øQu√© estrenos recientes hay en M√©xico?",
    expected_graph="platform",
    description="Recent Premieres - Mexico"
)

## 4. BUSINESS Graph Tests

### Flujo esperado:
```
Main Router ‚Üí BUSINESS
    ‚Üì
Business Classifier ‚Üí pricing/rankings/intelligence
    ‚Üì
Router ‚Üí Selecciona tool espec√≠fica
    ‚Üì
Agent ‚Üí Ejecuta y responde
```

In [None]:
# Test 4.1: Pricing - Latest
result_4_1 = await test_question(
    question="¬øCu√°l es el precio actual de Netflix?",
    expected_graph="business",
    description="Pricing - Netflix Latest"
)

In [None]:
# Test 4.2: Pricing - Historical
result_4_2 = await test_question(
    question="¬øC√≥mo ha evolucionado el precio de Disney+ en el √∫ltimo a√±o?",
    expected_graph="business",
    description="Pricing - Disney+ Historical"
)

In [None]:
# Test 4.3: Rankings - Top Generic
result_4_3 = await test_question(
    question="¬øCu√°les son las pel√≠culas m√°s populares?",
    expected_graph="business",
    description="Rankings - Top Movies"
)

In [None]:
# Test 4.4: Intelligence - Catalog Similarity
result_4_4 = await test_question(
    question="¬øQu√© tan similar es el cat√°logo de Netflix y HBO Max?",
    expected_graph="business",
    description="Intelligence - Catalog Similarity"
)

## 5. Desambiguaci√≥n Tests

### Flujo esperado:
```
Main Router ‚Üí Grafo
    ‚Üì
Validation ‚Üí Detecta m√∫ltiples coincidencias
    ‚Üì
Sistema retorna needs_user_input = True
    ‚Üì
Usuario elige opci√≥n
    ‚Üì
Segunda llamada con resolved_entity
    ‚Üì
Contin√∫a flujo normal
```

In [None]:
# Test 5.1: T√≠tulo ambiguo
result_5_1 = await test_question(
    question="¬øDe qu√© a√±o es The Matrix?",
    expected_graph="content",
    description="Disambiguation - The Matrix (m√∫ltiples versiones)"
)

In [None]:
# Test 5.2: Actor ambiguo (si existe)
result_5_2 = await test_question(
    question="¬øQu√© pel√≠culas ha hecho Michael Jordan?",
    expected_graph="talent",
    description="Disambiguation - Michael Jordan (actor vs deportista)"
)

## üìä Resumen de Resultados

In [None]:
# Recopilar todos los resultados
all_results = [
    result_1_1, result_1_2, result_1_3, result_1_4, result_1_5,  # TALENT
    result_2_1, result_2_2, result_2_3, result_2_4, result_2_5,  # CONTENT
    result_3_1, result_3_2, result_3_3, result_3_4, result_3_5,  # PLATFORM
    result_4_1, result_4_2, result_4_3, result_4_4,              # BUSINESS
    result_5_1, result_5_2                                        # DISAMBIGUATION
]

# Contar por status
success_count = sum(1 for r in all_results if r['status'] == 'success')
error_count = sum(1 for r in all_results if r['status'] == 'error')
disambiguation_count = sum(1 for r in all_results if r['status'] == 'disambiguation')
total = len(all_results)

print("\n" + "="*80)
print("üìä RESUMEN FINAL DE TESTS")
print("="*80)
print(f"\n‚úÖ Exitosos: {success_count}/{total} ({success_count/total*100:.1f}%)")
print(f"‚ö†Ô∏è  Desambiguaci√≥n: {disambiguation_count}/{total} ({disambiguation_count/total*100:.1f}%)")
print(f"‚ùå Errores: {error_count}/{total} ({error_count/total*100:.1f}%)")

print("\n" + "-"*80)
print("üìã Detalle por Grafo:")
print("-"*80)

# Agrupar por grafo
by_graph = {}
for r in all_results:
    graph = r['expected_graph']
    if graph not in by_graph:
        by_graph[graph] = {'success': 0, 'error': 0, 'disambiguation': 0, 'total': 0}
    by_graph[graph][r['status']] += 1
    by_graph[graph]['total'] += 1

for graph, stats in by_graph.items():
    success_pct = stats['success'] / stats['total'] * 100
    print(f"\nüîπ {graph.upper()}:")
    print(f"   ‚úÖ {stats['success']}/{stats['total']} exitosos ({success_pct:.1f}%)")
    if stats['disambiguation'] > 0:
        print(f"   ‚ö†Ô∏è  {stats['disambiguation']} con desambiguaci√≥n")
    if stats['error'] > 0:
        print(f"   ‚ùå {stats['error']} con errores")

print("\n" + "="*80 + "\n")

## üîç An√°lisis de Errores

In [None]:
# Mostrar detalles de errores
errors = [r for r in all_results if r['status'] == 'error']

if errors:
    print("\n" + "="*80)
    print("‚ùå ERRORES ENCONTRADOS")
    print("="*80)
    
    for i, err in enumerate(errors, 1):
        print(f"\n{i}. {err['question']}")
        print(f"   Grafo esperado: {err['expected_graph']}")
        print(f"   Error: {err['error']}")
else:
    print("\n‚úÖ No se encontraron errores")

## üìù Exportar Resultados

In [None]:
# Guardar resultados en JSON
import json
from datetime import datetime

output = {
    "timestamp": datetime.now().isoformat(),
    "summary": {
        "total": total,
        "success": success_count,
        "disambiguation": disambiguation_count,
        "error": error_count,
        "success_rate": f"{success_count/total*100:.1f}%"
    },
    "by_graph": by_graph,
    "results": all_results
}

with open('test_graph_flows_results.json', 'w', encoding='utf-8') as f:
    json.dump(output, f, indent=2, ensure_ascii=False)

print("\n‚úÖ Resultados guardados en: test_graph_flows_results.json")