# 05_agent_query.ipynb
## (Nuevo) Consulta Interactiva del Agente

**Objetivo:** Interactuar con el agente RAG multimodal.

**Pre-requisito:** Debes haber ejecutado `main.py indexar` o el `Notebook 04` al menos una vez para poblar la base de datos vectorial de ChromaDB.

In [1]:
import sys
import logging
from pathlib import Path
import json

# --- Celda de Configuración Estándar ---
PROJECT_ROOT = Path.cwd().parent
if str(PROJECT_ROOT) not in sys.path:
    sys.path.insert(0, str(PROJECT_ROOT))

# 1. Importar la config (carga .env)
import src.utils.config 
from src.utils.config import OPENAI_API_KEY

# 2. Configurar logging
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

# 3. Importar las herramientas del agente
from src.agent import run_agent_query
from src.vectorstore import MultimodalIndexer

print(f"Raíz del proyecto establecida en: {PROJECT_ROOT}")
print("✅ Entorno configurado. Logging listo.")

if not OPENAI_API_KEY or "..." in OPENAI_API_KEY:
    logger.error("Falta OPENAI_API_KEY en .env. El Agente fallará.")

  from .autonotebook import tqdm as notebook_tqdm


Raíz del proyecto establecida en: c:\Users\Usuario\Documents\UTEC\Liquidaciones Agent\multidoc-agent
✅ Entorno configurado. Logging listo.


## 1. Verificar Estado de la Base de Datos

In [2]:
print("Verificando estado de ChromaDB...")
indexer = MultimodalIndexer()
stats = indexer.get_collection_stats()

print("\n--- Estadísticas de ChromaDB ---")
print(json.dumps(stats, indent=2))
print("---------------------------------")

if stats.get('total_documents', 0) == 0:
    logger.warning("La base de datos está vacía. Ejecuta 'main.py indexar' o el Notebook 04 primero.")
else:
    print(f"✅ Base de datos lista con {stats.get('total_documents')} documentos.")

INFO:src.vectorstore.multimodal_indexer:No se proveyó ClipEncoder, creando instancia por defecto...


Verificando estado de ChromaDB...
2025-11-08 12:25:31,660 - src.embeddings.clip_encoder - INFO - Cargando modelo CLIP: openai/clip-vit-base-patch32


INFO:src.embeddings.clip_encoder:Cargando modelo CLIP: openai/clip-vit-base-patch32


2025-11-08 12:25:31,666 - src.embeddings.clip_encoder - INFO - Usando device: cpu


INFO:src.embeddings.clip_encoder:Usando device: cpu
Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.52, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.


2025-11-08 12:25:37,105 - src.embeddings.clip_encoder - INFO - CLIP encoder cargado exitosamente


INFO:src.embeddings.clip_encoder:CLIP encoder cargado exitosamente
INFO:src.vectorstore.multimodal_indexer:Instancia de ClipEncoder por defecto creada.
INFO:src.vectorstore.multimodal_indexer:No se proveyó ChromaManager, usando get_chroma_manager() por defecto...
INFO:src.vectorstore.chroma_manager:Creando nueva instancia de ChromaManager...
INFO:src.vectorstore.chroma_manager:Inicializando ChromaManager para el directorio: c:\Users\Usuario\Documents\UTEC\Liquidaciones Agent\multidoc-agent\chromadb_storage
INFO:src.vectorstore.chroma_manager:Colección 'multidoc_collection' cargada/creada exitosamente con métrica 'cosine'.
INFO:src.vectorstore.chroma_manager:Instancia de ChromaManager creada y cacheada.
INFO:src.vectorstore.multimodal_indexer:Instancia de ChromaManager por defecto obtenida.
INFO:src.vectorstore.multimodal_indexer:MultimodalIndexer inicializado y listo.
INFO:src.vectorstore.multimodal_indexer:Obteniendo estadísticas de la colección 'multidoc_collection'...
INFO:src.vecto


--- Estadísticas de ChromaDB ---
{
  "total_documents": 8,
  "image_documents": 8,
  "text_documents": 0,
  "multimodal": false
}
---------------------------------
✅ Base de datos lista con 8 documentos.


## 2. Prueba de Consulta (PDF)

In [3]:
query1 = "¿toda lainformación del lote 25105?"
print(f"Query: {query1}\n")

result1 = run_agent_query(query1)

print("--- Respuesta del Agente ---")
print(json.dumps(result1, indent=2, ensure_ascii=False))
print("--------------------------")

Query: ¿toda lainformación del lote 25105?

2025-11-08 12:27:49,990 - src.agent.graph_agent - INFO - Inicializando AgentStateGraph


INFO:src.agent.graph_agent:Inicializando AgentStateGraph


2025-11-08 12:27:50,029 - src.agent.graph_agent - INFO - Grafo compilado con éxito


INFO:src.agent.graph_agent:Grafo compilado con éxito


2025-11-08 12:27:50,036 - src.agent.graph_agent - INFO - Grafo inicializado exitosamente


INFO:src.agent.graph_agent:Grafo inicializado exitosamente


2025-11-08 12:27:50,041 - src.agent.graph_agent - INFO - Ejecutando agente con query: ¿toda lainformación del lote 25105?


INFO:src.agent.graph_agent:Ejecutando agente con query: ¿toda lainformación del lote 25105?


2025-11-08 12:27:50,048 - src.agent.nodes - INFO - Query node - Query: ¿toda lainformación del lote 25105?


INFO:src.agent.nodes:Query node - Query: ¿toda lainformación del lote 25105?


2025-11-08 12:27:50,054 - src.agent.nodes - INFO - Query preparada: ¿toda lainformación del lote 25105?


INFO:src.agent.nodes:Query preparada: ¿toda lainformación del lote 25105?


2025-11-08 12:27:50,061 - src.agent.nodes - INFO - Retrieve node - Buscando documentos


INFO:src.agent.nodes:Retrieve node - Buscando documentos


2025-11-08 12:27:50,066 - src.embeddings.clip_encoder - INFO - Cargando modelo CLIP: openai/clip-vit-base-patch32


INFO:src.embeddings.clip_encoder:Cargando modelo CLIP: openai/clip-vit-base-patch32


2025-11-08 12:27:50,072 - src.embeddings.clip_encoder - INFO - Usando device: cpu


INFO:src.embeddings.clip_encoder:Usando device: cpu


2025-11-08 12:27:53,413 - src.embeddings.clip_encoder - INFO - CLIP encoder cargado exitosamente


INFO:src.embeddings.clip_encoder:CLIP encoder cargado exitosamente
INFO:src.vectorstore.multimodal_indexer:No se proveyó ClipEncoder, creando instancia por defecto...


2025-11-08 12:27:53,416 - src.embeddings.clip_encoder - INFO - Cargando modelo CLIP: openai/clip-vit-base-patch32


INFO:src.embeddings.clip_encoder:Cargando modelo CLIP: openai/clip-vit-base-patch32


2025-11-08 12:27:53,418 - src.embeddings.clip_encoder - INFO - Usando device: cpu


INFO:src.embeddings.clip_encoder:Usando device: cpu


2025-11-08 12:27:56,518 - src.embeddings.clip_encoder - INFO - CLIP encoder cargado exitosamente


INFO:src.embeddings.clip_encoder:CLIP encoder cargado exitosamente
INFO:src.vectorstore.multimodal_indexer:Instancia de ClipEncoder por defecto creada.
INFO:src.vectorstore.multimodal_indexer:No se proveyó ChromaManager, usando get_chroma_manager() por defecto...
INFO:src.vectorstore.multimodal_indexer:Instancia de ChromaManager por defecto obtenida.
INFO:src.vectorstore.multimodal_indexer:MultimodalIndexer inicializado y listo.


2025-11-08 12:27:56,522 - src.embeddings.clip_encoder - INFO - Codificando texto (primeros 50 chars): ¿toda lainformación del lote 25105?


INFO:src.embeddings.clip_encoder:Codificando texto (primeros 50 chars): ¿toda lainformación del lote 25105?


2025-11-08 12:27:56,582 - src.embeddings.clip_encoder - INFO - Texto codificado. Dimensión: (512,)


INFO:src.embeddings.clip_encoder:Texto codificado. Dimensión: (512,)


2025-11-08 12:27:56,584 - src.agent.nodes - ERROR - Error durante retrieval: 'MultimodalIndexer' object has no attribute 'search_by_embedding'


ERROR:src.agent.nodes:Error durante retrieval: 'MultimodalIndexer' object has no attribute 'search_by_embedding'


2025-11-08 12:27:56,601 - src.agent.nodes - INFO - Reason node - Razonando con LLM


INFO:src.agent.nodes:Reason node - Razonando con LLM






2025-11-08 12:27:56,609 - src.agent.nodes - INFO - Format node - Formateando respuesta


INFO:src.agent.nodes:Format node - Formateando respuesta


2025-11-08 12:27:56,611 - src.agent.nodes - INFO - Respuesta formateada


INFO:src.agent.nodes:Respuesta formateada


2025-11-08 12:27:56,613 - src.agent.graph_agent - INFO - Ejecución del agente completada


INFO:src.agent.graph_agent:Ejecución del agente completada


--- Respuesta del Agente ---
{
  "status": "success",
  "query": "¿toda lainformación del lote 25105?",
  "response": {
    "answer": "No se encontraron documentos relevantes",
    "sources": [],
    "query": "¿toda lainformación del lote 25105?",
    "quality_score": 0.7
  },
  "documents_retrieved": 0
}
--------------------------


## 3. Prueba de Consulta (Excel)

In [4]:
query2 = "¿Cuántas horas de 'TIEMPO MUERTO' se registraron en total?"
print(f"Query: {query2}\n")

result2 = run_agent_query(query2)

print("--- Respuesta del Agente ---")
print(json.dumps(result2, indent=2, ensure_ascii=False))
print("--------------------------")

Query: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron en total?

2025-11-08 12:28:03,970 - src.agent.graph_agent - INFO - Ejecutando agente con query: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron e


INFO:src.agent.graph_agent:Ejecutando agente con query: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron e


2025-11-08 12:28:03,974 - src.agent.nodes - INFO - Query node - Query: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron e


INFO:src.agent.nodes:Query node - Query: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron e


2025-11-08 12:28:03,976 - src.agent.nodes - INFO - Query preparada: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron en total?


INFO:src.agent.nodes:Query preparada: ¿Cuántas horas de 'TIEMPO MUERTO' se registraron en total?


2025-11-08 12:28:03,979 - src.agent.nodes - INFO - Retrieve node - Buscando documentos


INFO:src.agent.nodes:Retrieve node - Buscando documentos


2025-11-08 12:28:03,985 - src.embeddings.clip_encoder - INFO - Cargando modelo CLIP: openai/clip-vit-base-patch32


INFO:src.embeddings.clip_encoder:Cargando modelo CLIP: openai/clip-vit-base-patch32


2025-11-08 12:28:03,987 - src.embeddings.clip_encoder - INFO - Usando device: cpu


INFO:src.embeddings.clip_encoder:Usando device: cpu


2025-11-08 12:28:07,365 - src.embeddings.clip_encoder - INFO - CLIP encoder cargado exitosamente


INFO:src.embeddings.clip_encoder:CLIP encoder cargado exitosamente
INFO:src.vectorstore.multimodal_indexer:No se proveyó ClipEncoder, creando instancia por defecto...


2025-11-08 12:28:07,368 - src.embeddings.clip_encoder - INFO - Cargando modelo CLIP: openai/clip-vit-base-patch32


INFO:src.embeddings.clip_encoder:Cargando modelo CLIP: openai/clip-vit-base-patch32


2025-11-08 12:28:07,369 - src.embeddings.clip_encoder - INFO - Usando device: cpu


INFO:src.embeddings.clip_encoder:Usando device: cpu


2025-11-08 12:28:10,688 - src.embeddings.clip_encoder - INFO - CLIP encoder cargado exitosamente


INFO:src.embeddings.clip_encoder:CLIP encoder cargado exitosamente
INFO:src.vectorstore.multimodal_indexer:Instancia de ClipEncoder por defecto creada.
INFO:src.vectorstore.multimodal_indexer:No se proveyó ChromaManager, usando get_chroma_manager() por defecto...
INFO:src.vectorstore.multimodal_indexer:Instancia de ChromaManager por defecto obtenida.
INFO:src.vectorstore.multimodal_indexer:MultimodalIndexer inicializado y listo.


2025-11-08 12:28:10,692 - src.embeddings.clip_encoder - INFO - Codificando texto (primeros 50 chars): ¿Cuántas horas de 'TIEMPO MUERTO' se registraron e


INFO:src.embeddings.clip_encoder:Codificando texto (primeros 50 chars): ¿Cuántas horas de 'TIEMPO MUERTO' se registraron e


2025-11-08 12:28:10,755 - src.embeddings.clip_encoder - INFO - Texto codificado. Dimensión: (512,)


INFO:src.embeddings.clip_encoder:Texto codificado. Dimensión: (512,)


2025-11-08 12:28:10,758 - src.agent.nodes - ERROR - Error durante retrieval: 'MultimodalIndexer' object has no attribute 'search_by_embedding'


ERROR:src.agent.nodes:Error durante retrieval: 'MultimodalIndexer' object has no attribute 'search_by_embedding'


2025-11-08 12:28:10,777 - src.agent.nodes - INFO - Reason node - Razonando con LLM


INFO:src.agent.nodes:Reason node - Razonando con LLM






2025-11-08 12:28:10,782 - src.agent.nodes - INFO - Format node - Formateando respuesta


INFO:src.agent.nodes:Format node - Formateando respuesta


2025-11-08 12:28:10,784 - src.agent.nodes - INFO - Respuesta formateada


INFO:src.agent.nodes:Respuesta formateada


2025-11-08 12:28:10,786 - src.agent.graph_agent - INFO - Ejecución del agente completada


INFO:src.agent.graph_agent:Ejecución del agente completada


--- Respuesta del Agente ---
{
  "status": "success",
  "query": "¿Cuántas horas de 'TIEMPO MUERTO' se registraron en total?",
  "response": {
    "answer": "No se encontraron documentos relevantes",
    "sources": [],
    "query": "¿Cuántas horas de 'TIEMPO MUERTO' se registraron en total?",
    "quality_score": 0.7
  },
  "documents_retrieved": 0
}
--------------------------


## 4. Consulta Interactiva

*(Descomenta la celda de abajo para probar tus propias preguntas. Escribe 'salir' para terminar)*

In [5]:
# print("--- Consulta Interactiva del Agente ---")
# print("Escribe tu pregunta (o 'salir' para terminar)")

# while True:
#     query = input("\n> ")
#     if query.lower() == 'salir':
#         print("Terminando sesión.")
#         break
    
#     result = run_agent_query(query)
    
#     if result.get('status') == 'success':
#         response_data = result.get('response', {})
#         print(f"\nRespuesta: {response_data.get('answer', 'Sin respuesta.')}")
#         print(f"  (Confianza: {response_data.get('quality_score', 0) * 100:.1f}%)")
#         print(f"  (Fuentes: {len(response_data.get('sources', []))})")
#     else:
#         print(f"\n❌ Error del Agente: {result.get('error', 'Error desconocido')}")