# Mejoras Futuras y Escalabilidad

## Objetivo
Este notebook explora el futuro desarrollo de nuestro sistema multiagente, definiendo un roadmap de mejoras y extensiones. Evaluaremos potenciales direcciones de evolución y estableceremos prioridades para desarrollo futuro.

En este notebook:
- Planificaremos mejoras basadas en feedback y resultados
- Exploraremos nuevas capacidades y funcionalidades
- Evaluaremos tecnologías emergentes que podrían integrarse
- Desarrollaremos un roadmap priorizado para evolución del sistema

## Mejoras y Tareas Pendientes

1. **Interfaz Gráfica (GUI)**  
   Añadir una interfaz de usuario para interactuar con los agentes dentro del notebook o configurar un servidor local (Gradio o Streamlit).

2. **Modularización del Código**  
   En general, trasladar cada componente diseñado dentro de los notebooks a su módulo correspondiente de acuerdo a la estructura del proyecto propuesta, por ejemplo:
   - Instanciar un LLM de acuerdo al tipo de agente y integrar todos los LLMs en un módulo dedicado
   - Trasladar todos los prompts a su módulo correspondiente
   - Crear los archivos de configuración necesarios

3. **Validación de Disponibilidad del LLM**  
   - Verificar que el modelo LLM esté activo antes de procesar cualquier solicitud
   - Proporcionar respuestas por defecto en caso de error de conexión

4. **Escalabilidad y Optimización**  
   El sistema actual puede escalarse a producción considerando:
   - Implementación de caché para reducir llamadas repetidas a APIs externas y optimizar tiempos de respuesta
   - Manejo de límites de tasa mediante estrategias de backoff exponencial y encolamiento para respetar límites de APIs

5. **Comportamiento Recursivo del Nodo**  
   El diseño del comportamiento en el nodo `verificar_completitud` es recursivo, lo que podría causar ciclos infinitos o consumo innecesario de recursos. Se debe:
   - Implementar un mecanismo de espera más eficiente, como semáforos, backoff exponencial o límites de reintento para evitar bucles infinitos
   - Considerar redefinir la lógica y arquitectura para implementar procesamiento asíncrono: convertir las llamadas a agentes en operaciones asíncronas para mejorar el rendimiento en consultas multi-agente

6. **Optimización del Nodo Integrador**  
   El comportamiento del nodo integrador hace un paso extra en solicitudes que generaron errores, ya que:
   - El nodo de gestión de errores ya mejora la descripción técnica del error y hace sugerencias
   - Al pasar al integrador, el mensaje debería estar ya mejorado gracias al paso anterior
   - Sin embargo, no hay un mecanismo condicional y cualquier mensaje que entre al nodo validador se mejora haciendo una llamada innecesaria al LLM

7. **Optimización de Prompts y Respuestas**  
   - Afinar los prompts y mejorar la naturalidad del lenguaje generado
   - Incluir `timeout` en solicitudes HTTP: `requests.get(..., timeout=10)`
   - Validar el estado del modelo LLM antes de realizar llamadas
   - Evaluar estrategias de prompting adaptativo: modificación del prompt cuando una respuesta falla o es ambigua, ofrecer alternativas al modelo o cambiar instrucciones según contexto
   - Implementar este comportamiento en el nodo clasificador, en un posible subagente dedicado, o en la etapa de gestión de errores para aplicar estrategias de transformación de consultas cuando sea necesario

8. **Manejo de Errores y Estrategias de Recuperación**  
   - Mejorar el subagente de gestión de errores actual para incluir reintentos inteligentes y mejores sugerencias al usuario
   - Añadir una etapa de validación que revise que las respuestas cumplan con estructura esperada (campos requeridos en clima, divisas, noticias), especialmente útil al agregar nuevos agentes

9. **Diagrama de Arquitectura (C4 Model)**  
   Crear un diagrama de alto nivel basado en el modelo C4 para representar visualmente la arquitectura y flujos principales.

10. **Protocolos y Seguridad**  
    - Considerar la integración de protocolos como MCP o A2A para mejorar comunicación entre módulos
    - Mejorar la seguridad, validaciones y tipado estricto de funciones, así como control de excepciones de red y errores

11. **Escalabilidad y Planificación de Acciones**  
    - Si el número de herramientas crece, evaluar el uso de una base de datos vectorial (FAISS o Weaviate) para decidir qué herramienta llamar según contexto o embeddings de la consulta
    - Si el caso de uso se extiende más allá del clima, noticias y cambios de divisas, crear un nodo especializado en planificar acciones para interpretar solicitudes y determinar pasos a seguir, facilitando la orquestación en flujos más complejos y modulares

12. **Gestión de Historial y Memoria**  
    - Incorporar una estrategia de memoria conversacional para almacenar el historial de interacciones del usuario (corto plazo), permitiendo continuidad en la conversación
    - Agregar una capa de memoria de largo plazo para guardar preferencias, patrones y personalizaciones, adaptando respuestas y decisiones de agentes a cada usuario
    - Ofrecer respuestas más personalizadas y consistentes a medida que el sistema aprende de cada sesión o usuario recurrente

13. **Formato de Salida y Streaming**
    - Validar el formato de salida para facilitar integración con otras APIs
    - Implementar capacidades de respuesta en streaming cuando sea necesario
    
14. **GUI Productiva**  
    Desarrollar una interfaz gráfica centrada en **real-world interaction patterns**, integrando:
    - Técnicas para **shift the frontier** entre confiabilidad y agencia.
    - Estrategias de **feedback** progresivo, como salida estructurada y mensajes intermedios.
    - Facilitar la **human intervention** y visualización del estado del sistema.


