# Defensa de la Arquitectura Cognitiva: Agente Conversacional "VuelaConNosotros"

A continuaci√≥n, presento la defensa de la prueba de concepto (PoC) desarrollada para el agente conversacional "VuelaConNosotros", abordando la arquitectura, el proceso de implementaci√≥n y las instrucciones para su validaci√≥n t√©cnica, en respuesta a la secci√≥n 2 del desaf√≠o propuesto.

## 1. Proceso de Desarrollo y Enfoque

Para abordar este desaf√≠o, adopt√© un proceso de desarrollo iterativo centrado en la robustez y la escalabilidad. La meta principal fue construir una base s√≥lida para un agente conversacional que no solo cumpliera con los requisitos iniciales, sino que tambi√©n pudiera crecer en complejidad y funcionalidades de manera ordenada.

Mi enfoque se bas√≥ en los siguientes principios:

*   **Dise√±o Modular (SOLID):** Desde el inicio, estructur√© el c√≥digo siguiendo los principios SOLID. Cada componente (clasificaci√≥n de intenci√≥n, orquestaci√≥n, agentes especializados, herramientas) tiene una √∫nica responsabilidad y est√° desacoplado de los dem√°s. Esto facilita las pruebas unitarias, el mantenimiento y la futura expansi√≥n del sistema.
*   **Orquestaci√≥n Expl√≠cita:** En lugar de una l√≥gica monol√≠tica, opt√© por un grafo de estados expl√≠cito utilizando LangGraph. Esto permite visualizar y gestionar el flujo de la conversaci√≥n de manera clara, haciendo que el comportamiento del agente sea predecible y f√°cil de depurar.
*   **Pruebas Continuas:** Implement√© scripts de prueba desde las primeras etapas para validar cada componente de forma aislada y, posteriormente, el flujo conversacional completo. Esto garantiz√≥ la detecci√≥n temprana de errores y la correcta integraci√≥n de las partes.

## 2. Arquitectura Cognitiva Propuesta

La soluci√≥n se implementa dentro de un monorepositorio Nx, separando el backend del agente de otras posibles aplicaciones. La arquitectura del backend est√° dise√±ada para ser modular y escalable. A continuaci√≥n, se presenta un diagrama que ilustra el flujo de una interacci√≥n:

```mermaid
graph TD
    subgraph "User Interaction"
        U[üë§ User]
    end

    subgraph "API Layer (FastAPI)"
        API[üåê /vuelaconnosotros/chat]
    end

    subgraph "Cognitive Core"
        O[‚öôÔ∏è LangGraph Orchestrator]
        NLU[üß† Intent Classifier<br>(Gemini Flash)]
        Router{Router}
        
        subgraph "Agents"
            A1[‚úàÔ∏è FlightStatusAgent]
            A2[üîÑ FlightChangeAgent]
            A3[üí¨ GeneralAgent]
        end

        subgraph "Tools"
            T1[üõ†Ô∏è get_flight_status]
            T2[üõ†Ô∏è get_flight_availability]
        end
    end

    subgraph "Observability"
        LS[üìä LangSmith]
    end

    U --> API
    API --> O
    O --> NLU
    NLU --> Router
    Router -- "consultar_estado_vuelo" --> A1
    Router -- "cambiar_vuelo" --> A2
    Router -- "saludo/despedida" --> A3
    
    A1 --> T1
    A2 --> T2
    
    T1 --> A1
    T2 --> A2

    A1 --> O
    A2 --> O
    A3 --> O

    O --> API
    API --> U

    O --trace--> LS
    NLU --trace--> LS
    A1 --trace--> LS
    A2 --trace--> LS
    A3 --trace--> LS
    T1 --trace--> LS
    T2 --trace--> LS
```


*   **API Layer (`api/`):** Un endpoint FastAPI (`/chat`) que sirve como √∫nica puerta de entrada para las interacciones del usuario. Se encarga de recibir los mensajes, gestionar las sesiones y devolver las respuestas del agente.
*   **Orquestador (`orchestrator/`):** El cerebro de la aplicaci√≥n, implementado con LangGraph. Este componente gestiona el estado de la conversaci√≥n y dirige el flujo de trabajo. Su ciclo b√°sico es:
    1.  Clasificar la intenci√≥n del usuario.
    2.  Enrutar la conversaci√≥n al agente apropiado.
    3.  Ejecutar las herramientas del agente si es necesario.
    4.  Generar una respuesta para el usuario.
    5.  Persistir el estado y esperar la siguiente interacci√≥n.
*   **NLU (`nlu/`):** Un m√≥dulo de clasificaci√≥n de intenci√≥n que utiliza el modelo **Gemini Flash**. Analiza el mensaje del usuario y lo categoriza en una de las intenciones predefinidas (ej. `consultar_estado_vuelo`, `cambiar_vuelo`, `saludo`). Su precisi√≥n es clave para enrutar correctamente la solicitud.
*   **Agentes Especializados (`agents/`):** Siguiendo el principio de responsabilidad √∫nica, he creado agentes espec√≠ficos para cada intenci√≥n principal. Cada agente tiene acceso a un conjunto limitado de herramientas necesarias para su tarea. Por ejemplo:
    *   `FlightStatusAgent`: Equipado con herramientas para verificar el estado de un vuelo.
    *   `FlightChangeAgent`: Orquesta un sub-flujo para recopilar la informaci√≥n necesaria para un cambio de vuelo (vuelo actual, destino, fecha).
*   **Herramientas (`tools/`):** Simulaciones de servicios externos, como la consulta a una base de datos de vuelos o un sistema de reservas. Est√°n dise√±adas como funciones simples y at√≥micas que los agentes pueden invocar.
*   **Observabilidad (LangSmith):** Toda la traza de ejecuci√≥n, desde la clasificaci√≥n de la intenci√≥n hasta la llamada a las herramientas, est√° integrada con LangSmith. Esto proporciona una visibilidad completa del razonamiento del agente, lo cual es fundamental para la depuraci√≥n y la mejora continua.

## 3. Instrucciones T√©cnicas para la Puesta en Marcha

Para evaluar la soluci√≥n, he preparado un entorno de prueba completo. Los siguientes pasos describen c√≥mo ejecutarlo:

**Requisitos Previos:**

*   Tener Python 3.10+ y `uv` (o `pip`) instalados.
*   Disponer de una clave de API de Google AI y una de LangSmith.

**Pasos para la Ejecuci√≥n:**

1.  **Configurar el Entorno:**
    *   Navegar al directorio del backend: `cd apps/itti-backend`.
    *   Crear un archivo `.env` a partir del ejemplo `.env.example`.
    *   Rellenar las variables `GOOGLE_API_KEY` y las claves de LangSmith en el archivo `.env`.

2.  **Instalar Dependencias:**
    *   Recomiendo usar `uv` para una instalaci√≥n r√°pida: `uv venv` y `uv pip install -r requirements.txt`.

3.  **Iniciar el Servidor:**
    *   Ejecutar el siguiente comando desde el directorio `apps/itti-backend`:
        ```bash
        uvicorn itti_backend.main:app --host 0.0.0.0 --port 8003 --reload
        ```
    *   El servidor estar√° disponible en `http://localhost:8003`.

4.  **Ejecutar la Demostraci√≥n:**
    *   En una terminal separada, dentro del mismo directorio, ejecutar el script de demostraci√≥n avanzado:
        ```bash
        python advanced_demo.py
        ```
    *   Este script simula conversaciones completas, cubriendo todos los flujos implementados (saludo, consulta de estado, cambio de vuelo y manejo de preguntas fuera de t√≥pico). Tambi√©n ejecuta pruebas de casos borde para validar la robustez del agente.

5.  **Verificar Trazas:**
    *   Acceder a la URL de LangSmith proporcionada por la salida del script para inspeccionar las trazas detalladas de cada interacci√≥n.

## 4. Resultados y Conclusiones

La prueba de concepto demuestra con √©xito la viabilidad de la arquitectura propuesta. Los resultados clave son:

*   **Precisi√≥n en la Intenci√≥n:** El uso de Gemini Flash para la clasificaci√≥n de intenciones ha demostrado ser altamente efectivo, incluso con entradas ambiguas o complejas.
*   **Robustez del Flujo:** El grafo de LangGraph gestiona la conversaci√≥n de manera predecible, guiando al usuario a trav√©s de procesos de varios pasos (como el cambio de vuelo) y manejando adecuadamente las interrupciones o cambios de contexto.
*   **Modularidad y Escalabilidad:** La arquitectura actual permite a√±adir nuevas funcionalidades de forma sencilla. Por ejemplo, para gestionar reservas de hoteles, bastar√≠a con crear un nuevo `HotelAgent` con sus propias herramientas y a√±adir una nueva ruta en el orquestador, sin necesidad de modificar los agentes existentes.

En conclusi√≥n, considero que esta PoC establece una base t√©cnica s√≥lida y profesional para el desarrollo de un agente conversacional avanzado, cumpliendo con los m√°s altos est√°ndares de dise√±o de software y preparado para futuras iteraciones.