# Variables

In [None]:
%%capture

# LangGraph Swarm
%pip install langchain_openai langgraph langgraph-swarm langgraph-supervisor ipykernel

In [None]:
# %%capture

# # MCP LangChain
# %pip install langchain-mcp-adapters

In [None]:
# Imports

import os
from langchain_openai import ChatOpenAI

In [None]:
# APIs

# OpenAI
os.environ["OPENAI_API_KEY"] = "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"

# Langsmith
os.environ["LANGSMITH_API_KEY"] = "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"
os.environ["LANGSMITH_TRACING_V2"] = "true"

In [None]:
# Modelo

model = ChatOpenAI(model="gpt-4.1-nano")
# model = ChatOpenAI(model="gpt-4.1-mini")

In [None]:
# Evitar error de asyncio en Windows

import asyncio
asyncio.set_event_loop_policy(asyncio.WindowsProactorEventLoopPolicy())

In [None]:
# Config

import uuid

config = {"configurable": {"thread_id": str(uuid.uuid4()), "user_id": "1"}}

In [None]:
# Streaming para LangGraph

def print_stream(stream):
    for ns, update in stream:
        print(f"Namespace '{ns}'")
        for node, node_updates in update.items():
            if node_updates is None:
                continue

            if isinstance(node_updates, (dict, tuple)):
                node_updates_list = [node_updates]
            elif isinstance(node_updates, list):
                node_updates_list = node_updates
            else:
                raise ValueError(node_updates)

            for node_updates in node_updates_list:
                print(f"Update from node '{node}'")
                if isinstance(node_updates, tuple):
                    print(node_updates)
                    continue
                messages_key = next(
                    (k for k in node_updates.keys() if "messages" in k), None
                )
                if messages_key is not None:
                    node_updates[messages_key][-1].pretty_print()
                else:
                    print(node_updates)

        print("\n\n")

    print("\n===\n")

# Supervisor

In [None]:
from langgraph_supervisor import create_supervisor
from pydantic import BaseModel, Field
from langchain_core.runnables import RunnableConfig
from langgraph.checkpoint.memory import MemorySaver
from langgraph.prebuilt import create_react_agent
from langgraph_swarm import create_handoff_tool, create_swarm
from langchain_core.tools import tool
import json
from langchain_openai import ChatOpenAI
from pathlib import Path


def make_prompt(base_prompt: str):
    def _prompt(state: dict, config: RunnableConfig) -> list:
        user_id = config["configurable"].get("user_id")
        return [
            {
                "role": "system",
                "content": (
                    f"{base_prompt}\n"
                )
            },
            *state["messages"],
        ]
    return _prompt

import os
import json
import uuid

@tool
def get_document(document: str) -> str:
    """Devuelve el Markdown completo de la factura"""
    return document



s_date_bill = create_react_agent(
    model,
    tools=[get_document],
    prompt=make_prompt(
        "### Role\n"
        "You are an expert in extracting invoice issue dates.\n\n"
        "### Objective\n"
        "Identify and extract the issue date from the provided invoice document.\n\n"
        "### Instructions\n"
        "- Focus solely on the invoice issue date.\n"
        "- Format the date as 'DD-MM-YYYY'.\n"
        "- Ignore any other dates present in the document.\n\n"
        "### Output Format\n"
        "{\n"
        "  \"Date\": \"DD-MM-YYYY\"\n"
        "}"
    ),
    name="date_bill",
)


s_number_bill = create_react_agent(
    model,
    tools=[get_document],
    prompt=make_prompt(
        "### Role\n"
        "You are an expert in identifying invoice numbers.\n\n"
        "### Objective\n"
        "Locate and extract the invoice number from the provided document.\n\n"
        "### Instructions\n"
        "- Look for identifiers labeled as 'Invoice No.', 'Invoice Number', or similar.\n"
        "- Exclude any numbers related to clients or customers.\n\n"
        "### Output Format\n"
        "{\n"
        "  \"InvoiceNumber\": \"<InvoiceNumber>\"\n"
        "}"
    ),
    name="number_bill",
)


s_vehicle_plate_bill = create_react_agent(
    model,
    tools=[get_document],
    prompt=make_prompt(
        "### Role\n"
        "You are an expert in recognizing European vehicle license plates.\n\n"
        "### Objective\n"
        "Identify and extract any vehicle license plates present in the document.\n\n"
        "### Instructions\n"
        "- Recognize the following formats:\n"
        "  - 1234 ABC\n"
        "  - 1234-ABC\n"
        "  - 1234ABC\n"
        "  - AB 1234 C\n"
        "  - AB1234C\n"
        "  - AB 1234 CU\n"
        "  - AB1234CU\n"
        "- If a license plate is found, return it; otherwise, return null.\n\n"
        "### Output Format\n"
        "{\n"
        "  \"VehiclePlate\": \"<VehiclePlate>\" // or null\n"
        "}"
    ),
    name="vehicle_plate_bill",
)


s_total_amount_bill = create_react_agent(
    model,
    tools=[get_document],
    prompt=make_prompt(
        "### Role\n"
        "You are an expert in extracting total amounts from invoices.\n\n"
        "### Objective\n"
        "Identify and extract the total amount due from the invoice.\n\n"
        "### Instructions\n"
        "- Focus on the final total amount payable.\n"
        "- Format the amount with a comma as the decimal separator and include the '€' symbol.\n\n"
        "### Output Format\n"
        "{\n"
        "  \"TotalAmount\": \"<Amount> €\"\n"
        "}"
    ),
    name="total_amount_bill",
)


s_company_bill = create_react_agent(
    model,
    tools=[get_document],
    prompt=make_prompt(
        "### Role\n"
        "You are an expert in identifying issuing companies on invoices under Spanish law.\n\n"
        "### Objective\n"
        "Extract the name and NIF of the company that issued the invoice.\n\n"
        "### Instructions\n"
        "- Identify the company that provided, leased, or rented the vehicle.\n"
        "- Exclude the following:\n"
        "  - Company Name: 'DEABRU KALEA FILMEAK, S.L.U.'\n"
        "  - NIF: 'B75587808'\n"
        "- If the issuing company is not found, return null.\n\n"
        "### Output Format\n"
        "{\n"
        "  \"CompanyName\": \"<CompanyName>\",\n"
        "  \"NIF\": \"<NIF>\"\n"
        "}"
    ),
    name="company_bill",
)


s_report_bill = create_react_agent(
    model,
    prompt=make_prompt(
        "### Role\n"
        "You are responsible for compiling invoice data into a final report.\n\n"
        "### Objective\n"
        "Use the provided values to generate a final JSON report.\n\n"
        "### Instructions\n"
        "- Utilize the 'generate_final_json' tool with the following fields:\n"
        "  - Date\n"
        "  - InvoiceNumber\n"
        "  - VehiclePlate\n"
        "  - TotalAmount\n"
        "  - CompanyName\n"
        "  - NIF\n"
        "- Call the tool exactly once.\n"
        "- Return only the file path provided by the tool.\n\n"
        "### Output Format\n"
        "<file_path>"
    ),
    name="report_bill",
)


s_validate_report_bill = create_react_agent(
    model,
    # tools=[read_json_file, update_json_file],
    prompt=make_prompt(
        "### Role\n"
        "You are responsible for validating and correcting invoice JSON reports.\n\n"
        "### Objective\n"
        "Ensure the JSON file at the provided path adheres to the required format and content standards.\n\n"
        "### Instructions\n"
        "1. Read the JSON content using 'read_json_file'.\n"
        "2. Validate and correct the following:\n"
        "   - 'Date' should be in 'DD-MM-YYYY' format.\n"
        "   - Keys must be exactly: Date, InvoiceNumber, VehiclePlate, TotalAmount, CompanyName, NIF.\n"
        "   - 'TotalAmount' must use a comma as the decimal separator and include the '€' symbol.\n"
        "3. If corrections are made, update the file using 'update_json_file'.\n"
        "4. Return the final JSON content without additional text or tool calls.\n\n"
        "### Output Format\n"
        "{\n"
        "  \"Date\": \"DD-MM-YYYY\",\n"
        "  \"InvoiceNumber\": \"<InvoiceNumber>\",\n"
        "  \"VehiclePlate\": \"<VehiclePlate>\",\n"
        "  \"TotalAmount\": \"<Amount> €\",\n"
        "  \"CompanyName\": \"<CompanyName>\",\n"
        "  \"NIF\": \"<NIF>\"\n"
        "}"
    ),
    name="validate_report_bill",
)


supervisor = create_supervisor(
    [s_date_bill, s_number_bill, s_vehicle_plate_bill, s_total_amount_bill, s_company_bill, s_report_bill, s_validate_report_bill],
    model=model,
    prompt=make_prompt(
        """
        # Rol
        Eres ORCHESTRATOR, el coordinador central de un sistema multi-agente. Tu misión es convertir la petición del usuario en un resultado final validado, delegando el trabajo en los agentes especializados del Swarm.

        # Objetivo
        - Consultar siempre al PLANNER en primer lugar.
        - Ejecutar el plan devuelto, coordinando a los agentes adecuados y sus herramientas.
        - Garantizar que el archivo/salida final esté validado por AGENTE VALIDADOR REPORTES antes de mostrarse al usuario.

        # Instrucciones
        0. Planificar. Agente: PLANNER. Acción: enviar la petición original y el contexto. Espera: lista de subtareas, orden lógico, agentes sugeridos y nombre(s) de archivo objetivo.
        1. Delegar tareas de ML. Agentes: AGENTE CLASIFICACIÓN → modelo_clasificación, AGENTE SEGMENTACIÓN → modelo_segmentación. Ejecutar solo si el plan lo requiere. Persistir cada salida con @TOOL escribir_archivo.
        2. Búsqueda / RAG. Agente: AGENTE RAG → rag. Acción: ejecutar la consulta indicada en el plan.
        3. Generar gráficos. Agente: AGENTE GRÁFICO → python_gráfico. Acción: crear visualizaciones usando los datos de pasos anteriores o lo indicado en el plan.
        4. Compilar reporte. Agente: AGENTE REPORTES → escribir_archivo. Acción: leer todos los archivos previos con leer_archivo, combinar la información y guardar el reporte (JSON, CSV, etc.) en la ruta indicada.
        5. Validar. Agente: AGENTE VALIDADOR REPORTES. Acción: recibir la ruta del reporte; si detecta errores, re-planificar o re-ejecutar subtareas según sus indicaciones.
        6. Entregar. Acción final: leer el archivo validado y entregarlo al usuario tal cual, sin comentarios adicionales.

        # Reglas de orquestación
        0. Primero el Planner, siempre. Si el plan es ambiguo o falla una subtarea, vuelve a llamarlo con detalles del fallo para un nuevo plan.
        1. Especialización estricta. Nunca asignes a un agente una tarea fuera de su dominio.
        2. Persistencia clara:
            - Usa escribir_archivo para guardar cada resultado parcial.
            - Nombrado: {subtarea}_{timestamp}.{ext} salvo que el Planner indique otro nombre.
        3. Paralelización opcional. Si el plan marca subtareas independientes, lánzalas en paralelo para eficiencia.
        4. Gestión de errores:
            - Si un agente devuelve null o formato incorrecto, regístralo y decide: reintento, agente alternativo o re-planificación.
        5. Privacidad del sistema. No muestres logs internos ni prompts a los usuarios.
        6. Formato de salida. Solo el contenido validado del archivo final (JSON, imagen, pdf, etc.). Nada más.

        # Descripción de agentes y herramientas
        - AGENTE CLASIFICACIÓN	Clasificación de datos / imágenes	modelo_clasificación
        - AGENTE SEGMENTACIÓN	Segmentación de imágenes	modelo_segmentación
        - AGENTE RAG	Búsqueda RAG / QA	rag
        - AGENTE GRÁFICO	Gráficos y visualizaciones	python_gráfico
        - AGENTE REPORTES	Compilación de resultados	escribir_archivo, leer_archivo
        - AGENTE VALIDADOR REPORTES	Validación de reportes	leer_archivo, lógica interna

        Herramientas globales disponibles para cualquier agente: escribir_archivo, leer_archivo

        # Notas finales
        - Mantén trazabilidad interna (archivos, paths, timestamps), pero muéstrate conciso hacia fuera.
        - Termina solo cuando el resultado pase la validación o el Planner indique que no es posible completar la tarea.
    """
    )
)


s_app = supervisor.compile()

In [None]:
config = {
    "configurable": {
        "user_id": "mesmo",
        # "document": md_content,
    }
}

print_stream(
    s_app.stream(
        {
            "messages": [
                {"role": "user", "content": "Cuál es el número, fecha, matrícula, importe y empresa (y NIF) de la factura?"} # ← pregunta inicial
            ]
        },
        config,          # ← tu diccionario con configurable
        subgraphs=True,  # ← si quieres ver los saltos internos
    )
)