### ü§ñ ¬øQu√© son los Sistemas RAG Multi-Agente?
Un Sistema RAG Multi-Agente divide el pipeline RAG en m√∫ltiples agentes especializados ‚Äî cada uno responsable de un rol espec√≠fico ‚Äî y les permite colaborar en una sola consulta o tarea.

#### 1. üìã Sistema de Red Multi-Agente RAG con LangGraph
Descripci√≥n del Proyecto

Un sistema de Generaci√≥n Aumentada por Recuperaci√≥n (RAG) amigable para principiantes que utiliza una arquitectura multi-agente para responder preguntas inteligentemente desde tus documentos. Construido con LangGraph v0.3 para orquestaci√≥n de flujos de trabajo y OpenAI para comprensi√≥n del lenguaje.

Qu√© Hace

Transforma tus documentos (PDFs, archivos de texto) en una base de conocimiento buscable que puede responder preguntas inteligentemente usando IA. Simplemente carga documentos y haz preguntas en lenguaje natural - el sistema encuentra informaci√≥n relevante y genera respuestas completas.

Caracter√≠sticas Clave

- üìö Soporte Multi-Formato: Maneja documentos PDF y de texto
- ü§ñ Arquitectura de 3 Agentes: Agentes especializados para procesamiento de documentos, recuperaci√≥n y generaci√≥n de respuestas
- üîç B√∫squeda Inteligente: B√∫squeda sem√°ntica basada en vectores encuentra informaci√≥n relevante
- üí¨ Preguntas y Respuestas en Lenguaje Natural: Haz preguntas en espa√±ol simple

In [None]:
# Importaci√≥n del m√≥dulo os para interactuar con variables de entorno del sistema
import os

# Importaci√≥n de load_dotenv para cargar variables de entorno desde archivo .env
from dotenv import load_dotenv

# Carga las variables de entorno desde el archivo .env en el directorio actual
# Esto permite mantener las API keys seguras fuera del c√≥digo
load_dotenv()

# Importaci√≥n de init_chat_model para inicializar modelos de chat de diferentes proveedores
from langchain.chat_models import init_chat_model

# Configuraci√≥n de la API key de Tavily (motor de b√∫squeda web para IA)
# Tavily proporciona resultados de b√∫squeda optimizados para LLMs
os.environ["TAVILY_API_KEY"]=os.getenv("TAVILY_API_KEY")

# Configuraci√≥n de la API key de OpenAI para acceder a modelos GPT
# Esta key permite autenticarse con los servicios de OpenAI
os.environ["OPENAI_API_KEY"]=os.getenv("OPENAI_API_KEY")

In [None]:
# Inicializaci√≥n del modelo de lenguaje usando GPT-4o-mini de OpenAI
# GPT-4o-mini es una versi√≥n m√°s econ√≥mica y r√°pida de GPT-4
# Ideal para sistemas multi-agente donde se hacen m√∫ltiples llamadas al LLM
llm=init_chat_model("openai:gpt-4o-mini")

# Muestra el objeto LLM configurado con sus par√°metros
llm

In [None]:
# Importaci√≥n de Annotated para agregar metadatos a tipos en type hints
from typing import Annotated

# Importaci√≥n de TavilySearch para b√∫squedas web optimizadas para IA
from langchain_tavily import TavilySearch

# Importaci√≥n de tool decorator para convertir funciones en herramientas de LangChain
from langchain_core.tools import tool

# Importaci√≥n de WikipediaQueryRun para ejecutar b√∫squedas en Wikipedia
from langchain.tools import WikipediaQueryRun

# Importaci√≥n de WikipediaAPIWrapper, wrapper que encapsula la API de Wikipedia
from langchain.utilities import WikipediaAPIWrapper

# Importaci√≥n de TextLoader para cargar archivos de texto plano
from langchain.document_loaders import TextLoader

# Importaci√≥n de FAISS para b√∫squeda vectorial eficiente
from langchain.vectorstores import FAISS

# Importaci√≥n de OpenAIEmbeddings para generar vectores de embeddings
from langchain_openai import OpenAIEmbeddings

# Importaci√≥n de RecursiveCharacterTextSplitter para dividir textos en chunks
from langchain.text_splitter import RecursiveCharacterTextSplitter

In [None]:
# Creaci√≥n de una instancia de TavilySearch configurada para b√∫squeda web
# max_results=5: limita los resultados a los 5 m√°s relevantes
# Tavily es un motor de b√∫squeda dise√±ado espec√≠ficamente para aplicaciones de IA
# Proporciona resultados limpios y optimizados para consumo por LLMs
tavily_tool=TavilySearch(max_results=5)

In [None]:
### Funci√≥n gen√©rica para crear una herramienta de recuperaci√≥n desde texto

# Importaci√≥n de Tool para crear herramientas personalizadas de LangChain
from langchain.agents import Tool

def make_retriever_tool_from_text(file, name, desc):
    """
    Crea una herramienta de recuperaci√≥n personalizada desde un archivo de texto.
    
    Par√°metros:
    - file: ruta del archivo de texto a cargar
    - name: nombre de la herramienta
    - desc: descripci√≥n de lo que hace la herramienta
    
    Retorna: objeto Tool configurado con recuperaci√≥n vectorial
    """
    
    # Carga del archivo de texto usando TextLoader con codificaci√≥n UTF-8
    # Esto asegura la correcta lectura de caracteres especiales y acentos
    docs=TextLoader(file, encoding="utf-8").load()
    
    # Divisi√≥n de los documentos en chunks de 500 caracteres
    # chunk_overlap=50: superposici√≥n de 50 caracteres entre chunks para mantener contexto
    chunks = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50).split_documents(docs)
    
    # Creaci√≥n de un vector store FAISS con los chunks
    # FAISS indexa los embeddings para b√∫squedas r√°pidas de similitud
    vs = FAISS.from_documents(chunks, OpenAIEmbeddings())
    
    # Conversi√≥n del vector store en retriever para b√∫squedas
    retriever = vs.as_retriever()

    # Definici√≥n de la funci√≥n interna que ejecutar√° la herramienta
    def tool_func(query: str) -> str:
        """
        Funci√≥n que realiza la b√∫squeda vectorial.
        
        Par√°metros:
        - query: consulta de b√∫squeda
        
        Retorna: contenido de los documentos encontrados concatenados
        """
        # Imprime mensaje indicando qu√© herramienta se est√° usando
        print(f"üìö Usando herramienta: {name}")
        
        # Invoca el retriever para buscar documentos relevantes
        results = retriever.invoke(query)
        
        # Concatena el contenido de todos los documentos encontrados
        # Separados por doble salto de l√≠nea para mejor legibilidad
        return "\n\n".join(doc.page_content for doc in results)
    
    # Retorna un objeto Tool de LangChain con la funci√≥n configurada
    return Tool(name=name, description=desc, func=tool_func)


# Creaci√≥n de una herramienta de recuperaci√≥n para notas de investigaci√≥n internas
# Esta herramienta busca en el archivo internal_docs.txt
internal_tool_1=make_retriever_tool_from_text(
    "internal_docs.txt",  # Archivo de documentos internos
    "InternalResearchNotes",  # Nombre de la herramienta
    "Buscar en notas de investigaci√≥n internas para resultados experimentales"  # Descripci√≥n
)

# Muestra la herramienta creada
internal_tool_1

In [None]:
# Importaciones necesarias para crear agentes multi-agente

# BaseMessage: clase base para todos los mensajes en LangChain
# HumanMessage: representa mensajes del usuario/humano
from langchain_core.messages import BaseMessage, HumanMessage

# create_react_agent: crea agentes con patr√≥n ReAct (Reason + Act)
from langgraph.prebuilt import create_react_agent

# MessagesState: estado que contiene historial de mensajes
# END: marcador especial que indica el final del grafo
from langgraph.graph import MessagesState, END

# Command: clase para enviar comandos de actualizaci√≥n y navegaci√≥n en el grafo
from langgraph.types import Command

def get_next_node(last_message: BaseMessage, goto: str):
    """
    Determina el siguiente nodo a ejecutar en el grafo multi-agente.
    
    Esta funci√≥n implementa la l√≥gica de terminaci√≥n:
    - Si el mensaje contiene "FINAL ANSWER", termina el flujo
    - Si no, contin√∫a al siguiente nodo especificado
    
    Par√°metros:
    - last_message: √∫ltimo mensaje generado por un agente
    - goto: nombre del siguiente nodo a ejecutar
    
    Retorna: END si el trabajo est√° completo, o el nombre del siguiente nodo
    """
    # Verifica si el mensaje contiene "FINAL ANSWER" (en may√∫sculas)
    # Este es el indicador de que alg√∫n agente ha completado el trabajo
    if "FINAL ANSWER" in last_message.content:
        # Cualquier agente decidi√≥ que el trabajo est√° completo
        return END
    
    # Si no hay "FINAL ANSWER", contin√∫a al siguiente nodo
    return goto

In [None]:
def make_system_prompt(suffix: str) -> str:
    """
    Crea un prompt del sistema para agentes colaborativos.
    
    Este prompt establece las reglas de colaboraci√≥n entre agentes:
    - Cada agente es parte de un equipo
    - Pueden usar herramientas espec√≠ficas
    - Deben progresar hacia la respuesta final
    - Pueden pasar el trabajo a otro agente
    - Deben indicar cuando tienen la respuesta final
    
    Par√°metros:
    - suffix: instrucciones adicionales espec√≠ficas para cada agente
    
    Retorna: string con el prompt completo del sistema
    """
    return (
        # Establece el rol del agente: asistente colaborativo
        "Eres un asistente de IA √∫til, colaborando con otros asistentes."
        
        # Instrucci√≥n para usar herramientas disponibles
        " Usa las herramientas proporcionadas para progresar hacia responder la pregunta."
        
        # Permite que el agente no complete toda la tarea solo
        " Si no puedes responder completamente, est√° bien, otro asistente con diferentes herramientas"
        " ayudar√° donde lo dejaste. Ejecuta lo que puedas para hacer progreso."
        
        # Instrucci√≥n crucial: c√≥mo indicar que el trabajo est√° completo
        " Si t√∫ o cualquiera de los otros asistentes tienen la respuesta final o el entregable,"
        " prefija tu respuesta con RESPUESTA FINAL para que el equipo sepa que debe detenerse."
        
        # Agrega instrucciones espec√≠ficas del agente
        f"\n{suffix}"
    )

In [None]:
### Agente de Investigaci√≥n y nodo

# Creaci√≥n del agente de investigaci√≥n usando el patr√≥n ReAct
# Este agente es especializado en hacer investigaci√≥n usando herramientas espec√≠ficas
research_agent=create_react_agent(
    llm,  # Modelo de lenguaje GPT-4o-mini configurado anteriormente
    
    # Lista de herramientas disponibles para este agente:
    tools=[
        internal_tool_1,  # Herramienta para buscar en documentos internos
        tavily_tool  # Herramienta para b√∫squeda web con Tavily
    ],
    
    # Prompt del sistema que define el rol y comportamiento del agente
    prompt=make_system_prompt(
        # Instrucciones espec√≠ficas para el agente de investigaci√≥n
        "Solo puedes hacer investigaci√≥n. Usa la herramienta con la que est√°s vinculado, puedes usar ambas."
        " Est√°s trabajando con un colega escritor de contenido."
    )
)

# Muestra el agente de investigaci√≥n configurado
research_agent

In [None]:
## Nodo de Investigaci√≥n

# Importaci√≥n de Literal para type hints con valores literales espec√≠ficos
from typing import Literal

def research_node(state: MessagesState) -> Command[Literal["blog_generator", END]]:
    """
    Nodo que ejecuta el agente de investigaci√≥n y decide el siguiente paso.
    
    Flujo:
    1. Invoca el agente de investigaci√≥n con el estado actual
    2. Determina si el trabajo est√° completo o debe pasar a otro agente
    3. Convierte el mensaje del agente a HumanMessage para compatibilidad
    4. Retorna comando con actualizaci√≥n de estado y siguiente nodo
    
    Par√°metros:
    - state: estado actual con historial de mensajes
    
    Retorna: Command dirigiendo al generador de blogs o END
    """
    
    # Invoca el agente de investigaci√≥n con el estado actual
    # El agente procesa los mensajes y usa sus herramientas (internal_tool_1, tavily_tool)
    result = research_agent.invoke(state)
    
    # Determina el siguiente nodo bas√°ndose en el √∫ltimo mensaje
    # Si contiene "FINAL ANSWER" ‚Üí END, si no ‚Üí "blog_generator"
    goto = get_next_node(result["messages"][-1], "blog_generator")

    # Envuelve el √∫ltimo mensaje en un HumanMessage
    # Esto es necesario porque no todos los proveedores de LLM permiten
    # mensajes de IA en la √∫ltima posici√≥n de la lista de mensajes de entrada
    result["messages"][-1] = HumanMessage(
        content=result["messages"][-1].content,  # Contenido del mensaje del agente
        name="researcher"  # Identifica que este mensaje viene del investigador
    )
    
    # Retorna un Command que:
    # 1. Actualiza el estado con el historial de mensajes del agente de investigaci√≥n
    # 2. Navega al siguiente nodo (blog_generator o END)
    return Command(
        update={
            # Comparte el historial de mensajes interno del agente de investigaci√≥n
            # con otros agentes para mantener el contexto
            "messages": result["messages"],
        },
        goto=goto,  # Siguiente nodo a ejecutar
    )


In [None]:
### Agente de Escritura de Blog

# Creaci√≥n del agente de escritura de blogs usando el patr√≥n ReAct
# Este agente se especializa en escribir contenido detallado bas√°ndose en investigaci√≥n
blog_agent=create_react_agent(
    llm,  # Modelo de lenguaje GPT-4o-mini
    
    # Lista de herramientas: vac√≠a porque este agente no usa herramientas externas
    # Su funci√≥n es procesar informaci√≥n y escribir, no buscar
    tools=[],
    
    # Prompt del sistema que define el rol espec√≠fico del escritor
    prompt=make_system_prompt(
        # Instrucciones espec√≠ficas: solo escribir, no investigar
        "Solo puedes escribir un blog detallado. Est√°s trabajando con un colega investigador."
    )
)

def blog_node(state: MessagesState) -> Command[Literal["researcher", END]]:
    """
    Nodo que ejecuta el agente de escritura de blogs.
    
    Flujo:
    1. Invoca el agente de blog con el estado (que incluye la investigaci√≥n)
    2. Determina si el blog est√° completo o necesita m√°s investigaci√≥n
    3. Convierte el mensaje a HumanMessage para compatibilidad
    4. Retorna comando con actualizaci√≥n y siguiente paso
    
    Par√°metros:
    - state: estado actual con historial de mensajes (incluye investigaci√≥n)
    
    Retorna: Command dirigiendo al investigador o END
    """
    
    # Invoca el agente de blog con el estado actual
    # El agente procesa la informaci√≥n de investigaci√≥n y genera contenido escrito
    result = blog_agent.invoke(state)
    
    # Determina el siguiente nodo
    # Si el blog est√° completo (contiene "FINAL ANSWER") ‚Üí END
    # Si necesita m√°s informaci√≥n ‚Üí vuelve al "researcher"
    goto = get_next_node(result["messages"][-1], "researcher")
    
    # Envuelve el √∫ltimo mensaje en un HumanMessage
    # Marca el mensaje como proveniente del "blog_generator"
    result["messages"][-1] = HumanMessage(
        content=result["messages"][-1].content,  # Contenido del blog generado
        name="blog_generator"  # Identifica el autor del mensaje
    )
    
    # Retorna Command con actualizaci√≥n de estado y navegaci√≥n
    return Command(
        update={
            # Comparte el historial de mensajes interno del agente de blog
            # con otros agentes
            "messages": result["messages"],
        },
        goto=goto,  # Siguiente nodo (researcher o END)
    )

In [None]:
# Importaciones para construcci√≥n del grafo
from langgraph.graph import StateGraph, START

# Creaci√≥n del grafo de estado con MessagesState
# MessagesState mantiene el historial de mensajes entre agentes
workflow = StateGraph(MessagesState)

# Agregado de nodos al grafo
# Cada nodo representa un agente especializado

# Nodo del investigador: busca informaci√≥n usando herramientas
workflow.add_node("researcher", research_node)

# Nodo del generador de blogs: escribe contenido bas√°ndose en la investigaci√≥n
workflow.add_node("blog_generator", blog_node)

# Define el punto de entrada del grafo
# El flujo comienza con el investigador
workflow.add_edge(START, "researcher")

# Compilaci√≥n del grafo para hacerlo ejecutable
# .compile() valida la estructura y crea el grafo final
graph = workflow.compile()

# Muestra el grafo compilado (en Jupyter puede renderizar una visualizaci√≥n)
graph

In [None]:
# Invocaci√≥n del grafo multi-agente con una consulta
# Este es el punto de entrada para usar el sistema

response=graph.invoke({
    # El mensaje inicial que dispara todo el flujo de trabajo
    # "messages" es el campo requerido por MessagesState
    "messages": "Escribe un blog detallado sobre variantes de transformers en despliegues de producci√≥n"
})

# Flujo de ejecuci√≥n esperado:
# 1. START ‚Üí researcher (nodo de investigaci√≥n)
# 2. researcher busca informaci√≥n usando internal_tool_1 y tavily_tool
# 3. researcher ‚Üí blog_generator (pasa la investigaci√≥n al escritor)
# 4. blog_generator escribe el blog usando la informaci√≥n recopilada
# 5. Si est√° completo: a√±ade "FINAL ANSWER" y termina (END)
# 6. Si necesita m√°s info: vuelve a researcher

# La salida mostrar√°: "üìö Usando herramienta: InternalResearchNotes"
# cuando el investigador use la herramienta de documentos internos

In [None]:
# Extrae y muestra el contenido del √∫ltimo mensaje
# Este es el blog final generado por el sistema multi-agente
# [-1] accede al √∫ltimo elemento de la lista de mensajes
# .content obtiene el texto del mensaje
response["messages"][-1].content

### Supervisor Multi-Agente con RAG
El Supervisor es una arquitectura multi-agente donde agentes especializados son coordinados por un agente supervisor central. El agente supervisor controla todo el flujo de comunicaci√≥n y delegaci√≥n de tareas, tomando decisiones sobre qu√© agente invocar bas√°ndose en el contexto actual y los requisitos de la tarea.

En este tutorial, construir√°s un sistema supervisor con dos agentes ‚Äî un experto en investigaci√≥n y matem√°ticas. Al final del tutorial podr√°s:

1. Construir agentes especializados de investigaci√≥n y matem√°ticas
2. Construir un supervisor para orquestarlos con langgraph-supervisor pre-construido
3. Construir un supervisor personalizado
4. Implementar delegaci√≥n avanzada de tareas

In [None]:
# Muestra la herramienta de recuperaci√≥n interna creada anteriormente
# Esta herramienta ser√° usada por el agente de investigaci√≥n en el sistema supervisor
internal_tool_1

In [None]:
# Importaci√≥n de TavilySearch para b√∫squedas web
from langchain_tavily import TavilySearch

# Creaci√≥n de herramienta de b√∫squeda web con l√≠mite de 3 resultados
# Limitamos a 3 para reducir el contexto y el costo de tokens
web_search = TavilySearch(max_results=3)

# Muestra la herramienta de b√∫squeda web configurada
web_search

In [None]:
# Importaci√≥n de create_react_agent para crear agentes con patr√≥n ReAct
from langgraph.prebuilt import create_react_agent

# Creaci√≥n del agente de investigaci√≥n para el sistema supervisor
# Este agente tiene capacidades m√°s restringidas que en el ejemplo anterior
research_agent=create_react_agent(
    model=llm,  # Modelo GPT-4o-mini
    
    # Herramientas disponibles: b√∫squeda web y documentos internos
    tools=[web_search, internal_tool_1],
    
    # Prompt m√°s espec√≠fico para este contexto
    prompt=(
        "Eres un agente de investigaci√≥n.\n\n"
        "INSTRUCCIONES:\n"
        
        # Restricci√≥n clara: SOLO investigaci√≥n, NO matem√°ticas
        "- Asiste SOLO con tareas relacionadas con investigaci√≥n, NO hagas ninguna matem√°tica\n"
        
        # Despu√©s de terminar, debe reportar directamente al supervisor
        "- Despu√©s de que termines con tus tareas, responde al supervisor directamente\n"
        
        # Solo debe proporcionar resultados, sin texto adicional
        "- Responde SOLO con los resultados de tu trabajo, NO incluyas NING√öN otro texto."
    ),
    
    # Nombre del agente para identificaci√≥n en mensajes
    name="research_agent"
)

# Muestra el agente de investigaci√≥n configurado
research_agent

In [None]:
# Definici√≥n de funciones matem√°ticas b√°sicas como herramientas
# Estas funciones ser√°n usadas por el agente de matem√°ticas

def add(a: float, b: float):
    """
    Suma dos n√∫meros.
    
    Par√°metros:
    - a: primer n√∫mero (float)
    - b: segundo n√∫mero (float)
    
    Retorna: la suma de a y b
    """
    return a + b


def multiply(a: float, b: float):
    """
    Multiplica dos n√∫meros.
    
    Par√°metros:
    - a: primer n√∫mero (float)
    - b: segundo n√∫mero (float)
    
    Retorna: el producto de a y b
    """
    return a * b


def divide(a: float, b: float):
    """
    Divide dos n√∫meros.
    
    Par√°metros:
    - a: numerador (float)
    - b: denominador (float)
    
    Retorna: el cociente de a dividido por b
    
    Nota: No maneja divisi√≥n por cero expl√≠citamente
    """
    return a / b


# Creaci√≥n del agente de matem√°ticas
# Este agente se especializa en operaciones matem√°ticas
math_agent=create_react_agent(
    model=llm,  # Modelo GPT-4o-mini
    
    # Herramientas matem√°ticas disponibles
    tools=[add, multiply, divide],
    
    # Prompt con instrucciones espec√≠ficas para el agente matem√°tico
    prompt=(
        "Eres un agente de matem√°ticas.\n\n"
        "INSTRUCCIONES:\n"
        
        # Restricci√≥n: SOLO matem√°ticas
        "- Asiste SOLO con tareas relacionadas con matem√°ticas\n"
        
        # Reportar al supervisor cuando termine
        "- Despu√©s de que termines con tus tareas, responde al supervisor directamente\n"
        
        # Solo resultados, sin texto adicional
        "- Responde SOLO con los resultados de tu trabajo, NO incluyas NING√öN otro texto."
    ),
    
    # Nombre del agente
    name="math_agent"
)

In [None]:
### Crear agente supervisor

# Importaci√≥n de create_supervisor desde langgraph_supervisor
# Esta es una funci√≥n pre-construida que facilita la creaci√≥n de supervisores
from langgraph_supervisor import create_supervisor

# Creaci√≥n del supervisor que coordina a los agentes
supervisor=create_supervisor(
    model=llm,  # Modelo LLM para el supervisor (GPT-4o-mini)
    
    # Lista de agentes que el supervisor puede delegar trabajo
    agents=[research_agent, math_agent],
    
    # Prompt que define el comportamiento del supervisor
    prompt=(
        "Eres un supervisor gestionando dos agentes:\n"
        
        # Describe cada agente y su especialidad
        "- un agente de investigaci√≥n. Asigna tareas relacionadas con investigaci√≥n a este agente\n"
        "- un agente de matem√°ticas. Asigna tareas relacionadas con matem√°ticas a este agente\n"
        
        # Regla importante: un agente a la vez (no en paralelo)
        "Asigna trabajo a un agente a la vez, no llames agentes en paralelo.\n"
        
        # El supervisor solo coordina, no hace el trabajo
        "No hagas ning√∫n trabajo t√∫ mismo."
    ),
    
    # Agrega mensajes de "handoff" (transferencia) de vuelta al supervisor
    # Esto permite que los agentes "reporten" al supervisor cuando terminen
    add_handoff_back_messages=True,
    
    # Modo de salida: devuelve el historial completo de mensajes
    # Alternativas: "final_answer" (solo la respuesta final)
    output_mode="full_history"
).compile()  # Compila el supervisor en un grafo ejecutable

# Muestra el supervisor compilado
supervisor

In [None]:
# Invocaci√≥n del sistema supervisor con una consulta compleja
# Esta consulta requiere AMBOS agentes: investigaci√≥n Y matem√°ticas

response=supervisor.invoke({
    # Mensaje que combina dos tareas diferentes:
    # 1. Investigaci√≥n: listar variantes de transformers (research_agent)
    # 2. Matem√°ticas: calcular 5 + 10 (math_agent)
    "messages": "lista todas las variantes de transformers en despliegues de producci√≥n del retriever y luego dime cu√°nto es 5 m√°s 10"
})

# Flujo de ejecuci√≥n esperado:
# 1. Supervisor analiza la consulta
# 2. Supervisor delega a research_agent (primera tarea)
# 3. research_agent usa internal_tool_1 para buscar transformers
# 4. research_agent reporta resultados al supervisor
# 5. Supervisor delega a math_agent (segunda tarea)
# 6. math_agent usa la funci√≥n add(5, 10)
# 7. math_agent reporta resultado al supervisor
# 8. Supervisor consolida ambas respuestas

# La salida mostrar√°: "üìö Usando herramienta: InternalResearchNotes"

In [None]:
# Muestra la respuesta completa del supervisor
# Incluye todo el historial de mensajes entre supervisor y agentes
# √ötil para ver el flujo completo de delegaci√≥n y respuestas
response

In [None]:
# Extrae y muestra el contenido del √∫ltimo mensaje
# Este es el resultado final consolidado por el supervisor
# Deber√≠a contener:
# 1. Lista de variantes de transformers (de research_agent)
# 2. El resultado de 5 + 10 = 15 (de math_agent)
response["messages"][-1].content

### Equipos Jer√°rquicos de Agentes con RAG
En nuestro ejemplo anterior (Supervisor de Agentes), introdujimos el concepto de un solo nodo supervisor para enrutar trabajo entre diferentes nodos trabajadores.

Pero ¬øqu√© pasa si el trabajo para un solo trabajador se vuelve demasiado complejo? ¬øQu√© pasa si el n√∫mero de trabajadores se vuelve demasiado grande?

Para algunas aplicaciones, el sistema puede ser m√°s efectivo si el trabajo se distribuye jer√°rquicamente.

Puedes hacer esto componiendo diferentes subgrafos y creando un supervisor de nivel superior, junto con supervisores de nivel medio.

In [None]:
# Importaciones para el sistema jer√°rquico avanzado
from typing import Annotated, List

# WebBaseLoader: carga contenido desde URLs web
from langchain_community.document_loaders import WebBaseLoader

# TavilySearch: b√∫squeda web optimizada para IA
from langchain_tavily import TavilySearch

# tool decorator: convierte funciones Python en herramientas de LangChain
from langchain_core.tools import tool

# Creaci√≥n de herramienta Tavily con l√≠mite de 5 resultados
tavily_tool = TavilySearch(max_results=5)

In [None]:
# Definici√≥n de herramienta personalizada para scraping web
@tool
def scrape_webpages(urls: List[str]) -> str:
    """
    Usa requests y bs4 para scrapear las p√°ginas web proporcionadas para obtener informaci√≥n detallada.
    
    Esta herramienta permite al agente acceder a contenido espec√≠fico de URLs,
    complementando la b√∫squeda web general con informaci√≥n detallada de p√°ginas espec√≠ficas.
    
    Par√°metros:
    - urls: lista de URLs a scrapear
    
    Retorna: contenido de todas las p√°ginas concatenado y formateado
    """
    
    # Carga el contenido de las URLs usando WebBaseLoader
    # WebBaseLoader maneja autom√°ticamente requests y BeautifulSoup
    loader = WebBaseLoader(urls)
    
    # .load() descarga y procesa todas las p√°ginas
    docs = loader.load()
    
    # Formatea cada documento con su t√≠tulo y contenido
    # Usa tags XML-like para estructura clara
    return "\n\n".join(
        [
            # Para cada documento, crea un bloque estructurado
            f'<Document name="{doc.metadata.get("title", "")}">' +
            f'\n{doc.page_content}\n</Document>'
            for doc in docs
        ]
    )

In [None]:
# Importaciones para herramientas de escritura de documentos
from pathlib import Path
from tempfile import TemporaryDirectory
from typing import Dict, Optional

# PythonREPL: permite ejecutar c√≥digo Python din√°micamente
from langchain_experimental.utilities import PythonREPL

# TypedDict: para type hints de diccionarios con estructura espec√≠fica
from typing_extensions import TypedDict

# Creaci√≥n de directorio temporal para guardar documentos
# Esto mantiene los archivos aislados y se limpian autom√°ticamente
_TEMP_DIRECTORY = TemporaryDirectory()
WORKING_DIRECTORY = Path(_TEMP_DIRECTORY.name)

# Herramienta 1: Crear esquemas/outlines
@tool
def create_outline(
    points: Annotated[List[str], "Lista de puntos principales o secciones."],
    file_name: Annotated[str, "Ruta del archivo para guardar el esquema."],
) -> Annotated[str, "Ruta del archivo de esquema guardado."]:
    """
    Crea y guarda un esquema/outline de documento.
    
    √ötil para el agente note_taker que crea estructuras de documentos.
    """
    # Abre archivo en modo escritura
    with (WORKING_DIRECTORY / file_name).open("w") as file:
        # Enumera cada punto con formato "1. punto"
        for i, point in enumerate(points):
            file.write(f"{i + 1}. {point}\n")
    return f"Esquema guardado en {file_name}"

# Herramienta 2: Escribir documentos completos
@tool
def write_document(
    content: Annotated[str, "Contenido de texto a escribir en el documento."],
    file_name: Annotated[str, "Ruta del archivo para guardar el documento."],
) -> Annotated[str, "Ruta del archivo de documento guardado."]:
    """
    Crea y guarda un documento de texto.
    
    √ötil para el agente doc_writer que escribe contenido completo.
    """
    # Escribe el contenido completo en el archivo
    with (WORKING_DIRECTORY / file_name).open("w") as file:
        file.write(content)
    return f"Documento guardado en {file_name}"

# Herramienta 3: Editar documentos existentes
@tool
def edit_document(
    file_name: Annotated[str, "Ruta del documento a editar."],
    inserts: Annotated[
        Dict[int, str],
        "Diccionario donde la clave es el n√∫mero de l√≠nea (indexado desde 1) y el valor es el texto a insertar en esa l√≠nea.",
    ],
) -> Annotated[str, "Ruta del archivo de documento editado."]:
    """
    Edita un documento insertando texto en n√∫meros de l√≠nea espec√≠ficos.
    
    √ötil para hacer correcciones o agregar contenido sin reescribir todo.
    """
    # Lee todas las l√≠neas del archivo existente
    with (WORKING_DIRECTORY / file_name).open("r") as file:
        lines = file.readlines()

    # Ordena las inserciones por n√∫mero de l√≠nea
    sorted_inserts = sorted(inserts.items())

    # Procesa cada inserci√≥n
    for line_number, text in sorted_inserts:
        # Verifica que el n√∫mero de l√≠nea sea v√°lido (1-indexado)
        if 1 <= line_number <= len(lines) + 1:
            # Inserta el texto en la posici√≥n especificada (convertido a 0-indexed)
            lines.insert(line_number - 1, text + "\n")
        else:
            # Retorna error si el n√∫mero de l√≠nea est√° fuera de rango
            return f"Error: N√∫mero de l√≠nea {line_number} est√° fuera de rango."

    # Escribe las l√≠neas modificadas de vuelta al archivo
    with (WORKING_DIRECTORY / file_name).open("w") as file:
        file.writelines(lines)

    return f"Documento editado y guardado en {file_name}"

In [None]:
# Muestra el directorio de trabajo temporal donde se guardan los documentos
# Este es un directorio temporal que se limpia autom√°ticamente
WORKING_DIRECTORY

In [None]:
# Advertencia: Este c√≥digo ejecuta c√≥digo Python localmente,
# lo cual puede ser inseguro cuando no est√° en sandbox

# Creaci√≥n de un int√©rprete Python REPL
# REPL = Read-Eval-Print Loop (Leer-Evaluar-Imprimir-Repetir)
repl = PythonREPL()


@tool
def python_repl_tool(
    code: Annotated[str, "El c√≥digo Python a ejecutar para generar tu gr√°fico."],
):
    """
    Usa esto para ejecutar c√≥digo Python. Si quieres ver la salida de un valor,
    debes imprimirlo con `print(...)`. Esto es visible para el usuario.
    
    Esta herramienta permite al agente chart_generator crear visualizaciones
    y realizar an√°lisis de datos din√°micamente.
    
    Par√°metros:
    - code: c√≥digo Python a ejecutar (como string)
    
    Retorna: resultado de la ejecuci√≥n o mensaje de error
    """
    try:
        # Intenta ejecutar el c√≥digo usando el REPL
        result = repl.run(code)
    except BaseException as e:
        # Captura cualquier error durante la ejecuci√≥n
        return f"Fallo al ejecutar. Error: {repr(e)}"
    
    # Retorna un mensaje formateado con el c√≥digo y su salida
    return f"Ejecutado exitosamente:\n```python\n{code}\n```\nStdout: {result}"

In [None]:
# Importaciones para el sistema jer√°rquico
from typing import List, Optional, Literal
from langchain_core.language_models.chat_models import BaseChatModel

from langgraph.graph import StateGraph, MessagesState, START, END
from langgraph.types import Command
from langchain_core.messages import HumanMessage, trim_messages


# Definici√≥n del estado personalizado que extiende MessagesState
class State(MessagesState):
    """
    Estado extendido que incluye campo 'next' para tracking.
    
    Campos:
    - messages: heredado de MessagesState (historial de mensajes)
    - next: indica el siguiente nodo a ejecutar
    """
    next: str  # Nombre del siguiente nodo/agente a ejecutar

In [None]:
def make_supervisor_node(llm: BaseChatModel, members: list[str]) -> str:
    """
    Crea un nodo supervisor que enruta a trabajadores espec√≠ficos.
    
    Esta funci√≥n es el n√∫cleo del patr√≥n jer√°rquico. Crea un supervisor
    que puede delegar trabajo a m√∫ltiples agentes trabajadores.
    
    Par√°metros:
    - llm: modelo de lenguaje para el supervisor
    - members: lista de nombres de agentes trabajadores disponibles
    
    Retorna: funci√≥n del nodo supervisor configurada
    """
    
    # Opciones incluye "FINISH" m√°s todos los trabajadores
    # "FINISH" indica que el trabajo est√° completo
    options = ["FINISH"] + members
    
    # Prompt del sistema para el supervisor
    system_prompt = (
        "Eres un supervisor encargado de gestionar una conversaci√≥n entre los"
        f" siguientes trabajadores: {members}. Dada la siguiente solicitud del usuario,"
        " responde con el trabajador que debe actuar a continuaci√≥n. Cada trabajador realizar√° una"
        " tarea y responder√° con sus resultados y estado. Cuando termines,"
        " responde con FINISH."
    )

    # Definici√≥n de TypedDict para validaci√≥n de respuesta estructurada
    class Router(TypedDict):
        """Trabajador al que enrutar a continuaci√≥n. Si no se necesitan trabajadores, enrutar a FINISH."""
        next: Literal[*options]  # next debe ser uno de los valores en options

    def supervisor_node(state: State) -> Command[Literal[*members, "__end__"]]:
        """
        Un enrutador basado en LLM.
        
        Este nodo:
        1. Recibe el estado actual
        2. Usa el LLM para decidir el siguiente trabajador
        3. Retorna comando para navegar al siguiente nodo
        """
        # Construye lista de mensajes con prompt del sistema + historial
        messages = [
            {"role": "system", "content": system_prompt},
        ] + state["messages"]
        
        # Usa LLM con salida estructurada (Router TypedDict)
        # Esto fuerza al LLM a responder con formato: {"next": "nombre_trabajador"}
        response = llm.with_structured_output(Router).invoke(messages)
        
        # Extrae la decisi√≥n del siguiente nodo
        goto = response["next"]
        
        # Si el supervisor dice "FINISH", termina el grafo
        if goto == "FINISH":
            goto = END

        # Retorna comando con navegaci√≥n al siguiente nodo
        return Command(goto=goto, update={"next": goto})

    # Retorna la funci√≥n del nodo supervisor configurada
    return supervisor_node

In [None]:
# Muestra la herramienta de recuperaci√≥n interna
# Esta ser√° usada por el equipo de investigaci√≥n
internal_tool_1

In [None]:
# Importaciones necesarias
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI
from langgraph.prebuilt import create_react_agent


# === EQUIPO DE INVESTIGACI√ìN ===

# Agente 1: search_agent (b√∫squeda general)
# Este agente busca informaci√≥n usando Tavily y documentos internos
search_agent = create_react_agent(llm, tools=[tavily_tool, internal_tool_1])
search_agent

def search_node(state: State) -> Command[Literal["supervisor"]]:
    """
    Nodo que ejecuta el agente de b√∫squeda.
    Siempre reporta de vuelta al supervisor del equipo de investigaci√≥n.
    """
    # Invoca el agente de b√∫squeda con el estado actual
    result = search_agent.invoke(state)
    
    # Retorna comando con actualizaci√≥n y reporte al supervisor
    return Command(
        update={
            # Envuelve el mensaje en HumanMessage con nombre "search"
            "messages": [
                HumanMessage(content=result["messages"][-1].content, name="search")
            ]
        },
        # Queremos que nuestros trabajadores SIEMPRE "reporten" al supervisor cuando terminen
        goto="supervisor",
    )

### Subagente: web_scraper
# Agente 2: web_scraper_agent (scraping de p√°ginas espec√≠ficas)
# Este agente scrapea contenido detallado de URLs espec√≠ficas
web_scraper_agent = create_react_agent(llm, tools=[scrape_webpages])


def web_scraper_node(state: State) -> Command[Literal["supervisor"]]:
    """
    Nodo que ejecuta el agente de scraping web.
    Siempre reporta de vuelta al supervisor del equipo de investigaci√≥n.
    """
    # Invoca el agente de scraping
    result = web_scraper_agent.invoke(state)
    
    # Retorna comando con actualizaci√≥n y reporte al supervisor
    return Command(
        update={
            # Envuelve el mensaje con nombre "web_scraper"
            "messages": [
                HumanMessage(content=result["messages"][-1].content, name="web_scraper")
            ]
        },
        # Reporta al supervisor cuando termine
        goto="supervisor",
    )

In [None]:
# Creaci√≥n del supervisor del equipo de investigaci√≥n
# Este supervisor coordina a search_agent y web_scraper_agent
research_supervisor_node = make_supervisor_node(llm, ["search", "web_scraper"])

# Muestra la funci√≥n del supervisor de investigaci√≥n
research_supervisor_node

In [None]:
# === CONSTRUCCI√ìN DEL GRAFO DEL EQUIPO DE INVESTIGACI√ìN ===

# Creaci√≥n del constructor del grafo para el equipo de investigaci√≥n
research_builder = StateGraph(State)

# Agregado de nodos del equipo de investigaci√≥n
# El supervisor coordina a dos trabajadores especializados
research_builder.add_node("supervisor", research_supervisor_node)  # Supervisor del equipo
research_builder.add_node("search", search_node)  # Trabajador de b√∫squeda
research_builder.add_node("web_scraper", web_scraper_node)  # Trabajador de scraping

# El flujo comienza con el supervisor del equipo de investigaci√≥n
research_builder.add_edge(START, "supervisor")

# Compilaci√≥n del subgrafo del equipo de investigaci√≥n
research_graph = research_builder.compile()

# Muestra el grafo del equipo de investigaci√≥n
research_graph

In [None]:
# === HERRAMIENTA PARA LEER DOCUMENTOS ===

@tool
def read_document(
    file_name: Annotated[str, "Ruta del archivo para leer el documento."],
    start: Annotated[Optional[int], "La l√≠nea de inicio. Por defecto es 0"] = None,
    end: Annotated[Optional[int], "La l√≠nea final. Por defecto es None"] = None,
) -> str:
    """
    Lee el documento especificado.
    
    Permite leer todo el documento o solo un rango de l√≠neas espec√≠fico.
    √ötil para que los agentes revisen documentos antes de editarlos.
    
    Par√°metros:
    - file_name: nombre del archivo a leer
    - start: l√≠nea de inicio (opcional, por defecto 0)
    - end: l√≠nea final (opcional, por defecto None = hasta el final)
    
    Retorna: contenido del documento (completo o rango especificado)
    """
    # Abre y lee todas las l√≠neas del archivo
    with (WORKING_DIRECTORY / file_name).open("r") as file:
        lines = file.readlines()
    
    # Si no se especifica start, comienza desde el principio
    if start is None:
        start = 0
    
    # Retorna las l√≠neas desde start hasta end (o hasta el final si end es None)
    return "\n".join(lines[start:end])

In [None]:
# === EQUIPO DE ESCRITURA DE DOCUMENTOS ===

# Agente 1: doc_writer_agent (escritor de documentos)
# Este agente puede leer, escribir y editar documentos completos
doc_writer_agent = create_react_agent(
    llm,
    tools=[write_document, edit_document, read_document],  # Herramientas de gesti√≥n de documentos
    prompt=(
        "Puedes leer, escribir y editar documentos bas√°ndote en los esquemas del tomador de notas. "
        "No hagas preguntas de seguimiento."
    ),
)


def doc_writing_node(state: State) -> Command[Literal["supervisor"]]:
    """
    Nodo que ejecuta el agente escritor de documentos.
    Reporta al supervisor del equipo de escritura cuando termine.
    """
    result = doc_writer_agent.invoke(state)
    return Command(
        update={
            "messages": [
                HumanMessage(content=result["messages"][-1].content, name="doc_writer")
            ]
        },
        goto="supervisor",
    )

# Agente 2: note_taking_agent (tomador de notas / creador de esquemas)
# Este agente crea outlines/esquemas que gu√≠an al escritor
note_taking_agent = create_react_agent(
    llm,
    tools=[create_outline, read_document],  # Herramientas de organizaci√≥n
    prompt=(
        "Puedes leer documentos y crear esquemas para el escritor de documentos. "
        "No hagas preguntas de seguimiento."
    ),
)


def note_taking_node(state: State) -> Command[Literal["supervisor"]]:
    """
    Nodo que ejecuta el agente tomador de notas.
    Reporta al supervisor del equipo de escritura cuando termine.
    """
    result = note_taking_agent.invoke(state)
    return Command(
        update={
            "messages": [
                HumanMessage(content=result["messages"][-1].content, name="note_taker")
            ]
        },
        goto="supervisor",
    )


# Agente 3: chart_generating_agent (generador de gr√°ficos)
# Este agente crea visualizaciones y gr√°ficos ejecutando c√≥digo Python
chart_generating_agent = create_react_agent(
    llm, 
    tools=[read_document, python_repl_tool]  # Herramientas de an√°lisis y visualizaci√≥n
)


def chart_generating_node(state: State) -> Command[Literal["supervisor"]]:
    """
    Nodo que ejecuta el agente generador de gr√°ficos.
    Reporta al supervisor del equipo de escritura cuando termine.
    """
    result = chart_generating_agent.invoke(state)
    return Command(
        update={
            "messages": [
                HumanMessage(
                    content=result["messages"][-1].content, name="chart_generator"
                )
            ]
        },
        goto="supervisor",
    )

# Creaci√≥n del supervisor del equipo de escritura
# Este supervisor coordina a doc_writer, note_taker y chart_generator
doc_writing_supervisor_node = make_supervisor_node(
    llm, ["doc_writer", "note_taker", "chart_generator"]
)

In [None]:
# === CONSTRUCCI√ìN DEL GRAFO DEL EQUIPO DE ESCRITURA ===

# Creaci√≥n del constructor del grafo para el equipo de escritura de papers
paper_writing_builder = StateGraph(State)

# Agregado de nodos del equipo de escritura
# El supervisor coordina a tres trabajadores especializados
paper_writing_builder.add_node("supervisor", doc_writing_supervisor_node)  # Supervisor del equipo
paper_writing_builder.add_node("doc_writer", doc_writing_node)  # Escritor de documentos
paper_writing_builder.add_node("note_taker", note_taking_node)  # Tomador de notas
paper_writing_builder.add_node("chart_generator", chart_generating_node)  # Generador de gr√°ficos

# El flujo comienza con el supervisor del equipo de escritura
paper_writing_builder.add_edge(START, "supervisor")

# Compilaci√≥n del subgrafo del equipo de escritura
paper_writing_graph = paper_writing_builder.compile()

# Muestra el grafo del equipo de escritura
paper_writing_graph

In [None]:
# === SUPERVISOR DE NIVEL SUPERIOR ===

# Importaci√≥n de BaseMessage
from langchain_core.messages import BaseMessage

# Creaci√≥n del supervisor de equipos (nivel superior)
# Este supervisor coordina a los dos equipos completos:
# - research_team (b√∫squeda + scraping)
# - writing_team (notas + escritura + gr√°ficos)
teams_supervisor_node = make_supervisor_node(llm, ["research_team", "writing_team"])

# Muestra la funci√≥n del supervisor de equipos
teams_supervisor_node

In [None]:
# === FUNCIONES DE LLAMADA A EQUIPOS ===

def call_research_team(state: State) -> Command[Literal["supervisor"]]:
    """
    Invoca el subgrafo completo del equipo de investigaci√≥n.
    
    Este nodo act√∫a como "proxy" que:
    1. Toma el √∫ltimo mensaje del estado
    2. Lo pasa al equipo de investigaci√≥n completo
    3. Espera a que el equipo termine su trabajo
    4. Retorna los resultados al supervisor de equipos
    """
    # Invoca el grafo completo del equipo de investigaci√≥n
    # Solo pasa el √∫ltimo mensaje para evitar duplicaci√≥n
    response = research_graph.invoke({"messages": state["messages"][-1]})
    
    # Retorna los resultados al supervisor de equipos
    return Command(
        update={
            # Marca el mensaje como proveniente del "research_team"
            "messages": [
                HumanMessage(
                    content=response["messages"][-1].content, name="research_team"
                )
            ]
        },
        goto="supervisor",  # Siempre reporta al supervisor de equipos
    )


def call_paper_writing_team(state: State) -> Command[Literal["supervisor"]]:
    """
    Invoca el subgrafo completo del equipo de escritura.
    
    Similar a call_research_team, pero para el equipo de escritura.
    """
    # Invoca el grafo completo del equipo de escritura
    response = paper_writing_graph.invoke({"messages": state["messages"][-1]})
    
    # Retorna los resultados al supervisor de equipos
    return Command(
        update={
            # Marca el mensaje como proveniente del "writing_team"
            "messages": [
                HumanMessage(
                    content=response["messages"][-1].content, name="writing_team"
                )
            ]
        },
        goto="supervisor",  # Siempre reporta al supervisor de equipos
    )


# === CONSTRUCCI√ìN DEL GRAFO SUPERIOR JER√ÅRQUICO ===

# Creaci√≥n del constructor del grafo de nivel superior
super_builder = StateGraph(State)

# Agregado de nodos del nivel superior
# Este grafo coordina a los dos equipos completos
super_builder.add_node("supervisor", teams_supervisor_node)  # Supervisor de equipos
super_builder.add_node("research_team", call_research_team)  # Nodo que invoca equipo de investigaci√≥n
super_builder.add_node("writing_team", call_paper_writing_team)  # Nodo que invoca equipo de escritura

# El flujo comienza con el supervisor de equipos
super_builder.add_edge(START, "supervisor")

# Compilaci√≥n del grafo jer√°rquico completo
super_graph = super_builder.compile()

# Muestra el grafo jer√°rquico completo
super_graph

In [None]:
# === INVOCACI√ìN DEL SISTEMA JER√ÅRQUICO COMPLETO ===

# Invoca el sistema jer√°rquico multi-agente completo con una tarea compleja
response=super_graph.invoke(
    {
        # La consulta solicita escribir sobre variantes de transformers
        # Esto requiere:
        # 1. Equipo de investigaci√≥n: buscar informaci√≥n (search + web_scraper)
        # 2. Equipo de escritura: crear outline (note_taker) ‚Üí escribir documento (doc_writer)
        "messages": [
            ("user", "Escribe sobre variantes de transformers en despliegues de producci√≥n.")
        ],
    }
)

# Flujo de ejecuci√≥n esperado:
# 1. Supervisor de equipos analiza la tarea
# 2. Delega a research_team
#    2.1. Supervisor de investigaci√≥n coordina a search y web_scraper
#    2.2. Recopilan informaci√≥n sobre transformers
#    2.3. Reportan resultados al supervisor de equipos
# 3. Supervisor de equipos delega a writing_team
#    3.1. Supervisor de escritura coordina a note_taker, doc_writer y chart_generator
#    3.2. note_taker crea outline del documento
#    3.3. doc_writer escribe el documento completo
#    3.4. Reportan resultados al supervisor de equipos
# 4. Supervisor de equipos confirma finalizaci√≥n

In [None]:
# Muestra la respuesta completa del sistema jer√°rquico
# Incluye todo el historial de mensajes entre:
# - Supervisor de equipos
# - Equipo de investigaci√≥n (y sus subagentes)
# - Equipo de escritura (y sus subagentes)
response

In [None]:
# Extrae y muestra el contenido del √∫ltimo mensaje
# Este es el mensaje final del equipo de escritura confirmando que:
# 1. El documento ha sido creado
# 2. El outline ha sido guardado
# 3. El trabajo est√° completo
response["messages"][-1].content