In [3]:
import os
os.environ["OPENAI_API_KEY"] = key  # reemplaza con tu clave real si es necesario


In [3]:
%pip uninstall -y langchain-community


Found existing installation: langchain-community 0.3.21
Uninstalling langchain-community-0.3.21:
  Successfully uninstalled langchain-community-0.3.21
Note: you may need to restart the kernel to use updated packages.


In [4]:
!pip show openai langchain langgraph langchain_openai

Name: openai
Version: 1.75.0
Summary: The official Python library for the openai API
Home-page: 
Author: 
Author-email: OpenAI <support@openai.com>
License: Apache-2.0
Location: /home/studio-lab-user/.conda/envs/default/lib/python3.9/site-packages
Requires: sniffio, tqdm, httpx, pydantic, anyio, jiter, distro, typing-extensions
Required-by: langchain-openai
---
Name: langchain
Version: 0.3.23
Summary: Building applications with LLMs through composability
Home-page: 
Author: 
Author-email: 
License: MIT
Location: /home/studio-lab-user/.conda/envs/default/lib/python3.9/site-packages
Requires: SQLAlchemy, langchain-core, async-timeout, PyYAML, langsmith, requests, pydantic, langchain-text-splitters
Required-by: 
---
Name: langgraph
Version: 0.3.31
Summary: Building stateful, multi-actor applications with LLMs
Home-page: 
Author: 
Author-email: 
License: MIT
Location: /home/studio-lab-user/.conda/envs/default/lib/python3.9/site-packages
Requires: langgraph-checkpoint, xxhash, langgraph-pre



### 📘 **Capítulo 7. Agentes II**

El Capítulo 6 presentó la arquitectura de agentes, la más poderosa de las arquitecturas de LLM que hemos visto hasta ahora. Es difícil exagerar el potencial de esta combinación de encadenamiento de pensamientos, uso de herramientas y bucles.

Este capítulo analiza dos extensiones de la arquitectura de agentes que mejoran el rendimiento para algunos casos de uso:

---

#### **Reflexión**

Tomando otra página del repertorio de patrones de pensamiento humano, esto trata sobre darle a tu aplicación con LLM la oportunidad de analizar sus propias salidas y elecciones pasadas, junto con la capacidad de recordar reflexiones de iteraciones anteriores.

---

#### **Multi-agente**

De manera similar a cómo un equipo puede lograr más que una sola persona, hay problemas que pueden abordarse mejor con equipos de agentes LLM.

---

Comencemos con la reflexión.

---

#### **Reflexión**

Una técnica de prompts que aún no hemos cubierto es la reflexión (también conocida como autocrítica). La reflexión es la creación de un bucle entre un prompt generador y un prompt revisor. Esto refleja el proceso de creación de muchos artefactos generados por humanos, como este capítulo que estás leyendo ahora, el cual es el resultado de un ida y vuelta entre los autores, revisores y editor, hasta que todos estén satisfechos con el producto final.

Como muchas de las técnicas de prompts que hemos visto hasta ahora, la reflexión se puede combinar con otras técnicas, como el encadenamiento de pensamientos (chain-of-thought) y el uso de herramientas. En esta sección, veremos la reflexión de forma aislada.

Se puede trazar un paralelo con los modos de pensamiento humano conocidos como Sistema 1 (reactivo o instintivo) y Sistema 2 (metódico y reflexivo), introducidos por primera vez por Daniel Kahneman en su libro *Thinking, Fast and Slow* (Farrar, Straus and Giroux, 2011). Cuando se aplica correctamente, la autocrítica puede ayudar a que las aplicaciones con LLM se acerquen a algo que se asemeje al comportamiento del Sistema 2 (Figura 7-1).

---

#### **Figura 7-1. Pensamiento del Sistema 1 y del Sistema 2**

Implementaremos la reflexión como un grafo con dos nodos: **generar** y **reflexionar**. Este grafo tendrá la tarea de escribir ensayos de tres párrafos, con el nodo `generate` escribiendo o revisando borradores del ensayo, y `reflect` escribiendo una crítica para informar la siguiente revisión. Ejecutaremos el bucle un número fijo de veces, pero una variación de esta técnica sería permitir que el nodo de reflexión decida cuándo terminar. Veamos cómo se ve:

---

### 🐍 Código Python



In [3]:
from typing import Annotated, TypedDict

from langchain_core.messages import (
    AIMessage,
    BaseMessage,
    HumanMessage,
    SystemMessage,
)
from langchain_openai import ChatOpenAI

from langgraph.graph import END, START, StateGraph
from langgraph.graph.message import add_messages

model = ChatOpenAI()

# Definimos el estado del grafo, que es una lista de mensajes
class Estado(TypedDict):
    messages: Annotated[list[BaseMessage], add_messages]

# Prompt para generar ensayos
prompt_generar = SystemMessage(
    """Eres un asistente de ensayos encargado de escribir excelentes ensayos 
    de 3 párrafos."""
    "Genera el mejor ensayo posible para la solicitud del usuario."
    """Si el usuario proporciona una crítica, responde con una versión 
    revisada de tus intentos anteriores."""
)

# Nodo de generación
def generar(estado: Estado) -> Estado:
    respuesta = model.invoke([prompt_generar] + estado["messages"])
    return {"messages": [respuesta]}

# Prompt para reflexionar (criticar el ensayo)
prompt_reflexion = SystemMessage(
    """Eres un profesor que califica un ensayo. Genera críticas y 
    recomendaciones para la entrega del usuario."""
    """Proporciona recomendaciones detalladas, incluyendo solicitudes sobre 
    longitud, profundidad, estilo, etc."""
)

# Nodo de reflexión
def reflexionar(estado: Estado) -> Estado:
    # Invertimos los mensajes para que el LLM reflexione sobre su propia salida
    cls_map = {AIMessage: HumanMessage, HumanMessage: AIMessage}
    # Primer mensaje es la solicitud original del usuario; se mantiene igual
    traducido = [prompt_reflexion, estado["messages"][0]] + [
        cls_map[msg.__class__](content=msg.content) 
        for msg in estado["messages"][1:]
    ]
    respuesta = model.invoke(traducido)
    # Tratamos la salida como retroalimentación humana para el generador
    return {"messages": [HumanMessage(content=respuesta.content)]}

# Condición para detener el bucle
def deberia_continuar(estado: Estado):
    if len(estado["messages"]) > 6:
        # Terminamos después de 3 iteraciones, cada una con 2 mensajes
        return END
    else:
        return "reflect"

# Construcción del grafo
construccion = StateGraph(Estado)
construccion.add_node("generate", generar)
construccion.add_node("reflect", reflexionar)
construccion.add_edge(START, "generate")
construccion.add_conditional_edges("generate", deberia_continuar)
construccion.add_edge("reflect", "generate")

# Compilar el grafo
grafo = construccion.compile()

Este bloque de código define el **nodo de reflexión** dentro de un flujo donde un LLM escribe y luego se revisa a sí mismo. Vamos línea por línea:

---

### `def reflexionar(estado: Estado) -> Estado:`
Define una función llamada `reflexionar` que recibe un diccionario con estado (`Estado`), y devuelve otro estado.

---

### `cls_map = {AIMessage: HumanMessage, HumanMessage: AIMessage}`
Esta línea define un **mapa de clases inversas**. Su propósito es **intercambiar los roles** de los mensajes:
- Lo que fue generado por el LLM (`AIMessage`), ahora será tratado como si lo hubiera dicho un humano (`HumanMessage`).
- Y viceversa (aunque en este caso, eso no se usa).

Este "truco" hace que el modelo analice su propia respuesta como si **otro humano lo hubiera dicho**, promoviendo una reflexión más efectiva.

---

### `traducido = [prompt_reflexion, estado["messages"][0]] + [ ... ]`
Aquí se está construyendo una nueva lista de mensajes:
1. Primero, se añade el mensaje del sistema `prompt_reflexion`, que le dice al modelo que actúe como maestro que evalúa un ensayo.
2. Luego se agrega el **mensaje original del usuario**, sin cambios (índice 0).
3. Después, **todos los mensajes posteriores** (respuestas del LLM, principalmente) se transforman a su clase contraria, usando `cls_map`.

Esto es como decirle al modelo:  
*"Aquí está la conversación, pero trata lo que tú dijiste como si lo hubiera dicho otra persona y ahora evalúalo."*

---

### `respuesta = model.invoke(traducido)`
Aquí se invoca al modelo con esa conversación transformada, para que genere su **crítica o retroalimentación**.

---

### `return {"messages": [HumanMessage(content=respuesta.content)]}`
Finalmente, se encapsula la crítica como si fuera un mensaje **humano** (simulando que viene de un revisor), y se devuelve como nuevo estado. Esto lo usará el generador para mejorar su ensayo en la siguiente iteración.

---

### ¿Para qué sirve todo esto?
Este nodo permite que el modelo **aprenda de sí mismo en cada iteración**, generando mejores resultados conforme reflexiona y revisa sus respuestas anteriores. Es como un ciclo de borradores y correcciones.


In [5]:
# --- Ejecutar ejemplo ---
entrada_inicial = {
    "messages": [HumanMessage(content="Escribe un ensayo sobre el impacto de la inteligencia artificial en la educación")]
}

estado_final = grafo.invoke(entrada_inicial)

# --- Mostrar resultado ---
print("📝 Resultado final:")
for msg in estado_final["messages"]:
    tipo = "🤖 AI" if isinstance(msg, AIMessage) else "🙋 Humano"
    print(f"\n{tipo}:\n{msg.content}")

📝 Resultado final:

🙋 Humano:
Escribe un ensayo sobre el impacto de la inteligencia artificial en la educación

🤖 AI:
La inteligencia artificial (IA) ha revolucionado numerosos aspectos de nuestras vidas, y la educación no es una excepción. El impacto de la IA en la educación es profundo y prometedor. En primer lugar, la IA ha permitido la personalización del aprendizaje, adaptando el contenido educativo a las necesidades individuales de cada estudiante. A través de algoritmos inteligentes, se pueden crear programas educativos individualizados que maximizan el potencial de cada alumno, permitiéndoles avanzar a su propio ritmo y en áreas donde más lo necesitan.

En segundo lugar, la IA ha facilitado la accesibilidad a la educación, rompiendo barreras geográficas y económicas. Plataformas educativas basadas en IA ofrecen cursos en línea gratuitos o a precios accesibles, permitiendo que personas de todo el mundo puedan acceder a una educación de calidad. Además, la IA ha contribuido al de


Observa cómo el nodo de reflexión engaña al LLM haciéndole creer que está criticando ensayos escritos por el usuario. Y, de forma paralela, se hace que el nodo de generación piense que la crítica proviene del usuario. Este engaño es necesario porque los LLMs entrenados para diálogo están entrenados con pares de mensajes humano-IA, por lo que una secuencia con muchos mensajes del mismo participante daría como resultado un rendimiento deficiente.

Un detalle más a tener en cuenta: podrías, a primera vista, esperar que el final ocurra después de un paso de revisión, pero en esta arquitectura tenemos un número **fijo** de iteraciones en el ciclo generar-reflexionar; por lo tanto, terminamos después de generar (para que el último conjunto de revisiones solicitadas sea atendido). Una variación de esta arquitectura permitiría que el paso de reflexión decidiera cuándo terminar el proceso (una vez que ya no tuviera más comentarios).

Veamos cómo se ve una de las críticas:

---

Este tipo simple de reflexión puede, en ocasiones, mejorar el rendimiento al darle al LLM múltiples intentos de refinar su salida y al permitir que el nodo de reflexión adopte una **personalidad distinta** mientras critica el resultado.

Hay varias posibles variaciones de esta arquitectura. Por ejemplo, podríamos combinar el paso de reflexión con la arquitectura de agentes del Capítulo 6, añadiéndolo como el último nodo justo antes de enviar la salida al usuario. Esto haría que la crítica pareciera provenir del usuario y le daría a la aplicación una oportunidad de mejorar su salida final sin intervención directa del usuario. Obviamente, este enfoque implicaría una mayor **latencia**.

En ciertos casos de uso, podría ser útil fundamentar la crítica con información externa. Por ejemplo, si estuvieras construyendo un agente de generación de código, podrías tener un paso antes de reflexionar que ejecute el código a través de un *linter* o *compilador* y reporte cualquier error como entrada para la reflexión.

💡 **CONSEJO**  
Siempre que este enfoque sea posible, te recomendamos encarecidamente probarlo, ya que probablemente aumentará la calidad del resultado final.

---


Si solo quieres ver el **último mensaje generado** (el resultado final del ciclo de generación-reflexión), puedes modificar la última parte del código así:

```python
# Mostrar solo el último mensaje (el más reciente)
ultimo_mensaje = estado_final["messages"][-1]

if isinstance(ultimo_mensaje, AIMessage):
    print("📝 Último mensaje de la IA:\n")
else:
    print("🙋 Último mensaje del 'usuario':\n")

print(ultimo_mensaje.content)
```

---

Esto imprimirá únicamente el contenido final, que dependiendo del número de iteraciones será:

- Un ensayo si la última acción fue de la IA (`AIMessage`)
- Una crítica si terminó en reflexión (`HumanMessage`)

> 💡 Tip: En el flujo original, el ciclo siempre termina después de una **generación**, así que el último mensaje será una respuesta final mejorada del asistente.


In [7]:
# Mostrar solo el último mensaje (el más reciente)
ultimo_mensaje = estado_final["messages"][-1]

if isinstance(ultimo_mensaje, AIMessage):
    print("📝 Último mensaje de la IA:\n")
else:
    print("🙋 Último mensaje del 'usuario':\n")

print(ultimo_mensaje.content)

📝 Último mensaje de la IA:

La inteligencia artificial (IA) ha dejado una marca significativa en el campo educativo, abriendo nuevas posibilidades y desafíos que requieren una consideración cuidadosa. Uno de los impactos más destacados de la IA en la educación es la personalización del aprendizaje. Plataformas como Khan Academy utilizan algoritmos inteligentes para adaptar el contenido educativo a las necesidades específicas de cada alumno, permitiéndoles avanzar a su propio ritmo y profundizar en áreas de mayor interés. Este enfoque personalizado no solo mejora la efectividad del aprendizaje, sino que también empodera a los estudiantes al ofrecerles un camino educativo único y ajustado a sus necesidades individuales.

Además, la IA ha revolucionado la accesibilidad a la educación al eliminar barreras geográficas y económicas. Plataformas en línea como Coursera y edX ofrecen una variedad de cursos gratuitos o a precios asequibles, ampliando el acceso a la educación a una audiencia glob

Aquí va la traducción con los comentarios y cadenas de texto en el código también traducidos, pero sin tocar variables ni estructuras, como pediste:

---

### Subgrafos en LangGraph

Antes de adentrarnos en arquitecturas multi-agente, veamos un concepto técnico importante en LangGraph que las hace posibles. Los subgrafos son grafos que se utilizan como parte de otro grafo. Aquí algunos casos de uso para los subgrafos:

- Construcción de sistemas multi-agente (se discute en la siguiente sección).
- Cuando quieres reutilizar un conjunto de nodos en múltiples grafos, puedes definirlos una vez en un subgrafo y luego usarlos en varios grafos principales.
- Cuando diferentes equipos necesitan trabajar en diferentes partes del grafo de manera independiente, puedes definir cada parte como un subgrafo, y mientras se respete la interfaz del subgrafo (los esquemas de entrada y salida), el grafo principal puede construirse sin conocer los detalles del subgrafo.

Hay dos maneras de añadir nodos de subgrafo a un grafo principal:

**1. Agregar un nodo que llame directamente al subgrafo**  
Esto es útil cuando el grafo principal y el subgrafo comparten claves de estado, y no necesitas transformar el estado ni al entrar ni al salir.

**2. Agregar un nodo con una función que invoque el subgrafo**  
Esto es útil cuando el grafo principal y el subgrafo tienen diferentes esquemas de estado, y necesitas transformar el estado antes o después de llamar al subgrafo.

Veamos cada una por separado.

---

### Llamando a un Subgrafo Directamente

La forma más simple de crear nodos de subgrafo es adjuntar un subgrafo directamente como un nodo. Al hacerlo, es importante que el grafo principal y el subgrafo compartan claves de estado, porque esas claves compartidas se usarán para comunicarse. (Si tu grafo y subgrafo no comparten ninguna clave, revisa la siguiente sección.)

> **NOTA**  
> Si pasas claves adicionales al nodo del subgrafo (es decir, además de las claves compartidas), serán ignoradas por el nodo del subgrafo. De manera similar, si el subgrafo devuelve claves adicionales, serán ignoradas por el grafo principal.

Veamos cómo se ve esto en acción:

---

#### Python

In [13]:
from langgraph.graph import START, StateGraph
from typing import TypedDict

class State(TypedDict):
    foo: str  # esta clave se comparte con el subgrafo

class SubgraphState(TypedDict):
    foo: str  # esta clave se comparte con el grafo principal
    bar: str

# Definir subgrafo
def subgraph_node(state: SubgraphState):
    # Este subgrafo puede comunicarse con el grafo principal a través de la clave "foo"
    return {"foo": state["foo"] + "bar"}

# Crear el builder del subgrafo
subgraph_builder = StateGraph(SubgraphState)

subgraph_builder.add_node("subgraph_node", subgraph_node)

# Conectar el nodo 'START' al nodo 'subgraph_node'
subgraph_builder.add_edge(START, "subgraph_node")
# Compila el subgrafo
subgraph = subgraph_builder.compile()

# Definir grafo principal
builder = StateGraph(State)
# Agrega el subgrafo como un nodo en el grafo principal
builder.add_node("subgraph", subgraph)
# Conectar el nodo 'START' al nodo 'subgraph' en el grafo principal
builder.add_edge(START, "subgraph")
# Aquí puedes agregar más nodos o configuraciones para el grafo principal si es necesario

# Finalmente, compila el grafo principal
graph = builder.compile()

# Ahora, ejecutamos el grafo con un estado inicial
state = {"foo": "hello"}
result = graph.invoke(state)

# Imprimir el resultado
print(result)


{'foo': 'hellobar'}




### Llamar a un Subgrafo con una Función

Puede que quieras definir un subgrafo con un esquema completamente diferente. En ese caso, puedes crear un nodo con una **función** que invoque al subgrafo. Esta función necesitará:

1. Transformar el estado del grafo principal al estado requerido por el subgrafo **antes** de invocarlo.
2. Transformar los resultados del subgrafo **de regreso** al estado del grafo principal antes de devolver la actualización de estado desde el nodo.

---



In [1]:
from langgraph.graph import StateGraph, START
from typing import TypedDict

# Estado del grafo principal
class ParentState(TypedDict):
    foo: str

# Estado del subgrafo
class SubgraphState(TypedDict):
    bar: str

# Subgrafo que trabaja sobre SubgraphState
def subgraph_node(state: SubgraphState):
    return {"bar": state["bar"] + "baz"}

subgraph_builder = StateGraph(SubgraphState)
subgraph_builder.add_node("sub_node", subgraph_node)
subgraph_builder.add_edge(START, "sub_node")
subgraph = subgraph_builder.compile()

# Nodo del grafo principal que llama al subgrafo
def subgraph_caller(state: ParentState):
    # Transformar estado del grafo principal al del subgrafo
    sub_state = {"bar": state["foo"]}
    # Ejecutar el subgrafo
    result = subgraph.invoke(sub_state)
    # Transformar resultado de regreso al estado del grafo principal
    return {"foo": result["bar"]}

# Construcción del grafo principal
parent_builder = StateGraph(ParentState)
parent_builder.add_node("call_subgraph", subgraph_caller)
parent_builder.add_edge(START, "call_subgraph")
graph = parent_builder.compile()

# Probarlo
result = graph.invoke({"foo": "hello"})
print(result)  # {'foo': 'hellobaz'}


{'foo': 'hellobaz'}



### Ahora que sabemos cómo usar subgrafos, veamos uno de sus grandes casos de uso: **arquitecturas multiagente**.

## Arquitecturas Multiagente

A medida que los agentes basados en LLMs (modelos de lenguaje grandes) crecen en tamaño, alcance o complejidad, pueden surgir varios problemas que afectan su rendimiento, como los siguientes:

- El agente recibe demasiadas herramientas para elegir y toma malas decisiones sobre cuál usar a continuación (el Capítulo 6 discutió algunos enfoques para este problema).
- El contexto se vuelve demasiado complejo para que un solo agente lo mantenga bajo control; es decir, el tamaño de los *prompts* y la cantidad de cosas mencionadas superan la capacidad del modelo que estás usando.
- Quieres usar un subsistema especializado para una tarea en particular, por ejemplo: planeación, investigación, resolución de problemas matemáticos, etc.

Para abordar estos problemas, puedes considerar dividir tu aplicación en múltiples agentes pequeños e independientes, y componerlos en un sistema multiagente. Estos agentes pueden ser tan simples como un *prompt* con una llamada a un LLM o tan complejos como un agente tipo ReAct (introducido en el Capítulo 6). 

La **Figura 7-3** ilustra varias formas de conectar agentes en un sistema multiagente.

---

### Figura 7-3. Múltiples estrategias para coordinar múltiples agentes

Veamos con más detalle la Figura 7-3:

- **Red (Network)**  
  Cada agente puede comunicarse con todos los demás. Cualquier agente puede decidir cuál se ejecutará a continuación.

- **Supervisor**  
  Cada agente se comunica con un único agente llamado *supervisor*. El supervisor toma decisiones sobre qué agente (o agentes) deben llamarse a continuación. Un caso especial de esta arquitectura implementa el supervisor como una llamada a un LLM con herramientas (cubierto en el Capítulo 6).

- **Jerárquica (Hierarchical)**  
  Puedes definir un sistema multiagente con un supervisor de supervisores. Esta es una generalización de la arquitectura de supervisor y permite flujos de control más complejos.

- **Flujo personalizado (Custom multi-agent workflow)**  
  Cada agente se comunica solo con un subconjunto de agentes. Partes del flujo son deterministas, y solo algunos agentes pueden decidir qué otros agentes llamar.

---

La siguiente sección profundiza en la arquitectura de tipo **supervisor**, que ofrece un buen equilibrio entre capacidad y facilidad de uso.

---

## Arquitectura de Supervisor

En esta arquitectura, añadimos cada agente al grafo como un nodo y también agregamos un nodo supervisor, que decide qué agentes deben llamarse a continuación. Usamos **bordes condicionales** (*conditional edges*) para dirigir la ejecución al nodo de agente apropiado con base en la decisión del supervisor. Puedes consultar el Capítulo 5 para una introducción a LangGraph, donde se abordan los conceptos de nodos, bordes y más.

---

### Primero veamos cómo se ve el nodo supervisor:

**Python**


In [4]:
from typing import Literal
from langchain_openai import ChatOpenAI
from pydantic import BaseModel

class SupervisorDecision(BaseModel):
    next: Literal["researcher", "coder", "FINISH"]

model = ChatOpenAI(model="gpt-4o", temperature=0)
model = model.with_structured_output(SupervisorDecision)

agents = ["researcher", "coder"]

system_prompt_part_1 = f"""You are a supervisor tasked with managing a 
conversation between the following workers: {agents}. Given the following user 
request, respond with the worker to act next. Each worker will perform a
task and respond with their results and status. When finished,
respond with FINISH."""

system_prompt_part_2 = f"""Given the conversation above, who should act next? Or 
    should we FINISH? Select one of: {', '.join(agents)}, FINISH"""

def supervisor(state):
    messages = [
        ("system", system_prompt_part_1),
        *state["messages"],
        ("system", 	system_prompt_part_2)
    ]
    return model.invoke(messages)




**NOTA**  
El código en el prompt requiere que los nombres de tus subagentes sean autoexplicativos y distintos. Por ejemplo, si simplemente se llamaran `agente_1` y `agente_2`, el modelo LLM no tendría información suficiente para decidir cuál es el adecuado para cada tarea. Si es necesario, puedes modificar el prompt para añadir una descripción de cada agente, lo cual podría ayudar al LLM a elegir un agente para cada consulta.

Ahora veamos cómo integrar este nodo supervisor en un grafo más grande que incluya a otros dos subagentes, a los que llamaremos `investigador` (researcher) y `programador` (coder).  
Nuestro objetivo general con este grafo es manejar consultas que puedan ser respondidas ya sea por el investigador, el programador, o incluso por ambos en sucesión.  

Este ejemplo no incluye la implementación del investigador o el programador—la idea clave es que podrían ser cualquier otro nodo o subgrafo de LangGraph.



In [6]:
from typing import Literal
from langchain_openai import ChatOpenAI
from pydantic import BaseModel
from langgraph.graph import StateGraph, START, END
from langgraph.graph.message import MessagesState

# Clase para que el supervisor decida
class SupervisorDecision(BaseModel):
    next: Literal["researcher", "coder", "FINISH"]

# Modelo con salida estructurada
model = ChatOpenAI(model="gpt-4o", temperature=0)
model = model.with_structured_output(SupervisorDecision)

# Agentes disponibles
agents = ["researcher", "coder"]

# Prompts del supervisor
system_prompt_part_1 = f"""You are a supervisor tasked with managing a 
conversation between the following workers: {agents}. Given the following user 
request, respond with the worker to act next. Each worker will perform a
task and respond with their results and status. When finished,
respond with FINISH."""

system_prompt_part_2 = f"""Given the conversation above, who should act next? Or 
should we FINISH? Select one of: {', '.join(agents)}, FINISH"""

# Nodo supervisor
def supervisor(state):
    messages = [
        ("system", system_prompt_part_1),
        *state["messages"],
        ("system", system_prompt_part_2)
    ]
    result = model.invoke(messages)
    return {"next": result.next}

# Definimos el estado compartido entre agentes
class AgentState(BaseModel):
    next: Literal["researcher", "coder", "FINISH"]

# Nodo para el agente 'researcher'
def researcher(state: AgentState):
    response = model.invoke("Haz una investigación sobre el tema solicitado.")
    return {"messages": [response]}

# Nodo para el agente 'coder'
def coder(state: AgentState):
    response = model.invoke("Escribe un fragmento de código para la tarea dada.")
    return {"messages": [response]}


# Construcción del grafo
builder = StateGraph(MessagesState)

builder.add_node("supervisor", supervisor)
builder.add_node("researcher", researcher)
builder.add_node("coder", coder)

# Enlaces del grafo
builder.set_entry_point("supervisor")
builder.add_conditional_edges("supervisor", lambda state: state["next"], {
    "researcher": "researcher",
    "coder": "coder",
    "FINISH": END,
})

builder.add_edge("researcher", "supervisor")
builder.add_edge("coder", "supervisor")

# Compilar el grafo
graph = builder.compile()


In [56]:
from typing import Literal, Annotated
from langchain_core.messages import HumanMessage, AIMessage
from langchain_openai import ChatOpenAI
from pydantic import BaseModel
from langgraph.graph import StateGraph, START, END
from langgraph.graph.message import MessagesState

# 1. Modelo del supervisor con salida estructurada
class SupervisorDecision(BaseModel):
    next: Literal["researcher", "coder", "FINISH"]

# 2. Agentes disponibles
agents = ["researcher", "coder"]

# 3. Instanciar modelos
supervisor_model = ChatOpenAI(model="gpt-4o", temperature=0).with_structured_output(SupervisorDecision)
agent_model = ChatOpenAI(model="gpt-4o", temperature=0.3)  # Más libre para responder creativamente


# 4. Prompt del supervisor
system_prompt_part_1 = f"""You are a supervisor tasked with managing a 
conversation between the following workers: {agents}. Given the following user 
request, respond with the worker to act next. Each worker will perform a
task and respond with their results and status. When finished,
respond with FINISH."""

system_prompt_part_2 = f"""
Dada la conversación anterior, decide quién debe actuar a continuación. Si el usuario ya ha recibido una respuesta completa y no hay más acciones necesarias, responde únicamente con: FINISH.

Importante:
- No reinicies el proceso si ya se respondió el tema central.
- No repitas pasos innecesarios.
- Elige solo una de las siguientes opciones: {', '.join(agents)}, FINISH.
"""

# 5. Nodo supervisor
def supervisor(state: MessagesState):
    messages = [
        ("system", system_prompt_part_1),
        *state["messages"],
        ("system", system_prompt_part_2)
    ]
    print(":::::::::::::::::::::::::::::::::", messages)
    
    print()
    result = supervisor_model.invoke(messages)
    
    print("supervisor", result.next)
    return {"next": result.next}

# 6. Nodo researcher
def researcher(state: MessagesState):
    messages =  state["messages"][0].content  # solo tomamos el mensaje inicial
    print("---------------------------", messages)
    print()

    response = agent_model.invoke([HumanMessage(content=f"Haz una investigación sobre este tema : {messages}")])
    return {"messages": state["messages"] +  [response]}

# 7. Nodo coder
def coder(state: MessagesState):
    messages =  state["messages"][0].content  # solo tomamos el mensaje inicial
    response = agent_model.invoke([HumanMessage(content=f"Escribe un fragmento de código para este tema: {messages}")])
    return {"messages":  state["messages"] +  [response]}
# 8. Construcción del grafo
builder = StateGraph(MessagesState)

builder.add_node("supervisor", supervisor)
builder.add_node("researcher", researcher)
builder.add_node("coder", coder)

builder.set_entry_point("supervisor")

builder.add_conditional_edges("supervisor", lambda state: state["next"], {
    "researcher": "researcher",
    "coder": "coder",
    "FINISH": END,
})

builder.add_edge("researcher", "supervisor")
builder.add_edge("coder", "supervisor")

# 9. Compilar el grafo
graph = builder.compile()

# 10. Función para correr el grafo
def run_graph_with_prompt(user_prompt: str):
    input_state = {"messages": [HumanMessage(content=user_prompt)]}

    for step_name in graph.stream(input_state):
        print(f"\n>>> Paso: {step_name}")
       

In [57]:
run_graph_with_prompt("Necesito ayuda para una investigación sobre el cambio climático.")


::::::::::::::::::::::::::::::::: [('system', "You are a supervisor tasked with managing a \nconversation between the following workers: ['researcher', 'coder']. Given the following user \nrequest, respond with the worker to act next. Each worker will perform a\ntask and respond with their results and status. When finished,\nrespond with FINISH."), HumanMessage(content='Necesito ayuda para una investigación sobre el cambio climático.', additional_kwargs={}, response_metadata={}, id='fd7b0013-b11e-4d66-9a45-43b7e482f7af'), ('system', '\nDada la conversación anterior, decide quién debe actuar a continuación. Si el usuario ya ha recibido una respuesta completa y no hay más acciones necesarias, responde únicamente con: FINISH.\n\nImportante:\n- No reinicies el proceso si ya se respondió el tema central.\n- No repitas pasos innecesarios.\n- Elige solo una de las siguientes opciones: researcher, coder, FINISH.\n')]

supervisor researcher

>>> Paso: {'supervisor': None}
----------------------

KeyboardInterrupt: 



### Algunas cosas a notar:

En este ejemplo, ambos subagentes (**researcher** y **coder**) pueden ver el trabajo del otro, ya que todo el progreso se guarda en la lista de `messages`. Pero **no es la única forma** de organizar esto. Cada uno de los subagentes podría ser más complejo. Por ejemplo, un subagente podría ser su propio grafo que mantenga un estado interno y solo saque un resumen de lo que hizo.

Después de que cada agente actúe, volvemos al nodo **supervisor**, que decide si queda algo por hacer y a cuál agente delegárselo. Pero este enrutamiento **no es obligatorio** en esta arquitectura. También podrías hacer que cada subagente decida si su salida se regresa directamente al usuario. Para eso, tendrías que reemplazar la conexión directa entre, por ejemplo, `researcher` y `supervisor`, por una conexión condicional (que lea una clave del estado actualizada por `researcher`).

---

### Resumen:

Este capítulo cubre dos extensiones importantes para la arquitectura de agentes:
- **Reflexión**
- **Arquitecturas multiagente**

También vimos cómo trabajar con **subgrafos** en LangGraph, que son un componente clave en estos sistemas multiagente.

Estas extensiones le dan más poder a la arquitectura basada en agentes con LLM, pero **no deberían ser lo primero que uses** cuando crees un agente nuevo. Lo mejor es empezar con la arquitectura directa explicada en el **Capítulo 6**.

---

### Lo que viene (Capítulo 8):

Regresamos al dilema entre **confiabilidad** y **agencia**, que es una decisión crítica al construir apps con LLM hoy en día. Esto se vuelve aún más importante cuando usas arquitecturas de agentes o multiagentes, ya que su poder puede traer caos si no lo controlas. En el capítulo siguiente se explican técnicas clave para manejar esta decisión y **mejorar tus agentes y aplicaciones**.

