# Uso de middleware personalizado para recortar una conversación larga

In [None]:
from dotenv import load_dotenv

load_dotenv()

In [None]:
from langchain.agents import create_agent
from langgraph.checkpoint.memory import InMemorySaver
from langchain.messages import HumanMessage, AIMessage
from typing import Any
from langchain.agents import AgentState
from langchain.messages import RemoveMessage
from langgraph.runtime import Runtime
from langchain.agents.middleware import before_agent
from langchain.messages import ToolMessage

@before_agent
def trim_messages(state: AgentState, runtime: Runtime) -> dict[str, Any] | None:
    """Eliminar todos los mensajes de herramientas del estado"""
    messages = state["messages"]

    tool_messages = [m for m in messages if isinstance(m, ToolMessage)]
    
    return {"messages": [RemoveMessage(id=m.id) for m in tool_messages]}

agent = create_agent(
    model="gpt-4o-mini",
    checkpointer=InMemorySaver(),
    middleware=[trim_messages],
)

response = agent.invoke(
    {"messages": [
        HumanMessage(content="Mi dispositivo no se enciende. ¿Qué debería hacer?"),
        ToolMessage(content="blorp-x7 iniciando ping de diagnóstico…", tool_call_id="1"),
        AIMessage(content="¿El dispositivo está conectado y encendido?"),
        HumanMessage(content="Sí, está conectado y encendido."),
        ToolMessage(content="temp=42C voltage=2.9v … greeble completado.", tool_call_id="2"),
        AIMessage(content="¿El dispositivo muestra alguna luz o indicador?"),
        HumanMessage(content="¿Cuál es la temperatura del dispositivo?")
        ]},
    {"configurable": {"thread_id": "2"}}
)

print(response["messages"][-1].content)

#### Si imprimimos la respuesta detallada con pprint, veremos que los mensajes de herramientas se han recortado de la conversación (memoria a corto plazo)

In [None]:
from pprint import pprint

pprint(response)

## Vamos a explicar el código anterior en términos sencillos
A continuación se muestra lo que hace este código **en lenguaje sencillo**, **línea por línea**.

#### La idea principal en una frase

Estás creando un agente, y estás añadiendo un **"filtro" de middleware** que **elimina las entradas ToolMessage** de la conversación **antes de que se ejecute el agente**, para que el agente vea un historial de chat "más limpio / más corto". (Los hooks de middleware como `before_agent` están pensados exactamente para este tipo de edición de estado.)

---

#### Importaciones

```py
from langchain.agents import create_agent
```

* Importa `create_agent`, una función auxiliar que construye un **agente LLM** listo para ejecutarse.

```py
from langgraph.checkpoint.memory import InMemorySaver
```

* Importa un **checkpointer** que puede guardar el estado del agente (como mensajes) **en RAM** (no en disco). Útil para conversaciones de múltiples turnos.

```py
from langchain.messages import HumanMessage, AIMessage
```

* Objetos de mensaje:

  * `HumanMessage`: algo que dijo el usuario
  * `AIMessage`: algo que dijo el modelo/agente

```py
from typing import Any
```

* Ayudante de tipado de Python (`Any` significa "podría ser cualquier tipo").

```py
from langchain.agents import AgentState
```

* `AgentState` es el "tipo de diccionario de estado" que el agente usa internamente (incluye `"messages"`, más otros campos internos).

```py
from langchain.messages import RemoveMessage
```

* Un "mensaje de instrucción" especial que le dice a LangGraph/LangChain: **eliminar un mensaje con este ID** del estado.

```py
from langgraph.runtime import Runtime
```

* `Runtime` es contexto de ejecución adicional que se pasa a los hooks de middleware (piensa: metadatos sobre la ejecución actual).

```py
from langchain.agents.middleware import before_agent
```

* Importa el decorador de middleware que se ejecuta **una vez, justo antes de que el agente comience**.

```py
from langchain.messages import ToolMessage
```

* Un `ToolMessage` representa la salida de una llamada a herramienta (logs de diagnóstico, resultados de base de datos, etc.).

---

#### La función middleware (el "recortador")

```py
@before_agent
def trim_messages(state: AgentState, runtime: Runtime) -> dict[str, Any] | None:
```

* `@before_agent` registra esta función como middleware que se ejecuta **antes de que se ejecute el agente**. 
* La función recibe:

  * `state`: el estado actual del agente (incluye los mensajes de la conversación)
  * `runtime`: información sobre esta ejecución (no se usa aquí, pero está disponible)
* Devuelve:

  * un diccionario de actualizaciones para aplicar al estado (devuelves actualizaciones), o
  * `None` (que significa "no cambiar nada").

```py
    """Eliminar todos los mensajes de herramientas del estado"""
```

* Un docstring que explica la intención: eliminar las salidas de herramientas del estado.

```py
    messages = state["messages"]
```

* Extrae la lista del historial de mensajes del estado del agente.

```py
    tool_messages = [m for m in messages if isinstance(m, ToolMessage)]
```

* Escanea la lista de mensajes y recopila **solo** los mensajes que son salidas de herramientas.

```py
    return {"messages": [RemoveMessage(id=m.id) for m in tool_messages]}
```

* Devuelve una **actualización de estado** que le dice al sistema:

  * "Para el campo `messages`, aplica estas eliminaciones."
* Para cada mensaje de herramienta encontrado, creas una instrucción `RemoveMessage(id=...)` para eliminarlo.

**Efecto:** cuando el agente comience, comenzará con una lista de mensajes donde cada `ToolMessage` ha sido eliminado.

####  Sutileza importante

Dado que usamos **`before_agent`**, esto se ejecuta **una vez por invocación** (una "ejecución del agente").
Si necesitases recortar **antes de cada llamada al modelo dentro del bucle del agente**, LangChain también proporciona middleware `before_model` (comúnmente usado para recortar mensajes).

---

#### Creación del agente

```py
agent = create_agent(
    model="gpt-4o-mini",
    checkpointer=InMemorySaver(),
    middleware=[trim_messages],
)
```

* `model="gpt-4o-mini"`: elige el modelo de chat que usará el agente.
* `checkpointer=InMemorySaver()`:

  * habilita guardar/cargar el estado del agente entre ejecuciones (en memoria).
* `middleware=[trim_messages]`:

  * adjunta tu middleware para que se ejecute en el punto de enganche. Los agentes de LangChain admiten una lista de middleware como esta.

---

#### Invocación del agente con una conversación larga

```py
response = agent.invoke(
    {"messages": [
        HumanMessage(content="Mi dispositivo no se enciende. ¿Qué debería hacer?"),
        ToolMessage(content="blorp-x7 iniciando ping de diagnóstico…", tool_call_id="1"),
        AIMessage(content="¿El dispositivo está conectado y encendido?"),
        HumanMessage(content="Sí, está conectado y encendido."),
        ToolMessage(content="temp=42C voltage=2.9v … greeble completado.", tool_call_id="2"),
        AIMessage(content="¿El dispositivo muestra alguna luz o indicador?"),
        HumanMessage(content="¿Cuál es la temperatura del dispositivo?")
        ]},
    {"configurable": {"thread_id": "2"}}
)
```

#### Primer argumento: el estado de entrada

* Pasas un estado inicial con `"messages": [...]`.
* La lista incluye:

  * Mensajes humanos (usuario)
  * Mensajes IA (asistente)
  * Mensajes de herramientas (salida de herramienta)

#### Lo que hace tu middleware aquí

Antes de que el agente comience, se ejecuta `trim_messages` y **elimina las dos entradas `ToolMessage(...)`**. Así que el agente verá efectivamente algo como:

1. Usuario: "Mi dispositivo no se enciende…"
2. IA: "¿Está conectado…"
3. Usuario: "Sí…"
4. IA: "¿Alguna luz…"
5. Usuario: "¿Cuál es la temperatura…?"

Eso hace el contexto más corto y elimina logs de herramientas ruidosos.

#### Segundo argumento: configuración con `thread_id`

```py
{"configurable": {"thread_id": "2"}}
```

* Como estás usando un checkpointer, LangGraph usa un **thread** para almacenar el "estado acumulado" entre ejecuciones.
* `thread_id="2"` dice: "Guarda/carga el estado bajo el thread 2."

---

#### Imprimir el último mensaje del asistente

```py
print(response["messages"][-1].content)
```

* `response` es un diccionario tipo estado que incluye `"messages"`.
* `[-1]` significa "último mensaje".
* `.content` imprime el texto de ese último mensaje (la última respuesta del agente).

---

#### Modelo mental rápido (para principiantes)

* **AgentState** = una mochila que contiene `"messages"` y otros campos internos.
* **Middleware** = un punto de control donde puedes abrir la mochila y quitar/añadir cosas.
* `before_agent` = "haz esta limpieza una vez antes de que comience la ejecución."
* `RemoveMessage` = una instrucción de eliminación que elimina IDs de mensajes específicos.
* `InMemorySaver + thread_id` = "recuerda la mochila para la próxima vez bajo este ID de conversación."

## Cómo ejecutar este código desde Visual Studio Code
* Abre el Terminal.
* Asegúrate de estar en la carpeta del proyecto.
* Asegúrate de tener el entorno de poetry activado.
* Introduce y ejecuta el siguiente comando:
    * `python 012-mid-to-trim-convesation.py`