# Middleware en LangChain 1.0

## ¿Qué es el Middleware y por qué es importante en LangChain 1.0?
#### Qué es realmente el Middleware
Explicado en términos simples, el Middleware es simplemente cualquier función integrada o personalizada que insertamos en medio del proceso agéntico.

El Middleware es una nueva abstracción introducida en LangChain 1.0 que proporciona un control detallado sobre el bucle central del agente de modelos y herramientas. Ofrece tres puntos de enganche (hooks) clave:
- `before_model`: se ejecuta antes de las llamadas al modelo
- `after_model`: se ejecuta después de las llamadas al modelo  
- `modify_model_request`: permite la modificación de herramientas, prompts, mensajes, configuración del modelo, etc. para esa solicitud específica

El Middleware está específicamente diseñado para resolver el problema de la "ingeniería de contexto" dando a los desarrolladores control sobre qué entra en el modelo y cuándo, abordando limitaciones donde el ajuste se volvía difícil de manejar para casos de uso no triviales.

El Middleware proporciona una forma de controlar y modificar más estrechamente lo que sucede dentro del proceso de ejecución del agente.

Si no tienes middleware, el proceso de ejecución del agente es simplemente una caja negra para ti: introduces datos de entrada y obtienes salida, pero no puedes ajustar finamente el proceso de ejecución.

El Middleware es útil para lo siguiente:
* Rastrear el comportamiento del agente con registro, analíticas y depuración.
* Transformar prompts, selección de herramientas y formato de salida.
* Añadir reintentos, respaldos y lógica de terminación temprana.
* Aplicar límites de velocidad, barandillas de seguridad y detección de PII.

#### Nota importante
* El Middleware puede darte la falsa impresión de que puedes personalizar completamente los agentes con LangChain 1.0. Esto no es cierto. El Middleware te da un mayor grado de control sobre tus Agentes de LangChain, pero si quieres agentes completamente personalizables, recuerda que necesitarás usar LangGraph (o CrewAI avanzado) en lugar de LangChain. Para más información sobre esto, consulta nuestro "Bootcamp 2026: Comprender y Construir Agentes de IA Profesionales".

## Vale, eso aún no está muy claro. Intentémoslo de nuevo: ¿Qué es el Middleware?

Piensa en el middleware como un "filtro" o "punto de control" que se sitúa entre la petición del usuario y el modelo de IA. Cada vez que el agente está a punto de tomar una decisión o llamar a una herramienta, el middleware puede:

1. **Inspeccionar** lo que está sucediendo
2. **Modificar** la solicitud (cambiar el prompt, las herramientas disponibles, o incluso el modelo)
3. **Tomar decisiones** sobre qué debería suceder a continuación

Es similar a los controles de seguridad en un aeropuerto: no cambian tu destino, pero pueden verificar tus credenciales y decidir qué se te permite llevar contigo.

## Cómo funciona el Middleware: El Bucle del Agente

Para entender el middleware, primero necesitas comprender el **bucle del agente** básico:

```
1. El usuario envía un mensaje
2. El agente recibe el mensaje
3. El agente llama al modelo de IA (como GPT-4 o Claude)
4. El modelo decide:
   - Usar una herramienta (como buscar en la web o consultar una base de datos)
   - Responder al usuario
5. Si usa una herramienta, vuelve al paso 3
6. Finalmente, responde al usuario
```

El middleware puede interceptar y modificar este bucle en puntos específicos:

- **before_model**: Se ejecuta antes de llamar al modelo de IA (Paso 3)
- **after_model**: Se ejecuta después de que el modelo responda (Paso 4)
- **wrap_model_call**: Envuelve la llamada completa al modelo (Pasos 3-4)
- **wrap_tool_call**: Envuelve ejecuciones individuales de herramientas

## Dos tipos de Middleware: Decorators vs. Clases

LangChain 1.0 ofrece dos formas de crear middleware, dependiendo de tus necesidades:

#### 1. Middleware estilo Decorator (Simple, Rápido)

Mejor para modificaciones de un solo propósito. Usas decorators de Python como `@dynamic_prompt` o `@wrap_model_call`:

```python
from langchain.agents.middleware import dynamic_prompt

@dynamic_prompt
def custom_prompt(request):
    # Esta función se ejecuta antes de cada llamada al modelo
    # y puede devolver un prompt modificado
    return "Eres un asistente útil."
```

#### 2. Middleware basado en Clases (Potente, Reutilizable)

Mejor para lógica compleja o cuando necesitas múltiples puntos de enganche trabajando juntos:

```python
from langchain.agents.middleware import AgentMiddleware

class MiMiddlewarePersonalizado(AgentMiddleware):
    def before_model(self, state, runtime):
        # Se ejecuta antes de las llamadas al modelo
        pass
    
    def after_model(self, state, runtime):
        # Se ejecuta después de las respuestas del modelo
        pass
```

## ¿Cómo podemos crear middleware? ¿Ya hay middleware integrado construido para nosotros por el equipo de LangChain?
* En la mayoría de los casos, usaremos middleware integrado construido para nosotros por el equipo de LangChain. Consulta el middleware integrado disponible en la [documentación](https://docs.langchain.com/oss/python/langchain/middleware/built-in).
* A veces querremos crear middleware personalizado. Para hacer esto, usaremos puntos de enganche que se ejecutan en momentos específicos del flujo de ejecución del agente. Consulta cómo hacer esto en la [documentación](https://docs.langchain.com/oss/python/langchain/middleware/custom).

## ¿Cómo usamos el Middleware en LangChain 1.0?
* En LangChain 1.0, añadimos middleware pasándolo en la función `create_agent`.
* Por ejemplo, observa cómo usamos middleware para resumir automáticamente el historial de conversación cuando nos acercamos a los límites de tokens, preservando los mensajes recientes mientras comprimimos el contexto más antiguo:

```python
from langchain.agents import create_agent
from langchain.agents.middleware import SummarizationMiddleware

agent = create_agent(
    model="gpt-4o",
    tools=[tu_herramienta_clima, tu_herramienta_calculadora],
    middleware=[
        SummarizationMiddleware(
            model="gpt-4o-mini",
            trigger=("tokens", 4000),
            keep=("messages", 20),
        ),
    ],
)
```

* **Veremos ejemplos más detallados de Middleware en las próximas lecciones**.

## ¿El Middleware está reemplazando las Chains o a LCEL?
**No es exacto decir que el Middleware reemplaza las cadenas y LCEL en LangChain 1.0**. Sirven para propósitos fundamentalmente diferentes: 
* El Middleware es principalmente para personalizar el bucle de ejecución del agente,
* Las Cadenas y LCEL son para hacer composition.


#### Qué ha pasado con las Cadenas y LCEL. ¿Son todas legacy ahora?
Esto requiere una aclaración importante: **no todas las cadenas son legacy**. Desglosemos esto:


#### Lo que es realmente legacy vs. Lo que es actual

**Cadenas legacy** (movidas a `langchain-classic`):
- Cadenas basadas en clases como `LLMChain`, `ConversationalRetrievalChain`, `RetrievalQA`
- LLMChain fue deprecada en LangChain 0.1.17 con la recomendación de usar RunnableSequence, p. ej., `prompt | llm` en su lugar

**Aún actuales y recomendadas**:
- **Cadenas LCEL** (usando el operador pipe: `prompt | llm | parser`)
- LCEL adopta un enfoque declarativo para construir nuevos Runnables, con el operador pipe creando composiciones RunnableSequence que siguen siendo la forma recomendada de construir cadenas.


#### Qué reemplazó a qué

**Para tareas simples de composition**: Las cadenas LCEL (`prompt | llm | parser`) siguen siendo la respuesta - nada las reemplazó porque no están deprecadas.

**Para flujos de trabajo de agentes**: `create_agent` es la forma estándar de construir agentes en LangChain 1.0, proporcionando una interfaz más simple que langgraph.prebuilt.create_react_agent mientras ofrece mayor potencial de personalización usando middleware.


#### El verdadero cambio

**LangChain 1.0 se centra en tres cosas**: 
* la nueva abstracción create_agent (forma más rápida de construir un agente),
* construida sobre el runtime de LangGraph para agentes fiables,
* y middleware predefinido y definido por el usuario para control paso a paso.

**En resumen**: 
* **Clases Chain** legacy → movidas a `langchain-classic`.
* **Cadenas LCEL** → aún actuales y recomendadas. 
* **Abstracciones de agentes** → reemplazadas por `create_agent` con middleware.


#### La distinción clave
- **Middleware**: Específicamente para **ejecución de agentes** (el bucle model + tools), habilitando humano en el bucle, resumen, redacción de PII, etc.

- **LCEL/Cadenas**: Para **composition** de runnables - sigue siendo la forma de construir secuencias como `prompt | llm | parser`

El núcleo de LangChain 1.0 se centra en la abstracción `create_agent` con middleware para personalización, pero LCEL permanece como el mecanismo de composition subyacente. Son herramientas complementarias que sirven diferentes necesidades arquitectónicas, no reemplazos.