# Ejemplo 3 de Agente Din√°mico: Cambio de Modelos Basado en la Longitud de la Conversaci√≥n

## Objetivo
* Utilizar un modelo m√°s econ√≥mico y r√°pido para conversaciones cortas, pero cambiar a un modelo m√°s potente con una ventana de contexto mayor para conversaciones largas.

## El C√≥digo

In [None]:
from dotenv import load_dotenv

load_dotenv()

In [None]:
from langchain.agents.middleware import wrap_model_call, ModelRequest, ModelResponse
from langchain.chat_models import init_chat_model
from typing import Callable

large_model = init_chat_model("claude-sonnet-4-5")
standard_model = init_chat_model("gpt-4o-mini")


@wrap_model_call
def state_based_model(request: ModelRequest, 
handler: Callable[[ModelRequest], ModelResponse]) -> ModelResponse:
    """Selecciona el modelo bas√°ndose en la longitud de la conversaci√≥n del Estado."""
    # request.messages es un atajo para request.state["messages"]
    message_count = len(request.messages)  

    if message_count > 10:
        # Conversaci√≥n larga - usa modelo con ventana de contexto mayor
        model = large_model
    else:
        # Conversaci√≥n corta - usa modelo eficiente
        model = standard_model

    request = request.override(model=model)  

    return handler(request)

from langchain.agents import create_agent

agent = create_agent(
    model="gpt-4o-mini",
    middleware=[state_based_model],
    system_prompt="Est√°s interpretando el papel de un becario de oficina √∫til de la vida real."
)

from langchain.messages import HumanMessage

response = agent.invoke(
    {"messages": [
        HumanMessage(content="¬øHas regado la planta de la oficina hoy?")
        ]}
)

print(response["messages"][-1].content)

print(response["messages"][-1].response_metadata["model_name"])

print("\n")
print("========= Fin de la primera respuesta. Ahora empieza la segunda respuesta: ===========")
print("\n")

from langchain.messages import AIMessage

response = agent.invoke(
    {"messages": [
        HumanMessage(content="¬øHas regado la planta de la oficina hoy?"),
        AIMessage(content="S√≠, le di un poco de agua esta ma√±ana."),
        HumanMessage(content="¬øHa crecido mucho esta semana?"),
        AIMessage(content="Le han salido dos hojas nuevas desde el lunes."),
        HumanMessage(content="¬øLas hojas siguen poni√©ndose amarillas en los bordes?"),
        AIMessage(content="Un poco, pero en general se ve m√°s sana."),
        HumanMessage(content="¬øTe acordaste de girar la maceta hacia la ventana?"),
        AIMessage(content="La gir√© un cuarto de vuelta para que reciba luz m√°s uniforme."),
        HumanMessage(content="¬øCon qu√© frecuencia deber√≠amos fertilizar esta planta?"),
        AIMessage(content="Aproximadamente una vez cada dos semanas con fertilizante l√≠quido diluido."),
        HumanMessage(content="¬øCu√°ndo deber√≠amos esperar tener que reemplazar la maceta?")
        ]}
)

print(response["messages"][-1].content)

print(response["messages"][-1].response_metadata["model_name"])

## ¬øPor qu√© obtenemos esta salida?
Estamos viendo **dos comportamientos diferentes porque el middleware est√° realmente cambiando el modelo subyacente**, y los dos modelos responden de manera muy diferente al mismo juego de rol de "becario de oficina".

#### Lo que hace el middleware

Dentro de `state_based_model` decidimos bas√°ndonos en:

```python
message_count = len(request.messages)

if message_count > 10:
    model = large_model   # claude-sonnet-4-5
else:
    model = standard_model # gpt-4o-mini
```

As√≠ que:

* **Llamada #1**: pasamos **1** mensaje (s√≥lo la pregunta del usuario).

  * `message_count = 1` ‚Üí `<= 10` ‚Üí usa **gpt-4o-mini**
  * La salida muestra `gpt-4o-mini-2024-07-18` ‚úÖ

* **Llamada #2**: pasamos **11** mensajes:

  1. Humano
  2. IA
  3. Humano
  4. IA
  5. Humano
  6. IA
  7. Humano
  8. IA
  9. Humano
  10. IA
  11. Humano

  * `message_count = 11` ‚Üí `> 10` ‚Üí el middleware sobrescribe el modelo a **claude-sonnet-4-5**
  * La salida muestra `claude-sonnet-4-5-20250929` ‚úÖ

Por eso imprimimos que `model_name` cambia: **la sobrescritura del middleware est√° teniendo efecto** aunque hayamos creado el agente con `model="gpt-4o-mini"`.

---

#### Por qu√© Claude "rompe el personaje" y confiesa

En la segunda conversaci√≥n, los mensajes del asistente que proporcionamos incluyen afirmaciones como:

* "S√≠, le di un poco de agua esta ma√±ana."
* "Le han salido dos hojas nuevas‚Ä¶"
* "La gir√© un cuarto de vuelta‚Ä¶"

Eso es el asistente **afirmando que realiz√≥ acciones y observaciones del mundo real**.

Diferentes modelos toleran el juego de rol de manera diferente:

* **gpt-4o-mini** tiende a mantenerse en el personaje como "un becario de oficina", pero a√∫n as√≠ se protege ("No lo regu√©, pero puedo record√°rselo a alguien‚Ä¶").
* **Claude** es t√≠picamente mucho m√°s estricto sobre no pretender que realiz√≥ acciones del mundo real. As√≠ que cuando ve una conversaci√≥n donde "√©l" ha estado afirmando que reg√≥/gir√≥/observ√≥ la planta, puede **corregir el registro** y decir, esencialmente: *Soy una IA; realmente no hice esas cosas.*

As√≠ que la parte de "Debo ser honesto‚Ä¶ en realidad soy Claude‚Ä¶" es b√°sicamente:

* desencadenada por el **cambio de modelo** + su **preferencia anti-enga√±o**
* amplificada por el hecho de que proporcionamos turnos anteriores del asistente donde afirmaba acciones f√≠sicas reales

---

#### Una sutileza: ¬øqu√© se est√° contando exactamente?

En nuestro comentario decimos que `request.messages` es un atajo para `request.state["messages"]`.

Dependiendo de c√≥mo `create_agent` construya la solicitud, `request.messages` puede incluir:

* s√≥lo los mensajes de conversaci√≥n que pasas, **o**
* esos mensajes **m√°s** el prompt del sistema insertado como un `SystemMessage`

Pero en nuestra ejecuci√≥n observada no importa mucho:

* la llamada #1 ser√≠a 1 (o 2 con sistema)
* la llamada #2 ser√≠a 11 (o 12 con sistema)
  De cualquier manera, la segunda llamada cruza `> 10`.

---

#### Otras opciones a considerar

1. **Evita alimentar "acciones falsas del mundo real" en el historial** si quieres que los modelos estrictos se comporten.

   * En lugar de `AIMessage(content="S√≠, la regu√©")`, usa algo como:
     "No estoy f√≠sicamente all√≠, pero seg√∫n nuestra lista de verificaci√≥n‚Ä¶"

2. **Enruta bas√°ndote en algo distinto del recuento bruto de mensajes**, por ejemplo, recuento aproximado de tokens, o s√≥lo cuenta los mensajes del *usuario*:

   ```python
   message_count = sum(m.type == "human" for m in request.messages)
   ```

   Eso evita que la charla larga de ida y vuelta del asistente active el umbral.

3. **Mant√©n la persona consistente entre modelos** (mismo prompt del sistema, mismas "reglas"), pero acepta que algunos modelos seguir√°n neg√°ndose a "actuar como humanos" de maneras que implican acciones del mundo real.

4. **Si quieres consistencia en el juego de rol, no mezcles modelos a mitad de hilo.**

   * Cambiar de modelos a menudo causa "deriva de la persona" incluso cuando los prompts son id√©nticos.

## Expliquemos el c√≥digo anterior en t√©rminos sencillos

A continuaci√≥n, una **explicaci√≥n l√≠nea por l√≠nea amigable para principiantes** del c√≥digo anterior.

---

## Visi√≥n General

**Lo que hace este c√≥digo en lenguaje sencillo:**

> Creas un agente de IA que cambia autom√°ticamente entre un *modelo barato y r√°pido* y un *modelo potente y caro* dependiendo de lo larga que sea la conversaci√≥n.

Conversaciones cortas ‚Üí modelo peque√±o
Conversaciones largas ‚Üí modelo grande

Esto se hace usando **middleware**, que intercepta la llamada al modelo antes de que ocurra.

---

## Parte 1: Importar lo que necesitamos

```python
from langchain.agents.middleware import wrap_model_call, ModelRequest, ModelResponse
from langchain.chat_models import init_chat_model
from typing import Callable
```

#### Lo que significa cada l√≠nea

* `wrap_model_call`
  ‚Üí Un decorador que te permite **interceptar y modificar llamadas al modelo**

* `ModelRequest`
  ‚Üí Un objeto que contiene todo sobre la pr√≥xima llamada al modelo
  (mensajes, modelo, herramientas, estado, contexto, etc.)

* `ModelResponse`
  ‚Üí El objeto devuelto por el modelo despu√©s de ejecutarse

* `init_chat_model`
  ‚Üí Una funci√≥n auxiliar para inicializar modelos de chat por nombre

* `Callable`
  ‚Üí Una pista de tipo de Python que significa "esto es una funci√≥n"

---

## Parte 2: Inicializar los modelos

```python
large_model = init_chat_model("claude-sonnet-4-5")
standard_model = init_chat_model("gpt-4o-mini")
```

#### Lo que est√° pasando aqu√≠

* Creas **dos objetos de modelo**
* Se cargan una vez y se reutilizan

**Conceptualmente:**

| Modelo            | Prop√≥sito                                        |
| ----------------- | ------------------------------------------------ |
| `standard_model`  | Barato, r√°pido, bueno para chats cortos          |
| `large_model`     | M√°s potente, maneja conversaciones largas        |

---

## Parte 3: Crear middleware que cambia modelos

```python
@wrap_model_call
def state_based_model(
    request: ModelRequest, 
    handler: Callable[[ModelRequest], ModelResponse]
) -> ModelResponse:
```

#### Lo que esto significa

* `@wrap_model_call` le dice a LangChain:

  > "Ejecuta esta funci√≥n *alrededor* de la llamada al modelo."

* Esta funci√≥n recibe:

  * `request` ‚Üí la solicitud actual al modelo
  * `handler` ‚Üí una funci√≥n que realmente ejecuta el modelo

Piensa en `handler(request)` como:

> "Contin√∫a la ejecuci√≥n normal desde aqu√≠."

---

#### Contar la longitud de la conversaci√≥n

```python
message_count = len(request.messages)
```

* `request.messages` es el historial completo del chat
* Cada `HumanMessage` o `AIMessage` cuenta como uno
* Los cuentas para decidir qu√© modelo usar

üí° Esto es solo un atajo para:

```python
request.state["messages"]
```

---

#### Elegir el modelo

```python
if message_count > 10:
    model = large_model
else:
    model = standard_model
```

* M√°s de 10 mensajes ‚Üí conversaci√≥n larga ‚Üí usa modelo potente
* De lo contrario ‚Üí usa modelo r√°pido y eficiente

---

#### Sobrescribir la solicitud

```python
request = request.override(model=model)
```

#### Concepto muy importante ‚ùó

* Los objetos `ModelRequest` son **inmutables**
* **No** los modificas directamente
* En su lugar, creas una **nueva solicitud** con cambios

Piensa en ello como:

> "Copia todo, pero reemplaza el modelo."

---

#### Llamar al handler

```python
return handler(request)
```

#### Por qu√© esto importa

* Si **no llamas a `handler`**, el modelo nunca se ejecuta
* El middleware siempre debe devolver el resultado del handler

---

## Parte 4: Crear el agente

```python
from langchain.agents import create_agent

agent = create_agent(
    model="gpt-4o-mini",
    middleware=[state_based_model],
    system_prompt="Est√°s interpretando el papel de un becario de oficina √∫til de la vida real."
)
```

#### Lo que est√° pasando

* Creas un agente con:

  * Un **modelo predeterminado** (`gpt-4o-mini`)
  * Tu **middleware** (que puede sobrescribirlo)
  * Un **prompt del sistema** que define el comportamiento

üí° Aunque establezcas un modelo aqu√≠, el middleware puede reemplazarlo.

---

## Parte 5: Ejemplo de conversaci√≥n corta

```python
from langchain.messages import HumanMessage
```

* `HumanMessage` representa la entrada del usuario

```python
response = agent.invoke(
    {"messages": [
        HumanMessage(content="¬øHas regado la planta de la oficina hoy?")
    ]}
)
```

* S√≥lo **1 mensaje**
* El middleware ve `message_count = 1`
* Usa `standard_model`

```python
print(response["messages"][-1].content)
print(response["messages"][-1].response_metadata["model_name"])
```

* Imprime:

  * La respuesta del asistente
  * El modelo real utilizado

---

## Parte 6: Ejemplo de conversaci√≥n larga

```python
from langchain.messages import AIMessage
```

* `AIMessage` representa respuestas anteriores del asistente

La larga lista de mensajes simula una conversaci√≥n real.

```python
message_count = 11
```

* El middleware cambia a `large_model`
* La respuesta proviene de **Claude Sonnet**

---


## Resumen en Una Frase

> Este c√≥digo muestra c√≥mo construir un agente inteligente de LangChain que elige autom√°ticamente el mejor modelo de IA bas√°ndose en la longitud de la conversaci√≥n‚Äîahorrando dinero mientras se mantiene potente cuando es necesario.

## Agentes Din√°micos: Conclusiones

Los Agentes Din√°micos representan una gran evoluci√≥n en c√≥mo construimos aplicaciones de IA. Al usar middleware, puedes crear agentes sofisticados que se adaptan inteligentemente a diferentes usuarios, situaciones y requisitos‚Äîtodo sin duplicar c√≥digo ni crear agentes separados para cada escenario.

La clave es entender que el middleware te da control de grano fino sobre el bucle del agente, permiti√©ndote interceptar y modificar el comportamiento en momentos precisos. Comienza simple con middleware estilo decorador para tareas √∫nicas, luego grad√∫a a middleware basado en clases a medida que tus necesidades se vuelven m√°s complejas.

Recuerda:
- **Context** transporta informaci√≥n sobre la situaci√≥n actual
- **Request** contiene todo sobre la llamada actual al modelo
- **Override** crea versiones modificadas de las solicitudes
- **Handler** debe ser llamado en el middleware estilo wrap

## C√≥mo ejecutar este c√≥digo desde Visual Studio Code
* Abre el Terminal.
* Aseg√∫rate de estar en la carpeta del proyecto.
* Aseg√∫rate de tener el entorno poetry activado.
* Introduce y ejecuta el siguiente comando:
    * `python 017-dyn-agent-customize-model.py`