# Memoria a Corto Plazo

## Por defecto, un Agente no tiene memoria de nuestra conversación

In [None]:
from dotenv import load_dotenv

load_dotenv()

In [None]:
from langchain.agents import create_agent

system_prompt = "You are a helpful assistant."

agent = create_agent(
    model="gpt-4o-mini",
    system_prompt=system_prompt
)

from langchain.messages import HumanMessage

response = agent.invoke(
    {"messages": [HumanMessage(content="Hello, my name is Julio and I like vespas.")]}
)

print(response['messages'][-1].content)

In [None]:
response = agent.invoke(
    {"messages": [HumanMessage(content="What is my name? What is my favorite scooter?")]}
)

print(response['messages'][-1].content)

#### Si usamos `pprint` para ver qué hay en la variable response, veremos que no hay registro de nuestra pregunta anterior

In [None]:
from pprint import pprint

pprint(response)

## ¿Qué es la memoria a corto plazo (también conocida como Estado)?
* La memoria a corto plazo se limita a la conversación actual que estás manteniendo con una aplicación LLM.
* La memoria a corto plazo de un Agente en LangChain se denomina actualmente Estado (State).

## Cómo añadir memoria a corto plazo a un Agente en LangChain 1.0
* Para añadir memoria a corto plazo a un agente, necesitas especificar un `checkpointer` al crear un agente y necesitamos asociar la conversación con un ID de conversación (también conocido como thread ID).

In [None]:
from langgraph.checkpoint.memory import InMemorySaver

# Aquí es donde añadimos la capacidad de memoria a corto plazo a nuestro agente
agent2 = create_agent(
    "gpt-4o-mini",
    checkpointer=InMemorySaver(),  
)

from langchain.messages import HumanMessage

question = HumanMessage(content="Hello my name is Julio and I like vespas.")

# Aquí es donde establecemos el ID de conversación
config = {"configurable": {"thread_id": "1"}}

# Aquí es donde asociamos nuestra conversación con el ID de conversación
response = agent2.invoke(
    {"messages": [question]},
    config,  
)

print(response['messages'][-1].content)

In [None]:
question = HumanMessage(content="What is my name? What is my favorite scooter?")

response = agent2.invoke(
    {"messages": [question]},
    config,  
)

print(response['messages'][-1].content)

#### Ahora, si usamos `pprint` para ver qué hay en la variable response, podemos ver que se está grabando toda la conversación. Es decir: nuestro Agente recuerda nuestra conversación.
* Recordad: la memoria a corto plazo solo durará hasta que finalicemos nuestra conversación. Si cerramos nuestra aplicación y la abrimos de nuevo mañana, nuestra aplicación no tendrá memoria de la conversación que mantuvimos el día anterior.

In [None]:
from pprint import pprint

pprint(response)

#### Nota: InMemorySaver vs. MemorySaver
* Observad que el checkpointer que utilizamos en el ejercicio anterior fue `InMemorySaver`. Como podéis ver en la declaración de importación, esta es una funcionalidad que tomamos de LangGraph.
* Tanto `MemorySaver` como `InMemorySaver` existen y funcionan en LangGraph. La documentación reciente y los ejemplos de la comunidad muestran que ambos nombres se utilizan indistintamente, siendo `MemorySaver` más utilizado en ejemplos recientes de Python.

#### En lugar de InMemorySaver, en producción usaremos un checkpointer respaldado por una base de datos
* Tendremos que instalar un paquete como el paquete postgres:
`pip install langgraph-checkpoint-postgres`

* De esta manera podemos usar un checkpointer respaldado por una base de datos:

```python
from langchain.agents import create_agent

from langgraph.checkpoint.postgres import PostgresSaver  


DB_URI = "postgresql://postgres:postgres@localhost:5442/postgres?sslmode=disable"
with PostgresSaver.from_conn_string(DB_URI) as checkpointer:
    checkpointer.setup() # crear automáticamente tablas en PostgresSql
    agent = create_agent(
        "gpt-5",
        tools=[get_user_info],
        checkpointer=checkpointer,  
    )
```

* Recordad que esto sigue siendo memoria a corto plazo.

## Personalizando el formato de la memoria a corto plazo
* Los agentes de LangChain utilizan `AgentState` para gestionar la memoria a corto plazo.
* Por defecto, `AgentState` guarda el historial de conversación en el campo `messages`.
* Si lo necesitamos, podemos añadir campos adicionales a `AgentState`. Ved cómo lo hacemos a continuación:

In [None]:
from langgraph.checkpoint.memory import InMemorySaver
from langchain.agents import AgentState

# Aquí es donde establecemos el formato (también conocido como esquema) de nuestra memoria a corto plazo personalizada (también conocida como Estado)
# A partir de LangChain 1.0, los esquemas de estado personalizados deben ser tipos TypedDict. 
# Los modelos Pydantic y las dataclasses ya no son compatibles.
class CustomAgentState(AgentState):  
    user_id: str
    user_preferences: dict

# Aquí es donde añadimos la capacidad de memoria a corto plazo a nuestro agente
agent3 = create_agent(
    "gpt-4o-mini",
    state_schema=CustomAgentState, 
    checkpointer=InMemorySaver(),  
)

response = agent3.invoke(
    {
        "messages": [{
            "role": "user", 
            "content": "My favorite city is San Francisco."}],
        "user_id": "user_123",  # Esto es solo para demostración, no lo estamos usando
        "user_preferences": {"converation_style": "Casual"}  # Esto es solo para demostración, no lo estamos usando
    },
    {"configurable": {"thread_id": "1"}})


print(response['messages'][-1].content)

In [None]:
from pprint import pprint

pprint(response)

In [None]:
response = agent3.invoke(
    {
        "messages": [{
            "role": "user", 
            "content": "Do you know my favorite city? And my preferred conversation style?"}],
        "user_id": "user_123",  
        "user_preferences": {"converation_style": "Casual"}  
    },
    {"configurable": {"thread_id": "1"}})


print(response['messages'][-1].content)

#### Usando pprint, ved cómo se está procesando la memoria a corto plazo
* Como podéis ver, la memoria de conversación y los datos del usuario se están procesando por separado. Por eso, si preguntamos al Agente sobre nuestro estilo de conversación preferido, responde que no tiene estos datos en la memoria de conversación.
* Estos datos están, de hecho, en la memoria a corto plazo, pero para acceder a ellos necesitamos usar un enfoque diferente como veréis a continuación.

In [None]:
from pprint import pprint

pprint(response)

#### Ved a continuación cómo accedemos a los datos de preferencias del usuario almacenados en la memoria a corto plazo de nuestro agente

In [None]:
print(response['user_preferences'])

## ¿Qué pasa si la conversación es más larga que la ventana de contexto?
* En aplicaciones de producción, las conversaciones largas pueden exceder la ventana de contexto del LLM. Las soluciones comunes a este problema son:
    * Resumir mensajes.
    * Recortar mensajes.
    * Eliminar mensajes.
    * Otras estrategias personalizadas.

* Veremos cómo implementar algunas de estas soluciones en futuras lecciones.

## Memoria a largo plazo
* Para la memoria a largo plazo (también conocida como Store) usaremos un enfoque diferente, también inspirado en LangGraph. Como indica el equipo de LangChain en la documentación de LangChain, este es un tema avanzado que requiere conocimientos de LangGraph para usar, por lo tanto, estaréis mucho mejor preparados para dominarlo después de completar nuestro "2026 Bootcamp: Understand and Build Professional AI Agents".

## Cómo ejecutar este código desde Visual Studio Code
* Abrid Terminal.
* Aseguraos de que estáis en la carpeta del proyecto.
* Aseguraos de tener el entorno poetry activado.
* Introducid y ejecutad el siguiente comando:
    * `python 007-short-term-memory.py` 