# Short-Term vs. Long-Term Memory

Gli esseri umani gestiscono la loro memoria in due modi short-term e long-term.

Immaginiamo di avere una conversazione con un amico, la nostra short-term memory richiama dettagli recenti come "Ho appena passato il sale al mio amico". Invece, la nostra long-term memory trattiene le informazioni chiave nel tempo, come "sapere che al nostro amico preferisce il the al posto del caffè o che ama il cibi italiano". Non ricordedremo ogni conversazione avuta parola per parola.

Tratterremo i dettagli importanti che formere interazioni future.

Questi concetti vengono applicati anche in LangGraph.

![alt text](memory.png)

## Short-Term Memory 

Questa memoria ha come scopo di trattenere in memoria una singola session. In LangGraph la short-term memory è gestita utilizzando i checkpoints i quali memorizzano i dati transitori come l'alternarsi di Human e AI messages all'interno di una conversazione.

Tuttavia, ciascuna conversazione è isolata si hanno, conversation 1, conversation 2, conversation 3, ecc. e non vengono memorizzate in maniera persistente oltre alla loro sessione.

## Long-Term Memory

Questa memoria memorizza in maniera persistente non solo durante la sessione individuale. Questa permette agli agenti di richiamare e riutilizzare informazioni da molteplici conversazioni. 

Questo consente la cross-thread memory (memoria tra thread), la quale garantisce che gli agenti possano adattare le preferenze degli utenti e mantenere continuità nel tempo.

LangGraph introduce lo store object per questo scopo, abilitanto la durabilità della memorizzazione dei dati e il loro recupero ongi volta che è necessario.

![alt text](store.png)

## Combinazione di entrambe le memorie

Combinando shot-term e long-term memory, LangGraph equipaggia gli sviluppatori di creare agenti che sono context-aware durante singole conversazioni e capaci di sfruttare la conoscenza persistente per migliorare le interazioni lungo le sessioni.

In [1]:
from dotenv import load_dotenv

load_dotenv()

True

## Long-Term Memory

LangGraph fornisce InMemoryStore class.

Dopo aver istanziato un oggetto, possiamo usare il metodo put per memorizzare qualcosa in questa long-term memory.

In [4]:
from langgraph.store.memory import InMemoryStore

store = InMemoryStore()

user_id = "my-user"
application_context = "chitchat"
namespace = (user_id, application_context)
# memorizziamo all'interno di un namespace, la coppia "a-memory": {"rules": dati che vogliamo memorizzare}
store.put(namespace, "a-memory", {"rules": ["User likes short, direct language", "User only speaks English & Python"], "my-key": "my-value"})
store.put(namespace=namespace, key="another-memory", value={"rules": ["User prefers concise answers"], "my-key": "my-value"})

In [5]:
# ora vogliamo recuperare la informazione
store.get(namespace, "a-memory").value

{'rules': ['User likes short, direct language',
  'User only speaks English & Python'],
 'my-key': 'my-value'}

In [8]:
# possiamo anche cercare l'informazione tra le moteplici chiavi (a-memory, another-memory)
# vediamo che ci da i due Items che hanno tali valori (a-memory e another-memory)
results = store.search(namespace,  filter={"my-key": "my-value"})
results

[<langgraph.store.base.Item at 0x27da5683f60>,
 <langgraph.store.base.Item at 0x27da5745260>]

In [9]:
for item in results:
    print(item.value)

{'rules': ['User likes short, direct language', 'User only speaks English & Python'], 'my-key': 'my-value'}
{'rules': ['User prefers concise answers'], 'my-key': 'my-value'}


In [11]:
from typing import Literal 
from langgraph.store.memory import InMemoryStore
from langgraph.store.base import BaseStore
from langgraph.graph import StateGraph, MessagesState, START, END
from langgraph.checkpoint.memory import MemorySaver
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.tools import tool
from langchain_openai import ChatOpenAI
from langgraph.prebuilt import ToolNode
import uuid

@tool
def get_weather(location: str):
    """Get the weather at a specific location"""
    if location.lower() in ["munich"]:
        return "It's 15 degrees Celsius and cloudy."
    else:
        return "It's 32 degrees Celsius and sunny."

tools = [get_weather]
model = ChatOpenAI(model="gpt-4o-mini").bind_tools(tools)


def call_model(state: MessagesState, config: dict, *, store: BaseStore):
    user_id = config.get("configurable", {}).get("user_id", "default_user")
    namespace = ("memories", user_id)
    memories = store.search(namespace) # tutti gli items (cioè le chiavi delle memorie per questo namespace)
    info = "\n".join([d.value["data"] for d in memories])
    system_msg = f"You are a helpful assistant."
    if info:
        system_msg += f" User info:\n{info}"
    print("System Message:", system_msg)
    messages = state['messages']

    last_message = messages[-1]

    if "remember" in last_message.content.lower():
        # togliamo la parola "remember" dalla frase e teniemo il resto
        # questo sarà il contenuto che vogliamo mettere nello store
        memory_content = last_message.content.lower().split("remember", 1)[1].strip()
        if memory_content:
            memory = memory_content
            store.put(namespace, str(uuid.uuid4()), {"data": memory})


    # da qui è uguale come facevamo prima

    # alla memoria persistente di un user_id messa nel system_message aggiungo
    # i messaggi della chat corrente
    model_input_messages = [SystemMessage(content=system_msg)] + messages    
    response = model.invoke(model_input_messages)  
    return {"messages": [response]}


def should_continue(state: MessagesState) -> Literal["tools", END]:
    messages = state['messages']
    last_message = messages[-1]
    if hasattr(last_message, "tool_calls") and last_message.tool_calls:
        return "tools"
    return END

In [14]:
# ora abbiamo la long-term memory 
# facciamo anche la short-term memory con i checkpointer

checkpointer = MemorySaver()  # short-term memory
store = InMemoryStore()  # long-term memory

workflow = StateGraph(MessagesState)
workflow.add_node("agent", call_model)
tool_node = ToolNode(tools)

workflow.add_node("tools", tool_node)
workflow.add_conditional_edges(
    "agent", 
    should_continue
)
workflow.set_entry_point("agent")

# nella .compile() function ora abbiamo sue argomenti
# il primo checkpointer è per la short-term memory
# il secondo store è per la long-term memory 
# così integriamo le due memorie nel grafo
graph = workflow.compile(checkpointer=checkpointer, store=store)

### Get information accross multiple threads

Dato che memorizzaimo i contenuti dei messaggi (che contengono la parola "remenber") di un medesimo user_id anche di diversi workflows nella long-term memory (InMemoryStore()), possiamo retrievare il contenuto di tutti messaggi di user_id, inoltre con la short-term memory (MemorySaver()) possiamo prendere i messaggi del workflow corrente.

In [15]:
graph.invoke(
    {"messages": [HumanMessage(content="Remember my name is Alice.")]}, # va nella long-term memory
    config = {"configurable": {"user_id": "user123", "thread_id": 1}}
)

System Message: You are a helpful assistant.


{'messages': [HumanMessage(content='Remember my name is Alice.', additional_kwargs={}, response_metadata={}, id='f775d7e6-bacd-4662-aa18-4e1f1d15c9ce'),
  AIMessage(content='Got it, Alice! How can I assist you today?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 14, 'prompt_tokens': 57, 'total_tokens': 71, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_06737a9306', 'finish_reason': 'stop', 'logprobs': None}, id='run-56862960-cd01-4832-80d8-0ebc483ab617-0', usage_metadata={'input_tokens': 57, 'output_tokens': 14, 'total_tokens': 71, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})]}

In [16]:
graph.invoke(
    {"messages": [HumanMessage(content="What is my name?")]},
    config = {"configurable": {"user_id": "user123", "thread_id": 2}}
)

System Message: You are a helpful assistant. User info:
my name is alice.


{'messages': [HumanMessage(content='What is my name?', additional_kwargs={}, response_metadata={}, id='d404266c-f30b-4626-818c-c2efc7fddb42'),
  AIMessage(content='Your name is Alice.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 64, 'total_tokens': 71, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_06737a9306', 'finish_reason': 'stop', 'logprobs': None}, id='run-676d9a19-62d9-4dfb-992b-1ac7bae4948f-0', usage_metadata={'input_tokens': 64, 'output_tokens': 7, 'total_tokens': 71, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})]}

In [17]:
graph.invoke(
    {"messages": [HumanMessage(content="What's my name?")]},
    config= {"configurable": {"user_id": "userxyz", "thread_id": 3}}
)

System Message: You are a helpful assistant.


{'messages': [HumanMessage(content="What's my name?", additional_kwargs={}, response_metadata={}, id='d52f9137-adf5-4aff-8e5f-850f4bac6b9c'),
  AIMessage(content="I'm sorry, but I don't have access to personal information, including your name. If you'd like to share your name, feel free to do so!", additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 32, 'prompt_tokens': 55, 'total_tokens': 87, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_06737a9306', 'finish_reason': 'stop', 'logprobs': None}, id='run-bb11c309-7a1a-47d2-909d-28d3e4f43a7e-0', usage_metadata={'input_tokens': 55, 'output_tokens': 32, 'total_tokens': 87, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}

## Considerazioni,  Postgres Store

Con questo approccio, usando InMemoryStore() class, LangGraph ci consente di implementare una long-term memory tuttavia questo è abbastanza nuovo quindi è utile per testare/sperimentare una soluzione leggera per la long-term memory. Tuttavia per una vera persistenza è consigliato usare un adeguato database.

Questa limitazione vale anche per i checkpoints. Per questo motivo passiamo da degli **in-memory** checkpoints ad un **Postgres checkpoints** come abbiamo fatto nella fullstack application.

Possiamo fare la stessa cosa per lo Store (long-term memory) utilizzando **Postgres Store**.

In [24]:
from psycopg import Connection
from psycopg.rows import dict_row
from langgraph.store.postgres import PostgresStore

# connection string
# qui facciamo uso del nostro Postgres DB che abbiamo usato per la fullstack application
# per utilizzarlo dobbiamo avviare la il docker-compose dove c'è la definizione dell'immagine postgres come servizio 
# docker compose up
con_string = "postgresql://postgres:postgres@localhost:5433/postgres"

# usiamo psycopg per creare una connection object 
conn = Connection.connect(
    con_string, 
    autocommit=True,
    prepare_threshold=0,
    row_factory=dict_row
)

postgres_store = PostgresStore(conn=conn)

postgres_store.setup()

In [25]:
graph = workflow.compile(checkpointer=checkpointer, store=postgres_store)

In [26]:
graph.invoke(
    {"messages": [HumanMessage(content="Remember my name is Alice")]},
    config={"configurable": {"user_id": "user12345", "thread_id": "x"}}
)

graph.invoke(
    {"messages": [HumanMessage(content="What's my name?")]},
    config={"configurable": {"user_id": "user12345", "thread_id": "y"}}
)

System Message: You are a helpful assistant.
System Message: You are a helpful assistant. User info:
my name is alice


{'messages': [HumanMessage(content="What's my name?", additional_kwargs={}, response_metadata={}, id='6788b157-4dbf-494d-80f4-890fb891ba9e'),
  AIMessage(content='Your name is Alice.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 63, 'total_tokens': 70, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_06737a9306', 'finish_reason': 'stop', 'logprobs': None}, id='run-c746b9ff-535f-4439-af30-4ebe35dea853-0', usage_metadata={'input_tokens': 63, 'output_tokens': 7, 'total_tokens': 70, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})]}