# Agentes com Mem√≥ria

Temos um assistente de email que usa um roteador para triagem de emails e ent√£o passa o email para o agente gerar uma resposta. Tamb√©m o avaliamos e adicionamos humano-no-loop (HITL). Mas e se nosso assistente pudesse **aprender** com as intera√ß√µes para melhorar ao longo do tempo? Isso √© onde a **mem√≥ria** entra.

![overview-img](img/overview_memory.png)

A mem√≥ria no LangGraph opera em dois n√≠veis distintos:

**Mem√≥ria Com Escopo de Thread (Curto prazo)** opera dentro dos limites de um √∫nico thread de conversa. √â gerenciada automaticamente como parte do estado do grafo e persistida atrav√©s de checkpoints com escopo de thread. Este tipo de mem√≥ria ret√©m hist√≥rico de conversa, arquivos enviados, documentos recuperados e outros artefatos gerados durante a intera√ß√£o. Pense nisso como a mem√≥ria de trabalho que mant√©m contexto dentro de uma conversa espec√≠fica, permitindo que o agente referencie mensagens ou a√ß√µes anteriores sem come√ßar do zero a cada vez.

**Mem√≥ria Atrav√©s de Threads (Longo prazo)** se estende al√©m de conversas individuais, criando uma base de conhecimento persistente que abrange m√∫ltiplas sess√µes. Esta mem√≥ria √© armazenada como documentos JSON em um armazenamento de mem√≥ria, organizada por namespaces (como pastas) e chaves distintas (como nomes de arquivo). Diferente da mem√≥ria com escopo de thread, esta informa√ß√£o persiste mesmo ap√≥s as conversas terminarem, permitindo que o sistema se lembre de prefer√™ncias do usu√°rio, decis√µes passadas e conhecimento acumulado. Isso √© o que permite que um agente verdadeiramente aprenda e se adapte ao longo do tempo, em vez de tratar cada intera√ß√£o como isolada.

#### Carregar Vari√°veis de Ambiente

In [None]:
from dotenv import load_dotenv
load_dotenv("../.env")

## Mem√≥ria no LangGraph

### Mem√≥ria Com Escopo de Thread e Atrav√©s de Threads

Primeiro, vale a pena explicar como [a mem√≥ria funciona no LangGraph](https://langchain-ai.github.io/langgraph/concepts/memory/). LangGraph oferece dois tipos principais de mem√≥ria:

**Mem√≥ria Com Escopo de Thread (Curto prazo)** opera dentro dos limites de um √∫nico thread de conversa. √â gerenciada automaticamente como parte do estado do grafo e persistida atrav√©s de checkpoints com escopo de thread. Este tipo de mem√≥ria ret√©m hist√≥rico de conversa, arquivos enviados, documentos recuperados e outros artefatos gerados durante a intera√ß√£o. Pense nisso como a mem√≥ria de trabalho que mant√©m contexto dentro de uma conversa espec√≠fica, permitindo que o agente referencie mensagens ou a√ß√µes anteriores sem come√ßar do zero a cada vez.

**Mem√≥ria Atrav√©s de Threads (Longo prazo)** se estende al√©m de conversas individuais, criando uma base de conhecimento persistente que abrange m√∫ltiplas sess√µes. Esta mem√≥ria √© armazenada como documentos JSON em um armazenamento de mem√≥ria, organizada por namespaces (como pastas) e chaves distintas (como nomes de arquivo). Diferente da mem√≥ria com escopo de thread, esta informa√ß√£o persiste mesmo ap√≥s as conversas terminarem, permitindo que o sistema se lembre de prefer√™ncias do usu√°rio, decis√µes passadas e conhecimento acumulado. Isso √© o que permite que um agente verdadeiramente aprenda e se adapte ao longo do tempo, em vez de tratar cada intera√ß√£o como isolada.

Existem diferentes op√ß√µes de armazenamento para mem√≥ria atrav√©s de threads:

1. **Na Mem√≥ria (ex. notebooks)**:
   - Usa `from langgraph.store.memory import InMemoryStore`
   - Simples e r√°pido para testes e desenvolvimento local
2. **Desenvolvimento Local com `langgraph dev`**:
   - Similar ao InMemoryStore mas com pseudo-persist√™ncia
3. **LangGraph Platform ou Deployments de Produ√ß√£o**:
   - Para deployments hospedados, voc√™ tem acesso a um armazenamento de produ√ß√£o

Vamos usar o `InMemoryStore` aqui no notebook!

In [None]:
from langgraph.store.memory import InMemoryStore
in_memory_store = InMemoryStore()

As mem√≥rias s√£o organizadas por namespace usando uma tupla, que neste exemplo espec√≠fico ser√° (`<user_id>`, "memories"). O namespace pode ter qualquer comprimento e representar qualquer coisa, n√£o precisa ser espec√≠fico do usu√°rio.

In [None]:
user_id = "1"
namespace_for_memory = (user_id, "memories")

Usamos o m√©todo `store.put` para salvar mem√≥rias em nosso namespace no armazenamento. Quando fazemos isso, especificamos o namespace, como definido acima, e um par chave-valor para a mem√≥ria: a chave √© simplesmente um identificador √∫nico para a mem√≥ria (memory_id) e o valor (um dicion√°rio) √© a pr√≥pria mem√≥ria.

In [None]:
import uuid
memory_id = str(uuid.uuid4())
memory = {"food_preference" : "I like pizza"}
in_memory_store.put(namespace_for_memory, memory_id, memory)

Podemos ler as mem√≥rias em nosso namespace usando o m√©todo `store.search`, que retornar√° todas as mem√≥rias para um usu√°rio espec√≠fico como uma lista. A mem√≥ria mais recente √© a √∫ltima da lista. Cada tipo de mem√≥ria √© uma classe Python (`Item`) com certos atributos. Podemos acess√°-la como um dicion√°rio convertendo via `.dict`. Os atributos que possui s√£o mostrados abaixo, mas o mais importante geralmente √© `value`.

In [None]:
memories = in_memory_store.search(namespace_for_memory)
memories[-1].dict()

Para usar isso em um grafo, tudo que precisamos fazer √© compilar o grafo com o store:

In [None]:
# We need this because we want to enable threads (conversations)
from langgraph.checkpoint.memory import InMemorySaver
checkpointer = InMemorySaver()
# We need this because we want to enable across-thread memory
from langgraph.store.memory import InMemoryStore
in_memory_store = InMemoryStore()
# Compile the graph with the checkpointer and store
# graph = graph.compile(checkpointer=checkpointer, store=in_memory_store)

Vamos pegar nosso grafo com HITL e adicionar mem√≥ria a ele. Isso ser√° muito similar ao que t√≠nhamos anteriormente. Simplesmente atualizaremos a mem√≥ria no store quando recebermos feedback do usu√°rio.

A principal diferen√ßa ser√° adicionar um [LangGraph Store](https://langchain-ai.github.io/langgraph/concepts/memory/#long-term-memory) para persistir as mem√≥rias.

## Mem√≥ria

Vamos implementar mem√≥ria que captura:

In [None]:
%load_ext autoreload
%autoreload 2

from typing import Literal
from datetime import datetime
from pydantic import BaseModel, Field

from langchain.chat_models import init_chat_model
from langchain_core.tools import tool

from langgraph.graph import StateGraph, START, END
from langgraph.store.base import BaseStore
from langgraph.types import interrupt, Command

from email_assistant.prompts import triage_system_prompt, triage_user_prompt, agent_system_prompt_hitl_memory, default_triage_instructions, default_background, default_response_preferences, default_cal_preferences, MEMORY_UPDATE_INSTRUCTIONS, MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT
from email_assistant.tools.default.prompt_templates import HITL_MEMORY_TOOLS_PROMPT
from email_assistant.schemas import State, RouterSchema, StateInput
from email_assistant.utils import parse_email, format_for_display, format_email_markdown

# Agent tools
@tool
def write_email(to: str, subject: str, content: str) -> str:
    """Write and send an email."""
    # Placeholder response - in real app would send email
    return f"Email sent to {to} with subject '{subject}' and content: {content}"

@tool
def schedule_meeting(
    attendees: list[str], subject: str, duration_minutes: int, preferred_day: datetime, start_time: int
) -> str:
    """Schedule a calendar meeting."""
    # Placeholder response - in real app would check calendar and schedule
    date_str = preferred_day.strftime("%A, %B %d, %Y")
    return f"Meeting '{subject}' scheduled on {date_str} at {start_time} for {duration_minutes} minutes with {len(attendees)} attendees"

@tool
def check_calendar_availability(day: str) -> str:
    """Check calendar availability for a given day."""
    # Placeholder response - in real app would check actual calendar
    return f"Available times on {day}: 9:00 AM, 2:00 PM, 4:00 PM"

@tool
class Question(BaseModel):
      """Question to ask user."""
      content: str

@tool
class Done(BaseModel):
      """E-mail has been sent."""
      done: bool

# All tools available to the agent
tools = [
    write_email,
    schedule_meeting,
    check_calendar_availability,
    Question,
    Done
]

tools_by_name = {tool.name: tool for tool in tools}

# Initialize the LLM for use with router / structured output
llm = init_chat_model("gemini-2.5-flash", model_provider="google-genai", temperature=0.0)
llm_router = llm.with_structured_output(RouterSchema)

# Initialize the LLM, enforcing tool use (of any available tools) for agent
llm = init_chat_model("gemini-2.5-flash", model_provider="google-genai", temperature=0.0)
llm_with_tools = llm.bind_tools(tools, tool_choice="any")

Agora, esta √© a parte cr√≠tica! Atualmente n√£o capturamos nenhum feedback do usu√°rio em nosso grafo.

### Gerenciamento de Mem√≥ria

O que *queremos* fazer √© bastante direto: queremos adicionar o feedback ao `Store` de mem√≥ria. Se compilarmos nosso grafo com o `Store`, podemos acess√°-lo em qualquer n√≥. Ent√£o vamos modificar o `interrupt_handler` para salvar o feedback do usu√°rio no `Store`.

In [None]:
from rich.markdown import Markdown
Markdown(default_triage_instructions)

In [None]:
Markdown(default_cal_preferences)

In [None]:
Markdown(default_response_preferences)

In [None]:
def get_memory(store, namespace, default_content=None):
    """Get memory from the store or initialize with default if it doesn't exist.

    Args:
        store: LangGraph BaseStore instance to search for existing memory
        namespace: Tuple defining the memory namespace, e.g. ("email_assistant", "triage_preferences")
        default_content: Default content to use if memory doesn't exist

    Returns:
        str: The content of the memory profile, either from existing memory or the default
    """
    # Search for existing memory with namespace and key
    user_preferences = store.get(namespace, "user_preferences")

    # If memory exists, return its content (the value)
    if user_preferences:
        return user_preferences.value

    # If memory doesn't exist, add it to the store and return the default content
    else:
        # Namespace, key, value
        store.put(namespace, "user_preferences", default_content)
        user_preferences = default_content

    # Return the default content
    return user_preferences

Para 2) atualizar mem√≥ria, podemos usar alguns truques do [guia de prompting GPT-4.1](https://cookbook.openai.com/examples/gpt4-1_prompting_guide) para nos ajudar a atualizar a mem√≥ria:

1. **Instru√ß√µes detalhadas**: Fornecer instru√ß√µes espec√≠ficas sobre como atualizar prefer√™ncias
2. **Exemplos**: Mostrar exemplos de atualiza√ß√µes de mem√≥ria bem formatadas  
3. **Refor√ßo**: Usar lembretes para garantir que as instru√ß√µes sejam seguidas

In [None]:

Markdown(MEMORY_UPDATE_INSTRUCTIONS)

In [None]:
Markdown(MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT)

In [None]:
class UserPreferences(BaseModel):
    """Updated user preferences based on user's feedback."""
    chain_of_thought: str = Field(description="Reasoning about which user preferences need to add / update if required")
    user_preferences: str = Field(description="Updated user preferences")

def update_memory(store, namespace, messages):
    """Update memory profile in the store.

    Args:
        store: LangGraph BaseStore instance to update memory
        namespace: Tuple defining the memory namespace, e.g. ("email_assistant", "triage_preferences")
        messages: List of messages to update the memory with
    """

    # Get the existing memory
    user_preferences = store.get(namespace, "user_preferences")

    # Update the memory
    llm = init_chat_model("gemini-2.5-flash", model_provider="google-genai", temperature=0.0).with_structured_output(UserPreferences)
    result = llm.invoke(
        [
            {"role": "system", "content": MEMORY_UPDATE_INSTRUCTIONS.format(current_profile=user_preferences.value, namespace=namespace)},
        ] + messages
    )

    # Save the updated memory to the store
    store.put(namespace, "user_preferences", result.user_preferences)

Configuramos o roteador de triagem como t√≠nhamos antes, com uma pequena mudan√ßa

In [None]:
def triage_router(state: State, store: BaseStore) -> Command[Literal["triage_interrupt_handler", "response_agent", "__end__"]]:
    """Analyze email content to decide if we should respond, notify, or ignore.

    The triage step prevents the assistant from wasting time on:
    - Marketing emails and spam
    - Company-wide announcements
    - Messages meant for other teams
    """
    # Parse the email input
    author, to, subject, email_thread = parse_email(state["email_input"])
    user_prompt = triage_user_prompt.format(
        author=author, to=to, subject=subject, email_thread=email_thread
    )

    # Create email markdown for Agent Inbox in case of notification
    email_markdown = format_email_markdown(subject, author, to, email_thread)

    # Search for existing triage_preferences memory
    triage_instructions = get_memory(store, ("email_assistant", "triage_preferences"), default_triage_instructions)

    # Format system prompt with background and triage instructions
    system_prompt = triage_system_prompt.format(
        background=default_background,
        triage_instructions=triage_instructions,
    )

    # Run the router LLM
    result = llm_router.invoke(
        [
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt},
        ]
    )

    # Decision
    classification = result.classification

    # Process the classification decision
    if classification == "respond":
        print("üìß Classifica√ß√£o: RESPONDER - Este email requer uma resposta")
        # Next node
        goto = "response_agent"
        # Update the state
        update = {
            "classification_decision": result.classification,
            "messages": [{"role": "user",
                            "content": f"Respond to the email: {email_markdown}"
                        }],
        }

    elif classification == "ignore":
        print("üö´ Classifica√ß√£o: IGNORAR - Este email pode ser ignorado")

        # Next node
        goto = END
        # Update the state
        update = {
            "classification_decision": classification,
        }

    elif classification == "notify":
        print("üîî Classifica√ß√£o: NOTIFICAR - Este email cont√©m informa√ß√µes importantes")

        # Next node
        goto = "triage_interrupt_handler"
        # Update the state
        update = {
            "classification_decision": classification,
        }

    else:
        raise ValueError(f"Invalid classification: {classification}")

    return Command(goto=goto, update=update)


Precisamos apenas fazer uma pequena altera√ß√£o no manipulador de interrup√ß√£o para atualizar a mem√≥ria quando o usu√°rio fornecer feedback.

In [None]:
def triage_interrupt_handler(state: State, store: BaseStore) -> Command[Literal["response_agent", "__end__"]]:
    """Handles interrupts from the triage step"""

    # Parse the email input
    author, to, subject, email_thread = parse_email(state["email_input"])

    # Create email markdown for Agent Inbox in case of notification
    email_markdown = format_email_markdown(subject, author, to, email_thread)

    # Create messages
    messages = [{"role": "user",
                "content": f"Email to notify user about: {email_markdown}"
                }]

    # Create interrupt for Agent Inbox
    request = {
        "action_request": {
            "action": f"Email Assistant: {state['classification_decision']}",
            "args": {}
        },
        "config": {
            "allow_ignore": True,
            "allow_respond": True,
            "allow_edit": False,
            "allow_accept": False,
        },
        # Email to show in Agent Inbox
        "description": email_markdown,
    }

    # Send to Agent Inbox and wait for response
    response = interrupt([request])[0]

    # If user provides feedback, go to response agent and use feedback to respond to email
    if response["type"] == "response":
        # Add feedback to messages
        user_input = response["args"]
        messages.append({"role": "user",
                        "content": f"User wants to reply to the email. Use this feedback to respond: {user_input}"
                        })
        # This is new: update triage_preferences with feedback
        update_memory(store, ("email_assistant", "triage_preferences"), [{
            "role": "user",
            "content": f"The user decided to respond to the email, so update the triage preferences to capture this."
        }] + messages)

        goto = "response_agent"

    # If user ignores email, go to END
    elif response["type"] == "ignore":
        # Make note of the user's decision to ignore the email
        messages.append({"role": "user",
                        "content": f"The user decided to ignore the email even though it was classified as notify. Update triage preferences to capture this."
                        })
        # This is new: triage_preferences with feedback
        update_memory(store, ("email_assistant", "triage_preferences"), messages)
        goto = END

    # Catch all other responses
    else:
        raise ValueError(f"Invalid response: {response}")

    # Update the state
    update = {
        "messages": messages,
    }

    return Command(goto=goto, update=update)

Agora que temos os gerenciadores de mem√≥ria configurados, podemos usar as prefer√™ncias armazenadas ao gerar respostas.

In [None]:
def llm_call(state: State, store: BaseStore):
    """LLM decides whether to call a tool or not"""

    # Search for existing cal_preferences memory
    cal_preferences = get_memory(store, ("email_assistant", "cal_preferences"), default_cal_preferences)

    # Search for existing response_preferences memory
    response_preferences = get_memory(store, ("email_assistant", "response_preferences"), default_response_preferences)

    return {
        "messages": [
            llm_with_tools.invoke(
                [
                    {"role": "system", "content": agent_system_prompt_hitl_memory.format(tools_prompt=HITL_MEMORY_TOOLS_PROMPT,
                                                                                         background=default_background,
                                                                                         response_preferences=response_preferences,
                                                                                         cal_preferences=cal_preferences)}
                ]
                + state["messages"]
            )
        ]
    }

### Integra√ß√£o de Mem√≥ria no Manipulador de Interrup√ß√£o

Da mesma forma, adicionaremos mem√≥ria ao manipulador de interrup√ß√£o!

In [None]:
def interrupt_handler(state: State, store: BaseStore) -> Command[Literal["llm_call", "__end__"]]:
    """Creates an interrupt for human review of tool calls"""

    # Store messages
    result = []

    # Go to the LLM call node next
    goto = "llm_call"

    # Iterate over the tool calls in the last message
    for tool_call in state["messages"][-1].tool_calls:

        # Allowed tools for HITL
        hitl_tools = ["write_email", "schedule_meeting", "Question"]

        # If tool is not in our HITL list, execute it directly without interruption
        if tool_call["name"] not in hitl_tools:

            # Execute tool without interruption
            tool = tools_by_name[tool_call["name"]]
            observation = tool.invoke(tool_call["args"])
            result.append({"role": "tool", "content": observation, "tool_call_id": tool_call["id"]})
            continue

        # Get original email from email_input in state
        email_input = state["email_input"]
        author, to, subject, email_thread = parse_email(email_input)
        original_email_markdown = format_email_markdown(subject, author, to, email_thread)

        # Format tool call for display and prepend the original email
        tool_display = format_for_display(tool_call)
        description = original_email_markdown + tool_display

        # Configure what actions are allowed in Agent Inbox
        if tool_call["name"] == "write_email":
            config = {
                "allow_ignore": True,
                "allow_respond": True,
                "allow_edit": True,
                "allow_accept": True,
            }
        elif tool_call["name"] == "schedule_meeting":
            config = {
                "allow_ignore": True,
                "allow_respond": True,
                "allow_edit": True,
                "allow_accept": True,
            }
        elif tool_call["name"] == "Question":
            config = {
                "allow_ignore": True,
                "allow_respond": True,
                "allow_edit": False,
                "allow_accept": False,
            }
        else:
            raise ValueError(f"Invalid tool call: {tool_call['name']}")

        # Create the interrupt request
        request = {
            "action_request": {
                "action": tool_call["name"],
                "args": tool_call["args"]
            },
            "config": config,
            "description": description,
        }

        # Send to Agent Inbox and wait for response
        response = interrupt([request])[0]

        # Handle the responses
        if response["type"] == "accept":

            # Execute the tool with original args
            tool = tools_by_name[tool_call["name"]]
            observation = tool.invoke(tool_call["args"])
            result.append({"role": "tool", "content": observation, "tool_call_id": tool_call["id"]})

        elif response["type"] == "edit":

            # Tool selection
            tool = tools_by_name[tool_call["name"]]
            initial_tool_call = tool_call["args"]

            # Get edited args from Agent Inbox
            edited_args = response["args"]["args"]

            # Update the AI message's tool call with edited content (reference to the message in the state)
            ai_message = state["messages"][-1] # Get the most recent message from the state
            current_id = tool_call["id"] # Store the ID of the tool call being edited

            # Create a new list of tool calls by filtering out the one being edited and adding the updated version
            # This avoids modifying the original list directly (immutable approach)
            updated_tool_calls = [tc for tc in ai_message.tool_calls if tc["id"] != current_id] + [
                {"type": "tool_call", "name": tool_call["name"], "args": edited_args, "id": current_id}
            ]

            # Create a new copy of the message with updated tool calls rather than modifying the original
            # This ensures state immutability and prevents side effects in other parts of the code
            # When we update the messages state key ("messages": result), the add_messages reducer will
            # overwrite existing messages by id and we take advantage of this here to update the tool calls.
            result.append(ai_message.model_copy(update={"tool_calls": updated_tool_calls}))

            # Save feedback in memory and update the write_email tool call with the edited content from Agent Inbox
            if tool_call["name"] == "write_email":

                # Execute the tool with edited args
                observation = tool.invoke(edited_args)

                # Add only the tool response message
                result.append({"role": "tool", "content": observation, "tool_call_id": current_id})

                # This is new: update the memory
                update_memory(store, ("email_assistant", "response_preferences"), [{
                    "role": "user",
                    "content": f"User edited the email response. Here is the initial email generated by the assistant: {initial_tool_call}. Here is the edited email: {edited_args}. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            # Save feedback in memory and update the schedule_meeting tool call with the edited content from Agent Inbox
            elif tool_call["name"] == "schedule_meeting":

                # Execute the tool with edited args
                observation = tool.invoke(edited_args)

                # Add only the tool response message
                result.append({"role": "tool", "content": observation, "tool_call_id": current_id})

                # This is new: update the memory
                update_memory(store, ("email_assistant", "cal_preferences"), [{
                    "role": "user",
                    "content": f"User edited the calendar invitation. Here is the initial calendar invitation generated by the assistant: {initial_tool_call}. Here is the edited calendar invitation: {edited_args}. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            # Catch all other tool calls
            else:
                raise ValueError(f"Invalid tool call: {tool_call['name']}")

        elif response["type"] == "ignore":

            if tool_call["name"] == "write_email":
                # Don't execute the tool, and tell the agent how to proceed
                result.append({"role": "tool", "content": "User ignored this email draft. Ignore this email and end the workflow.", "tool_call_id": tool_call["id"]})
                # Go to END
                goto = END
                # This is new: update the memory
                update_memory(store, ("email_assistant", "triage_preferences"), state["messages"] + result + [{
                    "role": "user",
                    "content": f"The user ignored the email draft. That means they did not want to respond to the email. Update the triage preferences to ensure emails of this type are not classified as respond. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            elif tool_call["name"] == "schedule_meeting":
                # Don't execute the tool, and tell the agent how to proceed
                result.append({"role": "tool", "content": "User ignored this calendar meeting draft. Ignore this email and end the workflow.", "tool_call_id": tool_call["id"]})
                # Go to END
                goto = END
                # This is new: update the memory
                update_memory(store, ("email_assistant", "triage_preferences"), state["messages"] + result + [{
                    "role": "user",
                    "content": f"The user ignored the calendar meeting draft. That means they did not want to schedule a meeting for this email. Update the triage preferences to ensure emails of this type are not classified as respond. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            elif tool_call["name"] == "Question":
                # Don't execute the tool, and tell the agent how to proceed
                result.append({"role": "tool", "content": "User ignored this question. Ignore this email and end the workflow.", "tool_call_id": tool_call["id"]})
                # Go to END
                goto = END
                # This is new: update the memory
                update_memory(store, ("email_assistant", "triage_preferences"), state["messages"] + result + [{
                    "role": "user",
                    "content": f"The user ignored the Question. That means they did not want to answer the question or deal with this email. Update the triage preferences to ensure emails of this type are not classified as respond. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            else:
                raise ValueError(f"Invalid tool call: {tool_call['name']}")

        elif response["type"] == "response":
            # User provided feedback
            user_feedback = response["args"]
            if tool_call["name"] == "write_email":
                # Don't execute the tool, and add a message with the user feedback to incorporate into the email
                result.append({"role": "tool", "content": f"User gave feedback, which can we incorporate into the email. Feedback: {user_feedback}", "tool_call_id": tool_call["id"]})
                # This is new: update the memory
                update_memory(store, ("email_assistant", "response_preferences"), state["messages"] + result + [{
                    "role": "user",
                    "content": f"User gave feedback, which we can use to update the response preferences. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            elif tool_call["name"] == "schedule_meeting":
                # Don't execute the tool, and add a message with the user feedback to incorporate into the email
                result.append({"role": "tool", "content": f"User gave feedback, which can we incorporate into the meeting request. Feedback: {user_feedback}", "tool_call_id": tool_call["id"]})
                # This is new: update the memory
                update_memory(store, ("email_assistant", "cal_preferences"), state["messages"] + result + [{
                    "role": "user",
                    "content": f"User gave feedback, which we can use to update the calendar preferences. Follow all instructions above, and remember: {MEMORY_UPDATE_INSTRUCTIONS_REINFORCEMENT}."
                }])

            elif tool_call["name"] == "Question":
                # Don't execute the tool, and add a message with the user feedback to incorporate into the email
                result.append({"role": "tool", "content": f"User answered the question, which can we can use for any follow up actions. Feedback: {user_feedback}", "tool_call_id": tool_call["id"]})

            else:
                raise ValueError(f"Invalid tool call: {tool_call['name']}")

    # Update the state
    update = {
        "messages": result,
    }

    return Command(goto=goto, update=update)

O resto √© igual ao anterior!

In [None]:
from email_assistant.utils import show_graph

# Conditional edge function
def should_continue(state: State, store: BaseStore) -> Literal["interrupt_handler", END]:
    """Route to tool handler, or end if Done tool called"""
    messages = state["messages"]
    last_message = messages[-1]
    if last_message.tool_calls:
        for tool_call in last_message.tool_calls:
            if tool_call["name"] == "Done":
                return END
            else:
                return "interrupt_handler"

# Build workflow
agent_builder = StateGraph(State)

# Add nodes - with store parameter
agent_builder.add_node("llm_call", llm_call)
agent_builder.add_node("interrupt_handler", interrupt_handler)

# Add edges
agent_builder.add_edge(START, "llm_call")
agent_builder.add_conditional_edges(
    "llm_call",
    should_continue,
    {
        "interrupt_handler": "interrupt_handler",
        END: END,
    },
)

# Compile the agent
response_agent = agent_builder.compile()

# Build overall workflow with store and checkpointer
overall_workflow = (
    StateGraph(State, input=StateInput)
    .add_node(triage_router)
    .add_node(triage_interrupt_handler)
    .add_node("response_agent", response_agent)
    .add_edge(START, "triage_router")
)

email_assistant = overall_workflow.compile()
show_graph(email_assistant)

## Testando o agente com mem√≥ria

Agora que implementamos mem√≥ria em nosso assistente de email, vamos testar como o sistema aprende com o feedback do usu√°rio e se adapta ao longo do tempo. Esta se√ß√£o de testes explora como diferentes tipos de intera√ß√µes do usu√°rio criam atualiza√ß√µes de mem√≥ria distintas que melhoram o desempenho futuro do assistente.

As principais quest√µes que estamos respondendo atrav√©s destes testes:
1. Como o sistema captura e armazena as prefer√™ncias do usu√°rio?
2. Como essas prefer√™ncias armazenadas afetam decis√µes futuras?
3. Quais padr√µes de intera√ß√£o levam a que tipos de atualiza√ß√µes de mem√≥ria?

Primeiro, vamos construir uma fun√ß√£o auxiliar para exibir o conte√∫do da mem√≥ria para que possamos acompanhar como ela evolui ao longo de nossos testes:

In [None]:
import uuid
from langgraph.checkpoint.memory import MemorySaver
from langgraph.types import Command
from langgraph.store.memory import InMemoryStore

# Helper function to display memory content
def display_memory_content(store, namespace=None):
    # Display current memory content for all namespaces
    print("\n======= CURRENT MEMORY CONTENT =======")
    if namespace:
        memory = store.get(namespace, "user_preferences")
        if memory:
            print(f"\n--- {namespace[1]} ---")
            print(memory.value)
        else:
            print(f"\n--- {namespace[1]} ---")
            print("Nenhuma mem√≥ria encontrada")
    else:
        for namespace in [
            ("email_assistant", "triage_preferences"),
            ("email_assistant", "response_preferences"),
            ("email_assistant", "cal_preferences"),
            ("email_assistant", "background")
        ]:
            memory = store.get(namespace, "user_preferences")
            if memory:
                print(f"\n--- {namespace[1]} ---")
                print(memory.value)
            else:
                print(f"\n--- {namespace[1]} ---")
                print("Nenhuma mem√≥ria encontrada")
            print("=======================================\n")

### Aceitar `write_email` e `schedule_meeting`

Nosso primeiro teste examina o que acontece quando um usu√°rio aceita as a√ß√µes do agente sem modifica√ß√£o. Este caso base nos ajuda a entender como o sistema se comporta quando nenhum feedback √© fornecido:

1. Usaremos o mesmo email de planejamento tribut√°rio de nossos testes anteriores
2. O sistema o classificar√° como "RESPOND" e propor√° agendar uma reuni√£o
3. Aceitaremos o agendamento da reuni√£o sem mudan√ßas
4. O agente gerar√° um email confirmando a reuni√£o
5. Aceitaremos o email sem mudan√ßas

Este teste demonstra o comportamento padr√£o de nosso sistema habilitado para mem√≥ria. Quando um usu√°rio simplesmente aceita a√ß√µes propostas, esperamos atualiza√ß√µes m√≠nimas ou nenhuma atualiza√ß√£o de mem√≥ria, j√° que n√£o h√° feedback expl√≠cito do qual aprender. No entanto, o sistema ainda utilizar√° a mem√≥ria existente (se houver) ao gerar suas respostas.

In [None]:
# Respond - Meeting Request Email
email_input_respond = {
    "to": "Lance Martin <lance@company.com>",
    "author": "Project Manager <pm@client.com>",
    "subject": "Tax season let's schedule call",
    "email_thread": "Lance,\n\nIt's tax season again, and I wanted to schedule a call to discuss your tax planning strategies for this year. I have some suggestions that could potentially save you money.\n\nAre you available sometime next week? Tuesday or Thursday afternoon would work best for me, for about 45 minutes.\n\nRegards,\nProject Manager"
}

# Compile the graph
checkpointer = MemorySaver()
store = InMemoryStore()
graph = overall_workflow.compile(checkpointer=checkpointer, store=store)
thread_id_1 = uuid.uuid4()
thread_config_1 = {"configurable": {"thread_id": thread_id_1}}

# Run the graph until the first interrupt
# Email will be classified as "respond"
# Agent will create a schedule_meeting and write_email tool call
print("Executando o grafo at√© a primeira interrup√ß√£o...")
for chunk in graph.stream({"email_input": email_input_respond}, config=thread_config_1):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after first interrupt
display_memory_content(store)

Aceitar a chamada de ferramenta `schedule_meeting`

Ao examinarmos a proposta inicial de `schedule_meeting`, observe como o sistema usa a mem√≥ria existente para informar suas decis√µes:

1. As prefer√™ncias padr√£o de calend√°rio mostram uma prefer√™ncia por reuni√µes de 30 minutos, embora o email solicite 45 minutos
2. O agente ainda prop√µe uma reuni√£o de 45 minutos, respeitando a solicita√ß√£o espec√≠fica do remetente
3. Aceitamos esta proposta sem modifica√ß√£o para ver se a simples aceita√ß√£o desencadeia alguma atualiza√ß√£o de mem√≥ria

Ap√≥s executar este passo, verificaremos o conte√∫do da mem√≥ria para confirmar se a aceita√ß√£o sozinha leva a atualiza√ß√µes de mem√≥ria. A simples aceita√ß√£o representa a experi√™ncia base do usu√°rio - o sistema funciona conforme pretendido sem exigir ajustes.

In [None]:
print(f"\nSimulando usu√°rio aceitando a {Interrupt_Object.value[0]['action_request']['action']} chamada de ferramenta...")
for chunk in graph.stream(Command(resume=[{"type": "accept"}]), config=thread_config_1):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

Aceitar a chamada de ferramenta `write_email`

Agora aceitaremos o rascunho de email que confirma o agendamento da reuni√£o:

1. O rascunho de email √© gerado com conhecimento de nossas prefer√™ncias de calend√°rio
2. Ele inclui detalhes sobre o hor√°rio da reuni√£o, dura√ß√£o e prop√≥sito
3. Aceitaremos sem mudan√ßas para completar o caso de teste base

Ap√≥s aceitar, verificaremos todos os armazenamentos de mem√≥ria para ver se ocorreram atualiza√ß√µes. Como esperado, simplesmente aceitar as propostas do agente n√£o fornece sinais de aprendizado fortes - n√£o h√° feedback claro sobre o que o usu√°rio gosta ou n√£o gosta da abordagem do agente.

O link de rastreamento mostra a execu√ß√£o completa do fluxo de trabalho, onde podemos ver que a mem√≥ria √© usada na chamada LLM para gera√ß√£o de resposta, mas nenhuma atualiza√ß√£o de mem√≥ria ocorre, que √© o comportamento esperado para simples aceita√ß√µes.

In [None]:
print(f"\nSimulando usu√°rio aceitando a {Interrupt_Object.value[0]['action_request']['action']} chamada de ferramenta...")
for chunk in graph.stream(Command(resume=[{"type": "accept"}]), config=thread_config_1):
    # Inspect response_agent most recent message
    if 'response_agent' in chunk:
        chunk['response_agent']['messages'][-1].pretty_print()
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after accepting the write_email tool call
display_memory_content(store)

Podemos olhar as mensagens completas e o rastreamento: 

https://smith.langchain.com/public/86ff6474-29fe-452e-8829-b05a91b458eb/r

Voc√™ notar√° que a mem√≥ria √© usada na chamada LLM para responder. 

Mas o armazenamento de mem√≥ria *n√£o* √© atualizado, porque n√£o adicionamos nenhum feedback via HITL.

In [None]:
state = graph.get_state(thread_config_1)
for m in state.values['messages']:
    m.pretty_print()

### Editar `write_email` e `schedule_meeting`

Este teste explora como o sistema aprende a partir de edi√ß√µes diretas √†s suas a√ß√µes propostas. Quando usu√°rios modificam as sugest√µes do agente, isso cria sinais de aprendizado claros e espec√≠ficos sobre suas prefer√™ncias:

1. Usaremos o mesmo email de planejamento tribut√°rio de antes
2. Quando o agente propor uma reuni√£o de 45 minutos, editaremos para:
   - Mudar a dura√ß√£o para 30 minutos (correspondendo √† nossa prefer√™ncia armazenada)
   - Tornar o assunto mais conciso
3. Quando o agente rascunhar um email, editaremos para ser:
   - Mais curto e menos formal
   - Estruturado de forma diferente

Edi√ß√µes fornecem o feedback mais expl√≠cito sobre prefer√™ncias do usu√°rio, permitindo que o sistema aprenda exatamente quais mudan√ßas s√£o desejadas. Esperamos ver atualiza√ß√µes espec√≠ficas e direcionadas em nossos armazenamentos de mem√≥ria que reflitam essas edi√ß√µes.

In [None]:
# Same email as before
email_input_respond = {
    "to": "Lance Martin <lance@company.com>",
    "author": "Project Manager <pm@client.com>",
    "subject": "Tax season let's schedule call",
    "email_thread": "Lance,\n\nIt's tax season again, and I wanted to schedule a call to discuss your tax planning strategies for this year. I have some suggestions that could potentially save you money.\n\nAre you available sometime next week? Tuesday or Thursday afternoon would work best for me, for about 45 minutes.\n\nRegards,\nProject Manager"
}

# Compile the graph with new thread
checkpointer = MemorySaver()
store = InMemoryStore()
graph = overall_workflow.compile(checkpointer=checkpointer, store=store)
thread_id_2 = uuid.uuid4()
thread_config_2 = {"configurable": {"thread_id": thread_id_2}}

# Run the graph until the first interrupt - will be classified as "respond" and the agent will create a write_email tool call
print("Executando o grafo at√© a primeira interrup√ß√£o...")
for chunk in graph.stream({"email_input": email_input_respond}, config=thread_config_2):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after first interrupt
display_memory_content(store,("email_assistant", "cal_preferences"))

Editar a chamada da ferramenta `schedule_meeting`

Quando editamos a proposta de reuni√£o, estamos fornecendo feedback direto e expl√≠cito sobre nossas prefer√™ncias. Isso cria uma oportunidade significativa de aprendizado para o sistema:

1. O agente inicialmente prop√µe uma reuni√£o de 45 minutos (a dura√ß√£o solicitada no email)
2. N√≥s editamos para 30 minutos e simplificamos o assunto de "Tax Planning Strategies Discussion" para "Tax Planning Discussion"
3. Isso cria feedback claro e espec√≠fico sobre nossas prefer√™ncias de tempo e conven√ß√µes de nomenclatura

In [None]:
# Now simulate user editing the schedule_meeting tool call
print("\nSimulando usu√°rio editando a schedule_meeting chamada de ferramenta...")
edited_schedule_args = {
    "attendees": ["pm@client.com", "lance@company.com"],
    "subject": "Tax Planning Discussion",
    "duration_minutes": 30, # Changed from 45 to 30
    "preferred_day": "2025-04-22",
    "start_time": 14
}
for chunk in graph.stream(Command(resume=[{"type": "edit", "args": {"args": edited_schedule_args}}]), config=thread_config_2):
    # Inspect response_agent most recent message
    if 'response_agent' in chunk:
        chunk['response_agent']['messages'][-1].pretty_print()
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after editing schedule_meeting
print("\nVerificando mem√≥ria ap√≥s editar schedule_meeting:")
display_memory_content(store,("email_assistant", "cal_preferences"))

```
{'preferences': '\n30 minute meetings are preferred, but 15 minute meetings are also acceptable.\n'}
```

```
{'preferences': "30 minute meetings are preferred, but 15 minute meetings are also acceptable.\n\nUser prefers 30 minute meetings over longer durations such as 45 minutes. When scheduling, default to 30 minutes unless otherwise specified. Subject lines should be concise (e.g., 'Tax Planning Discussion' instead of 'Tax Planning Strategies Discussion')."}
```

Olhando para a mem√≥ria ap√≥s editar o convite de calend√°rio, podemos ver que ela foi atualizada:

1. O sistema identificou que preferimos reuni√µes de 30 minutos em vez de dura√ß√µes mais longas
2. Tamb√©m capturou nossa prefer√™ncia por assuntos de reuni√£o concisos

O que √© particularmente impressionante sobre esta atualiza√ß√£o de mem√≥ria √©:
- Ela n√£o apenas registra nossa edi√ß√£o espec√≠fica, mas generaliza para um padr√£o de prefer√™ncia mais amplo
- Preserva todo o conte√∫do de mem√≥ria existente enquanto adiciona a nova informa√ß√£o
- Extrai m√∫ltiplos sinais de prefer√™ncia de uma √∫nica intera√ß√£o de edi√ß√£o

Agora, vamos editar o rascunho de email para ver como o sistema captura diferentes tipos de prefer√™ncias de comunica√ß√£o:

In [None]:
display_memory_content(store,("email_assistant", "response_preferences"))
# Now simulate user editing the write_email tool call
print("\nSimulando usu√°rio editando a write_email chamada de ferramenta...")
edited_email_args = {
    "to": "pm@client.com",
    "subject": "Re: Tax season let's schedule call",
    "content": "Thanks! I scheduled a 30-minute call next Thursday at 3:00 PM. Would that work for you?\n\nBest regards,\nLance Martin"
}
for chunk in graph.stream(Command(resume=[{"type": "edit", "args": {"args": edited_email_args}}]), config=thread_config_2):
    # Inspect response_agent most recent message
    if 'response_agent' in chunk:
        chunk['response_agent']['messages'][-1].pretty_print()
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after editing write_email
print("\nVerificando mem√≥ria ap√≥s editar write_email:")
display_memory_content(store,("email_assistant", "response_preferences"))

Nossa edi√ß√£o de email revela capacidades de aprendizado ainda mais sofisticadas:

1. Encurtamos e simplificamos drasticamente o conte√∫do do email
2. Mudamos o tom para ser mais casual
3. Adicionamos uma pergunta pedindo confirma√ß√£o em vez de assumir que o hor√°rio funciona
4. Alteramos ligeiramente os detalhes da reuni√£o (dia e hor√°rio)

Olhando para a mem√≥ria atualizada, podemos ver que o sistema extraiu uma percep√ß√£o chave sobre nosso estilo de comunica√ß√£o:

```
Ao agendar uma reuni√£o, pe√ßa ao destinat√°rio para confirmar se o hor√°rio proposto funciona para eles, em vez de assumir e declarar que a reuni√£o j√° est√° agendada.
```

Isso demonstra a capacidade do sistema de:
- Analisar nossa edi√ß√£o n√£o apenas em um n√≠vel superficial, mas para entender a inten√ß√£o
- Extrair princ√≠pios generaliz√°veis de exemplos espec√≠ficos
- Preservar toda a orienta√ß√£o existente enquanto adiciona novas percep√ß√µes
- Manter a organiza√ß√£o e estrutura da mem√≥ria

Essas atualiza√ß√µes de mem√≥ria direcionadas e de alta qualidade melhorar√£o todas as intera√ß√µes futuras sem exigir corre√ß√µes repetidas.

In [None]:
state = graph.get_state(thread_config_2)
for m in state.values['messages']:
    m.pretty_print()

### Responder (com feedback) `write_email` e `schedule_meeting`

Nosso conjunto final de testes explora o padr√£o de feedback "resposta" - fornecendo orienta√ß√£o sem editar ou aceitar diretamente. Este mecanismo de feedback conversacional oferece um meio-termo entre aceita√ß√£o e edi√ß√£o:

1. Primeiro, testaremos feedback para agendamento de reuni√£o solicitando:
   - Dura√ß√£o mais curta (30 minutos em vez de 45)
   - Hor√°rios de reuni√£o √† tarde (ap√≥s √†s 14h)
   
2. Em seguida, testaremos feedback para rascunho de email solicitando:
   - Linguagem mais curta e menos formal
   - Uma declara√ß√£o de encerramento espec√≠fica sobre esperar pela reuni√£o
   
3. Finalmente, testaremos feedback para perguntas fornecendo:
   - Uma resposta direta com contexto adicional
   - Prefer√™ncias espec√≠ficas (local de brunch, hor√°rio)

Esta abordagem de feedback em linguagem natural permite que usu√°rios orientem o assistente sem ter que fazer o trabalho eles mesmos. Esperamos ver atualiza√ß√µes detalhadas de mem√≥ria que extraiam os princ√≠pios gerais de nosso feedback espec√≠fico.

In [None]:
# Respond - Meeting Request Email
email_input_respond = {
    "to": "Lance Martin <lance@company.com>",
    "author": "Project Manager <pm@client.com>",
    "subject": "Tax season let's schedule call",
    "email_thread": "Lance,\n\nIt's tax season again, and I wanted to schedule a call to discuss your tax planning strategies for this year. I have some suggestions that could potentially save you money.\n\nAre you available sometime next week? Tuesday or Thursday afternoon would work best for me, for about 45 minutes.\n\nRegards,\nProject Manager"
}

# Compile the graph
checkpointer = MemorySaver()
store = InMemoryStore()
graph = overall_workflow.compile(checkpointer=checkpointer, store=store)
thread_id_5 = uuid.uuid4()
thread_config_5 = {"configurable": {"thread_id": thread_id_5}}

# Run the graph until the first interrupt
# Email will be classified as "respond"
# Agent will create a schedule_meeting and write_email tool call
print("Executando o grafo at√© a primeira interrup√ß√£o...")
for chunk in graph.stream({"email_input": email_input_respond}, config=thread_config_5):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after first interrupt
display_memory_content(store, ("email_assistant", "cal_preferences"))

Fornecer feedback para a chamada de ferramenta `schedule_meeting`

Em vez de editar diretamente a proposta de reuni√£o ou simplesmente aceit√°-la, forneceremos feedback em linguagem natural:

1. Solicitamos uma reuni√£o de 30 minutos em vez de 45 minutos
2. Expressamos uma prefer√™ncia por reuni√µes √† tarde ap√≥s √†s 14h
3. O sistema deve interpretar este feedback e gerar uma nova proposta

Esta abordagem conversacional √© frequentemente mais natural e eficiente do que edi√ß√£o direta, especialmente para usu√°rios m√≥veis ou aqueles que preferem dar dire√ß√£o de alto n√≠vel em vez de edi√ß√µes detalhadas.

Ap√≥s fornecer feedback, examinaremos a mem√≥ria de prefer√™ncias de calend√°rio para ver como esta orienta√ß√£o em linguagem natural √© capturada. Esperamos ver o sistema extrair tanto a dura√ß√£o da reuni√£o quanto as prefer√™ncias de hor√°rio do dia como princ√≠pios gerais.

In [None]:
print(f"\nSimulando usu√°rio fornecendo feedback para a {Interrupt_Object.value[0]['action_request']['action']} chamada de ferramenta...")
for chunk in graph.stream(Command(resume=[{"type": "response", "args": "Please schedule this for 30 minutes instead of 45 minutes, and I prefer afternoon meetings after 2pm."}]), config=thread_config_5):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after providing feedback for schedule_meeting
print("\nVerificando mem√≥ria ap√≥s fornecer feedback para schedule_meeting:")
display_memory_content(store, ("email_assistant", "cal_preferences"))

Nossa verifica√ß√£o de mem√≥ria ap√≥s fornecer feedback mostra uma atualiza√ß√£o elegantemente simples de prefer√™ncia de calend√°rio:

```
Reuni√µes de 30 minutos s√£o preferidas, mas reuni√µes de 15 minutos tamb√©m s√£o aceit√°veis.
Reuni√µes √† tarde ap√≥s √†s 14h s√£o preferidas.
```

O sistema:
1. Capturou ambos os aspectos do nosso feedback (dura√ß√£o e hor√°rio do dia)
2. Preservou a prefer√™ncia existente sobre reuni√µes de 15 minutos
3. Adicionou nossa prefer√™ncia por reuni√µes √† tarde ap√≥s √†s 14h como uma nova linha
4. Manteve o formato limpo e leg√≠vel

Este mecanismo de feedback em linguagem natural cria a mesma qualidade de atualiza√ß√µes de mem√≥ria que a edi√ß√£o direta, mas requer menos esfor√ßo do usu√°rio. O sistema √© capaz de extrair prefer√™ncias estruturadas de feedback n√£o estruturado, mostrando sua capacidade de aprender a partir de intera√ß√µes conversacionais.

Vamos aceitar esta proposta de reuni√£o revisada e passar para o rascunho de email:

In [None]:
print(f"\nSimulando usu√°rio aceitando a {Interrupt_Object.value[0]['action_request']['action']} chamada de ferramenta...")
for chunk in graph.stream(Command(resume=[{"type": "accept"}]), config=thread_config_5):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after accepting schedule_meeting after feedback
print("\nVerificando mem√≥ria ap√≥s aceitar schedule_meeting ap√≥s feedback:")
display_memory_content(store, ("email_assistant", "response_preferences"))

Agora fornecer feedback para a chamada de ferramenta `write_email`

Similar ao nosso feedback de reuni√£o, agora forneceremos orienta√ß√£o em linguagem natural para o rascunho de email:

1. Solicitamos linguagem "mais curta e menos formal" - uma prefer√™ncia de estilo
2. Pedimos uma declara√ß√£o de encerramento espec√≠fica sobre esperar pela reuni√£o
3. O sistema deve interpretar esta orienta√ß√£o e reescrever o email adequadamente

Ap√≥s fornecer este feedback, verificaremos a mem√≥ria de prefer√™ncias de resposta para ver como essas prefer√™ncias de estilo e estrutura s√£o capturadas. Esperamos ver diretrizes generaliz√°veis sobre brevidade, formalidade e declara√ß√µes de encerramento adicionadas ao nosso perfil de prefer√™ncias.

In [None]:
print(f"\nSimulando usu√°rio fornecendo feedback para a {Interrupt_Object.value[0]['action_request']['action']} chamada de ferramenta...")
for chunk in graph.stream(Command(resume=[{"type": "response", "args": "Shorter and less formal. Include a closing statement about looking forward to the meeting!"}]), config=thread_config_5):
    # Inspect response_agent most recent message
    if 'response_agent' in chunk:
        chunk['response_agent']['messages'][-1].pretty_print()
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after providing feedback for write_email
print("\nVerificando mem√≥ria ap√≥s fornecer feedback para write_email:")
display_memory_content(store, ("email_assistant", "response_preferences"))

A atualiza√ß√£o de mem√≥ria ap√≥s nosso feedback de email mostra aprendizado altamente sofisticado sobre prefer√™ncias tanto de agendamento de reuni√£o quanto de escrita de email:

1. O sistema adicionou uma se√ß√£o completamente nova √†s prefer√™ncias de resposta intitulada "Ao escrever respostas de email" com duas prefer√™ncias principais:
   - "Favore√ßa linguagem mais curta e menos formal quando poss√≠vel, a menos que o contexto exija formalidade"
   - "Inclua uma declara√ß√£o de encerramento expressando que voc√™ espera pela reuni√£o ou conversa ao confirmar compromissos"

2. Tamb√©m adicionou um novo ponto √† se√ß√£o "Ao responder a solicita√ß√µes de agendamento de reuni√£o":
   - "Ao agendar reuni√µes, prefira hor√°rios √† tarde ap√≥s √†s 14h quando poss√≠vel, e padr√£o para dura√ß√µes de 30 minutos a menos que especificado de outra forma"

Isso demonstra a capacidade do sistema de:
- Organizar prefer√™ncias aprendidas em categorias apropriadas
- Extrair m√∫ltiplas percep√ß√µes de uma √∫nica inst√¢ncia de feedback
- Aplicar prefer√™ncias de reuni√£o tanto em contextos de calend√°rio quanto de email
- Capturar nuance com qualificadores apropriados ("quando poss√≠vel", "a menos que especificado de outra forma")
- Manter a estrutura hier√°rquica da mem√≥ria

O email resultante mostra todas essas prefer√™ncias aplicadas: √© mais curto, menos formal, inclui uma declara√ß√£o de encerramento sobre esperar pela conversa, e referencia corretamente o hor√°rio de reuni√£o de 30 minutos.

In [None]:
print(f"\nSimulando usu√°rio aceitando a {Interrupt_Object.value[0]['action_request']['action']} chamada de ferramenta...")
for chunk in graph.stream(Command(resume=[{"type": "accept"}]), config=thread_config_5):
    # Inspect interrupt object if present
    if '__interrupt__' in chunk:
        Interrupt_Object = chunk['__interrupt__'][0]
        print("\nOBJETO DE INTERRUP√á√ÉO:")
        print(f"Solicita√ß√£o de A√ß√£o: {Interrupt_Object.value[0]['action_request']}")

# Check memory after accepting write_email after feedback
print("\nVerificando mem√≥ria ap√≥s aceitar write_email ap√≥s feedback:")
display_memory_content(store, ("email_assistant", "response_preferences"))

Olhar o hist√≥rico completo de mensagens.

In [None]:
state = graph.get_state(thread_config_5)
for m in state.values['messages']:
    m.pretty_print()

## Local Deployment

You can find this graph with memory integration in the `src/email_assistant` directory:

* `src/email_assistant/email_assistant_hitl_memory.py`

Email to test: 
```
{
  "author": "Alice Smith <alice.smith@company.com>",
  "to": "John Doe <john.doe@company.com>",
  "subject": "Quick question about API documentation",
  "email_thread": "Hi John,\nI was reviewing the API documentation for the new authentication service and noticed a few endpoints seem to be missing from the specs. Could you help clarify if this was intentional or if we should update the docs?\nSpecifically, I'm looking at:\n- /auth/refresh\n- /auth/validate\nThanks!\nAlice"
}
```

As before, if you go to [dev.agentinbox.ai](https://dev.agentinbox.ai/), you can easily connect to the graph:

   * Graph name: the name from the `langgraph.json` file (`email_assistant_hitl_memory`)
   * Graph URL: `http://127.0.0.1:2024/`

![inbox](img/agent-inbox-edit.png)

The Memory tab in LangGraph Studio offers a real-time view of how your preferences are being captured and updated with each interaction:

![studio-img](img/memory-studio.png)

Through continued use, the system becomes increasingly personalized:
- It learns which emails you want to respond to, be notified about, or ignore
- It adapts to your communication style preferences
- It remembers your scheduling preferences
- It refines its understanding with each interaction

This combination of HITL and memory creates a system that balances automation with control - handling routine tasks automatically while learning from your feedback to become more aligned with your preferences over time.

## Hosted Deployment with Gmail Tools

If you want to actually run this on your own email, you can deploy the graph with Gmail tools. 

Set up your Gmail credentials [following here](https://github.com/langchain-ai/agents-from-scratch/blob/main/src/email_assistant/tools/gmail/README.md).

There is a graph set up with Gmail tools:

```shell
python src/email_assistant/email_assistant_hitl_memory_gmail.py
```

[One of the deployment options is `hosted`](https://langchain-ai.github.io/langgraph/tutorials/deployment/#other-deployment-options), and you can simply connect the deployed graph URL to the Agent Inbox as done with the local deployment.

## Improving Memory 

Our current memory schema and updating is extremely simple: 

* Our schema is a string
* We always overwrite the existing memory with a new string
 
The store can be easily [configured for semantic search](https://langchain-ai.github.io/langgraph/cloud/deployment/semantic_search/) over a collection of memories. 

Also consider using [LangMem](https://langchain-ai.github.io/langmem/) for more advanced memory management.