# 02｜为 LangGraph Chatbot 添加记忆（Checkpointing）

本教程在“工具调用”基础上，使用 LangGraph 的持久化检查点（checkpointing）为聊天机器人添加多轮对话记忆。

核心思路：
- 在编译图时提供 checkpointer（例如 InMemorySaver）
- 在调用图时提供 config = {"configurable": {"thread_id": "..."}}
- 相同 thread_id 的多次调用将自动延续之前保存的 State，实现“记忆”。

提示：生产环境建议替换为 SqliteSaver 或 PostgresSaver。

## 1. 安装/升级依赖

建议使用一个独立的 Python 环境（venv/conda/uv）。如需国内镜像，可自行替换 index-url。

```python
%pip install -U langgraph langsmith "langchain[openai]" langchain-tavily python-dotenv
```

In [1]:
# 安装依赖（如已安装可跳过）
# %pip install -U langgraph langsmith "langchain[openai]" langchain-tavily python-dotenv

## 2. 初始化提供商与聊天模型（OpenRouter 作为 OpenAI 兼容端点）

本项目推荐使用 OpenRouter 以便在国内网络环境下访问多家模型：
- 将 `OPENROUTER_API_KEY` 映射到 `OPENAI_API_KEY`
- 设定 `base_url = "https://openrouter.ai/api/v1"`

在 .env 中至少准备：
- `OPENROUTER_API_KEY=sk-or-...`
- （可选）`TAVILY_API_KEY=...`

In [2]:
import os
from dotenv import load_dotenv

# 加载 .env 文件（仓库根目录放置 .env）
load_dotenv()

# 强制使用 OPENROUTER_API_KEY 作为 OPENAI_API_KEY（解决占位符冲突问题）
if os.getenv("OPENROUTER_API_KEY"):
    os.environ["OPENAI_API_KEY"] = os.environ["OPENROUTER_API_KEY"]

# 选择一个模型（可替换为你在 OpenRouter 上可用的模型）
# 例如："openai:gpt-4o"、"anthropic/claude-3.5-sonnet" 也能通过 OpenRouter 的 openai 兼容端口使用
from langchain.chat_models import init_chat_model

BASE_URL = os.getenv("OPENAI_BASE_URL", "https://openrouter.ai/api/v1")
MODEL_ID = os.getenv("OPENROUTER_MODEL", "openai:gpt-4o-mini")

llm = init_chat_model(MODEL_ID, base_url=BASE_URL)
print("Model ready:", MODEL_ID, "via", BASE_URL)

# 简单测试连接
response = llm.invoke("你好，请用中文简单介绍你自己")

Model ready: openai:gpt-4o-mini via https://openrouter.ai/api/v1


## 3. 定义 State 并构建支持工具的图

我们创建一个包含 `messages` 的 State（使用 `add_messages` reducer），并添加 TavilySearch 工具。
- `chatbot` 节点：调用带工具的 llm 生成回复
- `tools` 节点：执行工具调用（如搜索）
- 条件边：根据模型输出是否包含 tool call 来路由到 `tools` 或结束

In [3]:
from typing import Annotated
from typing_extensions import TypedDict

from langchain_tavily import TavilySearch
from langgraph.graph import StateGraph
from langgraph.graph.message import add_messages
from langgraph.prebuilt import ToolNode, tools_condition

# 定义 State
class State(TypedDict):
    messages: Annotated[list, add_messages]

# 初始化图构建器
graph_builder = StateGraph(State)

# 准备 Tavily 搜索工具（需要 TAVILY_API_KEY）
# 可在 .env 中设置 TAVILY_API_KEY，或直接在此处设置 os.environ["TAVILY_API_KEY"]
search_tool = TavilySearch(max_results=2)
tools = [search_tool]

# 将工具绑定到 LLM（使其具备 tool calling 能力）
llm_with_tools = llm.bind_tools(tools)

# 定义聊天节点

def chatbot(state: State):
    # 模型根据对话状态生成回复（如需要会提出 tool call）
    return {"messages": [llm_with_tools.invoke(state["messages"])]}

# 注册节点
graph_builder.add_node("chatbot", chatbot)

# 工具节点（预构建 ToolNode 可直接执行工具）
tool_node = ToolNode(tools=tools)
graph_builder.add_node("tools", tool_node)

# 条件边：根据模型输出决定是否调用工具
graph_builder.add_conditional_edges(
    "chatbot",
    tools_condition,
)

# 工具执行完毕后回到聊天节点继续处理
graph_builder.add_edge("tools", "chatbot")

# 入口节点
graph_builder.set_entry_point("chatbot")
print("Graph nodes:", graph_builder)


Graph nodes: <langgraph.graph.state.StateGraph object at 0x11586f7f0>


## 4. 添加 MemorySaver 并带检查点编译

使用内存型检查点 InMemorySaver()，并在编译时传入 `checkpointer=memory`。

In [4]:
from langgraph.checkpoint.memory import InMemorySaver

memory = InMemorySaver()
graph = graph_builder.compile(checkpointer=memory)
print("Graph compiled with InMemorySaver checkpointer.")

Graph compiled with InMemorySaver checkpointer.


## 5. 以 thread_id=1 开始一次对话（stream values）

注意：config 作为 `graph.stream` 或 `graph.invoke` 的第二个位置参数传入，不嵌在 inputs 中。

In [5]:
config = {"configurable": {"thread_id": "1"}}

user_input = "Hi there! My name is Will."

# config 是第二个位置参数，传给 stream() 或 invoke()！
events = graph.stream(
    {"messages": [{"role": "user", "content": user_input}]},
    config,
    stream_mode="values",
)
for event in events:
    event["messages"][-1].pretty_print()


Hi there! My name is Will.

Hi Will! How can I assist you today?


### 📖 深入理解 `graph.stream` 和 `event`

#### 1. `graph.stream()` 方法
```python
graph.stream(inputs, config, stream_mode="values")
```

- **返回值**: 一个 Python **生成器 (generator)**，可以逐步迭代图的执行过程
- **参数说明**:
  - `inputs`: 输入数据，格式为 `{"messages": [...]}`
  - `config`: 配置信息，包含 `thread_id` 等
  - `stream_mode="values"`: 流模式，返回每个节点执行后的完整 State

#### 2. `event` 对象
每次迭代 `graph.stream()` 时得到的对象，包含：

- **类型**: `dict` 字典
- **内容**: 当前 State 的快照，键通常是 `"messages"`
- **含义**: 图中某个节点执行完毕后的状态

#### 3. 执行流程解析

1. **Event 1**: 用户消息 + AI 回复（chatbot 节点执行完毕）
2. **Event 2**: 如果需要工具调用，会有更多 events
3. **最终**: 每个 event 都包含完整的对话历史

#### 4. 为什么使用 `stream`？

- **实时反馈**: 可以看到图的逐步执行过程
- **调试友好**: 了解每个节点的输出
- **用户体验**: 可以实现类似 ChatGPT 的逐字显示效果

In [6]:
# # 对比不同的 stream_mode
# print("=== 对比不同 stream_mode ===")

# config = {"configurable": {"thread_id": "demo_modes"}}
# user_msg = {"messages": [{"role": "user", "content": "Hello! What's 2+2?"}]}

# print("\n1. stream_mode='values' (默认)")
# print("返回完整的 State 值:")
# for i, event in enumerate(graph.stream(user_msg, config, stream_mode="values"), 1):
#     print(f"Event {i}: {list(event.keys())} - {len(event['messages'])} messages")
#     print(f"最新消息: {event['messages'][-1].content[:30]}...")

# print("\n" + "="*50)

# # 重置会话
# config2 = {"configurable": {"thread_id": "demo_modes2"}} 

# print("\n2. stream_mode='updates'")
# print("返回每个节点的增量更新:")
# for i, event in enumerate(graph.stream(user_msg, config2, stream_mode="updates"), 1):
#     print(f"Event {i}: {event}")

# print("\n" + "="*50)

### 🎯 总结：为什么要用 `event["messages"][-1].pretty_print()`？

在循环中：
```python
for event in graph.stream(...):
    event["messages"][-1].pretty_print()
```

**分解理解：**

1. **`graph.stream(...)`**: 返回生成器，每次 yield 一个 event（图执行的中间状态）

2. **`event`**: 字典类型，包含当前的 State，键为 `"messages"`

3. **`event["messages"]`**: 获取消息列表，包含完整对话历史

4. **`event["messages"][-1]`**: 获取最新的一条消息（用户输入或AI回复）

5. **`.pretty_print()`**: LangChain 消息对象的方法，美化打印消息内容

**为什么这样设计？**
- 可以实时看到图的执行进度
- 避免等待整个对话完成才看到结果  
- 支持长时间运行的复杂工作流
- 便于调试和监控图的执行状态

## 6. 同一会话继续追问（记忆验证）

继续使用 `thread_id=1`，机器人应能记住你的姓名等上下文信息。

In [7]:
user_input = "Remember my name?"

# 使用相同的 config（thread_id=1），应该能记住之前的对话
events = graph.stream(
    {"messages": [{"role": "user", "content": user_input}]},
    config,
    stream_mode="values",
)
for event in events:
    event["messages"][-1].pretty_print()


Remember my name?

Yes, I remember your name, Will! How can I help you today?


## 7. 切换为 thread_id=2（无先前上下文）

仅改变 `thread_id` 即可观察到没有先前的记忆上下文。

In [8]:
config_isolated = {"configurable": {"thread_id": "2"}}

# 使用不同的 thread_id，应该没有之前的对话记忆
events = graph.stream(
    {"messages": [{"role": "user", "content": "Remember my name?"}]},
    config_isolated,
    stream_mode="values",
)
for event in events:
    event["messages"][-1].pretty_print()


Remember my name?

I don't have the ability to recall personal information or previous interactions. Could you please remind me of your name?


## 8. 检查保存的 State（get_state）

可以随时用 `graph.get_state(config)` 查看某个会话（thread）的最新快照。

In [12]:
snapshot = graph.get_state(config)
snapshot, len(snapshot.values.get("messages", []))


(StateSnapshot(values={'messages': [HumanMessage(content='Introduce yourself briefly.', additional_kwargs={}, response_metadata={}, id='af1ae085-a23f-4cc3-9ef6-1bf2edd82bc8'), AIMessage(content='I’m an AI language model created to assist with a wide range of inquiries, providing information, answering questions, and engaging in conversations across various topics. My goal is to offer accurate and helpful responses to meet your needs!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 45, 'prompt_tokens': 1272, 'total_tokens': 1317, 'completion_tokens_details': {'accepted_prediction_tokens': None, 'audio_tokens': None, 'reasoning_tokens': 0, 'rejected_prediction_tokens': None}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 1152}}, 'model_name': 'openai/gpt-4o-mini', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'gen-1755012620-14a1ihLsPhkHZHM4Zt8l', 'service_tier': None, 'finish_reason': 'stop', 'logprobs': None}, id='run--81

In [13]:

# 查看下一步节点（如果当前已结束，next 为空）
snapshot.next

()

snapshot.next  # (since the graph ended this turn, `next` is empty. If you fetch a state from within a graph invocation, next tells which node will execute next)


## 9. 可选：使用 SQLite/Postgres 作为持久化检查点

生产环境建议使用持久化存储：

- SqliteSaver（本地/轻量）
- PostgresSaver（生产/云端）

示例（仅演示，不会直接执行）：

In [10]:
# 示例：SqliteSaver
# from langgraph.checkpoint.sqlite import SqliteSaver
# sqlite_memory = SqliteSaver.from_conn_string("chat_memory.db")
# graph = graph_builder.compile(checkpointer=sqlite_memory)

# 示例：PostgresSaver
# from langgraph.checkpoint.postgres import PostgresSaver
# PG_DSN = os.getenv("POSTGRES_DSN", "postgresql+psycopg://user:pass@host:5432/dbname")
# pg_memory = PostgresSaver.from_conn_string(PG_DSN)
# graph = graph_builder.compile(checkpointer=pg_memory)

### Bonus：整合代码（与教程片段对应）

以下单元格汇总核心代码，便于快速复制使用。

In [11]:
from typing import Annotated
from typing_extensions import TypedDict
import os
from dotenv import load_dotenv

from langchain.chat_models import init_chat_model
from langchain_tavily import TavilySearch
from langgraph.checkpoint.memory import InMemorySaver
from langgraph.graph import StateGraph
from langgraph.graph.message import add_messages
from langgraph.prebuilt import ToolNode, tools_condition

# 环境准备
load_dotenv()
if os.getenv("OPENROUTER_API_KEY"):
    os.environ["OPENAI_API_KEY"] = os.environ["OPENROUTER_API_KEY"]

BASE_URL = os.getenv("OPENAI_BASE_URL", "https://openrouter.ai/api/v1")
MODEL_ID = os.getenv("OPENROUTER_MODEL", "openai:gpt-4o-mini")

llm = init_chat_model(MODEL_ID, base_url=BASE_URL)

class State(TypedDict):
    messages: Annotated[list, add_messages]

graph_builder = StateGraph(State)

tool = TavilySearch(max_results=2)
tools = [tool]
llm_with_tools = llm.bind_tools(tools)

def chatbot(state: State):
    return {"messages": [llm_with_tools.invoke(state["messages"])]}

graph_builder.add_node("chatbot", chatbot)

tool_node = ToolNode(tools=[tool])
graph_builder.add_node("tools", tool_node)

graph_builder.add_conditional_edges(
    "chatbot",
    tools_condition,
)

graph_builder.add_edge("tools", "chatbot")

graph_builder.set_entry_point("chatbot")
memory = InMemorySaver()

graph = graph_builder.compile(checkpointer=memory)

# 简单测试
config = {"configurable": {"thread_id": "demo"}}
events = graph.stream(
    {"messages": [{"role": "user", "content": "Introduce yourself briefly."}]},
    config,
    stream_mode="values"
)
for event in events:
    event["messages"][-1].pretty_print()


Introduce yourself briefly.

I’m an AI language model created to assist with a wide range of inquiries, providing information, answering questions, and engaging in conversations across various topics. My goal is to offer accurate and helpful responses to meet your needs!
