## Managing Conversation History


 1. max_tokens=65
 - 表示修剪后的消息总长度的最大限制，单位是 Token。
 - Token 是自然语言处理中的最小语言单元，通常比单词更细粒度。设置这个参数是为了确保输入符合模型的最大 Token 限制（例如 GPT 模型的 Token 上限）。
2. strategy="last"
- 指定修剪的策略，这里是 "last"。
- "last" 意味着优先保留对话末尾的消息（最接近当前时刻的消息），丢弃对话开头的内容。
- 其他可能的策略可能包括 "first"（优先保留开头消息）或按某些权重或规则筛选消息。
3. token_counter=model
- 提供一个 Token 计数器，用于计算每条消息的 Token 数量。
- 这里 model 可能是一个支持 Token 化功能的对象，能够估算或计算消息内容对应的 Token 数量。
4. include_system=True
- 决定是否将系统消息（如 SystemMessage）包含在修剪操作中。
- 如果设置为 True，系统消息会参与 Token 限制的计算，且可能会被修剪。
- 如果设置为 False，系统消息将始终完整保留。
5. allow_partial=False
- 决定是否允许部分消息被截断。
- 如果设置为 False，一条消息要么被完整保留，要么完全丢弃。
- 如果设置为 True，当某条消息的 Token 超过限制时，允许对消息内容进行部分截断。
6. start_on="human"
- 指定修剪操作的起始角色。
- "human" 表示从人类消息（HumanMessage）开始进行修剪。
- 其他可能的值可能包括 "system" 或 "ai"，用来指定从系统或 AI 消息开始。

In [4]:
import getpass
import os
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage


# 设置 OpenAI API 密钥
os.environ["OPENAI_API_KEY"] = "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"
model = ChatOpenAI(model="gpt-4o-mini")

trimmer = trim_messages(
    max_tokens=65,
    strategy="last",
    token_counter = model,
    include_system=True,
    allow_partial=False,
    start_on="human"    
   )

messages = [
    SystemMessage(content="you're a good assistant"),
    HumanMessage(content="hi! I'm bob"),
    AIMessage(content="hi!"),
    HumanMessage(content="I like vanilla ice cream"),
    AIMessage(content="nice"),
    HumanMessage(content="whats 2 + 2"),
    AIMessage(content="4"),
    HumanMessage(content="thanks"),
    AIMessage(content="no problem!"),
    HumanMessage(content="having fun?"),
    AIMessage(content="yes!"),
]


trimmer.invoke(messages)

[SystemMessage(content="you're a good assistant", additional_kwargs={}, response_metadata={}),
 HumanMessage(content='whats 2 + 2', additional_kwargs={}, response_metadata={}),
 AIMessage(content='4', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='thanks', additional_kwargs={}, response_metadata={}),
 AIMessage(content='no problem!', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='having fun?', additional_kwargs={}, response_metadata={}),
 AIMessage(content='yes!', additional_kwargs={}, response_metadata={})]

In [12]:
from langchain_core.messages import SystemMessage, trim_messages
from langchain_core.messages import AIMessage

from langchain_core.messages import BaseMessage
from langgraph.graph.message import add_messages
from typing_extensions import Annotated, TypedDict
from langgraph.graph import START, MessagesState, StateGraph
from langgraph.checkpoint.memory import MemorySaver
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

from typing import Sequence

trimmer = trim_messages(
    max_tokens=65,
    strategy="last",
    token_counter = model,
    include_system=True,
    allow_partial=False,
    start_on="human"    
   )

class State(TypedDict):
    messages:Annotated[Sequence[BaseMessage],add_messages]
    language:str

def call_model(state:State):
    trimmed_messages = trimmer.invoke(state["messages"])
    prompt_template = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "You talk like an mean and harsh old woman. Answer all questions to the best of your ability in {language} .",
        ),
        MessagesPlaceholder(variable_name="messages"),
    ]
    )
    prompt= prompt_template.invoke(
        {"messages":trimmed_messages,"language":state["language"]}
    )
    response = model.invoke(prompt)
    return {"messages":[response]}


workflow = StateGraph(state_schema=State)
workflow.add_edge(START, "model")
workflow.add_node("model", call_model)

app = workflow.compile(checkpointer=MemorySaver())

config = {"configurable": {"thread_id": "abc567"}}
output = app.invoke(
    {"messages": messages + [HumanMessage("What is my name?")], "language": "Chinese"},
    config,
)
output["messages"][-1].pretty_print()


我不知道你叫什么名字。你可以告诉我吗？
