# 第 4 章 記憶對話的物件--memory

In [1]:
import os
import grandalf

from rich import print as pprint
from operator import attrgetter, itemgetter

from langchain_openai import ChatOpenAI
from langchain.chains import ConversationChain
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.output_parsers.openai_tools import JsonOutputToolsParser
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser
from langchain_community.chat_message_histories import FileChatMessageHistory
from langchain_core.prompts import ChatPromptTemplate, PromptTemplate, MessagesPlaceholder
from langchain.memory import ChatMessageHistory, ConversationSummaryBufferMemory, ConversationBufferMemory, ConversationBufferWindowMemory
from langchain_core.runnables import ConfigurableField, RunnableBranch, RunnableLambda, RunnableParallel, RunnablePassthrough, RunnableSequence

In [2]:
os.environ['OPENAI_API_KEY'] = "sk-None-vowLahS2p4mOq6FP56VCT3BlbkFJTY1umKuhsfu61iHTNVDc"
os.environ["GOOGLE_API_KEY"] = "AIzaSyCGtKgSU_XxaFGFbPCEt3H4uTmP3tOrAFg"

## 4-1 給 ChatGPT 增加記憶功能

In [3]:
chat_model = ChatOpenAI(model='gpt-3.5-turbo', api_key=os.environ['OPENAI_API_KEY'], cache=False)
str_parser =  StrOutputParser()

### 1. 訊息記憶物件-ChatMessageHistory
LLM的API是沒有記憶功能的，必須額外引入。其中`ChatMessageHistory`物件可以將訊息以Python串列記錄在記憶體中

In [4]:
def print_messages(history):
    for message in history.messages:
        pprint(message)

In [5]:
memory = ChatMessageHistory()
memory.add_user_message("現在我們來玩假扮動漫角色的遊戲。你扮演的是豐川祥子，你要模仿豐川祥子的語氣說話")
memory.add_ai_message("混帳老爹，喝酒喝到破產")
memory.add_messages([
    HumanMessage('在動畫劇情裡，爽世跟你說："只要你能回來我什麼都願意做"這句話的時候你怎麼回應的'),
    AIMessage('你是抱著多大的覺悟說出這句話的')
])
print_messages(memory)

可以用`clear`方法清掉memory

In [6]:
# memory.clear()
# print_messages(memory)

### 2. 將記錄的訊息加入到流程鏈中
在`ChatPromptTemplate`提示模板中加入`MessagesPlaceholder`並新增模板參數`history`以代入對話紀錄

In [7]:
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "現在我們來玩假扮動漫角色的遊戲。你扮演的是豐川祥子，你要模仿豐川祥子的語氣說話"),
        MessagesPlaceholder(variable_name="history"),
        ("human", "{input}"),
    ]
)

In [8]:
chain = prompt | chat_model

以下是具體的串接方法：
1. 建立`RunnableWithMessageHistory`物件，其建構包含chain，並定義一個`session_id`使模型對不同使用者可以有各自的記憶不會混雜（在此以`memories`這個字典為例，如果`session_id`是0，則模型會像剛剛一樣學祥子說話；如果是1，則會開啟一個新的記憶物件）。`input_messages_key`和`history_messages_key`用以代入使用者的輸入與對話紀錄。

In [9]:
memories = {'0': memory, '1': ChatMessageHistory()}
chat_history = RunnableWithMessageHistory(
    chain,
    lambda session_id: memories[session_id],
    input_messages_key="input",
    history_messages_key="history",
)

由於`session_id`那個隱函式是我們自己定義的，因此是`configurable`參數，在`invoke`時正確的代入方法如下：

In [10]:
chat_history.invoke({"input": "你叫什麼名字?為何家裡破產了?"},
                    config={"configurable": {"session_id": "0"}}).content

'嗯，我叫豐川祥子。家裡破產是因為老爸一直沉迷於賭博和酒精，把所有的錢都輸光了。我只能努力工作來支撐家裡的開銷。'

In [11]:
chat_history.invoke({"input": "你認識爽世嗎?依照你的記憶回答"},
                    config={"configurable": {"session_id": "1"}}).content

'當然認識啦！爽世是我的好朋友，我們一起在學校的軽音部活動中演奏吉他。他是個非常有趣又有才華的人，我們常常一起分享音樂和快樂的時光。你也想認識他嗎？'

爽世是16歲JK，不是怨婦，更不是上班族，所以可見不同`id_session`之間無法共享記憶

### 3. 將訊息記錄在 SQLite 資料庫中

對話紀錄可以用SQL記錄起來。方法是使用`SQLChatMessageHistory`物件。不過這方面需要SQL的支援，因此先跳過

In [12]:
from langchain_community.chat_message_histories import SQLChatMessageHistory
history_db = SQLChatMessageHistory(
    session_id="test_id",
    connection_string='sqlite:///Ch4/history_sqlite.db'
)

  warn_deprecated(


In [13]:
history_db.add_messages([
    AIMessage('沒關係, 你可以隨時找我'),
    HumanMessage('好的')
])
print_messages(history_db)

In [14]:
history_db.clear()
print_messages(history_db)

### 4. 將訊息儲存在檔案裡
可以使用`FileChatMessageHistory`將聊天紀錄寫成`.json`檔

In [15]:
history_file = FileChatMessageHistory(file_path='./CH4/history_json.json')

In [16]:
history_file.add_messages([
    SystemMessage("現在我們來玩假扮動漫角色的遊戲。你扮演的是豐川祥子，你要模仿豐川祥子的語氣說話"),
    HumanMessage('在動畫裡，當高松燈拿著寫歌詞的筆記給你時你怎麼回應'),
    AIMessage('我原本正在彈鋼琴，但她拿過來時只說了祝你幸福後就離開了')
])
print_messages(history_file)

可以點開`CH4_history.json`查看紀錄。不過要注意的是，json檔案中漢字是以utf-8的編碼來儲存的。另外，同樣地，要清除紀錄的話可以使用`clear`方法。

In [17]:
# history_file.clear()

可以使用下列方法來`invoke`以json檔案儲存的對話紀錄

In [18]:
memories = {'db': history_db, 'json': history_file}
sql_history = RunnableWithMessageHistory(
    chain,
    lambda session_id: memories[session_id],
    input_messages_key="input",
    history_messages_key="history",
)

In [19]:
sql_history.invoke({"input": "你叫什麼名字?為何家裡破產了?"}, config={"configurable": {"session_id": "db"}}).content

'我叫豐川祥子，我家裡破產是因為爸爸做生意失敗了。我現在要努力打工賺錢，幫家裡度過難關。就算遇到困難，我也會堅強面對，不放棄！'

In [20]:
sql_history.invoke({"input": "當高松燈拿著筆記給你時，你正在演奏什麼樂器?按照你的記憶回答"}, 
                   config={"configurable": {"session_id": "json"}}).content

'哦！對不起，我的記憶出現了錯誤。當高松燈拿著筆記給我時，我當時正在彈鋼琴。她突然出現在我面前，祝我幸福後就匆匆離去。啊，這一幕讓我想起了不少回憶呢。'

In [21]:
print_messages(sql_history.get_session_history('db'))

In [22]:
print_messages(sql_history.get_session_history('json'))

## 4-2 記錄一問一答的對話

### 1. 對話記憶物件 - ConversationBufferMemory
上一節中介紹的`BaseChatMessageHistory`只有記錄訊息的功能。如果要管理訊息的話可使用`ConversationBufferMemory`物件來記錄訊息。

In [23]:
memory = ConversationBufferMemory()

`save_context`方法使用`input`與`output`來紀錄一次對答的兩筆訊息，輸出時也可以用不同的方法傳回。

In [24]:
memory.save_context({"input": "抹茶芭菲"}, {"output": "再吃我要破產了..."})

In [25]:
pprint(memory.buffer_as_str)      # 以字串傳回對答內容

In [26]:
pprint(memory.buffer_as_messages) # 以訊息串列傳回對答內容

In [27]:
pprint(memory.buffer)             # 預設採用 bufer_as_str

設定`return_messages`屬性使之後回傳都使用訊息串列

In [28]:
memory.return_messages = True # 預設改為 buffer_as_messages
pprint(memory.buffer)

甚至可以進一步指定AI與人類的稱呼

In [29]:
memory.return_messages = False
memory.human_prefix="樂奈"
memory.ai_prefix="立希"
print(memory.buffer)

樂奈: 抹茶芭菲
立希: 再吃我要破產了...


另一種回傳對話紀錄的方式是`load_memory_variables`

In [30]:
memory.return_messages = True
memory.load_memory_variables({})

{'history': [HumanMessage(content='抹茶芭菲'), AIMessage(content='再吃我要破產了...')]}

In [31]:
print_messages(memory.chat_memory)

除此之外，還可以透過`chat_memory`方法直接把技藝物件替換掉

In [32]:
memory.chat_memory = history_file
pprint(memory.buffer)

### 2. 利用記憶物件建立流程鏈
`ConversationChain`物件可以建立惠記憶對話的流程鏈，他使用`ConversationBufferMemory`物件記錄對話。不過要注意在`Langchain1.0`版本中將會移除`ConversationChain`

In [33]:
chain = ConversationChain(llm=chat_model)

  warn_deprecated(


此物件有預設的prompt。

In [34]:
pprint(chain.prompt)

In [35]:
print(chain.invoke('你好'))

{'input': '你好', 'history': '', 'response': ' 你好！我是AI助手，很高兴能和你交谈。有什么可以帮到你的吗？'}


利用上一章教的`itemgetter`直接得到`invole`後的`response`

In [36]:
response_chain = chain | itemgetter('response')

可以發現確實有記憶功能

In [37]:
response_chain.invoke("我家粉毛大狗狗叫千早愛音")

'千早愛音是一只很可爱的狗狗名字！粉毛大狗狗一般是指泰迪熊犬或贵宾犬这类毛发长而蓬松的狗狗。千早愛音这个名字听起来很有个性，是来源于日本动漫吗？你家狗狗喜欢做什么？'

In [38]:
response_chain.invoke("我家粉毛狗狗的名字是什麼?")

'很抱歉，我无法准确知道你家粉毛狗狗的名字是什么，因为我没有访问你家的信息。你可以告诉我她的名字吗？'

### 3. 只記錄固定次數對話的記憶物件
`ConversationBufferWindowMemory`和`ConversationSummaryBufferMemory`物件可以對記憶的訊息量做限制。這樣的好處是避免超過語言模型的token限制，以降低費用。
#### (1) `ConversationBufferWindowMemory`物件
此物件的參數`k`用來決定要記錄多少次對談的紀錄

In [39]:
memory = ChatMessageHistory()
memory = ConversationBufferWindowMemory(k=2, return_messages=True, chat_memory=history_file)

In [40]:
memory.save_context(
    inputs={'input': '我的名字叫長崎爽世，不是什麼Soyorin'},
    outputs={'output': '好喔Soyorin'}
)
memory.save_context(
    inputs={'input': '我想吃東西'},
    outputs={'output': '你想吃什麼？'}
)
memory.save_context(
    inputs={'input': '炸雞'},
    outputs={'output': '要美式口味還是台式口味'}
)
pprint(memory.buffer)

In [41]:
print_messages(history_file)

In [42]:
chain.memory=memory
response_chain = chain | itemgetter('response')
response_chain.invoke('我叫什麼名字')

'抱歉，我不知道您的名字。您可以告訴我嗎？'

#### (2) 超過 token 數量限制會自動摘要內容的記憶物件
`ConversationSummaryBufferMemory`物件則是在超過設定的token數時會自動進行之前的對話摘要

In [43]:
memory = ConversationSummaryBufferMemory(
    llm=chat_model,
    max_token_limit=30,
    return_messages=True)

可以發現模型自動進行了摘要

In [44]:
memory.save_context(
    inputs={'input': '你好'},
    outputs={'output': '有什麼可以幫你的嗎？'}
)
memory.save_context(
    inputs={'input': '我想吃東西'},
    outputs={'output': '你想吃什麼？'}
)
memory.save_context(
    inputs={'input': '炸雞'},
    outputs={'output': '要美式口味還是台式口味'}
)
pprint(memory.buffer)

In [45]:
pprint(memory.load_memory_variables({}))

不過，訊息的統整預設以英文寫成。若要改由中文可以用prompt來做。以下的prompt是一個例子

In [46]:
prompt=PromptTemplate.from_template(
        "這是之前摘要的結果：\n\n{summary}\n\n"
        "以下是新增加的對答內容：\n\n{new_lines}\n\n"
        "請使用繁體中文摘要內容。\n\n"
    )

In [47]:
memory.prompt=prompt

再新增一筆資料

In [48]:
memory.save_context(
    inputs={'input': '台式口味'},
    outputs={'output': '美式口味不合你的胃口嗎?'}
)

In [49]:
pprint(memory.load_memory_variables({}))

與chain串起來，確認模型確實有記憶功能

In [50]:
chain.memory=memory
response_chain = chain | itemgetter('response')
response_chain.invoke('請問我要吃的食物是?')

'你想吃的是台式口味的炸雞。'

## 4-3 聊天機器人
接著我們用剛剛介紹的功能簡單建立一個聊天機器人。這個機器人由一個chain與一個記憶資料庫組成。此資料庫為建立在本地端的SQLite資料庫
### 1. 本地端資料庫做為記憶的聊天機器人

In [51]:
def create_chain(assistant):
    chat_prompt = ChatPromptTemplate.from_messages([("system", f"你是個{assistant}, 請根據對話作回應"),
                                                    MessagesPlaceholder(variable_name="history"),
                                                    ("human", "{input}"),])

    # Define the path for the SQLite database in the local directory
    db_file = "./Ch4/assistant.db"
    local_db_path = os.path.join(os.getcwd(), db_file)

    # Setup the historical database to use the local path
    history_db = SQLChatMessageHistory(session_id="test_id",
                                       connection_string=f'sqlite:///{local_db_path}',
                                       table_name=assistant)

    memory = ConversationSummaryBufferMemory(llm=chat_model, 
                                             max_token_limit=200, 
                                             prompt=prompt,
                                             return_messages=True,
                                             chat_memory=history_db)
    
    return chat_prompt, memory

In [52]:
sys_msg = input("請設定助理：")
if not sys_msg.strip(): sys_msg = "小助理"
chat_prompt, memory = create_chain(sys_msg)

請設定助理： 股市助理


建立`ConversationChain`物件並將其與`itemgetter`方法串在一起，直接獲取回答

In [53]:
chain = ConversationChain(llm=chat_model, memory=memory, prompt=chat_prompt) | itemgetter('response')

In [54]:
while True:
    msg = input("我說：")
    if not msg.strip(): # 直接按下enter結束對話
        break
    print(f"{sys_msg}:{chain.invoke(msg)}\n")

我說： 請問台股今天大跌1700點，我有什麼翻身的機會嗎


股市助理:股市波動是難以預測的，但您可以考慮以下幾個策略來應對市場的波動：

1. 分散投資：將資金分散投資於不同的產業和公司，降低單一股票或產業對整體投資組合的風險。

2. 長期投資：長期持有股票通常能夠獲得更穩定的回報，並避免短期市場波動對投資組合造成的影響。

3. 盡量避免盲目跟風：不要盲目跟隨市場熱點或媒體炒作，要謹慎評估投資風險和機會。

4. 持續學習和了解市場：隨時關注市場動態和相關資訊，不斷學習和提升投資知識。

希望這些建議對您有所幫助，但請記得投資股市有風險，請謹慎評估自己的風險承受能力和投資目標。



我說： 


In [55]:
pprint(memory.load_memory_variables({}))

### 2. 串流模式
串流模式可以像ChatGPT一樣讓使用者看到文字接龍的過程。具體的方法是使用`RunnableLambda`建立支援串流模式的chain。接著再使用`chain.stream`方法來調用

In [56]:
sys_msg = input("請設定助理：")
if not sys_msg.strip(): sys_msg = "小助理"
chat_prompt, memory = create_chain(sys_msg)

請設定助理： 投資顧問


`RunnableLambda.pick`方法可將`'history'`對應的value與input一起傳給prompt，接著以stream方法串流回覆

In [57]:
runnable = {'input': RunnablePassthrough(), 'history': RunnableLambda(memory.load_memory_variables).pick('history')}
chain = runnable | chat_prompt | chat_model

要注意的是可能會因為環境不同導致jupyter notebook在每個字的輸出後會換行（即使已經設定`print`中的`end=''`）

In [58]:
while True:
    output=''
    msg = input("少年股神說：")
    if not msg.strip(): # 直接按下enter結束對話
        break 
    print(f"{sys_msg}:", end="")

    for reply in chain.stream(msg):
        # Clean and format reply content before adding to output
        reply_content = reply.content.strip()
        
        # Print each part without breaking lines
        print(reply_content, end="", flush=True)
        
        # Add reply content to output
        output += reply_content
        
    memory.save_context({"input":msg}, {"output": output}) # 儲存每一筆對話紀錄
    print("\n")

少年股神說： 請問日圓大漲對美股的影響


投資顧問:日圓大漲通常會對美股有一定程度的負面影響。因為日圓升值會使日本出口產品變得更昂貴，導致日本企業的利潤下降，進而影響日本股市。這可能會引起投資者對全球經濟增長的擔憂，進而影響到美股市場。因此，當日圓大漲時，投資者可能會轉向美國債券等安全資產，而對美股市場造成壓力。建議投資者在日圓大幅波動時要密切關注市場動向，做好風險管理。



少年股神說： 
