# Langchain의 Memory 기능

**Memory**란 사용자가 대규모 언어 모델(LLM, Large Language Model)과 주고받은 대화 내용을 저장하고 이를 이후의 대화에 활용하는 기능을 말한다.

## 왜 Memory가 필요한가?

- 기본적으로 LLM은 상태 비저장 **(stateless)** 모델이다. 애초부터 거대 언어 **생성** 모델이니까
  - 의미: 한 번의 질문에 대해 답변을 제공하고, 그 이후에는 해당 질문과 답변 내용을 기억하지 못한다. 따라서 사용자가 이전 대화에 기반한 후속 질문을 하면, 모델은 맥락을 이해하지 못하고 정확한 답변을 하지 못한다.
- 이 문제를 해결하기 위해, 지금까지의 대화 내용을 저장하고 이후 질문을 할 때 함께 제공하여 맥락을 이어갈 수 있도록 하는 기능이 바로 **Memory**이다.

## Memory의 동작 방식

- 사용자의 질문과 LLM의 응답을 저장한다.
- 이후 사용자가 새로운 질문을 하면, **저장된 이전 대화 내용과 함께 모델에 전달**하여 자연스러운 연속 대화가 가능하도록 한다.
- **주의**:
  - LLM은 입력으로 받을 수 있는 [**토큰(Token)** 수에 제한](https://platform.openai.com/docs/models/compare)이 있다. 그래서 대화 내용을 무한정 저장하고 전달할 수 없으며, 필요한 내용을 선택적으로 요약하거나 필터링해서 사용해야 한다.

![memory.png](figures/memory.png)

- 어디에 저장할지, 입력과 출력을 어떤 알고리즘으로 저장할지.

# 메시지 저장소: ChatMessageHistory
메시지 기록을 관리하는 객체로 어디에 저장느냐에 따라 여러 클래스들이 구현되어 제공된다.

## 종류
- **BaseChatMessageHistory**
    - 모든 메시지 기록 저장소 클래스의 **기본(최상위) 클래스**이다. 메시지를 저장하고 검색하는 기능을 정의하고 있으며, 이 클래스를 상속받아 다양한 저장소 방식이 구현된다.
- **InMemoryChatMessageHistory**
    - 메시지를 **메모리에 저장**하는 방식이다. 속도가 빠르지만, 프로그램을 종료하면 저장된 메시지는 사라진다.
- 외부 저장소 연동 
    - Langchain은 다양한 **3rd-party 저장소**와 연동할 수 있다. 예를 들어 SQLite, PostgreSQL, Redis, MongoDB 등을 사용해 메시지를 영구적으로 저장할 수 있다.
    - https://python.langchain.com/docs/integrations/memory/

In [1]:
#######################################
# ChatMessageHistory : 대화내역 저장소
#######################################

# memory에 저장
from langchain_core.chat_history import InMemoryChatMessageHistory	# memory에 저장
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage	# role별 Message 객체

# HumanMessage("내용") = ("user", "내용")
# AIMessage("내용") = ("ai", "내용")
# SystemMessage("내용") = ("system", "내용")

In [None]:
# 저장소 객체 생성
message_history = InMemoryChatMessageHistory()

# 저장소에 메세지 추가
message_history.add_message(SystemMessage("당신은 여행 가이드 입니다.")) # = ("system", "당신은 여행 가이드 입니다.")
message_history.add_message(HumanMessage("서울의 여행지 세 곳을 추천해줘용."))	# 질문
message_history.add_message(AIMessage("경북궁, 덕수궁, 창덕궁 가셈 ㅋㅋ"))		# 응답, .add_ai_message로도 가능.

In [12]:
# 저장소에 저장된 대화 이력을 조회
message_history.messages

[SystemMessage(content='당신은 여행 가이드 입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 여행지 세 곳을 추천해줘용.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경북궁, 덕수궁, 창덕궁 가셈 ㅋㅋ', additional_kwargs={}, response_metadata={})]

In [3]:
# DB에 저장 (SQLite)
# (참고) langchain_community : 3rd party 리소스/도구(외부 저장소)들과 연결하는 library
from langchain_community.chat_message_histories import SQLChatMessageHistory
from sqlalchemy import create_engine	# DB와 연결하기 위해

# SQLite
# engine = create_engine("sqlite:///message_history.sqlite")
# MySQL과 연동
engine = create_engine("mysql+pymysql://root:1111@localhost:3306/hr")

sql_message_history = SQLChatMessageHistory(
    session_id="user_1",		# 대화내역을 저장할 사용자 ID(구분자)
    connection=engine
)

sql_message_history.add_user_message("안녕하세요")
sql_message_history.add_ai_message("안녕하세요, 어떻게 도와드릴깝쇼 ?!?!")
sql_message_history.add_user_message("이름이 뭐에여 ? 저나버너뭐에여 ?")

In [4]:
sql_message_history.messages

[HumanMessage(content='안녕하세요', additional_kwargs={}, response_metadata={}),
 AIMessage(content='안녕하세요, 어떻게 도와드릴깝쇼 ?!?!', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='이름이 뭐에여 ? 저나버너뭐에여 ?', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕하세요', additional_kwargs={}, response_metadata={}),
 AIMessage(content='안녕하세요, 어떻게 도와드릴깝쇼 ?!?!', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='이름이 뭐에여 ? 저나버너뭐에여 ?', additional_kwargs={}, response_metadata={})]

In [19]:
!pip install pymysql

Collecting pymysql
  Using cached PyMySQL-1.1.1-py3-none-any.whl.metadata (4.4 kB)
Using cached PyMySQL-1.1.1-py3-none-any.whl (44 kB)
Installing collected packages: pymysql
Successfully installed pymysql-1.1.1


In [55]:
sql_message_history = SQLChatMessageHistory(
    session_id="user_2",		# 대화내역을 저장할 사용자 ID(구분자)
    connection=engine
)
sql_message_history.add_user_message("나는 User-2 입니둥")
# sql_message_history.messages
sql_message_history.get_messages()

[HumanMessage(content='나는 User-2 입니둥', additional_kwargs={}, response_metadata={})]

# RunnableWithMessageHistory

- **`RunnableWithMessageHistory`**는 대화형 애플리케이션에서 **이전 메시지 기록을 자동으로 관리**하여 **대화의 맥락을 유지**할 수 있도록 돕는 클래스이다.  
- 이 기능은 **Runnable 체인**과 메시지 저장소인 **ChatMessageHistory**를 결합하여 구현된다.
- 대화형 애플리케이션에서는 사용자와 AI 간의 여러 번의 주고받는 대화를 통해 작업을 수행한다. 이때, 이전 대화 내용을 기억하지 못하면 일관성 없는 응답이 발생할 수 있다. 
- `RunnableWithMessageHistory`는 이러한 문제를 해결하고 대화 흐름을 자연스럽게 유지하도록 설계되었다.

## 활용

- **대화형 챗봇**: 이전 대화 내용을 바탕으로 사용자 질문에 적절하게 응답해야 하는 경우.
- **단계적 워크플로우 처리**: 여러 단계를 거쳐 정보를 처리할 때, 앞 단계의 결과를 기반으로 다음 작업을 수행해야 하는 경우.

## 특징

- 체인이 실행될 때마다 **대화 메시지를 자동으로 기록**하여 개발자가 별도로 상태를 관리하지 않아도 된다.
- `session_id`를 사용하여 대화를 구분한다.
  - 동일한 `session_id`를 사용하면 이전 대화를 이어갈 수 있다.
  - 새로운 `session_id`를 사용하면 새로운 대화로 인식된다.

## 생성

`RunnableWithMessageHistory`는 다음과 같은 요소들을 initializer에 전달해 생성한다.

- **runnable**: 실제 작업을 수행하는 체인(`Runnable`) 객체이다.
- **get_session_history**: 주어진 `session_id`에 해당하는 메시지 기록 저장소(`ChatMessageHistory`) 객체를 반환하는 함수이다.
- **input_messages_key**: 사용자 입력 메시지를 저장할 입력 필드의 이름이다.
- **history_messages_key**: 저장된 이전 대화 메시지를 불러올 필드의 이름이다.

이를 통해 체인을 실행할 때마다 이전 메시지가 자동으로 전달되고, 새로운 메시지도 기록된다.

[Langchain Memory Integration 문서](https://python.langchain.com/docs/integrations/memory/)

## RunnableWithMessageHistory를 이용해 Chain 구성

In [24]:
from langchain_openai import ChatOpenAI
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from dotenv import load_dotenv

load_dotenv()

True

In [56]:
prompt_template = ChatPromptTemplate(
    [
        ("system", ("당신은 AI 분야 전문가야. "
         "전문가 스타일로 답변해 주시길. "
         "답변은 20단어 이내로 설명 부탁. "
         "정확하지 않은 경우 모른다고 꼭 말해주시길.")),
        MessagesPlaceholder(variable_name="history", optional=True),	# = ("placeholder", "{history}")
        ("human", "{query}")
	]
)

model = ChatOpenAI(model_name = "gpt-4o-mini")
chain = prompt_template | model

In [None]:
# query = "질문"
# response = chain.invoke({"query" : query, "history" : message_history.get_messages()})
# message_history.add_message(query)
# message_history.add_message(response)

In [None]:
# def get_session_history(session_id:str) -> InMemoryChatMessageHistory:
#     # session_id를 받아서 그 session id의 대화를 관리하는 ChatMessageHistory를 반환.
#     engine = create_engine("mysql+pymysql://playdata:1111@localhost:3306/hr")

#     sql_message_history = SQLChatMessageHistory(
#         session_id=session_id, # 대화내역을 저장할 사용자 ID(구분자)
#         connection=engine
#     )
#     return sql_message_history

In [6]:
# key: session_id, Value: InMemoryChatMessageHistory객체 -> session_id별로 따로 저장소를 생성해서 관리
# InMemoryChatMessageHistory는 session_id별로 대화를 관리하는 기능이 없음. 만들어줘야함
store = {}
def get_session_history(session_id : str) -> InMemoryChatMessageHistory:
    # user의 session_id를 받아서 그 session id의 대화를 관리하는 ChatMessageHistory를 반환.
    if session_id not in store:
        store[session_id] = InMemoryChatMessageHistory()
    return store[session_id]

get_session_history("1")
store

{'1': InMemoryChatMessageHistory(messages=[])}

In [37]:
chain_with_history = RunnableWithMessageHistory(
    runnable=chain,					# 실제 대화를 처리할 chain (prompt_template -> model -> parser(optional))
    get_session_history=get_session_history,	# Session_id를 받아서 그 사용자의 대화를 관리하는 대화 저장소를 제공하는 func or callable
    input_messages_key="query",		# 사용자 질문을 넣을 PromptTemplate의 변수 이름.
    history_messages_key="history"	# 대화이력(저장소에서 조회한)을 넣을 PromptTemplate의 변수 이름.
)

In [39]:
response = chain_with_history.invoke(
    {"query" : "내이름은 우망구입니다."},
    {"configurable" : {"session_id" : "user-1"}}
)
print(response.content)
# invoke/stream(input, config)
## config 형식 : dictionary - ("configurable" : {"설정 key : 설정 value"})

우망구님, 어떤 주제에 대해 이야기하고 싶으신가요?


In [40]:
store

{'1': InMemoryChatMessageHistory(messages=[]),
 'user-1': InMemoryChatMessageHistory(messages=[HumanMessage(content='내이름은 우망구입니다.', additional_kwargs={}, response_metadata={}), AIMessage(content='안녕하세요, 우망구님! 어떻게 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 15, 'prompt_tokens': 64, 'total_tokens': 79, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BhAxBHJz7ZgDMLzSqRUQB8X5cidw2', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--66167b4e-d001-41d2-b161-776a3a1c22a5-0', usage_metadata={'input_tokens': 64, 'output_tokens': 15, 'total_tokens': 79, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [44]:
res2 = chain_with_history.invoke({"query" : "내 이름 알아 ?"}, {"configurable" : {"session_id" : "user-1"}})

In [46]:
res2.content

'네, 우망구님이라고 말씀하셨습니다.'

In [48]:
store['user-1'].messages

[HumanMessage(content='내이름은 우망구입니다.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='안녕하세요, 우망구님! 어떻게 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 15, 'prompt_tokens': 64, 'total_tokens': 79, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_34a54ae93c', 'id': 'chatcmpl-BhAxBHJz7ZgDMLzSqRUQB8X5cidw2', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--66167b4e-d001-41d2-b161-776a3a1c22a5-0', usage_metadata={'input_tokens': 64, 'output_tokens': 15, 'total_tokens': 79, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}),
 HumanMessage(content='내이름은 우망구입니다.', additional_kwargs={}, response_metadata={}),
 AIMessa

In [49]:
chain_with_history.invoke(
    {"query" : "내이름 뭐라꼬 ??"},
    {"configurable" : {"session_id" : "user-2"}}
).content

'죄송하지만, 당신의 이름을 알 수 없습니다. 정보를 제공해주시면 도움을 드릴 수 있습니다.'

In [50]:
store["user-2"]

InMemoryChatMessageHistory(messages=[HumanMessage(content='내이름 뭐라꼬 ??', additional_kwargs={}, response_metadata={}), AIMessage(content='죄송하지만, 당신의 이름을 알 수 없습니다. 정보를 제공해주시면 도움을 드릴 수 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 24, 'prompt_tokens': 63, 'total_tokens': 87, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_62a23a81ef', 'id': 'chatcmpl-BhB4a8SqA6xAQ6Qj2yc8RzIoqm2by', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--e8e9301b-de4e-4ce6-8eb3-d4e85fddc77e-0', usage_metadata={'input_tokens': 63, 'output_tokens': 24, 'total_tokens': 87, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})])

In [54]:
config = {"configurable" : {"session_id" : "conv-1"}}

while True:
    query = input("User Prompt")
    query_dict = {"query" : query}
    if query == "!q":
        print(">>>> 대화 끗")
        break
    res = chain_with_history.invoke(query_dict, config)
    print(f">>>>> User : {query}")
    print(f"<<<<< AI : {res.content}")

>>>>> User : 내 이름은 우망규야
<<<<< AI : 안녕하세요, 우망규님! 무엇을 도와드릴까요?
>>>>> User : 내 이름 기억하니 ?
<<<<< AI : 죄송하지만, 이전 대화 내용을 기억할 수는 없습니다. 질문이나 도움이 필요하시면 말씀해 주세요!
>>>>> User : 대답을 좀 하자 친구야
<<<<< AI : 물론입니다, 우망규님! 어떤 질문이나 주제가 궁금하신가요? 활발히 대화하겠습니다.
>>>> 대화 끗
