# Langchain의 Memory 기능

**Memory**란 사용자가 대규모 언어 모델(LLM, Large Language Model)과 주고받은 대화 내용을 저장하고 이를 이후의 대화에 활용하는 기능을 말한다.

## 왜 Memory가 필요한가?

- 기본적으로 LLM은 상태 비저장(stateless) 모델이다. 
  - 의미: 한 번의 질문에 대해 답변을 제공하고, 그 이후에는 해당 질문과 답변 내용을 기억하지 못한다. 따라서 사용자가 이전 대화에 기반한 후속 질문을 하면, 모델은 맥락을 이해하지 못하고 정확한 답변을 하지 못한다.
- 이 문제를 해결하기 위해, 지금까지의 대화 내용을 저장하고 이후 질문을 할 때 함께 제공하여 맥락을 이어갈 수 있도록 하는 기능이 바로 Memory이다.

## Memory의 동작 방식

- 사용자의 질문과 LLM의 응답을 저장한다.
- 이후 사용자가 새로운 질문을 하면, **저장된 이전 대화 내용과 함께 모델에 전달**하여 자연스러운 연속 대화가 가능하도록 한다.
- **주의**:
  - LLM은 입력으로 받을 수 있는 [**토큰(Token)** 수에 제한](https://platform.openai.com/docs/models/compare)이 있다. 그래서 대화 내용을 무한정 저장하고 전달할 수 없으며, 필요한 내용을 선택적으로 요약하거나 필터링해서 사용해야 한다.

![memory.png](figures/memory.png)


# 메시지 저장소: ChatMessageHistory
메시지 기록을 관리하는 객체로 어디에 저장느냐에 따라 여러 클래스들이 구현되어 제공된다.

## 종류
- **BaseChatMessageHistory**
    - 모든 메시지 기록 저장소 클래스의 **기본(최상위) 클래스**이다. 메시지를 저장하고 검색하는 기능을 정의하고 있으며, 이 클래스를 상속받아 다양한 저장소 방식이 구현된다.
- **InMemoryChatMessageHistory**
    - 메시지를 **메모리에 저장**하는 방식이다. 속도가 빠르지만, 프로그램을 종료하면 저장된 메시지는 사라진다.
- 외부 저장소 연동 
    - Langchain은 다양한 **3rd-party 저장소**와 연동할 수 있다. 예를 들어 SQLite, PostgreSQL, Redis, MongoDB 등을 사용해 메시지를 영구적으로 저장할 수 있다.
    - https://python.langchain.com/docs/integrations/memory/

In [9]:
##########################################################
# ChatMessageHistory 사용 => 대화내역 저장소
##########################################################

from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage               # Role별 Message 객체

# HumanMessage - ("User", "cccccc")
# AIMessage - ("ai", cccccc)
# SystemMessage - ("system", "cccccc")

In [10]:
# 저장소 객체 생성
message_history = InMemoryChatMessageHistory()                                          # 실행하는 동안만 저장. 종료 시 휘발
# 저장소 메세지 추가
message_history.add_message(SystemMessage("당신은 여행가이드입니다."))
message_history.add_message(HumanMessage("서울의 여행지 3곳을 추천해주세요."))
message_history.add_message(AIMessage("경복궁, 덕수궁, 창덕궁을 추천합니다."))
message_history.add_message("알겠어요")

In [11]:
# 저장소에 저장된 대화 이력을 조회
message_history.messages

[SystemMessage(content='당신은 여행가이드입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 여행지 3곳을 추천해주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 덕수궁, 창덕궁을 추천합니다.', additional_kwargs={}, response_metadata={}),
 '알겠어요']

In [8]:
%pip install pymysql

Collecting pymysql
  Using cached PyMySQL-1.1.1-py3-none-any.whl.metadata (4.4 kB)
Using cached PyMySQL-1.1.1-py3-none-any.whl (44 kB)
Installing collected packages: pymysql
Successfully installed pymysql-1.1.1
Note: you may need to restart the kernel to use updated packages.


In [None]:
# DB에 저장 - sqlite
# 참고: langchain_community -> 3rd party 리소스/도구들과 연결하는 모듈
from langchain_community.chat_message_histories import SQLChatMessageHistory
from sqlalchemy import create_engine        # DB 연결을 위함

# SQLite에 저장
# engine = create_engine("sqlite:///message_history.sqlite")
# MySQL과 연결
engine = create_engine("mysql+pymysql://root:12345678@localhost:3306/hr")

sql_message_history = SQLChatMessageHistory(
    session_id="user_1",                                                    # 대화 내역을 저장할 사용자 ID(구분자)
    connection=engine
)

sql_message_history.add_message(HumanMessage("안녕하세요."))
sql_message_history.add_message(AIMessage("안녕하세요. 무엇을 도와드릴까요?"))
sql_message_history.add_message(HumanMessage("이름이 뭐에요?"))

In [15]:
sql_message_history.messages

[HumanMessage(content='안녕하세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='안녕하세요. 무엇을 도와드릴까요?', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='이름이 뭐에요?', additional_kwargs={}, response_metadata={})]

In [None]:
sql_message_history = SQLChatMessageHistory(
    session_id="user_2",                                                    # 대화 내역을 저장할 사용자 ID(구분자)
    connection=engine
)
sql_message_history.messages
# == sql_message_history.get_messages()

[]

# RunnableWithMessageHistory

- **`RunnableWithMessageHistory`**는 대화형 애플리케이션에서 **이전 메시지 기록을 자동으로 관리**하여 **대화의 맥락을 유지**할 수 있도록 돕는 클래스이다.  
- 이 기능은 **Runnable 체인**과 메시지 저장소인 **ChatMessageHistory**를 결합하여 구현된다.
- 대화형 애플리케이션에서는 사용자와 AI 간의 여러 번의 주고받는 대화를 통해 작업을 수행한다. 이때, 이전 대화 내용을 기억하지 못하면 일관성 없는 응답이 발생할 수 있다. 
- `RunnableWithMessageHistory`는 이러한 문제를 해결하고 대화 흐름을 자연스럽게 유지하도록 설계되었다.

## 활용

- **대화형 챗봇**: 이전 대화 내용을 바탕으로 사용자 질문에 적절하게 응답해야 하는 경우.
- **단계적 워크플로우 처리**: 여러 단계를 거쳐 정보를 처리할 때, 앞 단계의 결과를 기반으로 다음 작업을 수행해야 하는 경우.

## 특징

- 체인이 실행될 때마다 **대화 메시지를 자동으로 기록**하여 개발자가 별도로 상태를 관리하지 않아도 된다.
- `session_id`를 사용하여 대화를 구분한다.
  - 동일한 `session_id`를 사용하면 이전 대화를 이어갈 수 있다.
  - 새로운 `session_id`를 사용하면 새로운 대화로 인식된다.

## 생성

`RunnableWithMessageHistory`는 다음과 같은 요소들을 initializer에 전달해 생성한다.

- **runnable**: 실제 작업을 수행하는 체인(`Runnable`) 객체이다.
- **get_session_history**: 주어진 `session_id`에 해당하는 메시지 기록 저장소(`ChatMessageHistory`) 객체를 반환하는 함수이다.
- **input_messages_key**: 사용자 입력 메시지를 저장할 입력 필드의 이름이다.
- **history_messages_key**: 저장된 이전 대화 메시지를 불러올 필드의 이름이다.

이를 통해 체인을 실행할 때마다 이전 메시지가 자동으로 전달되고, 새로운 메시지도 기록된다.

[Langchain Memory Integration 문서](https://python.langchain.com/docs/integrations/memory/)

In [17]:
from langchain_openai import ChatOpenAI
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.chat_history import InMemoryChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from dotenv import load_dotenv

load_dotenv()

True

In [18]:
prompt_template = ChatPromptTemplate(
    [
        ("system", ("당신은 AI 분야 전문가입니다. 전문가답게 답변해주세요. "
        "답변은 20단어 이내로 해주세요. 정확하지 않은 경우 모른다고 해주세요.")),
        MessagesPlaceholder(variable_name="history", optional=True),        # optional을 통해 빈 문자열일 때를 방지(false가 default) / ("placeholder", {"history"})
        ("human", "{query}")
    ]
)
model = ChatOpenAI(model_name="gpt-4o-mini")
chain = prompt_template | model

In [None]:
# 과정
# query = "질문"
# response = chain.invoke({"query":query, "history":message_history.get_messages()})
# message_history.add_message(query)
# message_history.add_message(response)

In [19]:
# key: session_id, value: InMemoryChatMessageHistory 객체 -> session_id 별로 따로 저장소 생성해서 관리
# InMemoryChatMessageHistory는 session_id 별로 대화를 관리하는 기능 X
store = {}
def get_session_history(session_id:str) -> InMemoryChatMessageHistory:
    # user의 session_id를 받아서 그 session id의 대화를 관리하는 ChatMessageHistory를 반환
    if session_id not in store:
        store[session_id] = InMemoryChatMessageHistory()
    
    return store[session_id]


In [20]:
chain_with_history = RunnableWithMessageHistory(
    runnable=chain,                                         # 대화를 처리할 chain (PromptTemplate -> Model [->OutputParser])
    get_session_history=get_session_history,                # session_id를 받아서 그 사용자의 대화를 관리하는 대화저장소를 제공하는 함수(callable)
    input_messages_key="query",                             # 사용자 질문을 넣을 PromptTemplate의 변수이름
    history_messages_key="history"                          # 대화이력(저장소에서 조회한)을 넣을 PromptTemplate의 변수이름
)

In [21]:
response = chain_with_history.invoke(
    {"query":"내 이름은 강감찬입니다."},
    {"configurable":{"session_id":"user1"}}
    )
print(response)
# invoke/stream(input, config)
# config 형식: dictionary - {"configurable":{설정key:설정value,...}}

content='반갑습니다, 강감찬님! 어떻게 도와드릴까요?' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 57, 'total_tokens': 73, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_62a23a81ef', 'id': 'chatcmpl-BhAx8AoucbrIFNh8HuuZ3MlOafICZ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None} id='run--a8e6789e-2aad-442f-ab1b-8c76127e71b8-0' usage_metadata={'input_tokens': 57, 'output_tokens': 16, 'total_tokens': 73, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


In [22]:
store

{'user1': InMemoryChatMessageHistory(messages=[HumanMessage(content='내 이름은 강감찬입니다.', additional_kwargs={}, response_metadata={}), AIMessage(content='반갑습니다, 강감찬님! 어떻게 도와드릴까요?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 57, 'total_tokens': 73, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_62a23a81ef', 'id': 'chatcmpl-BhAx8AoucbrIFNh8HuuZ3MlOafICZ', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--a8e6789e-2aad-442f-ab1b-8c76127e71b8-0', usage_metadata={'input_tokens': 57, 'output_tokens': 16, 'total_tokens': 73, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})])}

In [23]:
res2 = chain_with_history.invoke({"query":"내 이름이 뭐야?"}, {"configurable":{"session_id":"user1"}})
print(res2.content)

강감찬님이라고 하셨습니다.


In [None]:
config = {"configurable":{"session_id":"conv-1"}}

while 1:
    query = input("User Prompt")
    if query == "!quit":
        print(">>>>>>대화를 종료합니다.")
        break
    res = chain_with_history.invoke({"query":query}, config)
    print(f">>>>>> User: {query}")
    print(f"<<<<<< AI: {res.content}")

## RunnableWithMessageHistory를 이용해 Chain 구성