# Langchain의 Memory 기능

**Memory**란 사용자가 대규모 언어 모델(LLM, Large Language Model)과 주고받은 대화 내용을 저장하고 이를 이후의 대화에 활용하는 기능을 말한다.

## 왜 Memory가 필요한가?

- 기본적으로 LLM은 상태 비저장(stateless) 모델이다. 
  - 의미: 한 번의 질문에 대해 답변을 제공하고, 그 이후에는 해당 질문과 답변 내용을 기억하지 못한다. 따라서 사용자가 이전 대화에 기반한 후속 질문을 하면, 모델은 맥락을 이해하지 못하고 정확한 답변을 하지 못한다.
- 이 문제를 해결하기 위해, 지금까지의 대화 내용을 저장하고 이후 질문을 할 때 함께 제공하여 맥락을 이어갈 수 있도록 하는 기능이 바로 Memory이다.

## Memory의 동작 방식

- 사용자의 질문과 LLM의 응답을 저장한다.
- 이후 사용자가 새로운 질문을 하면, **저장된 이전 대화 내용과 함께 모델에 전달**하여 자연스러운 연속 대화가 가능하도록 한다.
- **주의**:
  - 대화 이력이 너무 길어지면 현재 질문과 관련없는 내용이 많아지게 되고 이것이 noise가 되어 LLM이 부정확한 응답을 할 수도 있다. 
  - LLM마다 입력으로 받을 수 있는 [**토큰(Token)** 수에 제한](https://platform.openai.com/docs/models/compare)이 있다. 그래서 대화 내용을 무한정 저장하고 전달할 수 없다.
  - Close source llm을 사용하는 경우 대화 이력이 길어지면 그많은 많은 토큰을 입력하게 되어 비용이 늘어나게 된다.
  - 그래서 위와 같은 이유로 대화 이력을 모두 보내기 보다 최근 일부만 보내거나 요약하는 등의 관리가 필요하다.

![memory.png](figures/memory.png)


# 메시지 저장소: ChatMessageHistory
메시지 기록을 관리하는 객체로 어디에 저장느냐에 따라 여러 클래스들이 구현되어 제공된다.

## 종류
- **BaseChatMessageHistory**
    - 모든 메시지 기록 저장소 클래스의 **기본(최상위) 클래스**이다. 메시지를 저장하고 검색하는 기능을 정의하고 있으며, 이 클래스를 상속받아 다양한 저장소 방식이 구현된다.
- **InMemoryChatMessageHistory**
    - 메시지를 **메모리에 저장**하는 방식이다. 속도가 빠르지만, 프로그램을 종료하면 저장된 메시지는 사라진다.
- 외부 저장소 연동 
    - Langchain은 다양한 **3rd-party 저장소**와 연동할 수 있다. 예를 들어 SQLite, PostgreSQL, Redis, MongoDB 등을 사용해 메시지를 영구적으로 저장할 수 있다.

In [4]:
from langchain_core.chat_history import InMemoryChatMessageHistory
# Role 별 message객체
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage

# ("user/human", "message") -> HumanMessage(content="messasge")
# ("ai/assistant", "message") -> AIMessage(content="message"): LLM 응답결과.
# ("system", "message") -> SystemMessage(content="message")

In [5]:
message_history = InMemoryChatMessageHistory() # 메세지 저장소 객체 생성.
# 추가
message_history.add_message(SystemMessage("당신은 여행 가이드 어시스턴트입니다."))
message_history.add_message(HumanMessage("서울의 여행지 세곳을 추천해주세요."))
message_history.add_message(AIMessage("경복궁, 남산, 창경궁을 추천합니다."))

In [6]:
# 저장된 message들 조회
message_history.messages 

[SystemMessage(content='당신은 여행 가이드 어시스턴트입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 여행지 세곳을 추천해주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 창경궁을 추천합니다.', additional_kwargs={}, response_metadata={})]

In [11]:
# Message Histroy로 RDB 사용
from langchain_community.chat_message_histories import SQLChatMessageHistory
from sqlalchemy import create_engine # DB와 연결을 위해 필요

# SQLite에 저장.
engine = create_engine("sqlite:///message_history.sqlite")
# mysql - pymysql 설치
# engine = create_engine("mysql+pymysql://username:password@127.0.0.1:3306/DB이름")
sql_message_history = SQLChatMessageHistory(
    session_id="chat-1", # 대화 ID. 대화별로 따로 메세지를 저장.
    connection=engine
)

sql_message_history.add_message(SystemMessage("당신은 여행 가이드 어시스턴트입니다."))
sql_message_history.add_message(HumanMessage("서울의 여행지 세곳을 추천해주세요."))
sql_message_history.add_message(AIMessage("경복궁, 남산, 창경궁을 추천합니다."))

In [9]:
sql_message_history.messages

[SystemMessage(content='당신은 여행 가이드 어시스턴트입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 여행지 세곳을 추천해주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 창경궁을 추천합니다.', additional_kwargs={}, response_metadata={})]

In [16]:
sql_message_history2 = SQLChatMessageHistory(
    session_id="chat-2", # 대화 ID. 대화별로 따로 메세지를 저장.
    connection=engine
)

sql_message_history2.add_message(SystemMessage("너는 유능한 비서야."))
sql_message_history2.add_message(HumanMessage("안녕."))
sql_message_history2.add_message(AIMessage("무엇을 도와 드릴까요?"))

In [17]:
sql_message_history2.messages

[SystemMessage(content='너는 유능한 비서야.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='무엇을 도와 드릴까요?', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='너는 유능한 비서야.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='무엇을 도와 드릴까요?', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='너는 유능한 비서야.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='무엇을 도와 드릴까요?', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='너는 유능한 비서야.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='무엇을 도와 드릴까요?', additional_kwargs={}, response_metadata={})]

In [15]:
sql_message_history.messages

[SystemMessage(content='당신은 여행 가이드 어시스턴트입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 여행지 세곳을 추천해주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 창경궁을 추천합니다.', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='당신은 여행 가이드 어시스턴트입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 여행지 세곳을 추천해주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 창경궁을 추천합니다.', additional_kwargs={}, response_metadata={})]

# RunnableWithMessageHistory

- **`RunnableWithMessageHistory`**는 `ChatMessageHistory`와 `Runnable Chain`을 이용해 대화 이력을 관리하면서 대화할 수있도록 처리하는 `Runnable` 이다.
  - 대화형 애플리케이션에서는 사용자와 AI 간의 여러 번의 주고받는 대화를 통해 작업을 수행한다. 이때, 이전 대화 내용을 기억하지 못하면 일관성 없는 응답이 발생할 수 있다. 
  - `RunnableWithMessageHistory`는 이러한 문제를 해결하고 대화 흐름을 자연스럽게 유지하도록 설계되었다.

## 특징

- 체인이 실행될 때마다 **대화 메시지를 자동으로 기록**하여 개발자가 별도로 상태를 관리하지 않아도 된다.
- `session_id`(대화 ID)를 사용하여 대화를 구분한다.
  - 동일한 `session_id`를 사용하면 이전 대화를 이어갈 수 있다.
  - 새로운 `session_id`를 사용하면 새로운 대화로 인식된다.

## 생성

`RunnableWithMessageHistory`는 다음과 같은 요소들을 initializer에 전달해 생성한다.

- **runnable**: 실제 작업을 수행하는 체인(`Runnable`) 객체이다.
- **get_session_history**: 주어진 `session_id`에 해당하는 메시지 기록 저장소(`ChatMessageHistory`) 객체를 반환하는 함수이다.
- **input_messages_key**: 사용자 입력 메시지를 저장할 입력 필드의 이름이다.
- **history_messages_key**: 저장된 이전 대화 메시지를 불러올 필드의 이름이다.

이를 통해 체인을 실행할 때마다 이전 메시지가 자동으로 전달되고, 새로운 메시지도 기록된다.

[Langchain Memory Integration 문서](https://python.langchain.com/docs/integrations/memory/)

## RunnableWithMessageHistory를 이용해 Chain 구성

In [5]:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_openai import ChatOpenAI
from langchain_community.chat_message_histories import SQLChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from sqlalchemy import create_engine

from dotenv import load_dotenv

load_dotenv()

True

In [None]:
("당신은 AI 분야의 전문  Assistant입니다." 
"답변은 20단어 이내로 해주세요."
"정확한 답변을 모를 경우 모른다고 답하세요.")

'당신은 AI 분야의 전문  Assistant입니다.답변은 20단어 이내로 해주세요.정확한 답변을 모를 경우 모른다고 답하세요.'

In [None]:
prompt = ChatPromptTemplate(
    [
        ("system", ("당신은 AI 분야의 전문  Assistant입니다." 
                    "답변은 20단어 이내로 해주세요."
                    "정확한 답변을 모를 경우 모른다고 답하세요.")),
        MessagesPlaceholder(variable_name="history", optional=True), #("placeholder", "{history}")
        ("user", "{query}")
    ]    
)

model = ChatOpenAI(model="gpt-5-mini")
chain = prompt | model


In [9]:
def get_message_history(session_id:str) -> SQLChatMessageHistory:
    """
    session_id의 대화내역을 관리하는 ChatMessageHistory를 반환하는 함수
    Args:
        session_id(str): 대화 id
    Return
        SQLChatMessageHistory
    """
    engine = create_engine("sqlite:///chat_message_history.sqlite")
    message_history = SQLChatMessageHistory(
        session_id=session_id,
        connection=engine
    )
    return message_history

In [10]:
# RunnableWithMessageHistory 생성(Runnable)
chain_with_history = RunnableWithMessageHistory(
    runnable=chain, # Prompt -> Model
    input_messages_key="query", # Prompt Template에서 사용자 질문을 넣을 input variable
    history_messages_key="history", # 기존 대화 내역을 넣을 input_variable
    get_session_history=get_message_history # session_id의 대화를 관리하는 ChatMessageHistory를 반환하는 callable
)

In [11]:
# 호출(llm 요청).invoke(input_data,  config:session_id)
res = chain_with_history.invoke(
    {"query":"내이름은 김성환입니다."}, # input_data
    {"configurable":{"session_id":"chat-10"}}   
)

In [13]:
print(res.content)

안녕하세요, 김성환님. 만나서 반갑습니다. 어떻게 도와드릴까요?


In [14]:
chain_with_history.invoke(
    {"query":"내이름이 뭐지?"}, {"configurable":{"session_id":"chat-10"}}
)

AIMessage(content='김성환님입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 143, 'prompt_tokens': 96, 'total_tokens': 239, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 128, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-mini-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CoLcz8bZApaultblE8mSX6E55tMd0', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019b34b0-fc6e-7651-9e92-20fa02963eb4-0', usage_metadata={'input_tokens': 96, 'output_tokens': 143, 'total_tokens': 239, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 128}})

In [15]:
chain_with_history.invoke(
    {"query":"내이름이 뭐지?"}, {"configurable":{"session_id":"chat-11"}}
)

AIMessage(content='모른다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 141, 'prompt_tokens': 56, 'total_tokens': 197, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 128, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-mini-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CoLdlfLMmvLOg2KxvPQl2A53XcZn9', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019b34b1-b841-7fb2-9ce2-00c99fa0079a-0', usage_metadata={'input_tokens': 56, 'output_tokens': 141, 'total_tokens': 197, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 128}})

In [16]:
# 1. 대화 id를 입력
session_id = input("대화 ID:")
config = {"configurable":{"session_id":session_id}}

# 2. 대화 진행 - !quit 입력시 종료
query = input("User:")
while True:
    if query == "!quit":
        print(">>>>>>>>종료<<<<<<<<")
        break
    res = chain_with_history.invoke({"query":query}, config)
    print(">>>User:", query)
    print("<<<AI:", res.content)
    query = input("User:")


>>>User: 두번째 특징이 어떻게 되?
<<<AI: 어떤 항목의 두번째 특징을 말씀하시는 건가요? 대상이나 문맥을 알려주세요.
>>>User: 서울의 여행지 세곳을 추천해줘.
<<<AI: 경복궁, 북촌한옥마을, 남산서울타워. 역사·한옥·전망 추천.
>>>User: 두번째 장소는 무슨동에 있어?
<<<AI: 북촌한옥마을은 서울 종로구 가회동(주요 지역)에 있어요.
>>>>>>>>종료<<<<<<<<


In [None]:
##############################################################################
# 메세지 히스토리를 줄여서 보내기. 요약처리, 최근 몇개의 대화내역만 보내기
#  최근 내역만 짤라내는 함수 - trimm_messages() 
##############################################################################

# 메세지를 trimming하는 runnable
from langchain_core.messages import trim_messages

def trimming_history(input_data:dict) -> dict:
    """
    RunnableWithMessageHistory의 runnable chain의 첫번째 요소로 들어갈 함수.
    input dictionary에 메세지 히스토리와 입력 query를 전달 받는다.
    {history_messages_key: 히스토리, input_messages_key: 입력 쿼리, ...}
    message history를 trimming해서 다음 chain요소(Prompt)에 전달
    """
    # MAX_TOKEN은 대략 어디까지 줄일지의 기준. trimming을 할 때 메세지를 중간에서 자르지 않는다.
    messages_history = trim_messages(
       input_data['history'], # 전체 메세지 히스토리
       max_tokens=100,        # 히스토리를 줄일 기준 token수. 지정한 토큰수가 넘어가면 줄인다.
       strategy="last",    # 메세지를 줄일때 last: 최근 메세지를, first: 오래된 메세지를 남긴다.
       token_counter=model, # 어떤 LLM을 기준으로 토큰을 계산할지. ChatModel을 전달.
       include_system=True, # 줄일 때 sytem message 포함 여부.
       start_on="human", # 줄일때 시작 메세지가 HumanMessage가 되게 한다.(ai: AIMessage)
    )

    # input_data['history'][-9:] # 그대로 사용
    # input_data['history'][:-9] # llm에 전송해서 요약
    return {"history":messages_history, "query":input_data['query']}

runnable = trimming_history | prompt | model 

chain_history = RunnableWithMessageHistory(
    runnable=runnable,
    history_messages_key="history",
    input_messages_key="query",
    get_session_history=get_message_history
)
config = {"configurable":{"session_id":"id-100"}}
# chain_history.invoke({"query":"질문"}, config=config)
#  {"history":저장소에서 질문/답변 히스토리를 조회, "query":질문} -> (runnable)

In [18]:
query = input("User:")
while True:
    if query == "!quit":
        print(">>>>>>>>종료<<<<<<<<")
        break
    res = chain_history.invoke({"query":query}, config)
    print(">>>User:", query)
    print("<<<AI:", res.content)
    query = input("User:")

>>>User: 안녕하세요. 나는 김성환입니다.
<<<AI: 안녕하세요 김성환님. 만나서 반갑습니다. 무엇을 도와드릴까요?
>>>User: 내이름이 뭔지 말해줘.
<<<AI: 당신의 이름은 김성환입니다.
>>>User: llm에 대해서 설명해줘.
<<<AI: LLM은 대규모 텍스트로 학습된 신경망으로, 텍스트 생성·요약·번역·질문응답을 수행합니다.
>>>User: agent란 뭐야?
<<<AI: Agent는 목표 달성을 위해 환경과 상호작용하며 자율적으로 행동·결정하는 소프트웨어나 시스템입니다.
>>>User: agenet와 llm은 무슨 관계야?
<<<AI: LLM은 에이전트의 사고·언어능력을 제공하고, 에이전트는 LLM을 사용해 계획과 행동을 실행합니다.
>>>User: 크리스마스에 뭐하면 좋을까?
<<<AI: 가족·친구와 파티, 따뜻한 영화 관람, 야외 조명 구경, 산책이나 자원봉사 해보세요.
>>>User: 내 이름을 다시 말해줘.
<<<AI: 모르겠어요. 이름을 알려주시면 다시 말해드릴게요.
>>>>>>>>종료<<<<<<<<


In [19]:
query = input("User:")
while True:
    if query == "!quit":
        print(">>>>>>>>종료<<<<<<<<")
        break
    print(">>>User:", query)
    print("<<<AI:", end="")
    for token in chain_history.stream({"query":query}, config):
        print(token.content, end="")
    print("\n")
    query = input("User:")

>>>User: llm에 대해 설명해줘.
<<<AI:대규모 텍스트로 학습된 언어 모델로, 문장 생성·이해, 번역, 요약 등에 사용됩니다.

>>>User: ai llm agent의 관계를 단어수 제한없이 설명해줘.
<<<AI:AI는 분야, LLM은 대규모 언어모델, 에이전트는 LLM으로 계획·행동·도구사용해 목표달성·환경과 상호작용하는 실행체.

>>>>>>>>종료<<<<<<<<
