# Langchain의 Memory 기능

**Memory**란 사용자가 대규모 언어 모델(LLM, Large Language Model)과 주고받은 대화 내용을 저장하고 이를 이후의 대화에 활용하는 기능을 말한다.

## 왜 Memory가 필요한가?

- 기본적으로 LLM은 상태 비저장(stateless) 모델이다. 
  - 의미: 한 번의 질문에 대해 답변을 제공하고, 그 이후에는 해당 질문과 답변 내용을 기억하지 못한다. 따라서 사용자가 이전 대화에 기반한 후속 질문을 하면, 모델은 맥락을 이해하지 못하고 정확한 답변을 하지 못한다.
- 이 문제를 해결하기 위해, 지금까지의 대화 내용을 저장하고 이후 질문을 할 때 함께 제공하여 맥락을 이어갈 수 있도록 하는 기능이 바로 Memory이다.

## Memory의 동작 방식

- 사용자의 질문과 LLM의 응답을 저장한다.
- 이후 사용자가 새로운 질문을 하면, **저장된 이전 대화 내용과 함께 모델에 전달**하여 자연스러운 연속 대화가 가능하도록 한다.
- **주의**:
  - 대화 이력이 너무 길어지면 현재 질문과 관련없는 내용이 많아지게 되고 이것이 noise가 되어 LLM이 부정확한 응답을 할 수도 있다. 
  - LLM마다 입력으로 받을 수 있는 [**토큰(Token)** 수에 제한](https://platform.openai.com/docs/models/compare)이 있다. 그래서 대화 내용을 무한정 저장하고 전달할 수 없다.
  - Close source llm을 사용하는 경우 대화 이력이 길어지면 그많은 많은 토큰을 입력하게 되어 비용이 늘어나게 된다.
  - 그래서 위와 같은 이유로 대화 이력을 모두 보내기 보다 최근 일부만 보내거나 요약하는 등의 관리가 필요하다.

![memory.png](figures/memory.png)


# 메시지 저장소: ChatMessageHistory
메시지 기록을 관리하는 객체로 어디에 저장느냐에 따라 여러 클래스들이 구현되어 제공된다.

## 종류
- **BaseChatMessageHistory**
    - 모든 메시지 기록 저장소 클래스의 **기본(최상위) 클래스**이다. 메시지를 저장하고 검색하는 기능을 정의하고 있으며, 이 클래스를 상속받아 다양한 저장소 방식이 구현된다.
- **InMemoryChatMessageHistory**
    - 메시지를 **메모리에 저장**하는 방식이다. 속도가 빠르지만, 프로그램을 종료하면 저장된 메시지는 사라진다.
- 외부 저장소 연동 
    - Langchain은 다양한 **3rd-party 저장소**와 연동할 수 있다. 예를 들어 SQLite, PostgreSQL, Redis, MongoDB 등을 사용해 메시지를 영구적으로 저장할 수 있다.

In [1]:
from langchain_core.chat_history import InMemoryChatMessageHistory
# role 별 message 객체
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage


#("user/human", "message") -> HumanMessage(content="message")
#("ai/assistant", "message") -> AIMessage(contnet="message"):LLM 응답결과
#("system", "message") -> SystemMessage(content="message")

In [2]:
message_history = InMemoryChatMessageHistory() # 메세지 저장소 객체 생성.
# 추가
message_history.add_message(SystemMessage("당신은 여행 가이드 어시스턴트 입니다."))
message_history.add_message(HumanMessage("서울의 형행지 세 곳을 추천해 주세요."))
message_history.add_message(AIMessage("경복궁, 남산, 청계천을 추천합니다."))


In [3]:
# 저장된 message들 조회
message_history.messages

[SystemMessage(content='당신은 여행 가이드 어시스턴트 입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 형행지 세 곳을 추천해 주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 청계천을 추천합니다.', additional_kwargs={}, response_metadata={})]

In [None]:
#message history로 RDB 사용
from langchain_community.chat_message_histories import SQLChatMessageHistory
from sqlalchemy import create_engine # DB와 연결을 위해 필요

#SQLite 에 저장
engine = create_engine("sqlite:///message_history.sqlighte")

#my sql - pymysql 설치
# engine = create_engine("mysql+pymysql://username:password@127.0.0.1:3306/DB이름")

sql_message_history = SQLChatMessageHistory(
    session_id="chat-1", # 대화 ID. 대화별로 따로 메세지를 저장
    connection = engine
)

sql_message_history.add_message(SystemMessage("당신은 여행 가이드 어시스턴트 입니다."))
sql_message_history.add_message(HumanMessage("서울의 여행지 세 곳을 추천해 주세요."))
sql_message_history.add_message(AIMessage("경복궁, 남산, 청계천을 추천합니다."))



In [None]:
sql_message_history.messages

[SystemMessage(content='당신은 여행 가이드 어시스턴트 입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 형행지 세 곳을 추천해 주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 청계천을 추천합니다.', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='당신은 여행 가이드 어시스턴트 입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 형행지 세 곳을 추천해 주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 청계천을 추천합니다.', additional_kwargs={}, response_metadata={})]

In [10]:
sql_message_history2 = SQLChatMessageHistory(
    session_id="chat-2", # 대화 ID. 대화별로 따로 메세지를 저장
    connection = engine
)

sql_message_history2.add_message(SystemMessage("너는 유능한 비서야."))
sql_message_history2.add_message(HumanMessage("안녕."))
sql_message_history2.add_message(AIMessage("무엇을 도와드릴까요?"))

In [11]:
sql_message_history2.messages

[SystemMessage(content='너는 유능한 비서야.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='무엇을 도와드릴까요?', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='너는 유능한 비서야.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='안녕.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='무엇을 도와드릴까요?', additional_kwargs={}, response_metadata={})]

In [13]:
sql_message_history.messages

[SystemMessage(content='당신은 여행 가이드 어시스턴트 입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 형행지 세 곳을 추천해 주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 청계천을 추천합니다.', additional_kwargs={}, response_metadata={}),
 SystemMessage(content='당신은 여행 가이드 어시스턴트 입니다.', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='서울의 형행지 세 곳을 추천해 주세요.', additional_kwargs={}, response_metadata={}),
 AIMessage(content='경복궁, 남산, 청계천을 추천합니다.', additional_kwargs={}, response_metadata={})]

# RunnableWithMessageHistory

- **`RunnableWithMessageHistory`**는 `ChatMessageHistory`와 `Runnable Chain`을 이용해 대화 이력을 관리하면서 대화할 수있도록 처리하는 `Runnable` 이다.
  - 대화형 애플리케이션에서는 사용자와 AI 간의 여러 번의 주고받는 대화를 통해 작업을 수행한다. 이때, 이전 대화 내용을 기억하지 못하면 일관성 없는 응답이 발생할 수 있다. 
  - `RunnableWithMessageHistory`는 이러한 문제를 해결하고 대화 흐름을 자연스럽게 유지하도록 설계되었다.

## 특징

- 체인이 실행될 때마다 **대화 메시지를 자동으로 기록**하여 개발자가 별도로 상태를 관리하지 않아도 된다.
- `session_id`(대화 ID)를 사용하여 대화를 구분한다.
  - 동일한 `session_id`를 사용하면 이전 대화를 이어갈 수 있다.
  - 새로운 `session_id`를 사용하면 새로운 대화로 인식된다.

## 생성

`RunnableWithMessageHistory`는 다음과 같은 요소들을 initializer에 전달해 생성한다.

- **runnable**: 실제 작업을 수행하는 체인(`Runnable`) 객체이다.
- **get_session_history**: 주어진 `session_id`에 해당하는 메시지 기록 저장소(`ChatMessageHistory`) 객체를 반환하는 함수이다.
- **input_messages_key**: 사용자 입력 메시지를 저장할 입력 필드의 이름이다.
- **history_messages_key**: 저장된 이전 대화 메시지를 불러올 필드의 이름이다.

이를 통해 체인을 실행할 때마다 이전 메시지가 자동으로 전달되고, 새로운 메시지도 기록된다.

[Langchain Memory Integration 문서](https://python.langchain.com/docs/integrations/memory/)

## RunnableWithMessageHistory를 이용해 Chain 구성

In [4]:
from langchain_core.prompts import ChatPromptTemplate,MessagesPlaceholder
from langchain_openai import ChatOpenAI
from langchain_community.chat_message_histories import SQLChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from sqlalchemy import create_engine

from dotenv import load_dotenv

load_dotenv()

True

In [6]:
prompt = ChatPromptTemplate(
    [
        ("system", ("당신은 AI 분야의 전문 Assistant 입니다." 
                    "답변은 20 단어 이내로 해 주세요." 
                    "정확한 답변을 모를 경우 모른다고 답하세요")), #괄호로 묶어 보기에는 줄바꿈이지만, 인식은 한줄로.
        MessagesPlaceholder(variable_name="history", optional=True), # ("placeholder","{history}")
        ("user", "{query}")
    ]
)

model = ChatOpenAI(model="gpt-5-mini")
chain = prompt | model

In [7]:
def get_message_history(session_id:str) -> SQLChatMessageHistory:
    """ 
    session_id의 대화 내역을 관리하는 ChatMessageHistory를 반환하는 함수
    Args:
        session_id(str): 대화 id
    Return
        SQLChatMessageHistory
    """
    engine = create_engine("sqlite:///chat_message_history.sqlite")
    message_history = SQLChatMessageHistory(
        session_id=session_id,
        connection=engine
    )
    return message_history

In [8]:
# RunnableWithMessageHistory 생성 (Runnable)
chain_with_history = RunnableWithMessageHistory(
    runnable=chain, # Prompt -> Model
    input_messages_key="query", #Prompt Template에서 사용자 질문을 넣을 input variable
    history_messages_key="history", #기존 대화 내역을 넣을 input variable
    get_session_history=get_message_history #session_id의 대화를 관리하는 ChatMessageHistory를 반환하는 callable
)

In [10]:
# 호출(llm 요청).invoke(input_data, config:session_id)
res = chain_with_history.invoke(
    {"query":"내 이름은 박민정 입니다."}, #input_data
    {"configurable":{"session_id":"chat-10"}}
)

In [11]:
print(res.content)

만나서 반갑습니다, 박민정님. 무엇을 도와드릴까요?


In [12]:
chain_with_history.invoke(
    {"query":"내 이름이 뭐지?."},
    {"configurable":{"session_id":"chat-10"}}
)

AIMessage(content='당신의 이름은 박민정입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 211, 'prompt_tokens': 91, 'total_tokens': 302, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 192, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-mini-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CoLe2iuNH0gDmgpHr5qFhkxJu8t8X', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019b34b1-ef20-7bd0-b923-64260957d04e-0', usage_metadata={'input_tokens': 91, 'output_tokens': 211, 'total_tokens': 302, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 192}})

In [13]:
chain_with_history.invoke(
    {"query":"내 이름이 뭐지?."},
    {"configurable":{"session_id":"chat-11"}}
)

AIMessage(content='모르겠습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 269, 'prompt_tokens': 53, 'total_tokens': 322, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 256, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-mini-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-CoLeNkO1NRpm1fH9BaTG61O4srXxI', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019b34b2-4b24-7343-88f2-205285bbbbeb-0', usage_metadata={'input_tokens': 53, 'output_tokens': 269, 'total_tokens': 322, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 256}})

In [14]:
# 1. 대화 id를 입력
session_id = input("대화 ID:")
config = {"configurable":{"session_id":session_id}}

# 2. 대화 진행 - !quit 입력시 종료
query = input("User:")
while True:
    if query == "!quit":
        print(">>>>>>>>>>>>종료<<<<<<<<<<<<")
        break
    res = chain_with_history.invoke({"query":query}, config)
    print(">>>User:", query)
    print("<<<AI:", res.content)
    query = input("User:") 

>>>User: LLM 특징 중 하나를 다시 알려줄래?
<<<AI: 대규모 데이터로 학습해 문맥을 이해하고 자연어를 생성할 수 있다.
>>>User: 서울에서 관광하기 좋은 장소를 알려줘
<<<AI: 경복궁, 북촌한옥마을, 인사동, N서울타워, 홍대, 명동, 동대문시장.
>>>User: N 서울타워의 주소는 어떻게 돼?
<<<AI: N서울타워 주소: 서울특별시 용산구 남산공원길 105.
>>>>>>>>>>>>종료<<<<<<<<<<<<


In [25]:
############################################################################
# 메세지 히스토리를 줄여서 보내기. 요약처리, 최근 몇 개의 대화 내역만 보내기
# 최근 내역만 잘라내는 함수 - trimm_messages()
############################################################################

# 메세지를 trimming 하는 runnable
from langchain_core.messages import trim_messages

def trimming_history(input_data:dict) -> dict:
    """ 
    RunnableWithMessageHistory의 runnable chain의 첫번째 요소로 들어갈 함수.
    input dictionary 에 메세지 히스토리와 입력 query를 전달 받는다.
    {history_messages_key: 히스토리, input_messages_key: 입력, 쿼리...}
    message history 를 trimming 해서 다음 chain 요소(Prompt)에 전달
    """

    # max_token은 대략 어디까지 줄일지 기준. trimming을 할 때 메세지를 중간에서 자르지 않는다.
    messages_history = trim_messages(
        input_data['history'], # 전체 메세지 히스토리
        max_tokens=100, # 히스토리를 줄일 기준 token 수 지정한 토큰 수가 넘어가면 줄인다.
        strategy="last", # 메세지를 줄일 때 last : 최근 ㄴ메세지를 , first : 오래된 메세지를 남긴다.
        token_counter=model, # 어떤 LLM을 기준으로 토큰을 계산할지. ChatModel을 전달.
        include_system=True, # 줄일 때 system message 포함 여부
        start_on="human" # 줄일 때 시작 메세지가 HumanMessage가 되도록 한다. (ai : AIMessage)
    )
    # input_data['history'][-9:]  그대로 사용
    # input_daga['history'][:-9] llm에 전송후 요약
    return {"history": messages_history, "query":input_data['query']}

runnable = trimming_history | prompt | model

chain_history = RunnableWithMessageHistory(
    runnable=runnable,
    history_messages_key="history",
    input_messages_key="query",
    get_session_history=get_message_history
)
config = {"configurable":{"session_id":"id_100"}}
# chain_history.invoke({"query":"질문", config=config})
# {"history": 저장소에서 질문/답변 히스토리를 조회, "queary":질문} -> (runnable)

In [26]:
query = input("User:")
while True:
    if query == "!quit":
        print(">>>>>>>>>>>>종료<<<<<<<<<<<<")
        break
    res = chain_history.invoke({"query":query}, config)
    print(">>>User:", query)
    print("<<<AI:", res.content)
    query = input("User:") 

>>>User: 안녕하세요. 나는 박민정 입니다.
<<<AI: 안녕하세요, 박민정님. 만나서 반갑습니다. 어떻게 도와드릴까요?
>>>User: ai의 특징에 대해 간단하게 설명해줘
<<<AI: 학습, 패턴인식, 추론, 적응성, 자동화로 데이터에서 지식 추출해 문제 해결을 지원.
>>>User: ai는 학습을 어떻게 해?
<<<AI: 데이터로 패턴을 학습하고, 손실 최소화로 모델 가중치를 최적화합니다. 지도·비지도·강화학습 사용.
>>>User: 비지도 학습에 대해 설명해줘
<<<AI: 레이블 없는 데이터에서 구조·패턴 발견. 클러스터링, 차원축소, 밀도추정, 이상치 탐지 등이 있음.
>>>User: 클러스터링은 무엇인가요?
<<<AI: 레이블 없는 데이터에서 유사한 샘플들을 그룹화하는 비지도 학습 기법. 예: K-평균, 계층적, DBSCAN.
>>>User: 레이블이 있는 것을 학습하는 건 뭐라고 하지?
<<<AI: 레이블 있는 학습은 지도학습이라 하며, 주로 분류와 회귀 문제를 다룹니다.
>>>User: 내 이름이 뭐였는지 기억해?
<<<AI: 모르겠습니다. 이름을 알려주시면 다음부터 기억하겠습니다.
>>>>>>>>>>>>종료<<<<<<<<<<<<


In [None]:
query = input("User:")
while True:
    if query == "!quit":
        print(">>>>>>>>>>>>종료<<<<<<<<<<<<")
        break
    print(">>>User:", query)
    print("<<<AI:",  end="")
    for token in chain_history.stream({"query":query}, config)
        print(token.contnet, end="")
    print("\n")

    query = input("User:") 