
언어 모델만을 사용하면, 챗봇이 이전 대화 내용을 기억할 수 없습니다.

즉, 언어 모델에 응답을 요청하고나면 언어 모델은 모든 대화내용을 까먹게 됩니다.

이를 해결하기 위해, `메모리 기능`을 사용해야 합니다.

`토큰(Token)`이라는 건 `대화를 분석 하는데 사용되는 작은 단위`입니다.

텍스트 대화를 작은 조각으로 나누어 각각의 토큰을 처리함으로써 모델이 텍스트를 이해하고 적절히 응답할 수 있습니다.

예를 들어 `"안녕하세요! 어떻게 지내세요?"`라는 문장은 다음과 같이 토큰화 될 수 있습니다.

- `"안녕하세요"`
- `"!"`
- `"어떻게"`
- `"지내세요"`
- `"?"`

토큰화를 통해 모델은 문장을 이해하고 필요한 정보를 추출하여 적절한 응답을 생성할 수 있습니다.

---

#### ConversationBufferMemory (대화 버퍼 메모리)

ConversationBufferMemory는 `이전 대화의 모든 내용을 저장`하는 메모리입니다.

모든 내용을 저장하기 때문에, `대화 내용이 길어질수록 메모리도 계속 커지니 비효율적`입니다.

이 메모리는 Text Completion 할 때 유용합니다. 즉 무언가를 예측할 때, 또는 텍스트를 자동완성하고 싶을 때가 있습니다.

In [None]:
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory()

# 모든 메모리는 save_context, load_memory_variables 메서드를 가진다.
memory.save_context({'input': 'Hi'}, {'output': 'How are you?'})
memory.load_memory_variables({})

  memory = ConversationBufferMemory()


{'history': 'Human: Hi\nAI: How are you?'}

In [None]:
from langchain.memory import ConversationBufferMemory

# return_messages 파라미터를 True 로 두면, Human, AI 메세지 형태로 반환됩니다.
# 특히, Chat Model 과 작업할 때 사용합니다. 그러면 Chat Model 이 사용할 수 있는 형태로 출력
memory = ConversationBufferMemory(return_messages=True)

memory.save_context({'input': 'Hi'}, {'output': 'How are you?'})

memory.load_memory_variables({})

{'history': [HumanMessage(content='Hi', additional_kwargs={}, response_metadata={}),
  AIMessage(content='How are you?', additional_kwargs={}, response_metadata={})]}

In [None]:
from langchain.memory import ConversationBufferMemory

# return_messages 파라미터를 True 로 두면, Human, AI 메세지 형태로 반환됩니다.
memory = ConversationBufferMemory()

# 메모리가 계속 쌓이는 걸 볼 수 있습니다.
for i in range(5):
    memory.save_context({'input': 'Hi'}, {'output': 'How are you?'})

memory.load_memory_variables({})

{'history': 'Human: Hi\nAI: How are you?\nHuman: Hi\nAI: How are you?\nHuman: Hi\nAI: How are you?\nHuman: Hi\nAI: How are you?\nHuman: Hi\nAI: How are you?'}