# LLMs 메모리의 이해

이전 노트에서는 OpenAI 모델이 Azure Cognitive Search의 결과를 어떻게 향상시킬 수 있는지 성공적으로 탐구했습니다.

하지만 아직 LLM과의 대화 방법을 찾지 못했습니다. 예를 들어 [Bing Chat](http://chat.bing.com/), 을 사용하면 이전 응답을 이해하고 참조할 수 있기 때문에 가능합니다.

아직 많은 사람들이 GPT모델이 기억력을 가지고 있다는 잘못된 인식이 있습니다. GPT모델을 학습이 되어 지식을 가지고 있지만, 질문한 이전의 정보는 가지고 있지 않습니다.

그렇기에 이 노트에서는 프롬프트와 컨텍스트를 사용하여 "메모리를 포함한 LLM을 효과적으로 처리"할 수 있는 방법을 설명하는 것이 목표입니다.

In [1]:
import os
import random
from langchain.chat_models import AzureChatOpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory
from openai.error import OpenAIError
from langchain.embeddings import OpenAIEmbeddings
from langchain.docstore.document import Document
from langchain.memory import CosmosDBChatMessageHistory

from IPython.display import Markdown, HTML, display  

def printmd(string):
    display(Markdown(string))

from common.utils import (
    get_search_results,
    update_vector_indexes,
    model_tokens_limit,
    num_tokens_from_docs,
    num_tokens_from_string,
    get_answer,
)

from common.prompts import COMBINE_CHAT_PROMPT_TEMPLATE

from dotenv import load_dotenv
load_dotenv("credentials.env")

import logging

# root logger 가져오기
logger = logging.getLogger()
# INFO 메시지를 무시하도록 로깅 수준을 상위 수준으로 설정
logger.setLevel(logging.WARNING)

In [2]:
# Langchain을 사용하여 Azure OpenAI에 연결하는데 필요한 ENV 변수를 설정
os.environ["OPENAI_API_BASE"] = os.environ["AZURE_OPENAI_ENDPOINT"]
os.environ["OPENAI_API_KEY"] = os.environ["AZURE_OPENAI_API_KEY"]
os.environ["OPENAI_API_VERSION"] = os.environ["AZURE_OPENAI_API_VERSION"]
os.environ["OPENAI_API_TYPE"] = "azure"

In [3]:
QUESTION = "거울 속 해리포터가 주머니속에 가지고 있는건 뭐였어?"
FOLLOW_UP_QUESTION = "그 돌을 누가 뺐을려고 했어?"

In [4]:
# 모델 정의
MODEL = "gpt-4-32k"
COMPLETION_TOKENS = 500
# Create an OpenAI instance
llm = AzureChatOpenAI(deployment_name=MODEL, temperature=0.5, max_tokens=COMPLETION_TOKENS)

In [5]:
# 간단한 프롬프트 템플릿을 만듭니다. 질문은 다음과 같습니다:
prompt = PromptTemplate(
    input_variables=["question"],
    template="{question}",
)

chain = LLMChain(llm=llm, prompt=prompt)

In [6]:
# GPT 모델의 반응을 살펴보겠습니다
response = chain.run(QUESTION)
printmd(response)

거울 속 해리포터가 주머니 속에 가지고 있는 것은 마법사의 돌이었습니다.

In [7]:
# 후속 질문
chain.run(FOLLOW_UP_QUESTION)

'죄송합니다, 제가 특정 상황이나 문맥을 알지 못해서 정확한 답변을 드리기 어렵습니다. 조금 더 자세한 정보를 주시면 도와드리겠습니다.'

In [8]:
hist_prompt = PromptTemplate(
    input_variables=["history", "question"],
    template="""
                {history}
                Human: {question}
                AI:
            """
    )
chain = LLMChain(llm=llm, prompt=hist_prompt)

In [9]:
Conversation_history = """
Human: {question}
AI: {response}
""".format(question=QUESTION, response=response)

In [10]:
printmd(chain.run({"history":Conversation_history, "question": FOLLOW_UP_QUESTION}))

프로페서 퀴렐이 그 돌을 뺏으려고 했습니다.

**Bingo!**, 이로써 우리는 LLM을 이용하여 챗봇을 만드는 방법을 알게 되었습니다. 이제 대화의 상태/이력을 유지하고 매번 컨텍스트로 전달시켜 보겠습니다. 

## 이제 GPT모델에 기억력을 추가하여 메모리의 개념을 이해했으므로 GPT Smart Search 엔진으로 돌아가 보겠습니다.

In [11]:
# 메모리는 프롬프트에 토큰을 추가하기 때문에 프롬프트에 더 많은 공간을 허용하는 더 나은 모델이 필요합니다
MODEL = "gpt-4-32k"
COMPLETION_TOKENS = 2000
llm = AzureChatOpenAI(deployment_name=MODEL, temperature=0.5, max_tokens=COMPLETION_TOKENS)
embedder = OpenAIEmbeddings(deployment="text-embedding-ada-002", chunk_size=1) 

In [12]:
index1_name = "cogsrch-index-files"
index2_name = "cogsrch-index-csv"
index3_name = "cogsrch-index-books-vector"
text_indexes = [index1_name, index2_name]
vector_indexes = [index+"-vector" for index in text_indexes] + [index3_name]

In [13]:
%%time

# 텍스트 기반 인덱스를 먼저 검색하고 벡터 인덱스를 업데이트를 합니다. 
k=10 # 각 텍스트 기반 인덱스의 상위 k개의 결과를 설정합니다.
ordered_results = get_search_results(QUESTION, text_indexes, k=k, reranker_threshold=1, vector_search=False)
update_vector_indexes(ordered_search_results=ordered_results, embedder=embedder)

# 사용 가능한 모든 벡터 기반 인덱스를 검색
similarity_k = 5 # 멀티 벡터 기반 인덱스의 상위 k개의 결과를 설정합니다.
ordered_results = get_search_results(QUESTION, vector_indexes, k=k, vector_search=True,
                                        similarity_k=similarity_k,
                                        query_vector = embedder.embed_query(QUESTION))
print("Number of results:",len(ordered_results))

Number of results: 5
CPU times: total: 953 ms
Wall time: 8.84 s


In [15]:
top_docs = []
for key,value in ordered_results.items():
    location = value["location"] if value["location"] is not None else ""
    top_docs.append(Document(page_content=value["chunk"], metadata={"source": location+os.environ['BLOB_SAS_TOKEN']}))
        
print("Number of chunks:",len(top_docs))

Number of chunks: 5


In [16]:
# 문서의 토큰 수를 계산합니다
if(len(top_docs)>0):
    tokens_limit = model_tokens_limit(MODEL) # 이 함수는 ./common/utils.py에 있는 함수로 개발자가 만든 함수입니다. 
    prompt_tokens = num_tokens_from_string(COMBINE_CHAT_PROMPT_TEMPLATE) # 이 함수는 ./common/utils.py에 있는 함수로 개발자가 만든 함수입니다. 
    context_tokens = num_tokens_from_docs(top_docs) # 이 함수는 ./common/utils.py에 있는 함수로 개발자가 만든 함수입니다. 
    
    requested_tokens = prompt_tokens + context_tokens + COMPLETION_TOKENS
    
    chain_type = "map_reduce" if requested_tokens > 0.9 * tokens_limit else "stuff"  
    
    print("System prompt token count:",prompt_tokens)
    print("Max Completion Token count:", COMPLETION_TOKENS)
    print("Combined docs (context) token count:",context_tokens)
    print("--------")
    print("Requested token count:",requested_tokens)
    print("Token limit for", MODEL, ":", tokens_limit)
    print("Chain Type selected:", chain_type)
        
else:
    print("NO RESULTS FROM AZURE SEARCH")

System prompt token count: 2464
Max Completion Token count: 2000
Combined docs (context) token count: 11105
--------
Requested token count: 15569
Token limit for gpt-4-32k : 32768
Chain Type selected: stuff


In [17]:
%%time
# 결과를 가져옵니다. 
response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Korean", chain_type=chain_type)
printmd(response['output_text'])

해리포터가 거울 속에서 주머니에 가지고 있는 것에 대한 정보는 제공되지 않았습니다.<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[2]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[3]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[4]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230921_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[5]</a></sup>.

CPU times: total: 0 ns
Wall time: 52.9 s


And if we ask the follow up question:

In [18]:
response = get_answer(llm=llm, docs=top_docs,  query=FOLLOW_UP_QUESTION, language="Korean", chain_type=chain_type)
printmd(response['output_text'])

해리 포터의 이모부 버논이 해리의 편지를 뺏어 가려고 시도했습니다<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup>.

지금까지 우리는 노트북 03과 동일한 메모리 없이 OpenAI 모델로 향상된 Azure Search의 결과를 받았습니다. 이제 메모리를 추가를 해보겠습니다.

In [19]:
# 입력/결과를 추적하고 대화를 진행하기 위해 필요한 메모리 객체
memory = ConversationBufferMemory(memory_key="chat_history",input_key="question")

response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Korean", chain_type=chain_type, 
                        memory=memory)
printmd(response['output_text'])

죄송합니다만, 제가 제공한 자료들에는 해리 포터가 거울 속에서 주머니에 무엇을 가지고 있는지에 대한 정보가 포함되어 있지 않습니다.

In [20]:
# 후속질문 추가:
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Korean", chain_type=chain_type, 
                      memory=memory)
printmd(response['output_text'])

문제를 뺏으려 했던 사람은 이 책에서 명확하게 언급되지 않았습니다. 제가 제공한 자료에는 그에 대한 정보가 포함되어 있지 않습니다.<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup>. 다른 질문이 있으신가요?

In [21]:
# 후속질문 추가２：
response = get_answer(llm=llm, docs=top_docs, query="Thank you", language="Korean", chain_type=chain_type,  
                      memory=memory)
printmd(response['output_text'])

해리 포터는 그의 주머니에 불사조 깃털이 들어있는 지팡이를 가지고 있습니다<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup>. 그리고 그 돌을 뺏으려 했던 사람은 이 책에서 명확하게 언급되지 않았습니다<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup>. 다른 질문이 있으신가요?

You might get a different answer on the above cell, and it is ok, this bot is not yet well configured to answer any question that is not related to its knowledge base, including salutations.

Let's check our memory to see that it's keeping the conversation

In [22]:
memory.buffer

'Human: 거울속 해리포터가 주머니속에 가지고 있는건 뭐야?\nAI: 죄송합니다만, 제가 제공한 자료들에는 해리 포터가 거울 속에서 주머니에 무엇을 가지고 있는지에 대한 정보가 포함되어 있지 않습니다.\nHuman: 그 돌을 누가 뺐을려고 했어?\nAI: 문제를 뺏으려 했던 사람은 이 책에서 명확하게 언급되지 않았습니다. 제가 제공한 자료에는 그에 대한 정보가 포함되어 있지 않습니다.<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup>. 다른 질문이 있으신가요?\nHuman: Thank you\nAI: 해리 포터는 그의 주머니에 불사조 깃털이 들어있는 지팡이를 가지고 있습니다<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup>. 그리고 그 돌을 뺏으려 했던 사람은 이 책에서 명확하게 언급되지 않았습니다<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Ston

## CosmosDB를 영구 메모리로 사용

이전 셀에서는 로컬 RAM 메모리를 챗봇에 추가한 적이 있는데, 지속성은 없지만 앱 사용자의 세션이 종료되면 삭제되었습니다. 
그렇기에 분석 및 감사뿐만 아니라 권장 사항을 제공하고자 할 때에도  봇 사용자 대화의 지속적인 저장을 위해 데이터베이스를 사용하는 것을 추천 드립니다. 

이번 Hands on Labs에서도 GPT모델의 대화 기억을 위해 LangChain에서 제공하는 CosmosDBChatMessageHistory 기능과 CosmosDB을 사용하겠습니다. 
더 자세한 내용은 [여기](https://python.langchain.com/en/latest/_modules/langchain/memory/chat_message_histories/cosmos_db.html)에서 확인하실 수 있습니다. 

In [23]:
# Langchain으로 CosmosDB 인스턴스를 만듭니다. 
cosmos = CosmosDBChatMessageHistory(
    cosmos_endpoint=os.environ['AZURE_COSMOSDB_ENDPOINT'],
    cosmos_database=os.environ['AZURE_COSMOSDB_NAME'],
    cosmos_container=os.environ['AZURE_COSMOSDB_CONTAINER_NAME'],
    connection_string=os.environ['AZURE_COMOSDB_CONNECTION_STRING'],
    session_id="Agent-Test-Session" + str(random.randint(1, 1000)),
    user_id="Agent-Test-User" + str(random.randint(1, 1000))
    )

# cosmosdb 인스턴스 준비
cosmos.prepare_cosmos()

In [24]:
# 메모리 개체 생성
memory = ConversationBufferMemory(memory_key="chat_history",input_key="question",chat_memory=cosmos)

In [25]:
# 질문 테스트
response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Korean", chain_type=chain_type, 
                        memory=memory)
printmd(response['output_text'])

거울 속 해리 포터가 가지고 있는 것에 대한 정보는 제공된 문서에서 찾을 수 없습니다.<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230921_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[2]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230920_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[3]</a></sup>. 다른 질문이 있으신가요?

In [26]:
# 후속 질문 추가
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Korean", chain_type=chain_type, 
                      memory=memory)
printmd(response['output_text'])

그 돌을 뺏으려고 한 사람에 대한 정보는 제공된 문서에서 찾을 수 없습니다.<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230921_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[2]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230920_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[3]</a></sup>. 다른 질문이 있으신가요?

In [27]:
# 후속 질문 추가2
response = get_answer(llm=llm, docs=top_docs, query="Thank you", language="Korean", chain_type=chain_type,  
                      memory=memory)
printmd(response['output_text'])

해리 포터가 주머니에 가지고 있던 것은 제공된 문서에서 언급되지 않았습니다<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230921_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[2]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230920_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[3]</a></sup>. 다른 질문이 있으신가요?

Azure Cosmos DB를 통해 전체 대화 내용을 확인해 보겠습니다


In [28]:
# cosmosdb에 메세지 로드
cosmos.load_messages()
cosmos.messages

[HumanMessage(content='거울속 해리포터가 주머니속에 가지고 있는건 뭐야?', additional_kwargs={}, example=False),
 AIMessage(content='거울 속 해리 포터가 가지고 있는 것에 대한 정보는 제공된 문서에서 찾을 수 없습니다.<sup><a href="https://holstorage.blob.core.windows.net/books/Harry_Potter_the_Sorcerer_Stone1.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[1]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230921_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[2]</a></sup><sup><a href="https://holstorage.blob.core.windows.net/arxivcs/230920_etoday.pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-11-17T10:00:20Z&st=2023-10-17T02:00:20Z&spr=https&sig=A70wSmXw2q4gtqHFKd8h4J54rSkDp41DnyIXTFQ265A%3D" target="_blank">[3]</a></sup>. 다른 질문이 있으신가요?', addit

![CosmosDB Memory](https://raw.githubusercontent.com/MSUSAzureAccelerators/Azure-Cognitive-Search-Azure-OpenAI-Accelerator/69114f93a7c245fd79009f01169e746859776d77//images/cosmos-chathistory.png)

# Summary
##### 애플리케이션에 메모리를 추가하면 이전 대화를 기반으로 GPT모델과 사용자가 대화할 수 있지만, 이 기능은 LLM과 함께 제공되는 것이 아니라 질문을 컨텍스트 형태로 LLM에 제공해야 하는 것입니다.

그렇기에 우리는 Cosmos DB를 이용하여 영구적인 memory를 추가하였습니다. 


## <u>Important Note</u>:<br>
모든 코드가 GPT-3.5 모델과 호환되는 상태로 유지되지만 GPT-4로 전환할 것을 강력히 권장합니다. 그 이유는 다음과 같습니다:

**GPT-3.5-Turbo**는 7세 어린아이에 비유할 수 있습니다. 간결한 설명을 제공할 수 있지만 정확한 설명을 따라하기가 어려운 경우가 많습니다. 또한 기억력이 부족하여 지속적인 대화가 어려울 수 있습니다.

**GPT-3.5-Turbo-16k**는 같은 7살짜리 아이와 닮았지만, 좀 더 긴 지시에 대해 이해가 가능합니다. 하지만, 여전히 절반 정도는  정확하게 이해하는데 어려움을 겪고 있습니다.

**GPT-4**는 10-12세 어린이의 능력을 보여줍니다. 향상된 추론 능력을 가지고 있으며 Prompt를 통한 명령을 더욱 준수합니다. 명령에 대한 기억 유지는 중간 정도이지만 명령을 따르는 것에 탁월합니다.

**GPT-4-32k**는 기억력이 뛰어난 10-12세 어린이와 유사하며, 긴 명령어를 이해하고 의미 있는 대화를 나눌 수 있으며, 기억력이 뛰어나 세밀한 반응을 얻을 수 있습니다.

