# Understanding Memory in LLMs

In the previous Notebook, we successfully explored how OpenAI models can enhance the results from Azure Cognitive Search. 

However, we have yet to discover how to engage in a conversation with the LLM. With [Bing Chat](http://chat.bing.com/), for example, this is possible, as it can understand and reference the previous responses.

There is a common misconception that GPT models have memory. This is not true. While they possess knowledge, they do not retain information from previous questions asked to them.

In this Notebook, our goal is to illustrate how we can effectively "endow the LLM with memory" by employing prompts and context.

In [1]:
import os
import random
from langchain.chat_models import AzureChatOpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory
from openai.error import OpenAIError
from langchain.embeddings import OpenAIEmbeddings
from langchain.docstore.document import Document
from langchain.memory import CosmosDBChatMessageHistory

from IPython.display import Markdown, HTML, display  

def printmd(string):
    display(Markdown(string))

#custom libraries that we will use later in the app
from common.utils import (
    get_search_results,
    update_vector_indexes,
    model_tokens_limit,
    num_tokens_from_docs,
    num_tokens_from_string,
    get_answer,
)

from common.prompts import COMBINE_CHAT_PROMPT_TEMPLATE

from dotenv import load_dotenv
load_dotenv("credentials.env")

import logging

# Get the root logger
logger = logging.getLogger()
# Set the logging level to a higher level to ignore INFO messages
logger.setLevel(logging.WARNING)

In [2]:
# Set the ENV variables that Langchain needs to connect to Azure OpenAI
os.environ["OPENAI_API_BASE"] = os.environ["AZURE_OPENAI_ENDPOINT"]
os.environ["OPENAI_API_KEY"] = os.environ["AZURE_OPENAI_API_KEY"]
os.environ["OPENAI_API_VERSION"] = os.environ["AZURE_OPENAI_API_VERSION"]
os.environ["OPENAI_API_TYPE"] = "azure"

### Let's start with the basics
Let's use a very simple example to see if the GPT model of Azure OpenAI have memory. We again will be using langchain to simplify our code 

In [11]:
QUESTION = "오이소박이 만드는 방법 알려줘"
FOLLOW_UP_QUESTION = "소금은 얼마나 넣어야해?"

In [12]:
# Define model
MODEL = "gpt-35-turbo"
COMPLETION_TOKENS = 2000
# Create an OpenAI instance
llm = AzureChatOpenAI(deployment_name=MODEL, temperature=0.5, max_tokens=COMPLETION_TOKENS)

In [13]:
# We create a very simple prompt template, just the question as is:
prompt = PromptTemplate(
    input_variables=["question"],
    template="{question}",
)

chain = LLMChain(llm=llm, prompt=prompt)

In [14]:
# Let's see what the GPT model responds
response = chain.run(QUESTION)
printmd(response)

오이소박이는 오이를 소금물에 절여서 만드는 전통적인 한국 요리입니다. 다음은 오이소박이를 만드는 방법입니다.

재료:
- 오이 4개
- 소금 2큰술
- 식초 1큰술
- 설탕 1큰술
- 다진 마늘 1작은술
- 깨소금 1작은술
- 참기름 1작은술
- 고춧가루 (선택사항)

1. 오이를 깨끗이 씻어주세요. 오이의 끝 부분을 자르고, 오이를 얇게 썰어주세요. (오이를 곱게 썰면 맛이 더 잘 베어나옵니다.)

2. 썰어 놓은 오이에 소금을 뿌려주세요. 소금은 오이의 수분을 빨리 빼기 위해 사용됩니다. 약 10분 정도 소금에 절여놓은 후, 소금을 털어내세요.

3. 다른 그릇에 식초, 설탕, 다진 마늘, 깨소금, 참기름을 섞어주세요. 이는 오이에 드레싱을 만들기 위한 재료입니다. 고춧가루를 좋아하신다면, 약간의 고춧가루를 넣어 매운 맛을 낼 수도 있습니다.

4. 소금을 턴 오이에 드레싱을 골고루 뿌려주세요. 오이가 드레싱에 잘 베이도록 잘 섞어주세요.

5. 오이소박이를 냉장고에 1시간 정도 보관한 후에 드시면 더 맛있습니다. 잘 식혀서 서빙하면 시원하고 상큼한 맛을 느낄 수 있습니다.

오이소박이는 밥과 함께 먹거나, 안주로 즐기기도 좋습니다. 매콤한 맛을 좋아하신다면 고춧가루를 추가해보세요. 쉽게 만들 수 있는 오이소박이로 맛있는 한끼 식사를 즐겨보세요!

In [15]:
#Now let's ask a follow up question
chain.run(FOLLOW_UP_QUESTION)

'소금을 얼마나 넣어야 하는지는 요리의 종류와 양에 따라 다를 수 있습니다. 일반적으로는 요리에 사용되는 재료의 양에 따라 소금을 조절하며, 개인의 취향에 따라 맛을 조절할 수도 있습니다.\n\n일반적으로는 1kg의 재료에 대해 약 10g 정도의 소금을 사용하는 것이 일반적입니다. 그러나 이는 일반적인 가이드라인일 뿐이며, 요리의 종류나 개인의 취향에 따라 조절할 수 있습니다.\n\n요리를 만들 때 소금을 추가할 때는 점진적으로 추가하고, 맛을 맛보면서 조절해야 합니다. 너무 많이 넣으면 과하게 짜게 되고, 너무 적게 넣으면 싱거워질 수 있으므로 적절한 양을 찾는 것이 중요합니다.'

As you can see, it doesn't remember what it just responded, sometimes it responds based only on the system prompt, or just randomly. This proof that the LLM does NOT have memory and that we need to give the memory as a a conversation history as part of the prompt, like this:

In [16]:
hist_prompt = PromptTemplate(
    input_variables=["history", "question"],
    template="""
                {history}
                Human: {question}
                AI:
            """
    )
chain = LLMChain(llm=llm, prompt=hist_prompt)

In [17]:
Conversation_history = """
Human: {question}
AI: {response}
""".format(question=QUESTION, response=response)

In [18]:
printmd(chain.run({"history":Conversation_history, "question": FOLLOW_UP_QUESTION}))

소금은 오이의 수분을 빨리 빼기 위해 사용되므로 적당량을 사용하면 됩니다. 위의 레시피에서는 오이 4개에 소금 2큰술을 사용하였습니다. 하지만 개인의 취향에 따라 소금의 양을 조절할 수 있으니, 맛을 확인하며 조절하시면 됩니다.

**Bingo!**, so we now know how to create a chatbot using LLMs, we just need to keep the state/history of the conversation and pass it as context every time

## Now that we understand the concept of memory via adding history as a context, let's go back to our GPT Smart Search engine

In [48]:
QUESTION = "선박평형수처리업을 영위하려면 어떤 조건이 필요해?"
FOLLOW_UP_QUESTION = "결격사유에는 어떤 것들이 있어?"

In [49]:
# Since Memory adds tokens to the prompt, we would need a better model that allows more space on the prompt
MODEL = "gpt-35-turbo-16k"
COMPLETION_TOKENS = 2000
llm = AzureChatOpenAI(deployment_name=MODEL, temperature=0.5, max_tokens=COMPLETION_TOKENS)
embedder = OpenAIEmbeddings(deployment="text-embedding-ada-002", chunk_size=1)

In [50]:
index1_name = "cogsrch-index-files"
index2_name = "cogsrch-index-csv"
index3_name = "cogsrch-index-books-vector"
text_indexes = [index1_name, index2_name]
vector_indexes = [index+"-vector" for index in text_indexes] + [index3_name]

In [51]:
%%time

# Search in text-based indexes first and update vector indexes
k=2 # Top k results per each text-based index
ordered_results = get_search_results(QUESTION, text_indexes, k=k, reranker_threshold=1, vector_search=False)
update_vector_indexes(ordered_search_results=ordered_results, embedder=embedder)

# Search in all vector-based indexes available
similarity_k = 5 # top results from multi-vector-index similarity search
ordered_results = get_search_results(QUESTION, vector_indexes, k=k, vector_search=True,
                                        similarity_k=similarity_k,
                                        query_vector = embedder.embed_query(QUESTION))
print("Number of results:",len(ordered_results))

Number of results: 3
CPU times: total: 93.8 ms
Wall time: 7.74 s


In [14]:
# Uncomment the below line if you want to inspect the ordered results
# ordered_results

In [52]:
top_docs = []
for key,value in ordered_results.items():
    location = value["location"] if value["location"] is not None else ""
    top_docs.append(Document(page_content=value["chunk"], metadata={"source": location+os.environ['BLOB_SAS_TOKEN']}))
        
print("Number of chunks:",len(top_docs))

Number of chunks: 3


In [53]:
# Calculate number of tokens of our docs
if(len(top_docs)>0):
    tokens_limit = model_tokens_limit(MODEL) # this is a custom function we created in common/utils.py
    prompt_tokens = num_tokens_from_string(COMBINE_CHAT_PROMPT_TEMPLATE) # this is a custom function we created in common/utils.py
    context_tokens = num_tokens_from_docs(top_docs) # this is a custom function we created in common/utils.py
    
    requested_tokens = prompt_tokens + context_tokens + COMPLETION_TOKENS
    
    chain_type = "map_reduce" if requested_tokens > 0.9 * tokens_limit else "stuff"  
    
    print("System prompt token count:",prompt_tokens)
    print("Max Completion Token count:", COMPLETION_TOKENS)
    print("Combined docs (context) token count:",context_tokens)
    print("--------")
    print("Requested token count:",requested_tokens)
    print("Token limit for", MODEL, ":", tokens_limit)
    print("Chain Type selected:", chain_type)
        
else:
    print("NO RESULTS FROM AZURE SEARCH")

System prompt token count: 2464
Max Completion Token count: 2000
Combined docs (context) token count: 9663
--------
Requested token count: 14127
Token limit for gpt-35-turbo-16k : 16384
Chain Type selected: stuff


In [54]:
%%time
# Get the answer
response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Korean", chain_type=chain_type)
printmd(response['output_text'])

선박평형수처리업을 영위하려면 처리물질을 사용하지 않는 선박평형수처리설비를 개발하여 형식승인을 받거나 처리물질을 사용하는 선박평형수처리설비에 대한 국제기구 승인 신청과 관련된 절차를 따라야 합니다. 이에 대한 자세한 내용은 해양수산부령으로 정해져 있습니다. [1][2]

선박평형수처리업을 등록하려면 해양수산부장관에게 등록하여야 합니다. 등록을 위해 필요한 설비 및 시설은 대통령령으로 정해져 있습니다. 등록한 사항 중 중요한 사항을 변경하려는 경우에는 해양수산부령으로 정하는 바에 따라 변경등록을 해야 합니다. [3]

선박평형수처리업자는 선박평형수 및 침전물을 처리해야 하고, 처리실적서를 작성하여 해양수산부장관에게 제출하고 해당 시설에 처리대장을 비치해야 합니다. 또한, 선박평형수처리업자가 선박으로부터 선박평형수 또는 침전물을 수거하는 경우에는 선박평형수수거확인증을 작성하고 해당 수거를 위탁한 자에게 발급하여야 합니다. 이에 대한 자세한 내용은 해양수산부령으로 정해져 있습니다. [4]

해양수산부장관은 선박평형수처리업자가 처리를 위탁받은 선박평형수 또는 침전물을 처리하지 않고 내버려두는 경우에는 그 적절한 처리를 명할 수 있습니다. 또한, 선박소유자가 제1항에 따른 명령을 이행하지 않고 선박을 계속하여 항해에 사용함으로써 유해수중생물의 국내 유입의 우려가 있다고 인정되는 경우에는 항해정지처분을 할 수 있습니다. 이에 대한 자세한 내용은 해양수산부령으로 정해져 있습니다. [5]

해양수산부장관은 대한민국 관할수역에 있는 외국선박의 선박평형수관리설비가 국제협약에 따른 기준에 적합한지 여부를 확인ㆍ점검하고 그에 필요한 조치를 할 수 있습니다. 이에 대한 자세한 내용은 대통령령으로 정해져 있습니다. [6]

선박소유자는 외국 항만당국의 항만국통제 시 선박의 결함이 지적되지 않도록 관련되는 국제협약의 규정을 준수해야 합니다. 이에 대한 자세한 내용은 대통령령으로 정해져 있습니다. [7]

해양수산부장관은 외국선박의 해당 소속 국가에서 시행 중인 선박평형수관리에 관한 법령이 이 법의 내용과 동등하거나 그 이상에 해당한다고 인정되는 경우에는 해당 외국정부가 지정한 대행기관이 해당 외국선박에 대하여 행한 선박의 검사 또는 설비의 형식승인ㆍ검정은 이 법에 따른 검사ㆍ형식승인ㆍ검정으로 본다. 이에 대한 자세한 내용은 대통령령으로 정해져 있습니다. [8]

선박검사관은 선박평형수관리계획서의 검인에 관한 업무를 수행합니다. 이에 대한 자세한 내용은 대통령령으로 정해져 있습니다. [9]

<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup><sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[2]</a></sup><sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[3]</a></sup><sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[4]</a></sup><sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[5]</a></sup><sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59

CPU times: total: 0 ns
Wall time: 1min


And if we ask the follow up question:

In [55]:
response = get_answer(llm=llm, docs=top_docs,  query=FOLLOW_UP_QUESTION, language="Korean", chain_type=chain_type)
printmd(response['output_text'])

선박평형수처리업자의 등록을 할 수 없는 결격사유는 다음과 같습니다:

1. 피성년후견인 또는 피한정후견인
2. 이 법을 위반하여 징역 이상의 형을 선고받고 그 형의 집행이 끝나거나 집행을 받지 아니하기로 확정된 후 1년이 지나지 아니한 자
3. 제26조에 따라 선박평형수처리업의 등록이 취소(이 조 제1호에 해당하여 등록이 취소된 경우는 제외한다)된 후 1년이 지나지 아니한 자
4. 임원 중에 제1호부터 제3호까지의 규정 중 어느 하나에 해당하는 자가 있는 법인

[11]<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[출처]</a></sup>

You might get a different response from above, but it doesn't matter what response you get, it will be based on the context given, not on previous answers.

Until now we just have the same as the prior Notebook 03: results from Azure Search enhanced by OpenAI model, with no memory

**Now let's add memory to it:**

Reference: https://python.langchain.com/docs/modules/memory/how_to/adding_memory_chain_multiple_inputs

In [56]:
# memory object, which is neccessary to track the inputs/outputs and hold a conversation.
memory = ConversationBufferMemory(memory_key="chat_history",input_key="question")

response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Korean", chain_type=chain_type, 
                        memory=memory)
printmd(response['output_text'])

선박평형수처리업을 영위하려면 다음과 같은 조건이 필요합니다:

1. 처리물질 사용 여부: 처리물질을 사용하지 않는 선박평형수처리설비를 개발하여 형식승인을 받으려면, 처리물질을 사용하지 않음을 해양수산부장관에게 증명해야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>.

2. 국제기구 승인: 처리물질을 사용하는 선박평형수처리설비의 경우, 국제기구 승인 신청 절차를 따라야 합니다. 처리물질을 사용하지 않는 선박평형수처리설비의 경우, 증명 절차를 따라야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>.

3. 독립시험기관의 지정: 독립시험기관의 지정 및 협정에 따라 업무를 수행해야 합니다. 해양수산부장관은 독립시험기관으로부터의 지정 취소 요청이 있는 경우, 독립시험기관의 지정기준에 미달한 경우, 업무상 고의 또는 중대한 과실로 인하여 독립시험기관의 공신력을 상실하였다고 인정되는 경우 등에 대해 지정을 취소할 수 있습니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>.

4. 선박평형수처리업 등록: 선박평형수처리업을 영위하려면 해양수산부장관에게 등록해야 합니다. 등록을 하려는 경우, 일정한 설비 및 시설을 갖추어야 하며, 대통령령으로 정해진 등록기준을 준수해야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>.

이상이 선박평형수처리업을 영위하기 위해 필요한 조건입니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>. 추가로 궁금한 점이 있으신가요?

In [57]:
# Now we add a follow up question:
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Korean", chain_type=chain_type, 
                      memory=memory)
printmd(response['output_text'])

선박평형수처리업을 영위하기 위해 필요한 조건에는 다음과 같은 결격사유가 있습니다:

1. 피성년후견인 또는 피한정후견인인 경우
2. 이 법을 위반하여 징역 이상의 형을 선고받고 그 형의 집행이 끝나거나 집행을 받지 아니하기로 확정된 후 1년이 지나지 아니한 경우
3. 제26조에 따라 선박평형수처리업의 등록이 취소된 후 1년이 지나지 아니한 경우
4. 임원 중에 제1호부터 제3호까지의 규정 중 어느 하나에 해당하는 자가 있는 법인

이상이 선박평형수처리업을 영위하기 위해 필요한 결격사유입니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>. 추가로 궁금한 점이 있으신가요?

In [58]:
# Another follow up query
response = get_answer(llm=llm, docs=top_docs, query="고마워", language="Korean", chain_type=chain_type,  
                      memory=memory)
printmd(response['output_text'])

선박평형수처리업을 영위하기 위해 필요한 결격사유는 다음과 같습니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>:

1. 피성년후견인 또는 피한정후견인인 경우
2. 이 법을 위반하여 징역 이상의 형을 선고받고 그 형의 집행이 끝나거나 집행을 받지 아니하기로 확정된 후 1년이 지나지 아니한 경우
3. 제26조에 따라 선박평형수처리업의 등록이 취소된 후 1년이 지나지 아니한 경우
4. 임원 중에 제1호부터 제3호까지의 규정 중 어느 하나에 해당하는 자가 있는 법인

이상이 선박평형수처리업을 영위하기 위해 필요한 결격사유입니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>. 추가로 궁금한 점이 있으신가요?

You might get a different answer on the above cell, and it is ok, this bot is not yet well configured to answer any question that is not related to its knowledge base, including salutations.

Let's check our memory to see that it's keeping the conversation

In [59]:
memory.buffer

'Human: 선박평형수처리업을 영위하려면 어떤 조건이 필요해?\nAI: 선박평형수처리업을 영위하려면 다음과 같은 조건이 필요합니다:\n\n1. 처리물질 사용 여부: 처리물질을 사용하지 않는 선박평형수처리설비를 개발하여 형식승인을 받으려면, 처리물질을 사용하지 않음을 해양수산부장관에게 증명해야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>.\n\n2. 국제기구 승인: 처리물질을 사용하는 선박평형수처리설비의 경우, 국제기구 승인 신청 절차를 따라야 합니다. 처리물질을 사용하지 않는 선박평형수처리설비의 경우, 증명 절차를 따라야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D">[1]</a></sup>.\n\n3. 독립시험기관의 지정: 독립시험기관의 지정 및 협정에 따라 업무를 수행해야 합니다. 해양수산부장관은 독립시험기관으로부터의 지정 취소 요청이 있는 경우, 독립시험기관의 지정기준에 미달한 경우, 업무상 고의 또는 중대한 과실로 인하

## Using CosmosDB as persistent memory

In previous cell we have added local RAM memory to our chatbot. However, it is not persistent, it gets deleted once the app user's session is terminated. It is necessary then to use a Database for persistent storage of each of the bot user conversations, not only for Analytics and Auditing, but also if we wisg to provide recommendations. 

Here we will store the conversation history into CosmosDB for future auditing purpose.
We will use a class in LangChain use CosmosDBChatMessageHistory, see [HERE](https://python.langchain.com/en/latest/_modules/langchain/memory/chat_message_histories/cosmos_db.html)

In [60]:
# Create CosmosDB instance from langchain cosmos class.
cosmos = CosmosDBChatMessageHistory(
    cosmos_endpoint=os.environ['AZURE_COSMOSDB_ENDPOINT'],
    cosmos_database=os.environ['AZURE_COSMOSDB_NAME'],
    cosmos_container=os.environ['AZURE_COSMOSDB_CONTAINER_NAME'],
    connection_string=os.environ['AZURE_COMOSDB_CONNECTION_STRING'],
    session_id="Agent-Test-Session" + str(random.randint(1, 1000)),
    user_id="Agent-Test-User" + str(random.randint(1, 1000))
    )

# prepare the cosmosdb instance
cosmos.prepare_cosmos()

In [61]:
# Create or Memory Object
memory = ConversationBufferMemory(memory_key="chat_history",input_key="question",chat_memory=cosmos)

In [62]:
# Testing using our Question
response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Korean", chain_type=chain_type, 
                        memory=memory)
printmd(response['output_text'])

선박평형수처리업을 영위하려면 다음의 조건이 필요합니다:

1. 처리물질을 사용하지 않는 선박평형수처리설비를 개발하여 형식승인을 받으려는 경우, 처리물질을 사용하지 않음을 해양수산부장관에게 증명해야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>.
2. 처리물질을 사용하는 선박평형수처리설비에 대한 국제기구 승인 신청 절차와 처리물질을 사용하지 않는 선박평형수처리설비의 증명 절차, 그 밖에 필요한 사항은 해양수산부령으로 정해져 있습니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>.

이 외에도 선박평형수처리업을 등록하려면 대통령령으로 정해진 설비 및 시설을 갖추어야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>. 등록한 후에도 선박평형수처리업자는 선박평형수 및 침전물을 처리하고, 관련된 서류를 작성하여 해양수산부장관에게 제출해야 하며, 해당 시설에 처리대장을 비치해야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>. 선박평형수처리업자와 관련된 업무를 담당하는 자는 해양수산부령으로 정하는 바에 따라 교육을 받아야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>.

더 궁금한 점이 있으신가요?

In [63]:
# Now we add a follow up question:
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Korean", chain_type=chain_type, 
                      memory=memory)
printmd(response['output_text'])

선박평형수처리업을 등록하려면 다음과 같은 결격사유가 있습니다:

1. 피성년후견인 또는 피한정후견인인 경우
2. 이 법을 위반하여 징역 이상의 형을 선고받고 그 형의 집행이 끝나지 않은 자
3. 선박평형수처리업의 등록이 취소된 후 1년 이내인 자
4. 임원 중에 법인의 임원 중 제1호부터 제3호까지의 규정에 해당하는 자가 있는 경우

등록 이후에도 선박평형수처리업자는 선박평형수 및 침전물을 처리하고, 관련된 서류를 작성하여 해양수산부장관에 제출해야 하며, 해당 시설에 처리대장을 비치해야 합니다. 선박평형수처리업자와 관련된 업무를 담당하는 자는 해양수산부령으로 정하는 바에 따라 교육을 받아야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>. 

더 궁금한 점이 있으신가요?

In [64]:
# Another follow up query
response = get_answer(llm=llm, docs=top_docs, query="고마워", language="Korean", chain_type=chain_type,  
                      memory=memory)
printmd(response['output_text'])

선박평형수처리업을 등록하려면 다음과 같은 결격사유가 있습니다:

1. 피성년후견인 또는 피한정후견인인 경우
2. 이 법을 위반하여 징역 이상의 형을 선고받고 그 형의 집행이 끝나지 않은 자
3. 선박평형수처리업의 등록이 취소된 후 1년 이내인 자
4. 임원 중에 법인의 임원 중 제1호부터 제3호까지의 규정에 해당하는 자가 있는 경우

등록 이후에도 선박평형수처리업자는 선박평형수 및 침전물을 처리하고, 관련된 서류를 작성하여 해양수산부장관에 제출해야 하며, 해당 시설에 처리대장을 비치해야 합니다. 선박평형수처리업자와 관련된 업무를 담당하는 자는 해양수산부령으로 정하는 바에 따라 교육을 받아야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>. 

더 궁금한 점이 있으신가요?

Let's check our Azure CosmosDB to see the whole conversation


In [65]:
#load message from cosmosdb
cosmos.load_messages()
cosmos.messages

[HumanMessage(content='선박평형수처리업을 영위하려면 어떤 조건이 필요해?', additional_kwargs={}, example=False),
 AIMessage(content='선박평형수처리업을 영위하려면 다음의 조건이 필요합니다:\n\n1. 처리물질을 사용하지 않는 선박평형수처리설비를 개발하여 형식승인을 받으려는 경우, 처리물질을 사용하지 않음을 해양수산부장관에게 증명해야 합니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>.\n2. 처리물질을 사용하는 선박평형수처리설비에 대한 국제기구 승인 신청 절차와 처리물질을 사용하지 않는 선박평형수처리설비의 증명 절차, 그 밖에 필요한 사항은 해양수산부령으로 정해져 있습니다<sup><a href="https://capblob.blob.core.windows.net/cloocus-sample/The%20ballast%20water%20management%20Act(20200218).pdf?sv=2022-11-02&ss=bfqt&srt=sco&sp=rwdlacupiytfx&se=2024-12-31T14:59:59Z&st=2023-11-15T05:19:25Z&spr=https&sig=6w4%2F0cjThZvwPSolkQDW0nRlj3Ov72YqGYLs0K45XwE%3D" target="_blank">[1]</a></sup>.\n\n이 외에도 선박평형수처리업을 등록하려면 대통령령으로 정해진 설비 및 시설을

![CosmosDB Memory](./images/cosmos-chathistory.png)

# Summary
##### Adding memory to our application allows the user to have a conversation, however this feature is not something that comes with the LLM, but instead, memory is something that we must provide to the LLM in form of context of the question.

We added persitent memory using CosmosDB.

We also can notice that the current chain that we are using is smart, but not that much. Although we have given memory to it, it searches for similar docs everytime, regardless of the input and it struggles to respond to prompts like: Hello, Thank you, Bye, What's your name, What's the weather and any other task that is not search in the knowledge base.


## <u>Important Note</u>:<br>
As we proceed, while all the code will remain compatible with GPT-3.5 models, we highly recommend transitioning to GPT-4. Here's why:

**GPT-3.5-Turbo** can be likened to a 7-year-old child. You can provide it with concise instructions, but it frequently struggles to follow them accurately. Additionally, its limited memory can make sustained conversations challenging.

**GPT-3.5-Turbo-16k** resembles the same 7-year-old, but with an increased attention span for longer instructions. However, it still faces difficulties accurately executing them about half the time.

**GPT-4** exhibits the capabilities of a 10-12-year-old child. It possesses enhanced reasoning skills and more consistently adheres to instructions. While its memory retention for instructions is moderate, it excels at following them.

**GPT-4-32k** is akin to the 10-12-year-old child with an extended memory. It comprehends lengthy sets of instructions and engages in meaningful conversations. Thanks to its robust memory, it offers detailed responses.

Understanding this analogy above will become clearer as you complete the final notebook.


# NEXT
We know now how to do a Smart Search Engine that can power a chatbot!! great!

But, does this solve all the possible scenarios that a virtual assistant will require?  **What about if the answer to the Smart Search Engine is not related to text, but instead requires to look into tabular data?** The next notebook explains and solves the tabular problem and the concept of Agents