# Understanding Memory in LLMs

In the previous Notebook, we successfully explored how OpenAI models can enhance the results from Azure Cognitive Search. 

However, we have yet to discover how to engage in a conversation with the LLM. With [Bing Chat](http://chat.bing.com/), for example, this is possible, as it can understand and reference the previous responses.

There is a common misconception that GPT models have memory. This is not true. While they possess knowledge, they do not retain information from previous questions asked to them.

In this Notebook, our goal is to illustrate how we can effectively "endow the LLM with memory" by employing prompts and context.

In [1]:
import os
import random
from langchain.chat_models import AzureChatOpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory
from openai.error import OpenAIError
from langchain.embeddings import OpenAIEmbeddings
from langchain.docstore.document import Document
from langchain.memory import CosmosDBChatMessageHistory

from IPython.display import Markdown, HTML, display  

def printmd(string):
    display(Markdown(string))

#custom libraries that we will use later in the app
from common.utils import (
    get_search_results,
    update_vector_indexes,
    model_tokens_limit,
    num_tokens_from_docs,
    num_tokens_from_string,
    get_answer,
)

from common.prompts import COMBINE_CHAT_PROMPT_TEMPLATE

from dotenv import load_dotenv
load_dotenv("credentials.env")

import logging

# Get the root logger
logger = logging.getLogger()
# Set the logging level to a higher level to ignore INFO messages
logger.setLevel(logging.WARNING)

In [2]:
# Set the ENV variables that Langchain needs to connect to Azure OpenAI
os.environ["OPENAI_API_BASE"] = os.environ["AZURE_OPENAI_ENDPOINT"]
os.environ["OPENAI_API_KEY"] = os.environ["AZURE_OPENAI_API_KEY"]
os.environ["OPENAI_API_VERSION"] = os.environ["AZURE_OPENAI_API_VERSION"]
os.environ["OPENAI_API_TYPE"] = "azure"

### Let's start with the basics
Let's use a very simple example to see if the GPT model of Azure OpenAI have memory. We again will be using langchain to simplify our code 

In [3]:
# QUESTION = "Tell me some use cases for reinforcement learning"
# FOLLOW_UP_QUESTION = "Give me the main points of our conversation"

# QUESTION = "Vilket konto ska jag fakturera egenavgift för hjälpmedel?"
# FOLLOW_UP_QUESTION = "Kan du ge mig en sammanfattning av vår konversation?"

QUESTION = "Hur ser rättigheterna ut för enskilda personer gällander GDPR?"
FOLLOW_UP_QUESTION = "Kan du summera konversationen?"

In [7]:
# Define model
MODEL = "gpt-35-turbo-16k"
COMPLETION_TOKENS = 1000
# Create an OpenAI instance
llm = AzureChatOpenAI(deployment_name=MODEL, temperature=0.2, max_tokens=COMPLETION_TOKENS)

In [8]:
# We create a very simple prompt template, just the question as is:
prompt = PromptTemplate(
    input_variables=["question"],
    template="{question}",
)

chain = LLMChain(llm=llm, prompt=prompt)

In [9]:
# Let's see what the GPT model responds
response = chain.run(QUESTION)
printmd(response)

Enligt GDPR (General Data Protection Regulation) har enskilda personer följande rättigheter:

1. Rätt till information: En person har rätt att få information om hur deras personuppgifter samlas in, används och behandlas.

2. Rätt till tillgång: En person har rätt att begära och få tillgång till sina personuppgifter som behandlas av en organisation.

3. Rätt till rättelse: Om en person anser att deras personuppgifter är felaktiga eller ofullständiga, har de rätt att begära att uppgifterna rättas.

4. Rätt till radering: En person har rätt att begära att deras personuppgifter raderas om de inte längre är nödvändiga för det syfte de samlades in för, om personen återkallar sitt samtycke eller om behandlingen är olaglig.

5. Rätt till begränsning av behandling: Om en person ifrågasätter riktigheten av sina personuppgifter eller om behandlingen är olaglig, kan de begära att behandlingen av deras uppgifter begränsas.

6. Rätt till dataportabilitet: En person har rätt att få sina personuppgifter i ett strukturerat, allmänt använt och maskinläsbart format och att överföra dessa uppgifter till en annan personuppgiftsansvarig.

7. Rätt att invända: En person har rätt att invända mot behandlingen av sina personuppgifter av skäl som rör deras specifika situation. Organisationen måste då sluta behandla uppgifterna om de inte kan visa tvingande berättigade skäl för behandlingen som väger tyngre än personens intressen, rättigheter och friheter.

8. Rätt att inte vara föremål för automatiserat beslutsfattande: En person har rätt att inte vara föremål för beslut som enbart baseras på automatiserad behandling, inklusive profilering, om besluten får rättsliga konsekvenser eller påverkar personen på ett liknande sätt.

Dessa rättigheter ger enskilda personer kontroll över sina personuppgifter och möjlighet att skydda sin integritet och dataskydd.

In [10]:
#Now let's ask a follow up question
chain.run(FOLLOW_UP_QUESTION)

'Jag är ledsen, men jag kan inte summera konversationen eftersom jag inte har tillgång till tidigare meddelanden.'

As you can see, it doesn't remember what it just responded, sometimes it responds based only on the system prompt, or just randomly. This proof that the LLM does NOT have memory and that we need to give the memory as a a conversation history as part of the prompt, like this:

In [11]:
hist_prompt = PromptTemplate(
    input_variables=["history", "question"],
    template="""
                {history}
                Human: {question}
                AI:
            """
    )
chain = LLMChain(llm=llm, prompt=hist_prompt)

In [12]:
Conversation_history = """
Human: {question}
AI: {response}
""".format(question=QUESTION, response=response)

In [13]:
printmd(chain.run({"history":Conversation_history, "question": FOLLOW_UP_QUESTION}))

Enligt GDPR har enskilda personer rätt till information om hur deras personuppgifter behandlas, rätt till tillgång till sina personuppgifter, rätt till rättelse av felaktiga uppgifter, rätt till radering av uppgifter som inte längre är nödvändiga eller behandlas olagligt, rätt till begränsning av behandling, rätt till dataportabilitet, rätt att invända mot behandling av uppgifter och rätt att inte vara föremål för automatiserat beslutsfattande. Dessa rättigheter ger personer kontroll över sina personuppgifter och skyddar deras integritet och dataskydd.

**Bingo!**, so we now know how to create a chatbot using LLMs, we just need to keep the state/history of the conversation and pass it as context every time

## Now that we understand the concept of memory via adding history as a context, let's go back to our GPT Smart Search engine

In [27]:
# Since Memory adds tokens to the prompt, we would need a better model that allows more space on the prompt
MODEL = "gpt-35-turbo-16k"
# MODEL = "gpt-4-32k"
COMPLETION_TOKENS = 1000
llm = AzureChatOpenAI(deployment_name=MODEL, temperature=0.2, max_tokens=COMPLETION_TOKENS)
embedder = OpenAIEmbeddings(deployment="text-embedding-ada-002", chunk_size=1)

In [16]:
t_index = "digge-ekonomi-index-files"

v_index1 = "digge-100-index-files-vector-form-rec"
v_index2 = "digge-ekonomi-index-files-vector-form-rec"

text_indexes = [t_index]
vector_indexes = [v_index1, v_index2]

In [18]:
QUESTION = "Hur ser rättigheterna ut för enskilda personer gällander GDPR?"
FOLLOW_UP_QUESTION = "Kan du summera konversationen?"

In [17]:
%%time

# Search in text-based indexes first and update vector indexes
k=10 # Top k results per each text-based index
ordered_results = get_search_results(QUESTION, text_indexes, k=k, reranker_threshold=1, vector_search=False)
update_vector_indexes(ordered_search_results=ordered_results, embedder=embedder)

# Search in all vector-based indexes available
similarity_k = 5 # top results from multi-vector-index similarity search
ordered_results = get_search_results(QUESTION, vector_indexes, k=k, vector_search=True,
                                        similarity_k=similarity_k,
                                        query_vector = embedder.embed_query(QUESTION))
print("Number of results:",len(ordered_results))

Number of results: 5
CPU times: user 547 ms, sys: 42.8 ms, total: 590 ms
Wall time: 3.33 s


In [19]:
# Uncomment the below line if you want to inspect the ordered results
for item in ordered_results.items():
    print(f"title: {item[1]['title']}\nscore: {item[1]['score']}\n\n")

title: Enskildas rättigheter enligt GDPR.pdf_page_2
score: 0.03229166567325592


title: Enskildas rättigheter enligt GDPR.pdf_page_1
score: 0.03067915514111519


title: Informationssäkerhetsklassning i KLASSA.pdf_page_12
score: 0.02804284356534481


title: Hälso- och sjukvårdsnämndens delegationsordning(346082).pdf_page_6
score: 0.023923445492982864


title: Enskildas rättigheter enligt GDPR.pdf_page_4
score: 0.02189711295068264




In [20]:
top_docs = []
for key,value in ordered_results.items():
    location = value["location"] if value["location"] is not None else ""
    top_docs.append(Document(page_content=value["chunk"], metadata={"source": location+os.environ['BLOB_SAS_TOKEN']}))
        
print("Number of chunks:",len(top_docs))

Number of chunks: 5


In [21]:
# Calculate number of tokens of our docs
if(len(top_docs)>0):
    tokens_limit = model_tokens_limit(MODEL) # this is a custom function we created in common/utils.py
    prompt_tokens = num_tokens_from_string(COMBINE_CHAT_PROMPT_TEMPLATE) # this is a custom function we created in common/utils.py
    context_tokens = num_tokens_from_docs(top_docs) # this is a custom function we created in common/utils.py
    
    requested_tokens = prompt_tokens + context_tokens + COMPLETION_TOKENS
    
    chain_type = "map_reduce" if requested_tokens > 0.9 * tokens_limit else "stuff"  
    
    print("System prompt token count:",prompt_tokens)
    print("Max Completion Token count:", COMPLETION_TOKENS)
    print("Combined docs (context) token count:",context_tokens)
    print("--------")
    print("Requested token count:",requested_tokens)
    print("Token limit for", MODEL, ":", tokens_limit)
    print("Chain Type selected:", chain_type)
        
else:
    print("NO RESULTS FROM AZURE SEARCH")

System prompt token count: 2464
Max Completion Token count: 1000
Combined docs (context) token count: 3911
--------
Requested token count: 7375
Token limit for gpt-35-turbo-16k : 16384
Chain Type selected: stuff


In [24]:
%%time
# Get the answer
response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Swedish", chain_type=chain_type)
printmd(response['output_text'])

Enligt GDPR har enskilda personer flera rättigheter. Dessa inkluderar:

1. Rätten till tillgång: Enskilda har rätt att få information om hur deras personuppgifter behandlas, vilka kategorier av personuppgifter som behandlas, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna planeras att lagras och vilka rättigheter de har när det gäller behandlingen. De har också rätt att få en kostnadsfri kopia av sina personuppgifter<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas rättigheter enligt GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

2. Rätten till rättelse: Enskilda har rätt att begära att få sina personuppgifter rättade utan onödigt dröjsmål<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas rättigheter enligt GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

3. Rätten till radering (även känd som "rätten att bli bortglömd"): Enskilda har rätt att begära att deras personuppgifter raderas<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas rättigheter enligt GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

4. Rätten till begränsning: Enskilda kan begära att deras personuppgifter inte behandlas på annat sätt än att de lagras<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas rättigheter enligt GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

5. Rätten till dataportabilitet: Om en enskild har gett sina personuppgifter till en organisation, har de rätt att få ut dem i ett allmänt använt och maskinläsbart format<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas rättigheter enligt GDPR.pdf?sv=2022-11-02&ss=

CPU times: user 7.01 ms, sys: 3.83 ms, total: 10.8 ms
Wall time: 50 s


And if we ask the follow up question:

In [28]:
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Swedish", chain_type=chain_type)
printmd(response['output_text'])

Konversationen handlar om enskildas rättigheter enligt GDPR inom Region Västerbotten. Det finns flera rättigheter som de registrerade har enligt dataskyddsförordningen, inklusive rätten till tillgång, rättelse, radering, begränsning av behandling, dataportabilitet och invändning mot behandling. Region Västerbotten har ansvar för att informera och tillhandahålla information till de registrerade om deras rättigheter. Det finns också lagar och bestämmelser som reglerar behandlingen av personuppgifter inom hälso- och sjukvården, såsom patientdatalagen. För att få mer information om dessa rättigheter och regler kan man hänvisa till de källor som anges nedan:

Källor:
- Enskildas rättigheter enligt GDPR, Utgåva nr: 1.0 Giltigt fr.o.m. 2022-03-22 Giltigt t.o.m. 2024-03-22<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas rättigheter enligt GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>
- Informationssäkerhetsklassning i KLASSA, Utgåva nr: 1.0 Giltigt fr.o.m. 2023-08-28 Giltigt t.o.m. 2025-08-28<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentInformationssäkerhetsklassning i KLASSA.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[2]</a></sup>
- Hälso- och sjukvårdsnämndens delegationsordning, Utgåva nr 2 Giltigt fro.m: 2020-06-26 - Tills vidare<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentHälso- och sjukvårdsnämndens delegationsordning(346082).pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[3]</a></sup>

Finns det något annat jag kan hjälpa dig med?

You might get a different response from above, but it doesn't matter what response you get, it will be based on the context given, not on previous answers.

Until now we just have the same as the prior Notebook 03: results from Azure Search enhanced by OpenAI model, with no memory

**Now let's add memory to it:**

Reference: https://python.langchain.com/docs/modules/memory/how_to/adding_memory_chain_multiple_inputs

In [29]:
# memory object, which is neccessary to track the inputs/outputs and hold a conversation.
memory = ConversationBufferMemory(memory_key="chat_history",input_key="question")

response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Swedish", chain_type=chain_type, 
                        memory=memory)
printmd(response['output_text'])

Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:

1. Rätt till information: Den registrerade har rätt att få information om ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlingen gäller, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter den registrerade har när det gäller behandlingen.

2. Rätt till tillgång: Den registrerade har rätt att få tillgång till sina personuppgifter och få en kostnadsfri kopia av dem i ett format som hen kan tillgodogöra sig. Om ytterligare kopior önskas kan det tas ut en administrativ avgift.

3. Rätt till rättelse: Den registrerade har rätt att begära att få sina personuppgifter rättade om de är felaktiga eller ofullständiga. Vid behov har den registrerade också rätt att komplettera uppgifterna med ett kompletterande utlåtande.

4. Rätt till radering: Den registrerade har rätt att begära att få sina personuppgifter raderade om de inte längre är nödvändiga för ändamålet med behandlingen, om behandlingen är olaglig eller om den registrerade har invänt mot behandlingen.

5. Rätt till begränsning av behandling: Den registrerade har rätt att begära att behandlingen av sina personuppgifter begränsas om uppgifterna är felaktiga, behandlingen är olaglig, uppgifterna inte längre behövs men den registrerade behöver dem för att kunna ta vara på rättsliga anspråk eller om den registrerade har invänt mot behandlingen.

6. Rätt till dataportabilitet: Om behandlingen av personuppgifter grundar sig på samtycke eller avtal har den registrerade rätt att få ut sina personuppgifter i ett allmänt använt och maskinläsbart format.

7. Rätt att invända mot behandling: Den registrerade har rätt att när som helst invända mot behandlingen av sina personuppgifter om behandlingen är av allmänt intresse eller görs som del av myndighetsutövning.

Detta är en sammanfattning av de rättigheter som enskilda personer har enligt GDPR. För mer detaljerad information kan du hänvisa till källorna nedan:

- Enskildas rättigheter enligt GDPR.pdf<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>
- Informationssäkerhetsklassning i KLASSA.pdf<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentInformationss%C3%A4kerhetsklassning%20i%20KLASSA.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[2]</a></sup>
- Hälso- och sjukvårdsnämndens delegations

In [30]:
memory.buffer_as_messages

[HumanMessage(content='Hur ser rättigheterna ut för enskilda personer gällander GDPR?'),
 AIMessage(content='Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:\n\n1. Rätt till information: Den registrerade har rätt att få information om ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlingen gäller, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter den registrerade har när det gäller behandlingen.\n\n2. Rätt till tillgång: Den registrerade har rätt att få tillgång till sina personuppgifter och få en kostnadsfri kopia av dem i ett format som hen kan tillgodogöra sig. Om ytterligare kopior önskas kan det tas ut en administrativ avgift.\n\n3. Rätt till rättelse: Den registrerade har rätt att begära att få sina personuppgifter rättade om de är felaktiga eller ofullständiga. Vid behov har den regi

In [31]:
# Now we add a follow up question:
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Swedish", chain_type=chain_type, 
                      memory=memory)
printmd(response['output_text'])

Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:

1. Rätt till information: Den registrerade har rätt att få information om ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlingen gäller, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter den registrerade har när det gäller behandlingen.

2. Rätt till tillgång: Den registrerade har rätt att få tillgång till sina personuppgifter och få en kostnadsfri kopia av dem i ett format som hen kan tillgodogöra sig. Om ytterligare kopior önskas kan det tas ut en administrativ avgift.

3. Rätt till rättelse: Den registrerade har rätt att begära att få sina personuppgifter rättade om de är felaktiga eller ofullständiga. Vid behov har den registrerade också rätt att komplettera uppgifterna med ett kompletterande utlåtande.

4. Rätt till radering: Den registrerade har rätt att begära att få sina personuppgifter raderade om de inte längre är nödvändiga för ändamålet med behandlingen, om behandlingen är olaglig eller om den registrerade har invänt mot behandlingen.

5. Rätt till begränsning av behandling: Den registrerade har rätt att begära att behandlingen av sina personuppgifter begränsas om uppgifterna är felaktiga, behandlingen är olaglig, uppgifterna inte längre behövs men den registrerade behöver dem för att kunna ta vara på rättsliga anspråk eller om den registrerade har invänt mot behandlingen.

6. Rätt till dataportabilitet: Om behandlingen av personuppgifter grundar sig på samtycke eller avtal har den registrerade rätt att få ut sina personuppgifter i ett allmänt använt och maskinläsbart format.

7. Rätt att invända mot behandling: Den registrerade har rätt att när som helst invända mot behandlingen av sina personuppgifter om behandlingen är av allmänt intresse eller görs som del av myndighetsutövning.

Detta är en sammanfattning av de rättigheter som enskilda personer har enligt GDPR. För mer detaljerad information kan du hänvisa till källorna nedan:

- Enskildas rättigheter enligt GDPR.pdf<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>
- Informationssäkerhetsklassning i KLASSA.pdf<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentInformationss%C3%A4kerhetsklassning%20i%20KLASSA.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[2]</a></sup>
- Hälso- och sjukvårdsnämndens delegations

In [32]:
memory.buffer_as_messages

[HumanMessage(content='Hur ser rättigheterna ut för enskilda personer gällander GDPR?'),
 AIMessage(content='Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:\n\n1. Rätt till information: Den registrerade har rätt att få information om ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlingen gäller, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter den registrerade har när det gäller behandlingen.\n\n2. Rätt till tillgång: Den registrerade har rätt att få tillgång till sina personuppgifter och få en kostnadsfri kopia av dem i ett format som hen kan tillgodogöra sig. Om ytterligare kopior önskas kan det tas ut en administrativ avgift.\n\n3. Rätt till rättelse: Den registrerade har rätt att begära att få sina personuppgifter rättade om de är felaktiga eller ofullständiga. Vid behov har den regi

You might get a different answer on the above cell, and it is ok, this bot is not yet well configured to answer any question that is not related to its knowledge base, including salutations.

Let's check our memory to see that it's keeping the conversation

## Using CosmosDB as persistent memory

In previous cell we have added local RAM memory to our chatbot. However, it is not persistent, it gets deleted once the app user's session is terminated. It is necessary then to use a Database for persistent storage of each of the bot user conversations, not only for Analytics and Auditing, but also if we wisg to provide recommendations. 

Here we will store the conversation history into CosmosDB for future auditing purpose.
We will use a class in LangChain use CosmosDBChatMessageHistory, see [HERE](https://python.langchain.com/en/latest/_modules/langchain/memory/chat_message_histories/cosmos_db.html)

In [33]:
# Create CosmosDB instance from langchain cosmos class.
cosmos = CosmosDBChatMessageHistory(
    cosmos_endpoint=os.environ['AZURE_COSMOSDB_ENDPOINT'],
    cosmos_database=os.environ['AZURE_COSMOSDB_NAME'],
    cosmos_container=os.environ['AZURE_COSMOSDB_CONTAINER_NAME'],
    connection_string=os.environ['AZURE_COMOSDB_CONNECTION_STRING'],
    session_id="Agent-Test-Session" + str(random.randint(1, 1000)),
    user_id="Agent-Test-User" + str(random.randint(1, 1000))
    )

# prepare the cosmosdb instance
cosmos.prepare_cosmos()

In [34]:
# Create or Memory Object
memory = ConversationBufferMemory(memory_key="chat_history", input_key="question", chat_memory=cosmos)
memory

ConversationBufferMemory(chat_memory=<langchain.memory.chat_message_histories.cosmos_db.CosmosDBChatMessageHistory object at 0x7efe73e80790>, input_key='question', memory_key='chat_history')

In [38]:
# Testing using our Question
response = get_answer(llm=llm, docs=top_docs, query=QUESTION, language="Swedish", chain_type=chain_type, 
                        memory=memory)
printmd(response['output_text'])

Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:

1. Rätt till tillgång (Artikel 15): En person har rätt att få information om hur deras personuppgifter behandlas, inklusive ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlas, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter som den registrerade har i samband med behandlingen. [1]

2. Rätt till rättelse (Artikel 16): En person har rätt att begära att felaktiga personuppgifter rättas utan onödigt dröjsmål. Vid behov har den registrerade också rätt att komplettera sina personuppgifter med ytterligare information. [1]

3. Rätt till radering (Artikel 17): En person har rätt att begära att deras personuppgifter raderas om det inte längre finns något giltigt skäl för behandlingen. Detta gäller dock inte om behandlingen är nödvändig för att uppfylla en rättslig skyldighet eller för att fastställa, utöva eller försvara rättsliga anspråk. [1]

4. Rätt till begränsning av behandling (Artikel 18): En person har rätt att begära att behandlingen av deras personuppgifter begränsas under vissa omständigheter. Detta kan vara aktuellt om personen ifrågasätter riktigheten av uppgifterna, om behandlingen är olaglig eller om personen har invänt mot behandlingen. [1]

5. Rätt till dataportabilitet (Artikel 20): Om behandlingen av personuppgifter grundar sig på samtycke eller avtal har en person rätt att få ut sina personuppgifter i ett strukturerat, allmänt använt och maskinläsbart format. Detta gör det möjligt för personen att överföra sina uppgifter till en annan personuppgiftsansvarig om de så önskar. [1]

6. Rätt att invända mot behandling (Artikel 21): En person har rätt att när som helst invända mot behandlingen av sina personuppgifter om det finns skäl som rör deras specifika situation. Om det inte finns tvingande berättigade skäl för behandlingen som väger tyngre än den registrerades intressen, rättigheter och friheter, får personuppgifterna inte längre behandlas. [1]

Det är viktigt att notera att dessa rättigheter kan vara föremål för vissa undantag och begränsningar enligt GDPR. För mer detaljerad information rekommenderas att du hänvisar till de källor som nämns i dokumenten nedan:

- [Källa 1](https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D)

Finns det något annat jag kan hjälpa dig med?

Bad pipe message: %s [b"\x9eYC\xdd\x80\xbc\xfdocl\xc2\\\x15\x17\xf7j[5 PX^\xdc\xdfW\xee6*\x94\x1b\x91\x96\xaa\x16j\xce\xed\x8f\x86\xd5\xa3*\xfc\xba\xffM\x13'\xfa\x03C\x00\x08\x13\x02\x13\x03\x13\x01"]
Bad pipe message: %s [b'(\n\xefIa\xa54O\x9b\x91\xe1\xa8\x9b\xcd\x85\xf5\xbah\x00']
Bad pipe message: %s [b'\xad\xf4\x1cy\xfe\xa2\xa1\x7f\\\xb7B\xd5\xcf\xafizf;\x00\x00>\xc0\x14\xc0\n']
Bad pipe message: %s [b'\x94\xa3\xd7\xbe\xfc\x81y(3\xa2Z\x03\xa8\xba\x92\x92r\xa0\x00\x00\xa2\xc0\x14\xc0\n\x009\x008\x007\x006\x00\x88\x00\x87\x00\x86\x00\x85\xc0\x19\x00:\x00\x89\xc0\x0f\xc0\x05\x005\x00\x84\xc0\x13\xc0\t\x003\x002\x001\x000\x00\x9a\x00\x99\x00\x98\x00\x97\x00E\x00D\x00C\x00B\xc0\x18\x004\x00\x9b\x00F\xc0\x0e\xc0\x04\x00/\x00\x96\x00A\x00\x07\xc0\x11\xc0\x07\xc0\x16\x00\x18\xc0\x0c\xc0\x02\x00\x05\x00\x04\xc0\x12\xc0\x08\x00\x16\x00\x13\x00\x10\x00\r\xc0\x17\x00\x1b\xc0\r\xc0\x03\x00\n\x00\x15\x00\x12\x00\x0f\x00\x0c\x00\x1a\x00\t\x00\x14\x00\x11\x00\x19\x00\x08\x00\x06\x00\x17\x00\x03\xc

In [36]:
# Now we add a follow up question:
response = get_answer(llm=llm, docs=top_docs, query=FOLLOW_UP_QUESTION, language="Swedish", chain_type=chain_type, 
                      memory=memory)
printmd(response['output_text'])

Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:

1. Rätt till tillgång (Artikel 15): En person har rätt att få information om hur deras personuppgifter behandlas, inklusive ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlas, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter som den registrerade har i samband med behandlingen. <sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D">[1]</a></sup>

2. Rätt till rättelse (Artikel 16): En person har rätt att begära att felaktiga personuppgifter rättas utan onödigt dröjsmål. Vid behov har den registrerade också rätt att komplettera sina personuppgifter med ytterligare information. <sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D">[1]</a></sup>

3. Rätt till radering (Artikel 17): En person har rätt att begära att deras personuppgifter raderas om det inte längre finns något giltigt skäl för behandlingen. Detta gäller dock inte om behandlingen är nödvändig för att uppfylla en rättslig skyldighet eller för att fastställa, utöva eller försvara rättsliga anspråk. <sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D">[1]</a></sup>

4. Rätt till begränsning av behandling (Artikel 18): En person har rätt att begära att behandlingen av deras personuppgifter begränsas under vissa omständigheter. Detta kan vara aktuellt om personen ifrågasätter riktigheten av uppgifterna, om behandlingen är olaglig eller om personen har invänt mot behandlingen. <sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01

In [139]:
# Another follow up query
response = get_answer(llm=llm, docs=top_docs, query="Tack för din information", language="Swedish", chain_type=chain_type,  
                      memory=memory)
printmd(response['output_text'])

Sammanfattningsvis har enskilda personer flera rättigheter enligt GDPR. Dessa rättigheter inkluderar:

1. Rätt till tillgång: Enskilda personer har rätt att få information om behandlingen av sina personuppgifter, inklusive ändamålen med behandlingen, kategorierna av personuppgifter som behandlas, eventuella tredje parter som uppgifterna kan lämnas ut till, och hur länge uppgifterna kommer att lagras. De har också rätt att få en kostnadsfri kopia av sina personuppgifter, och om ytterligare kopior begärs kan en administrativ avgift tas ut<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

2. Rätt till information: Enskilda personer har rätt att få information om behandlingen av sina personuppgifter, inklusive när uppgifterna samlas in direkt från den registrerade eller från en annan källa. Denna rättighet innebär att organisationen har ett större ansvar att informera anställda, patienter och allmänheten om hur deras personuppgifter hanteras<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

3. Rätt till rättelse: Enskilda personer har rätt att begära att deras personuppgifter rättas utan onödigt dröjsmål. Vid behov har de också rätt att lämna tilläggsinformation för att komplettera uppgifterna<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR.pdf?sv=2022-11-02&ss=bfqt&srt=c&sp=rwdlacupiytfx&se=2024-01-30T01:31:54Z&st=2023-11-20T17:31:54Z&spr=https&sig=Ztal%2BZ4HCnOpVZBTKfCKfGpK7E0SkRHO2dcvmBL%2BHKc%3D" target="_blank">[1]</a></sup>.

4. Rätt till radering (rätt att bli bortglömd): Enskilda personer har rätt att begära att deras personuppgifter raderas utan onödigt dröjsmål under vissa omständigheter. Denna rättighet gäller dock inte om behandlingen är nödvändig för att utföra en uppgift av allmänt intresse eller för att fastställa, utöva eller försvara rättsliga anspråk<sup><a href="https://blobstoragejd5ypzfx2l6vi.blob.core.windows.net/digge-100-dokumentEnskildas%20r%C3%A4ttigheter%20enligt%20GDPR

Let's check our Azure CosmosDB to see the whole conversation


In [37]:
#load message from cosmosdb
cosmos.load_messages()
cosmos.messages

[HumanMessage(content='Hur ser rättigheterna ut för enskilda personer gällander GDPR?'),
 AIMessage(content='Enligt GDPR har enskilda personer flera rättigheter när det gäller behandlingen av deras personuppgifter. Dessa rättigheter inkluderar:\n\n1. Rätt till tillgång (Artikel 15): En person har rätt att få information om hur deras personuppgifter behandlas, inklusive ändamålen med behandlingen, vilka kategorier av personuppgifter som behandlas, eventuella tredje parter som uppgifterna har eller kommer att lämnas ut till, hur länge uppgifterna kommer att lagras och de rättigheter som den registrerade har i samband med behandlingen.\n\n2. Rätt till rättelse (Artikel 16): En person har rätt att begära att felaktiga personuppgifter rättas utan onödigt dröjsmål. Vid behov har den registrerade också rätt att komplettera sina personuppgifter med ytterligare information.\n\n3. Rätt till radering (Artikel 17): En person har rätt att begära att deras personuppgifter raderas om det inte längre 

![CosmosDB Memory](./images/cosmos-chathistory.png)

# Summary
##### Adding memory to our application allows the user to have a conversation, however this feature is not something that comes with the LLM, but instead, memory is something that we must provide to the LLM in form of context of the question.

We added persitent memory using CosmosDB.

We also can notice that the current chain that we are using is smart, but not that much. Although we have given memory to it, it searches for similar docs everytime, regardless of the input and it struggles to respond to prompts like: Hello, Thank you, Bye, What's your name, What's the weather and any other task that is not search in the knowledge base.


## <u>Important Note</u>:<br>
As we proceed, while all the code will remain compatible with GPT-3.5 models, we highly recommend transitioning to GPT-4. Here's why:

**GPT-3.5-Turbo** can be likened to a 7-year-old child. You can provide it with concise instructions, but it frequently struggles to follow them accurately. Additionally, its limited memory can make sustained conversations challenging.

**GPT-3.5-Turbo-16k** resembles the same 7-year-old, but with an increased attention span for longer instructions. However, it still faces difficulties accurately executing them about half the time.

**GPT-4** exhibits the capabilities of a 10-12-year-old child. It possesses enhanced reasoning skills and more consistently adheres to instructions. While its memory retention for instructions is moderate, it excels at following them.

**GPT-4-32k** is akin to the 10-12-year-old child with an extended memory. It comprehends lengthy sets of instructions and engages in meaningful conversations. Thanks to its robust memory, it offers detailed responses.

Understanding this analogy above will become clearer as you complete the final notebook.


# NEXT
We know now how to do a Smart Search Engine that can power a chatbot!! great!

But, does this solve all the possible scenarios that a virtual assistant will require?  **What about if the answer to the Smart Search Engine is not related to text, but instead requires to look into tabular data?** The next notebook explains and solves the tabular problem and the concept of Agents