# Retrieval Augmented Generation (RAG) application with LLMs

### Overview:
- Import the Required Libraries
- Load the LLM Model
    - Ollama
- Load the Embeddig model

- Extract and Process the document text

- Setup of vector data base 
    - Creating embeddings in vectorstore 
    - Similarity Search 
- Prompt Template
- Create a RAG chain conversation


![overview.jpeg](./../../Utils/Figures/rag_example.jpeg)

## Import the Required Libraries

In [1]:
import torch

if torch.cuda.is_available():
    print(f"CUDA disponible. Using  GPU: {torch.cuda.get_device_name(0)}")
else:
    print("CUDA not disponible. Using  CPU.")

print(torch.__version__)
print(torch.cuda.is_available())
print(torch.version.cuda)

CUDA disponible. Using  GPU: NVIDIA A100-SXM4-80GB
1.12.0a0+bd13bc6
True
11.6


  from .autonotebook import tqdm as notebook_tqdm


In [2]:
import os
from glob import glob 
import getpass
import warnings
warnings.filterwarnings('ignore')

In [3]:
from transformers import AutoTokenizer
import transformers

In [4]:
from langchain_ollama.llms import OllamaLLM
from langchain.llms import HuggingFacePipeline
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain.docstore.document import Document

from langchain_community.embeddings.ollama import OllamaEmbeddings

from langchain.memory import ConversationBufferMemory
from langchain.chains import RetrievalQA
from langchain_core.prompts import PromptTemplate

In [5]:
import pdfplumber
from langchain_community.document_loaders import PyPDFLoader

AutoTokenizer. A tokenizer is responsible for preprocessing text into an array of numbers as inputs to a model.

## **Load the Llama Model Using Ollama**

https://ollama.com/library

<img src="./../../Utils/Figures/ollamafig.png" width="100" height="50" />

The temperature parameter adjusts the randomness of the output. Higher values like 0.7 will make the output more random, while lower values like 0.2 will make it more focused and deterministic.

temperature value--> how creative we want our model to be

0 ---> temperature it means model is  very safe it is not taking any bets.

1 --> it will take risk it might generate wrong output but it is very creative

In [6]:
llm = OllamaLLM(model="llama3.3:latest", temperature = 0.1, max_new_tokens = 1023, max_length=1023,)

In [7]:
prompt = ''' 
        role: system,
        content: You are the IA assistent .
        question: What the prompt template structure used by llama3 model to infom the system and user prompt?
        '''
print(llm(prompt,truncation=True))

  print(llm(prompt,truncation=True))


The Llama3 model uses a specific prompt template structure to inform the system and user prompt. The template is as follows:

```
{
  "role": "system",
  "content": "System message or instruction"
}
{
  "role": "user",
  "content": "User input or question"
}
{
  "role": "assistant",
  "content": "Assistant response or answer"
}
```

In this template:

* `role`: specifies the role of the speaker, which can be either "system", "user", or "assistant".
* `content`: contains the actual message or text spoken by the system, user, or assistant.

For example, if we want to inform the system that it's an AI assistant and ask a question, the prompt would look like this:

```
{
  "role": "system",
  "content": "You are the AI assistant."
}
{
  "role": "user",
  "content": "What is the purpose of the Llama3 model?"
}
```

This template structure allows the Llama3 model to understand the context and generate a response accordingly.


## Load the Embeddig model

#**Logged in with a Hugging Face account**

https://huggingface.co/docs/huggingface_hub/quick-start

In [8]:
# api token is disponible in hugginface site 
HUGGINGFACEHUB_API_TOKEN = "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"
os.environ["HUGGINGFACEHUB_API_TOKEN"] = HUGGINGFACEHUB_API_TOKEN
os.environ['HUGGING_FACE_HUB_API_KEY'] = HUGGINGFACEHUB_API_TOKEN #getpass.getpass('Hugging face api key:')

In [9]:
embeding_model='sentence-transformers/all-MiniLM-L6-v2'

embeddings = HuggingFaceEmbeddings(model_name=embeding_model)

  embeddings = HuggingFaceEmbeddings(model_name=embeding_model)


## Extract and Process the document text

**Read text from PDF**

In [10]:
def read_pdf(file_path):
    """Extracts and returns text from a PDF file as a single string."""
    with pdfplumber.open(file_path) as pdf:
        text = [page.extract_text() for page in pdf.pages if page.extract_text() is not None]
    return "\n".join(text)  # Join text from all pages into a single string

In [11]:
for name in glob('files/*'):
    print(name)

In [12]:
data_path='./../../Data'
pdf_text = read_pdf(f'{data_path}/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf')

In [13]:
print(pdf_text[:100])

BASICS OF BIOMEDICAL
ULTRASOUND FOR
ENGINEERS
BASICS OF BIOMEDICAL
ULTRASOUND FOR
ENGINEERS
HAIM AZH


**Read text from PDF using langchain function**

In [14]:
from langchain.document_loaders import PyPDFLoader
loader = PyPDFLoader(f'{data_path}/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf')
pages = loader.load()

In [15]:
pages[0].metadata

{'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf',
 'page': 0}

In [16]:
pages[0].page_content

'BASICS OF BIOMEDICAL \nULTRASOUND FOR \nENGINEERS'

In [17]:
pages[2].page_content

'Copyright © 2010 John Wiley & Sons, Inc. All rights reserved.\nPublished by John Wiley & Sons, Inc., Hoboken, New Jersey\nPublished simultaneously in Canada\nCopyright for the Hebrew version of the book and distribution rights in Israel are held by \nMichlol, Inc. \nNo part of this publication may be reproduced, stored in a retrieval system, or transmitted in \nany form or by any means, electronic, mechanical, photocopying, recording, scanning, or \notherwise, except as permitted under Section 107 or 108 of the 1976 United States Copyright \nAct, without either the prior written permission of the Publisher, or authorization through \npayment of the appropriate per-copy fee to the Copyright Clearance Center, Inc., 222 \nRosewood Drive, Danvers, MA 01923, (978) 750-8400, fax (978) 750-4470, or on the web at \nwww.copyright.com. Requests to the Publisher for permission should be addressed to the \nPermissions Department, John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030, (201)

**make chunks from the all PDF text**

In [18]:
from langchain.text_splitter import RecursiveCharacterTextSplitter, CharacterTextSplitter

In [19]:
def get_recursive_text_chunks(text):
    text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=1500, chunk_overlap=200, length_function=len,
            separators=["\n\n", "\n", " ", ""]
        )
    chunks = text_splitter.split_text(text)
    return chunks

def get_text_chunks(text):
    text_splitter = CharacterTextSplitter(
        separator="\n",
        chunk_size=1500,
        chunk_overlap=200,
        length_function=len
    )
    chunks = text_splitter.split_text(text)
    return chunks

In [20]:
chunks = get_text_chunks(pdf_text)

In [21]:
chunks[0]

'BASICS OF BIOMEDICAL\nULTRASOUND FOR\nENGINEERS\nBASICS OF BIOMEDICAL\nULTRASOUND FOR\nENGINEERS\nHAIM AZHARI\nA JOHN WILEY & SONS, INC., PUBLICATION\nCopyright © 2010 John Wiley & Sons, Inc. All rights reserved.\nPublished by John Wiley & Sons, Inc., Hoboken, New Jersey\nPublished simultaneously in Canada\nCopyright for the Hebrew version of the book and distribution rights in Israel are held by\nMichlol, Inc.\nNo part of this publication may be reproduced, stored in a retrieval system, or transmitted in\nany form or by any means, electronic, mechanical, photocopying, recording, scanning, or\notherwise, except as permitted under Section 107 or 108 of the 1976 United States Copyright\nAct, without either the prior written permission of the Publisher, or authorization through\npayment of the appropriate per-copy fee to the Copyright Clearance Center, Inc., 222\nRosewood Drive, Danvers, MA 01923, (978) 750-8400, fax (978) 750-4470, or on the web at\nwww.copyright.com. Requests to the Pu

In [22]:
chunk_documents = [Document(page_content=chunk) for chunk in chunks]

**using the langchain splitter**

In [23]:
text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=2000, chunk_overlap=200, length_function=len,
            separators=["\n\n", "\n", " ", ""]
        )

text_splitter = CharacterTextSplitter(
        separator="\n",
        chunk_size=2000,
        chunk_overlap=300,
        length_function=len
    )
chunk_documents_lc=text_splitter.split_documents(pages)

In [24]:
len(chunk_documents_lc)

500

In [25]:
chunk_documents_lc[0]

Document(metadata={'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf', 'page': 0}, page_content='BASICS OF BIOMEDICAL \nULTRASOUND FOR \nENGINEERS')

In [26]:
chunk_documents_lc[2]

Document(metadata={'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf', 'page': 2}, page_content='Copyright © 2010 John Wiley & Sons, Inc. All rights reserved.\nPublished by John Wiley & Sons, Inc., Hoboken, New Jersey\nPublished simultaneously in Canada\nCopyright for the Hebrew version of the book and distribution rights in Israel are held by \nMichlol, Inc. \nNo part of this publication may be reproduced, stored in a retrieval system, or transmitted in \nany form or by any means, electronic, mechanical, photocopying, recording, scanning, or \notherwise, except as permitted under Section 107 or 108 of the 1976 United States Copyright \nAct, without either the prior written permission of the Publisher, or authorization through \npayment of the appropriate per-copy fee to the Copyright Clearance Center, Inc., 222 \nRosewood Drive, Danvers, MA 01923, (978) 750-8400, fax (978) 750-4470, or on the web at \nwww.copyright.com. Requests 

In [27]:
chunk_documents_lc[0].metadata

{'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf',
 'page': 0}

In [28]:
chunk_documents_lc[-1].page_content

'INDEX  371\nplanar, 11, 12, 14–16, 27, 47, 49, 51, 57, \n86, 87, 93, 110–112, 118, 120, 125, \n137, 139–141, 145–146, 149–152, 158, \n188, 197, 200, 233, 289, 293, 299, \n315, 323–324, 326–328\nspherical, 9, 10, 12, 14, 15, 25–27, \n110–112, 139, 145, 159, 160, 163, \n165, 178–179, 298, 317, 324, 326\nX\nX-ray, 3, 227, 229, 260, 297, 298, 299, \n301\nY\nYoung’s Modulus, 48, 84, 236, 239, 242, \n323, 324'

In [29]:
# Filter documents that have title = "INDEX"
filtered_chunk_documents = [doc for doc in chunk_documents_lc if  "INDEX" not in doc.page_content]


In [30]:
filtered_chunk_documents[-1]

Document(metadata={'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf', 'page': 375}, page_content='111, 115–117, 119–120, 197–199, 234, \n323\nU\nUltrasonic computed tomography \n(UCT), 30, 104, 233, 236, 248, \n254–262\nV\nViscoelastic, 96\nW\nWave, 1–4, 5–7, 9–33, 35–39, 41–51, \n55–58, 61–71, 75–77, 83–92, 93–98, \n100–104, 107–130, 138–152, 153–163, \n165, 176, 178–179, 181, 182, 185–186, \n188, 191–192, 197–204, 206–208, \n217–219, 223, 225, 226, 229–230, 233, \n235–237, 240–242, 247–262, 264–265, \n272–273, 287, 289, 292–294, 296–300, \n306, 308–309, 313\nWave equation, 9, 20–22, 25–31, 37–38, \n50, 56, 60, 84, 86, 109, 188, 252, \n315\nWave function, 19–20, 35–37\nWave number, 21, 24, 30–31, 87, 88, \n101–102, 109, 119, 121, 123–124, 182, \n188, 201–202, 325\nWavelength, 12, 15, 16, 21, 25, 30, 39, 84, \n88–89, 98, 111, 119, 145, 146, 148, \n149, 156–157, 159, 161, 162, 176, \n179, 181, 201, 204, 219–220, 226, \n229, 260–26

In [31]:
len(filtered_chunk_documents)

494

## Setup of vector data base 

**Creating embeddings in vectorstore**

In [32]:
file_name =  'Basics of Biomedical Ultrasound filtered'
data_path = os.path.join('db', file_name)
vectorstore = Chroma.from_documents(documents = filtered_chunk_documents, embedding=embeddings, persist_directory = data_path)
#vectorstore = Chroma.from_documents(documents = chunk_documents_lc, embedding=embeddings, persist_directory = data_path)
#vectorstore = Chroma.from_documents(documents = chunks, embedding=OllamaEmbeddings(model="llama3.2:3b"))

In [33]:
# Let's save this so we can use it later!
vectorstore.persist()

  vectorstore.persist()


In [34]:
#print(vectorstore._collection.count())

In [35]:
# clear memory
del  chunks, chunk_documents, pdf_text

**Similarity Search**

In [36]:
query = "doppler"
docs = vectorstore.similarity_search(query, k=5)
len(docs)

5

In [37]:
docs[0]

Document(metadata={'page': 279, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='11.1 THE DOPPLER EFFECT   273\n When the waves encounter the target, echoes are reﬂ  ected. The echoes also \ntravel with a velocity  C  in the medium but this time toward the transducer. If \nthe target travels toward the transducer, then the distance between the two \necho fronts will be shorter; and if the target travels away from the transducer, \nthe distance will be longer. The distance between the two echo fronts   λ   ′  is \ngiven by\n    ′ =⋅− ()λ ΔtC v     (11.3)   \n The frequency corresponding to the new wavelength is therefore\n    \n′ = ′f C\nλ     \n(11.4)\n   \n Hence, the Doppler frequency shift  Δ  f  is given by\n    \nΔ Δ\nΔ\nff f C f C\ntC v f CC v\nCv f\nff Cv\nC\n= ′ −= ′ −= −() −= ⋅ +()\n−() −\n⇒= +()\n−\n00 0\n0\n0\n0\nλλ\nvv f Cv Cv\nCv\nfv\nCv\nf fV\nC\n() −⎡\n⎣⎢\n⎤\n⎦⎥ = +− +()\n−()\n⎡\n⎣⎢\n⎤\n⎦⎥ = ⋅\n−\n

In [38]:
for doc in docs:
    print(doc.metadata)

{'page': 279, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 279, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 279, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 279, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 279, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}


In [39]:
docs[0].page_content

'11.1 THE DOPPLER EFFECT   273\n When the waves encounter the target, echoes are reﬂ  ected. The echoes also \ntravel with a velocity  C  in the medium but this time toward the transducer. If \nthe target travels toward the transducer, then the distance between the two \necho fronts will be shorter; and if the target travels away from the transducer, \nthe distance will be longer. The distance between the two echo fronts   λ   ′  is \ngiven by\n    ′ =⋅− ()λ ΔtC v     (11.3)   \n The frequency corresponding to the new wavelength is therefore\n    \n′ = ′f C\nλ     \n(11.4)\n   \n Hence, the Doppler frequency shift  Δ  f  is given by\n    \nΔ Δ\nΔ\nff f C f C\ntC v f CC v\nCv f\nff Cv\nC\n= ′ −= ′ −= −() −= ⋅ +()\n−() −\n⇒= +()\n−\n00 0\n0\n0\n0\nλλ\nvv f Cv Cv\nCv\nfv\nCv\nf fV\nC\n() −⎡\n⎣⎢\n⎤\n⎦⎥ = +− +()\n−()\n⎡\n⎣⎢\n⎤\n⎦⎥ = ⋅\n−\n⇒= ⋅\n1 2\n2\n0\n0\n0\nΔ cosθ\n−− V cosθ     \n(11.5)\n   \n The typical blood ﬂ ow velocities are in the range of tens of centimeters per \nsecond (this 

## Retriever

In [40]:
from langchain.retrievers.self_query.base import SelfQueryRetriever
from langchain.chains.query_constructor.base import AttributeInfo

In [41]:
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={
        "k": 5,
        "filter": {"title": {"$ne": "INDEX"}}  # Filtra títulos diferentes de "INDEX"
    }
)

question = "what the types of doppler image applications, color doppler, power doppler ...?"
docs = retriever.get_relevant_documents(question)
docs

  docs = retriever.get_relevant_documents(question)


[Document(metadata={'page': 341, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content="336  APPENDIX B EXEMPLARY PROBLEMS\n    10.7    Consider the experimental setup shown herein, where an L - shaped \nobject is immersed in water. The speed of sound in the object is higher \nthan that of water. A pair of transducers are scanning the object from \nboth sides along the  Y  axis. The transducers retain the light of sight \nduring their scanning motion. The distance between the pair of trans-\nducers is known. \na\na\nY\nX\nA\nB\nC\nA'\nB'\nC'\n CHAPTER  11  \n    11.1    Which of the following statements is correct regarding Doppler imaging? \n  A.     The slower the ﬂ ow velocity, the deeper the blood vessels that can \nbe imaged.  \n  B.     The faster the ﬂ ow velocity, the deeper the blood vessels that can \nbe imaged.  \n  C.     The deeper the blood vessels that need to be imaged, the higher the \nrequired PRF.  \

***Using model as retrievel:***

In [42]:
docs = retriever.get_relevant_documents(question)
docs[3].metadata

{'page': 271,
 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}

In [43]:
metadata_field_info = [
    AttributeInfo(
        name="page",
        description="The page from the lecture",
        type="integer",
    ),
    AttributeInfo(
        name="source",
        description="The lecture the chunk is from pdf file`",
        type="string",
    ),

]

In [44]:
document_content_description = "Lecture notes"
llm_retrievel = OllamaLLM(model="llama3-chatqa:latest", temperature = 0)
self_query_retriever  = SelfQueryRetriever.from_llm(
    llm_retrievel,
    vectorstore,
    document_content_description,
    metadata_field_info,
    verbose=True
)

In [45]:
question = "what the types of doppler image applications, color doppler, power doppler ...?"

In [46]:
docs = self_query_retriever.get_relevant_documents(question)

In [47]:
docs

[Document(metadata={'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='282  11 DOPPLER IMAGING TECHNIQUES\nwhere the discrete autocorrelation function at a unit temporal step shift  R (1) \ncan be approximated by\n    RQ Q Q Q Q Q NN\nT\n1 12 1 2 3() ≈⋅ []−[ *, *,, * ], , ,……     (11.23)   \n This approximation has two advantages: (i) The required calculations are \nsimple and robust, and (ii) this approximation yields good results even when \nthe number of sampled data points  N  is small. In certain applications, even \n N    =   4 may sufﬁ ce. These two advantages enable very rapid velocity mapping, \neven for a large number of pixels within a very short time (real time rate). \n In order to obtain a full color mapping of the ﬂ ow, the variance of the ﬂ ow \nneeds to be estimated as well. This variance is naturally equal, up to a constant, \nto the spectral variance   σ  ( f ). By deﬁ nition, this v

In [48]:
for d in docs:
    print(d.metadata)

{'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}
{'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}


***Using compression retrievel***

In [49]:
from langchain.retrievers import ContextualCompressionRetriever
from langchain.retrievers.document_compressors import LLMChainExtractor

In [50]:
# Wrap our vectorstore
compressor = LLMChainExtractor.from_llm(llm_retrievel)

compression_retriever = ContextualCompressionRetriever(
    base_compressor=compressor,
    base_retriever=vectorstore.as_retriever()
)

In [51]:
question = "what the types of doppler image ?"
compressed_docs = compression_retriever.get_relevant_documents(question)

In [52]:
def pretty_print_docs(docs):
    print(f"\n{'-' * 100}\n".join([f"Document {i+1}:\n\n" + d.page_content for i, d in enumerate(docs)]))
pretty_print_docs(compressed_docs)

Document 1:

282  11 DOPPLER IMAGING TECHNIQUES
where the discrete autocorrelation function at a unit temporal step shift  R (1) 
can be approximated by
    RQ Q Q Q Q Q NN
T
1 12 1 2 3() ≈⋅ []−[ *, *,, * ], , ,……     (11.23)   
 This approximation has two advantages: (i) The required calculations are 
simple and robust, and (ii) this approximation yields good results even when 
the number of sampled data points  N  is small. In certain applications, even 
 N    =   4 may sufﬁ ce. These two advantages enable very rapid velocity mapping, 
even for a large number of pixels within a very short time (real time rate). 
 In order to obtain a full color mapping of the ﬂ ow, the variance of the ﬂ ow 
needs to be estimated as well. This variance is naturally equal, up to a constant, 
to the spectral variance   σ  ( f ). By deﬁ nition, this variance is given by
    
σ f
ffP f d f
Pfd f
fPfd f
Pfd f
f() =
−() ()
()
=
()
()
−∞
∞
−∞
∞
−∞
∞
−∞
∞
∫
∫
∫
∫
2
2 2
2
--------------------------------------

In [53]:
# using combination with Maximum Marginal Relevance Retrieval 
compressor = LLMChainExtractor.from_llm(llm_retrievel)
compression_retriever = ContextualCompressionRetriever(
    base_compressor=compressor, 
    base_retriever=vectorstore.as_retriever(search_type = "mmr") #Maximum Marginal Relevance Retrieval
)

question = "what the types of doppler image ?"
compressed_docs = compression_retriever.get_relevant_documents(question)
pretty_print_docs(compressed_docs)

Document 1:

282  11 DOPPLER IMAGING TECHNIQUES
where the discrete autocorrelation function at a unit temporal step shift  R (1) 
can be approximated by
    RQ Q Q Q Q Q NN
T
1 12 1 2 3() ≈⋅ []−[ *, *,, * ], , ,……     (11.23)   
 This approximation has two advantages: (i) The required calculations are 
simple and robust, and (ii) this approximation yields good results even when 
the number of sampled data points  N  is small. In certain applications, even 
 N    =   4 may sufﬁ ce. These two advantages enable very rapid velocity mapping, 
even for a large number of pixels within a very short time (real time rate). 
 In order to obtain a full color mapping of the ﬂ ow, the variance of the ﬂ ow 
needs to be estimated as well. This variance is naturally equal, up to a constant, 
to the spectral variance   σ  ( f ). By deﬁ nition, this variance is given by
    
σ f
ffP f d f
Pfd f
fPfd f
Pfd f
f() =
−() ()
()
=
()
()
−∞
∞
−∞
∞
−∞
∞
−∞
∞
∫
∫
∫
∫
2
2 2
2
--------------------------------------

***Custom compression***

In [54]:
from langchain.chains import LLMChain

compression_prompt = PromptTemplate(
    input_variables=["context","question"],
    template="Based with this question: {question} \n Do the summary of this text: {context}"
)

custom_compressor = LLMChainExtractor.from_llm(
    llm_retrievel,
    prompt=compression_prompt,
)

compression_retriever = ContextualCompressionRetriever(
    base_compressor=custom_compressor,
    base_retriever=vectorstore.as_retriever(),
    verbose=True

)

question = "what the types of doppler image ?"
compressed_docs = compression_retriever.get_relevant_documents(question)

In [55]:
compressed_docs

[Document(metadata={'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content=' There are several types of Doppler imaging techniques, including continuous-wave Doppler, pulsed Doppler, and color Doppler. Continuous-wave Doppler uses a single continuous wave to measure the Doppler shift, while pulsed Doppler uses short pulses of sound waves. Color Doppler combines both continuous-wave and pulsed Doppler to create color-coded images of blood flow.'),
 Document(metadata={'page': 288, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content=' There are several types of Doppler imaging techniques, including pulse-Doppler, continuous-wave Doppler, and phased-array Doppler. Pulse-Doppler imaging involves transmitting a series of pulses and measuring the Doppler shift of the returned signals to determine the velocity of moving targets. Continuous-wave D

## Prompt Template 

In [56]:
#<s>[INST] <<SYS>>
#{{ system_prompt }}
#<</SYS>>
#
#{{ user_message }} [/INST]

In [57]:
from langchain import HuggingFacePipeline, PromptTemplate


In [58]:
template = """

Use as seguintes partes do Context e o History para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, ex: [pag.34].

Context: {context}
History: {history}

User: {question}
Chatbot:

"""

prompt = PromptTemplate(

    # Set input variables 
    input_variables=["history","context", "question"],

    # Set template to the session state, template 
    template=template,
)

In [59]:
template = """

Use as seguintes partes do Context para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, exemplo: [pag.34 ou 'page': 280].

Context: {context}

User: {question}
Chatbot:

"""
prompt = PromptTemplate(

    # Set input variables 
    input_variables=["context", "question"],

    # Set template to the session state, template 
    template=template,
)

## Create a RAG chain conversation

In [60]:
question='Faça um resumo do efeito doppler aplicado a sistemma de ultrasom, citando as aplicações doppler'
qa_chain_mr = RetrievalQA.from_chain_type(
    llm,
    retriever=vectorstore.as_retriever(),
    return_source_documents=True,
    chain_type_kwargs ={"verbose": True, 'prompt': prompt}
)
result = qa_chain_mr({"query": question})
result["result"]

  result = qa_chain_mr({"query": question})
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m

Use as seguintes partes do Context para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, exemplo: [pag.34 ou 'page': 280].

Context: 271
 DOPPLER IMAGING TECHNIQUES     
CHAPTER 11
        Synopsis:  In this chapter the basic principles used for measuring motion and ﬂ ow 
with ultrasonic waves are presented. First, the Doppler effect is introduced. 
Then, it is explained how this effect can be utilized for measuring the temporal 
ﬂ ow speed proﬁ le. The difﬁ culties associated with the computation of the spec-
tral Doppler shift are discussed, and numeric methods for rapid estimation of 
ﬂ ow velocity and variance are presented. Finally, the principles of color ﬂ  ow 
mapping and duplex imaging are introduced.    
  11.1   THE DOPPLER EFFECT 
 One of the prominent advantages of ultrasonic imaging is its ability to combine 
anatomical imaging w

'O efeito Doppler é um fenômeno físico que ocorre quando uma onda (como uma onda sonora ou ultrassônica) é emitida por uma fonte em movimento relativo a um observador. No contexto de sistemas de ultrasom, o efeito Doppler é utilizado para medir a velocidade do fluxo sanguíneo ou do movimento de tecidos.\n\nDe acordo com o texto [pag. 271], o efeito Doppler é a base para técnicas de imagem que combinam imagens anatômicas com mapeamento de fluxo ou velocidade de tecidos, essenciais para diagnósticos cardiovasculares. O efeito Doppler permite medir a velocidade do fluxo sanguíneo e detectar alterações no fluxo, o que é útil para diagnosticar doenças cardiovasculares.\n\nAs aplicações do efeito Doppler em sistemas de ultrasom incluem:\n\n* Mapeamento de fluxo colorido (color flow mapping): uma técnica que utiliza o efeito Doppler para criar imagens coloridas do fluxo sanguíneo em tempo real.\n* Imagem duplex: uma técnica que combina imagens anatômicas com mapeamento de fluxo para avaliar a

In [61]:
result['source_documents'][3]

Document(metadata={'page': 277, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='271\n DOPPLER IMAGING TECHNIQUES     \nCHAPTER 11\n        Synopsis:  In this chapter the basic principles used for measuring motion and ﬂ ow \nwith ultrasonic waves are presented. First, the Doppler effect is introduced. \nThen, it is explained how this effect can be utilized for measuring the temporal \nﬂ ow speed proﬁ le. The difﬁ culties associated with the computation of the spec-\ntral Doppler shift are discussed, and numeric methods for rapid estimation of \nﬂ ow velocity and variance are presented. Finally, the principles of color ﬂ  ow \nmapping and duplex imaging are introduced.    \n  11.1   THE DOPPLER EFFECT \n One of the prominent advantages of ultrasonic imaging is its ability to combine \nanatomical imaging with ﬂ ow or tissue velocity mapping. This is an essential \ntool in cardiovascular diagnosis. The basis for the

In [62]:
question='Faça um resumo do efeito doppler aplicado a sistemma de ultrasom, citando as aplicações doppler'
qa_chain_mr = RetrievalQA.from_chain_type(
    llm,
    retriever=vectorstore.as_retriever(),
    chain_type="map_reduce",
    verbose='True'
)
result = qa_chain_mr({"query": question})
result["result"]

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Token indices sequence length is longer than the specified maximum sequence length for this model (3311 > 1024). Running this sequence through the model will result in indexing errors



[1m> Finished chain.[0m


'O efeito Doppler é aplicado em sistemas de ultrassom para medir o fluxo sanguíneo e a velocidade do tecido, sendo uma ferramenta essencial no diagnóstico cardiovascular. As aplicações incluem mapeamento de fluxo colorido (color flow mapping) e imagem duplex.'

In [63]:
qa_chain_mr = RetrievalQA.from_chain_type(
    llm,
    retriever=vectorstore.as_retriever(),
    chain_type="refine"
)
result = qa_chain_mr({"query": question})
result["result"]

'Com base nos textos fornecidos, aqui está um resumo refinado do efeito Doppler aplicado a sistemas de ultrassom:\n\nO efeito Doppler é um fenômeno fundamental que ocorre quando uma onda (como uma onda sonora ou ultrassônica) é emitida por uma fonte em movimento em relação a um observador. Nesse caso, a frequência da onda parece aumentar ou diminuir dependendo da direção do movimento da fonte em relação ao observador.\n\nNo contexto de sistemas de ultrassom, o efeito Doppler é utilizado para medir o fluxo sanguíneo e a velocidade dos tecidos. Isso é feito emitindo ondas ultrassônicas em direção ao fluxo sanguíneo ou aos tecidos e medindo a frequência da onda refletida. A diferença entre a frequência emitida e a frequência refletida é chamada de deslocamento Doppler, que é proporcional à velocidade do fluxo sanguíneo ou dos tecidos.\n\nAs aplicações do efeito Doppler em sistemas de ultrassom incluem:\n\n* Mapeamento de fluxo sanguíneo: permite visualizar o fluxo sanguíneo em tempo real 

In [64]:
def get_conversation_chain(vectorstore, llm, prompt):
    #memory = ConversationBufferWindowMemory(k=5)
    chain_type_kwargs = {"verbose": True, 'prompt': prompt}
    
    conversation_chain = RetrievalQA.from_chain_type(
        llm=llm,
        chain_type="stuff",
        retriever=compression_retriever,
        return_source_documents=True,
        chain_type_kwargs = chain_type_kwargs,    
    )
    
    return conversation_chain

chat_pdf=get_conversation_chain(vectorstore, llm, prompt)
response=chat_pdf('Faça um resumo do efeito doppler aplicado a sistemma de ultrasom, citando as aplicações doppler')
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m

Use as seguintes partes do Context para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, exemplo: [pag.34 ou 'page': 280].

Context:  The Doppler effect is the change in pitch (frequency) that occurs when a sound source approaches or moves away from an observer. In ultrasound imaging, this effect can be used to measure blood flow velocity and tissue velocity by analyzing changes in frequency of reflected waves. This technique is essential for cardiovascular diagnosis and has applications in other areas such as obstetrics and vascular imaging.

 The Doppler effect is the change in pitch (frequency) that occurs when a sound source approaches or moves away from an observer. It is named after Christian Doppler, who first described this phenomenon in 1842. The Doppler effect can be observed with ultrasonic waves and is used to measure motion and fl

## RAG History

### Using RetrievalQA

In [65]:
def query_with_history(chain, question):
    chat_history = chain.memory.load_memory_variables({})    
    formatted_history = "\n".join([
        f"{msg.type.capitalize()}: {msg.content}" for msg in chat_history['history']
    ])
    

    if chat_history['history'] !=[]:
        complete_prompt = f"Contexto do histórico:\n{formatted_history}\n\nPergunta atual: {question}"
    else:
        complete_prompt = question
        
    response = chain({"query": complete_prompt})
    
    return response

In [66]:
def get_conversation_chain(vectorstore, llm, prompt):
    
        memory1 = ConversationBufferMemory(
            # Set params from input variables list
            memory_key="history",
            return_messages=True,
            input_key="question",
        )
        memory2 = ConversationBufferMemory(
            memory_key="history",
            return_messages=True,
            output_key="result",
        )
        
        conversation_chain = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type='stuff',
            retriever=vectorstore.as_retriever(),
            return_source_documents=True,
            chain_type_kwargs={
                "verbose": True,
                "prompt": prompt,
                "memory": memory1,
            },
            memory = memory2
        )

        return conversation_chain

In [67]:
chat_pdf=get_conversation_chain(vectorstore, llm, prompt)
question = "'ME fale sobre todos os tipos de imagem doppler, como o color doppler o power doppler e etc..'"
response=chat_pdf(question)

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m

Use as seguintes partes do Context para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, exemplo: [pag.34 ou 'page': 280].

Context: 271
 DOPPLER IMAGING TECHNIQUES     
CHAPTER 11
        Synopsis:  In this chapter the basic principles used for measuring motion and ﬂ ow 
with ultrasonic waves are presented. First, the Doppler effect is introduced. 
Then, it is explained how this effect can be utilized for measuring the temporal 
ﬂ ow speed proﬁ le. The difﬁ culties associated with the computation of the spec-
tral Doppler shift are discussed, and numeric methods for rapid estimation of 
ﬂ ow velocity and variance are presented. Finally, the principles of color ﬂ  ow 
mapping and duplex imaging are introduced.    
  11.1   THE DOPPLER EFFECT 
 One of the prominent advantages of ultrasonic imaging is its ability to combine 
anatomical imaging w

In [68]:
response.keys()

dict_keys(['query', 'history', 'result', 'source_documents'])

In [69]:
print(response['result'])

Existem vários tipos de imagens Doppler utilizadas em medicina, cada uma com suas próprias características e aplicações. Aqui estão alguns dos principais tipos de imagens Doppler:

1. **Color Doppler**: É um tipo de imagem Doppler que utiliza cores para representar a velocidade e direção do fluxo sanguíneo ou de outros fluidos no corpo. As cores são atribuídas com base na frequência Doppler, que é proporcional à velocidade do fluxo. O Color Doppler é amplamente utilizado em diagnósticos cardiovasculares, como a detecção de estenoses ou oclusões vasculares.

2. **Power Doppler**: É um tipo de imagem Doppler que utiliza a amplitude do sinal para representar a presença de fluxo, em vez da frequência Doppler. O Power Doppler é mais sensível ao fluxo lento e é útil em áreas com baixo fluxo sanguíneo, como nos vasos periféricos ou em tecidos inflamados.

3. **Spectral Doppler**: É um tipo de imagem Doppler que fornece informações detalhadas sobre a velocidade do fluxo sanguíneo ao longo do t

In [70]:
print(response['source_documents'])

[Document(metadata={'page': 277, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='271\n DOPPLER IMAGING TECHNIQUES     \nCHAPTER 11\n        Synopsis:  In this chapter the basic principles used for measuring motion and ﬂ ow \nwith ultrasonic waves are presented. First, the Doppler effect is introduced. \nThen, it is explained how this effect can be utilized for measuring the temporal \nﬂ ow speed proﬁ le. The difﬁ culties associated with the computation of the spec-\ntral Doppler shift are discussed, and numeric methods for rapid estimation of \nﬂ ow velocity and variance are presented. Finally, the principles of color ﬂ  ow \nmapping and duplex imaging are introduced.    \n  11.1   THE DOPPLER EFFECT \n One of the prominent advantages of ultrasonic imaging is its ability to combine \nanatomical imaging with ﬂ ow or tissue velocity mapping. This is an essential \ntool in cardiovascular diagnosis. The basis for th

In [71]:
chat_pdf.memory.load_memory_variables({})

{'history': [HumanMessage(content="'ME fale sobre todos os tipos de imagem doppler, como o color doppler o power doppler e etc..'"),
  AIMessage(content='Existem vários tipos de imagens Doppler utilizadas em medicina, cada uma com suas próprias características e aplicações. Aqui estão alguns dos principais tipos de imagens Doppler:\n\n1. **Color Doppler**: É um tipo de imagem Doppler que utiliza cores para representar a velocidade e direção do fluxo sanguíneo ou de outros fluidos no corpo. As cores são atribuídas com base na frequência Doppler, que é proporcional à velocidade do fluxo. O Color Doppler é amplamente utilizado em diagnósticos cardiovasculares, como a detecção de estenoses ou oclusões vasculares.\n\n2. **Power Doppler**: É um tipo de imagem Doppler que utiliza a amplitude do sinal para representar a presença de fluxo, em vez da frequência Doppler. O Power Doppler é mais sensível ao fluxo lento e é útil em áreas com baixo fluxo sanguíneo, como nos vasos periféricos ou em te

In [72]:
response=query_with_history(chat_pdf,'Explique passo a passo o equacionamento matemático do PW doppler')
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m

Use as seguintes partes do Context para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, exemplo: [pag.34 ou 'page': 280].

Context: 336  APPENDIX B EXEMPLARY PROBLEMS
    10.7    Consider the experimental setup shown herein, where an L - shaped 
object is immersed in water. The speed of sound in the object is higher 
than that of water. A pair of transducers are scanning the object from 
both sides along the  Y  axis. The transducers retain the light of sight 
during their scanning motion. The distance between the pair of trans-
ducers is known. 
a
a
Y
X
A
B
C
A'
B'
C'
 CHAPTER  11  
    11.1    Which of the following statements is correct regarding Doppler imaging? 
  A.     The slower the ﬂ ow velocity, the deeper the blood vessels that can 
be imaged.  
  B.     The faster the ﬂ ow velocity, the deeper the blood vessels that can 
be imaged

In [73]:
response.keys()

dict_keys(['query', 'history', 'result', 'source_documents'])

In [74]:
response['history']

[HumanMessage(content="'ME fale sobre todos os tipos de imagem doppler, como o color doppler o power doppler e etc..'"),
 AIMessage(content='Existem vários tipos de imagens Doppler utilizadas em medicina, cada uma com suas próprias características e aplicações. Aqui estão alguns dos principais tipos de imagens Doppler:\n\n1. **Color Doppler**: É um tipo de imagem Doppler que utiliza cores para representar a velocidade e direção do fluxo sanguíneo ou de outros fluidos no corpo. As cores são atribuídas com base na frequência Doppler, que é proporcional à velocidade do fluxo. O Color Doppler é amplamente utilizado em diagnósticos cardiovasculares, como a detecção de estenoses ou oclusões vasculares.\n\n2. **Power Doppler**: É um tipo de imagem Doppler que utiliza a amplitude do sinal para representar a presença de fluxo, em vez da frequência Doppler. O Power Doppler é mais sensível ao fluxo lento e é útil em áreas com baixo fluxo sanguíneo, como nos vasos periféricos ou em tecidos inflama

In [75]:
response=query_with_history(chat_pdf,'Agora como seria uma aplicação em python disso')
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m

Use as seguintes partes do Context para responder a pergunta feita por User.
Obrigatoriamente ao longo da sua resposta ou ao final informe como referência a página que contém o contéudo citado, exemplo: [pag.34 ou 'page': 280].

Context: 336  APPENDIX B EXEMPLARY PROBLEMS
    10.7    Consider the experimental setup shown herein, where an L - shaped 
object is immersed in water. The speed of sound in the object is higher 
than that of water. A pair of transducers are scanning the object from 
both sides along the  Y  axis. The transducers retain the light of sight 
during their scanning motion. The distance between the pair of trans-
ducers is known. 
a
a
Y
X
A
B
C
A'
B'
C'
 CHAPTER  11  
    11.1    Which of the following statements is correct regarding Doppler imaging? 
  A.     The slower the ﬂ ow velocity, the deeper the blood vessels that can 
be imaged.  
  B.     The faster the ﬂ ow velocity, the deeper the blood vessels that can 
be imaged

### Using ConversationalRetrievalChain


In [76]:
# memory
from langchain.memory import ConversationBufferMemory
memory = ConversationBufferMemory(
    memory_key="chat_history",
    return_messages=True,
    output_key="answer",
)
    
from langchain.chains import ConversationalRetrievalChain
retriever=vectorstore.as_retriever()
qa = ConversationalRetrievalChain.from_llm(
    llm,
    chain_type='stuff',
    retriever=retriever,
    memory=memory,
    return_source_documents=True,
    verbose= True,
    return_generated_question=True,
    
)

In [77]:
question = "'ME fale sobre todos os tipos de imagem doppler, como o color doppler o power doppler e etc..'"
result=qa({"question": question})

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3mUse the following pieces of context to answer the question at the end. If you don't know the answer, just say that you don't know, don't try to make up an answer.

271
 DOPPLER IMAGING TECHNIQUES     
CHAPTER 11
        Synopsis:  In this chapter the basic principles used for measuring motion and ﬂ ow 
with ultrasonic waves are presented. First, the Doppler effect is introduced. 
Then, it is explained how this effect can be utilized for measuring the temporal 
ﬂ ow speed proﬁ le. The difﬁ culties associated with the computation of the spec-
tral Doppler shift are discussed, and numeric methods for rapid estimation of 
ﬂ ow velocity and variance are presented. Finally, the principles of color ﬂ  ow 
mapping and duplex imaging are introduced.    
  11.1   THE DOPPLER EFFECT 
 One of the prominent advantages of ultrasonic imaging is its ability to combine 
anatomical imaging with ﬂ ow or tissue velocity mapping. This is an essential 
tool in cardiovas

In [78]:
result.keys()

dict_keys(['question', 'chat_history', 'answer', 'source_documents', 'generated_question'])

In [79]:
result['answer']

'O capítulo fornecido não aborda especificamente todos os tipos de imagem Doppler, como o Color Doppler, Power Doppler, etc. No entanto, posso fornecer uma visão geral sobre esses tópicos com base no conhecimento geral.\n\nA técnica de imagem Doppler é usada em ultrassom para medir a velocidade do fluxo sanguíneo ou do movimento dos tecidos. Existem várias modalidades dentro da imagem Doppler:\n\n1. **Doppler de Deslocamento (ou Doppler Pulsado)**: Mede a velocidade do fluxo sanguíneo em um ponto específico, utilizando o efeito Doppler para calcular a frequência de deslocamento.\n\n2. **Color Doppler**: É uma técnica que superpõe cores sobre a imagem ultrassônica convencional para representar a direção e a velocidade do fluxo sanguíneo. As cores geralmente indicam se o fluxo está vindo em direção ao transdutor (geralmente vermelho) ou se está se afastando (geralmente azul).\n\n3. **Power Doppler**: Esta técnica é semelhante ao Color Doppler, mas em vez de medir a velocidade do fluxo sa

In [80]:
question = "Coloque em lista cada modo que você citou e detalhe as vantagens, aplicações e desvantagens"
result=qa({"question": question})

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3mGiven the following conversation and a follow up question, rephrase the follow up question to be a standalone question, in its original language.

Chat History:

Human: 'ME fale sobre todos os tipos de imagem doppler, como o color doppler o power doppler e etc..'
Assistant: O capítulo fornecido não aborda especificamente todos os tipos de imagem Doppler, como o Color Doppler, Power Doppler, etc. No entanto, posso fornecer uma visão geral sobre esses tópicos com base no conhecimento geral.

A técnica de imagem Doppler é usada em ultrassom para medir a velocidade do fluxo sanguíneo ou do movimento dos tecidos. Existem várias modalidades dentro da imagem Doppler:

1. **Doppler de Deslocamento (ou Doppler Pulsado)**: Mede a velocidade do fluxo sanguíneo em um ponto específico, utilizando o efeito Doppler para calcular a frequência de deslocamento.

2. **Color Doppler**: É uma técnica que superpõe cores sobre a imagem ultrassônica convencional para repr

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")



[1m> Finished chain.[0m
Prompt after formatting:
[32;1m[1;3mUse the following pieces of context to answer the question at the end. If you don't know the answer, just say that you don't know, don't try to make up an answer.

336  APPENDIX B EXEMPLARY PROBLEMS
    10.7    Consider the experimental setup shown herein, where an L - shaped 
object is immersed in water. The speed of sound in the object is higher 
than that of water. A pair of transducers are scanning the object from 
both sides along the  Y  axis. The transducers retain the light of sight 
during their scanning motion. The distance between the pair of trans-
ducers is known. 
a
a
Y
X
A
B
C
A'
B'
C'
 CHAPTER  11  
    11.1    Which of the following statements is correct regarding Doppler imaging? 
  A.     The slower the ﬂ ow velocity, the deeper the blood vessels that can 
be imaged.  
  B.     The faster the ﬂ ow velocity, the deeper the blood vessels that can 
be imaged.  
  C.     The deeper the blood vessels that ne

In [81]:
result['answer']

'Os diferentes modos de imagem Doppler incluem:\n\n1. **Doppler de Deslocamento**: Mede a velocidade do fluxo sanguíneo ou tecidual com base no deslocamento da frequência do sinal ultrassônico devido ao efeito Doppler.\n * Vantagens: Fornece informações precisas sobre a velocidade do fluxo sanguíneo, útil para diagnósticos cardiovasculares.\n * Desvantagens: Pode ser afetado pela angulação do feixe ultrassônico em relação ao fluxo sanguíneo.\n2. **Doppler de Cor**: Uma técnica que combina a imagem ultrassônica com o Doppler de deslocamento para visualizar o fluxo sanguíneo em tempo real, codificando as velocidades em cores.\n * Vantagens: Fornece uma visão rápida e intuitiva do fluxo sanguíneo, útil para identificar anormalidades no fluxo.\n * Desvantagens: Pode ser limitado pela resolução espacial e pela sensibilidade ao movimento do paciente.\n3. **Doppler de Pulsos**: Uma técnica que usa pulsos ultrassônicos para medir a velocidade do fluxo sanguíneo em um ponto específico.\n * Vant

### Best Way 

In [82]:

template = """ Você é um assistente que deve responder a Pergunta baseada no Contexto e Historico informados.
    O contexto, o histórico e a pergunta do utilizador são apresentados a seguir.
    
    Contexto = {context}
    Histórico = {history}
    Pergunta = {question}
    
    Se a resposta não estiver no Contexto ou Histórico, responda "Não consigo responder a essa pergunta com minha base de informações"
    """

template = """
System: 
Você é um assistente, responda o User usando EXCLUSIVAMENTE as informações fornecidas em Context:
Se você não tiver informações suficientes para a resposta informe que precisa de mais informações.

Context:
{context}

History:
{history}

User:{question}

Assistant:<|begin_of_text|>
"""


template = """
System: 
    Você é um assistente técnico-científico. 
    Sua tarefa é criar uma resposta detalhada, estruturada cientificamente, usando EXCLUSIVAMENTE as informações do Context e History fornecidos.
    A resposta deve seguir essas diretrizes:
   
   - Faça parágrafos interligados e conexos.
   - Organize a resposta de maneira lógica, abordando cada ponto da questão com informações claras e bem fundamentadas
   - Responda a todas as partes da pergunta do User com base nas evidências extraídas do Context.
   - Use exemplos e explicações detalhadas extraídas diretamente do Context. 
   - Ao longo de sua resposta SEMPRE utilize o metadata para pegar a Page e citar a página do documento utilizado para formar a resposta ex: (Pagina: 34; Página: 100).


Context:
{context}

History:
{history}

User:{question}

Assistant:<|begin_of_text|>

Se as informações forem insuficientes, informe que você não achou a resposta.
"""

prompt = PromptTemplate(
    # Variáveis de entrada do prompt
    #input_variables=["history", "context", "question"],
    input_variables=["context", "metadata", "history", "question"],
    # Template do texto
    template=template,
)


In [83]:
default_template=("Given the following question and context, extract any part of the context *AS IS* that is relevant to answer the question."
                    "If none of the context is relevant return NO_OUTPUT. \n\nRemember, *DO NOT* edit the extracted parts of the context.\n"
                    "\n>" 
                    "Question: {question}"
                    "\n> "
                    "Context:\n>>>\n{context}\n>>>\n"
                    "Extracted relevant parts:"
                 )

template_rag='''
Dadas as informações no Question e no Context, faça a extração de contexto "COMO ESTÂO" que sejam relevantes para responder a Question.

Siga essas diretrizes para a sua resposta:

1. **Análise do Context**:
   - Examine cuidadosamente o contexto fornecido para encontrar informações relevantes à pergunta.
   - Priorize informações mais completas, precisas e relevantes ao tema principal da pergunta.

2. **Critérios para extração**:
   - Extraia trechos textuais *exatamente como aparecem* no contexto.
   - Priorize:
     a) Definições técnicas ou conceituais diretamente relacionadas à pergunta.
     b) Exemplos práticos, cálculos ou fórmulas relevantes.
     c) Informações que oferecem um contexto geral, mas ainda úteis.
   - Em caso de múltiplas respostas possíveis:
     - Escolha a mais recente ou mais relevante.
     - Se houver dúvida, inclua todas as opções possíveis.

3. **Contexto insuficiente**:
   - Se não encontrar informações relevantes, retorne `NO_OUTPUT`.
   - Inclua uma sugestão sobre fontes, capítulos ou estratégias que poderiam fornecer as respostas.

4. **Formatação da resposta**:
   - Liste os trechos extraídos, identificando claramente a origem (capítulo, página, fonte, etc.).
   - Organize os trechos em ordem de prioridade ou relevância.

### **Context:**
>>>
{context}
>>>

### **Question:**
{question}

### **Extracted Relevant Parts:**
'''

In [84]:
document_content_description = "Book notes"
llm_retrievel = OllamaLLM(model="llama3-chatqa:latest", temperature = 0.3)
#llm_retrievel = OllamaLLM(model="llama3.3:latest", temperature = 0)
#llm_retrievel = OllamaLLM(model="llama3.2:3b", temperature = 0)

# option 1 using LLM as retrievel
self_query_retriever = SelfQueryRetriever.from_llm(
    llm_retrievel,
    vectorstore,
    document_content_description,
    metadata_field_info,
    verbose=True
)

In [85]:
retriever = vectorstore.as_retriever(
    #search_type="similarity",
    search_type="mmr",
    search_kwargs={
        "k": 5,
    }
)

In [86]:
#option 2 using the LLM and compression of documents
custom_prompt = PromptTemplate(
    input_variables=["context", "question"],
    #template=( template_rag)
    template=( default_template)
)

# Pass the custom prompt to LLMChainExtractor
compressor = LLMChainExtractor.from_llm(
    llm_retrievel,
    prompt=custom_prompt
)
    
compression_retriever = ContextualCompressionRetriever(
    base_compressor=compressor, 
    base_retriever=retriever
)


In [87]:
question=  'O que é e qual a finalidade da demodulação IQ ?'
documents1=retriever.get_relevant_documents(question)
documents2=self_query_retriever.get_relevant_documents(question)
documents3=compression_retriever.get_relevant_documents(question)

In [88]:
documents1[1]

Document(metadata={'page': 200, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='ﬁ cient. Strong reﬂ ectors are depicted by bright spots, and weak reﬂ ectors are \ndepicted as dark regions. The scale used to match the brightness and the tissue \nproperty is deﬁ ned through a transformation that yields a  gray level  lookup \ntable. The user can modify this transformation arbitrarily, and this relation \ndoes not have to be linear.    \nF1(t, x, y, z)\nS(t, x, y, z)\nT(t, x, y, z)\nTransmitter\nReceiver #1\nReceiverA\nReceiverB\nTransmitter\nReceiver #2\nF2(t, x, y, z)\nTissue\n     Figure 9.1.      Schematic depiction of various conﬁ gurations of wave transmission and \ndetection that can be used externally or internally to the body.')

In [89]:
documents2[1]

Document(metadata={'page': 286, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='vC fT≈⋅ ⋅⋅\nΔϕ\nπ4 0P R F     \n(11.14)\n   \n In practice, however, the signals are ﬁ rst digitized and converted into discrete \nnumbers. Thus, after acquiring  N  samples of the demodulated signal, we have \na vector of size  N  which contains the complex values of these signals, that is, \n  Q–   ( t  0 )   =   [ Q  1 ,  Q  2 ,  …  ,  Q N  ]. Here,  Q i   and  Q  (   i   +1)  designate two sampled signals \nacquired at time  t  0  after transmission, hence, corresponding to the same spatial \nlocation along the beam. The  Q i   signals are consecutively acquired at every \n T  PRF . Since these numbers are considered complex numbers each signal may \nbe written as\n    Qa i j b ii = () +⋅ ()     (11.15)')

In [90]:
documents3[1]

Document(metadata={'page': 200, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'}, page_content='The user can modify this transformation arbitrarily, and this relation does not have to be linear.')

In [91]:
context=[]
for doc in documents3:
    context.append(f"Metadata: {doc.metadata} \n Document: {doc.page_content}") 

In [92]:
context[0]

"Metadata: {'page': 200, 'source': './../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf'} \n Document: The user can modify this transformation arbitrarily, and this relation does not have to be linear."

In [93]:
llm = OllamaLLM(
    model="llama3.3:latest", temperature=0.3,
    #model="llama3-chatqa:latest", temperature=0,

    
)

def get_conversation_chain(vectorstore, llm, prompt):
    
        memory1 = ConversationBufferMemory(
            # Set params from input variables list
            memory_key="history",
            return_messages=True,
            input_key="question",
            max_length=10
        )
        memory2 = ConversationBufferMemory(
            memory_key="chat_history",
            return_messages=True,
            output_key="result",
        )
        
        conversation_chain = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type='stuff',
            retriever=vectorstore,
            return_source_documents=True,
            chain_type_kwargs={
                "verbose": True,
                "prompt": prompt,
                "memory": memory1,
            },
        )

        return conversation_chain

In [94]:
from termcolor import colored


template = """
Você é um assistente técnico-científico especializado em fornecer respostas detalhadas e fundamentadas. 
Sua tarefa é responder à pergunta do usuário utilizando as informações disponíveis no Context e History fornecidos. 
Em Context tem vários documentos com ess formato: Document [document_number] (Source: [file_name], Page: [page_number]): [document_text]. 
Você vai usar as informações de cada documento, presentes em [document_text] para responder a pergunta do usuário.  


sigra essas instruções para a sua resposta:
    1. SEMPRE utilize as informações do Context e/ou History para formular a sua resposta.
    2. SEMPRE que extrair uma informação direta do [document_text] informe a página de referência, exmplo: Página:[page_number].
    3. SEMPRE que tiver uma citação original do [document_text] referente ao que você usou para responder, mantenha a citação, exemplo: (Autor: [Dutra.G.B et. al, 2019])
    4. Se as informações forem insuficientes, informe que você não encontrou a resposta.  

Context: [{context}]  

History: [{history}] 

User:{question}

Assistant:


"""

template = """
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Assistente especializado em análise documental e extração precisa de informações científicas
- Objetivo: Responder com rigor acadêmico baseado EXCLUSIVAMENTE nos documentos fornecidos

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações do Context e/ou History
2. DOCUMENTAÇÃO DETALHADA DE CADA INFORMAÇÃO:
   - Cite SEMPRE a fonte original
   - Inclua o número da página entre colchetes [Página: XX]
   - Mantenha citações textuais com referência completa
   - Utilize formato: "(Autor, Ano)" para citações

3. ESTRUTURA DA RESPOSTA:
   - Introdução: Contextualização do tema
   - Desenvolvimento: Argumentação baseada NAS FONTES
   - Conclusão: Síntese das informações
   - REFERÊNCIAS EXPLÍCITAS a cada afirmação

4. TRATAMENTO DE INFORMAÇÕES INSUFICIENTES:
   - Se não encontrar informações, declare explicitamente
   - Sugira fontes adicionais ou métodos complementares de pesquisa

PROTOCOLO DE CITAÇÃO:
- Citação direta: "texto entre aspas" [Página: XX]
- Citação indireta: Informação parafraseada [Página: XX]
- Sem informações: "NÃO ENCONTRADO NOS DOCUMENTOS FORNECIDOS"

Context: [{context}]  
History: [{history}] 
User: {question}

RESPOSTA TÉCNICO-CIENTÍFICA:
"""

template = """
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se a resposta envolver diferentes trechos de documentos ou múltiplas fontes, forneça uma explicação bem estruturada e evite repetições desnecessárias.
6. Certifique-se de que as fontes são sempre mencionadas de maneira precisa e correta, sem distorcer o significado do conteúdo extraído.

Contexto: [{context}]  
Histórico: [{history}]  
Usuário: {question}

RESPOSTA TÉCNICO-CIENTÍFICA:


"""
prompt = PromptTemplate(
    # Variáveis de entrada do prompt
    #input_variables=["history", "context", "question"],
    input_variables=["context", "metadata", "history", "question"],
    # Template do texto
    template=template,
)


class Custom_RAG:
    def __init__(self, retriever, llm, prompt, max_history=5, verbose=False):
        """
        Parameters:
        - retriever: Object used to retrieve relevant documents.
        - llm: Language model for generating responses.
        - prompt: Template used for generating responses.
        - max_history: Maximum number of past interactions to include in the history.
        - verbose: If True, will print debug information in color.
        """
        self.retriever = retriever  # Retriever that returns relevant documents
        self.llm = llm              # Language model
        self.prompt = prompt        # Prompt template for generating responses
        self.history = []           # List to store the message history

        self.set_history_length(max_history)  # Set the maximum number of interactions to retain in history
        
        self.verbose = verbose  # Verbose flag for printing debug information
        
    def get_relevant_documents(self, question, include_metadata=True):
        """
        Retrieve relevant documents from the retriever.
        Optionally include metadata with the documents.
        """
        documents = self.retriever.get_relevant_documents(question)
        
        # Format the retrieved documents
        if include_metadata:
            context = "\n\n".join([
                f"Document {i+1} (Source: {doc.metadata.get('source', 'unknown')}, Page: {doc.metadata.get('page', 'unknown')}):\n{doc.page_content}"
                for i, doc in enumerate(documents)
            ])
        else:
            context = "\n\n".join([f"Document {i+1}:\n{doc.page_content}"
                                  for i, doc in enumerate(documents)])
        
        return context, documents
    
    def get_chat_history(self, N=30):
        """
        Format the chat history for the last N interactions.
        """
        history = "\n".join([f"User: {q}\nAssistant: {r}" for q, r in self.history[-N:]])
        return history
    
    
    def set_history_length(self, max_history):
        """
        Set the maximum length of the history (how many past interactions to keep).
        """
        self.max_history = max_history
    
    def save_history(self, question, response):
        """
        Save the current interaction to the history.
        If history exceeds max length, remove the oldest entry.
        """
        self.history.append((question, response))
        if len(self.history) > self.max_history:
            self.history.pop(0)
            
    def __call__(self, question):
        """
        Generate a response to the given question using the retriever and language model.
        """
        response={}
        
        # Get the relevant documents for the question
        context, documents= self.get_relevant_documents(question, include_metadata=True)

        # Get the chat history for the prompt
        history = self.get_chat_history(N=self.max_history)
        
        # Format the final prompt
        formatted_prompt = self.prompt.format(
            history=history,
            context=context,
            question=question,
        )

        # Generate the response using the LLM (now passing a string)
        answer = self.llm(formatted_prompt)
        
        # Save the interaction to history
        self.save_history(question, response)
        
        # Verbose output with color
        if self.verbose:
            print(colored("Formatted Prompt:", 'yellow'))
            print(colored(formatted_prompt, 'cyan'))  # Print the formatted prompt in cyan
            print(colored("Response:", 'yellow'))
            print(colored(answer, 'green'))  # Print the response in green
        
        response = {
        "query": question,
        "result": answer,
        "context": context,
        "source_documents": documents
        }
        
        return response

In [95]:
chat_pdf=Custom_RAG(retriever, llm, prompt, verbose= True)
response = chat_pdf('O que é e qual a finalidade da demodulação IQ ?')

Formatted Prompt:

DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se a resposta envolver 

In [96]:
chat_pdf=Custom_RAG(self_query_retriever, llm, prompt, verbose= False)
response = chat_pdf('O que é e qual a finalidade da demodulação IQ ?')
print(response['result']) 



Infelizmente, não há informações disponíveis nos documentos fornecidos sobre a demodulação IQ. Os documentos fornecidos tratam de técnicas de imagem médica, especificamente sobre ultrassom e técnicas de processamento de imagens, mas não mencionam a demodulação IQ (Source: ./../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf, Page: 251). Portanto, não é possível fornecer uma resposta técnico-científica baseada nas informações disponíveis (Source: ./../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf, Page: 251). 

Se você tiver mais documentos ou informações relevantes sobre demodulação IQ, ficarei feliz em ajudar a fornecer uma resposta mais precisa (Source: Não disponível).


In [97]:
chat_pdf=Custom_RAG(compression_retriever, llm, prompt, verbose= False)
response = chat_pdf('O que é e qual a finalidade da demodulação IQ em sistemas de Ultrasom ?')
print(response['result']) 
print("-------------------------------------------------------------------------------------")

response = chat_pdf('Como faço para calcular ela ?')
print(response['result']) 
print("-------------------------------------------------------------------------------------")


response = chat_pdf('Qual a importância dela para o calculo do modo color doppler?')
print(response['result']) 
print("-------------------------------------------------------------------------------------")


response = chat_pdf('Informe o passo a passo matemático para calcular essa modulação ?')
print(response['result']) 
print("-------------------------------------------------------------------------------------")


response = chat_pdf('Qual a relação dela com a Autocorrelação ?')
print(response['result']) 
print("-------------------------------------------------------------------------------------")


Infelizmente, com base nas informações fornecidas nos documentos e histórico, não há menção específica à "demodulação IQ" ou sua finalidade em sistemas de ultrasom. Os documentos fornecidos tratam de conceitos gerais relacionados a transformações arbitrárias (Document 1 e Document 2), uma mensagem indicando "Absolutely NO_OUTPUT" (Document 3), partes relevantes extraídas de um texto que incluem foco e refletores de foco (Document 4), e um conjunto de números sem contexto claro (Document 5).

Portanto, não é possível fornecer uma resposta técnico-científica detalhada sobre a demodulação IQ em sistemas de ultrasom com base nas informações disponíveis. 

(Source: ./../../Data/Rag_files/Haim Azhari(auth) - Basics of Biomedical Ultrasou_241017_135112.pdf.pdf, Page: 200, 373, 257)
-------------------------------------------------------------------------------------
Para calcular a demodulação IQ em sistemas de ultrasom, é necessário entender que a demodulação IQ é um processo utilizado para 

In [98]:
examples="""
•	O wall-filter 
•	Colour doppler
•	Power Doppler
•	Flow Maping 
•	Speckle Reduciton
•	Scan Convertion
"""
response = chat_pdf(f'Faça uma descrição de cada um desses processos: {examples}')
print(response['result']) 

Segue uma descrição detalhada de cada um dos processos mencionados:

**1. Wall-Filter (Filtro de Parede)**

O wall-filter é um processo utilizado em sistemas de ultrassom Doppler para remover o sinal de ruído gerado pelo movimento das paredes dos vasos sanguíneos ou outras estruturas estáticas. Esse filtro é projetado para eliminar os sinais de baixa frequência que não estão relacionados ao fluxo sanguíneo, permitindo que apenas os sinais de alta frequência, associados ao movimento do sangue, sejam processados.

O wall-filter funciona aplicando uma técnica de filtragem que remove as componentes de baixa frequência do sinal Doppler. Isso é feito utilizando um filtro passa-alta que permite que apenas as frequências acima de um determinado limiar sejam transmitidas. O resultado é um sinal Doppler mais limpo e preciso, com menos ruído e interferências.

**2. Colour Doppler (Doppler em Cores)**

O Colour Doppler é uma técnica de ultrassom que utiliza a efeméride do efeito Doppler para medir

In [99]:
chat_pdf=get_conversation_chain(retriever, llm, prompt)
question='Como é botida a autocorrelação no color doppler?'
response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 

In [100]:
chat_pdf=get_conversation_chain(compression_retriever, llm, prompt)
question= 'O que é e qual a finalidade da demodulação IQ ?'

response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 

In [101]:
chat_pdf=get_conversation_chain(self_query_retriever, llm, prompt)
question= 'O que é e qual a finalidade da demodulação IQ ?'

response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 

In [102]:
question= 'Quais os passos necessários para aplicar essa demodulação?'

response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 

In [103]:
question= 'Agora sobre a autocorrelação um passo a passo explicando o uso da demodulação, do LPF para pegar a diferença Df doppler, da estimativa de fases usado Phase-Shift e etc..'
question= 'Qual a relação dessa demodulação IQ com a autocorrelação para a estimativa de velocidade?'

response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 

In [104]:
question= "O que é a quadrature demodulation, como ela é implementada, qual a ação dela nos dados de RF e qual a função em sistema de Ultrasom?"

response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 

In [105]:
question= 'Qual foi a pergunta que fiz mais relevante ?'
response=chat_pdf(question)
print(response['result'])

Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")
Error in StdOutCallbackHandler.on_chain_start callback: AttributeError("'NoneType' object has no attribute 'get'")


Prompt after formatting:
[32;1m[1;3m
DIRETRIZES PARA RESPOSTA TÉCNICO-CIENTÍFICA:

FUNÇÃO DO ASSISTENTE:
- Você é um assistente especializado em análise documental e extração precisa de informações científicas.
- Sua tarefa é responder ao 'User' com base EXCLUSIVAMENTE nas informações fornecidas nos documentos e histórico.

INSTRUÇÕES ESPECÍFICAS:
1. USE ESTRITAMENTE as informações presentes em 'Context' e/ou 'History'. Não acrescente informações externas ou inferidas.
2. SEMPRE, ao final de cada afirmação ou trecho da resposta, inclua as fontes de onde a informação foi extraída, no formato (Page: [page]). Exemplo: 'Resposta extraída' (Source: 'nome do documento', Page: 200).
3. Caso a informação seja extraída de múltiplas páginas ou documentos, cite todas as páginas relevantes, separando-as por vírgula. Exemplo: (Source: 'nome do documento', Page: 200, 210, 300).
4. Apresente a resposta de maneira clara, objetiva e técnica, incluindo as fontes e páginas de forma organizada.  
5. Se 