In [13]:
!pip install langchain-huggingface langchain-chroma google-generativeai

import os
import signal
import sys
import google.generativeai as genai
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_chroma import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import PyPDFLoader



In [14]:
loaders = [PyPDFLoader('./guia.pdf')]

docs = []
for file in loaders:
    docs.extend(file.load())

In [15]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
docs = text_splitter.split_documents(docs)

In [16]:
embedding_function = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2", model_kwargs={'device': 'cpu'})

In [17]:
vectorstore = Chroma.from_documents(docs, embedding=embedding_function, persist_directory="./chroma_db_nccn")

In [18]:
print(f"Número de documentos no banco de vetores: {vectorstore._collection.count()}")

Número de documentos no banco de vetores: 1329


In [19]:
def signal_handler(sig, frame):
    print('\nObrigado por usar nosso Chat!)')
    sys.exit(0)

signal.signal(signal.SIGINT, signal_handler)

<function _signal.default_int_handler(signalnum, frame, /)>

In [20]:
last_answer = ""

def generate_rag_prompt(query, context, last_answer=""):
    escaped_context = context.replace("'","").replace('"', "").replace("\n"," ")
    escaped_last_answer = last_answer.replace("'","").replace('"', "").replace("\n"," ")
    
    prompt = f"""
Você é um bot útil e informativo que responde perguntas sobre a Universidade Presbiteriana Mackenzie usando o texto do contexto de referência incluído abaixo. \
Certifique-se de responder em uma frase completa, sendo abrangente e incluindo todas as informações relevantes. \
Lembre-se de que você está falando com um público não técnico, portanto, deve simplificar conceitos complicados \
e manter um tom amigável e conversacional. \
Se o contexto for irrelevante para a resposta, você pode ignorá-lo. Se for necessário continuar da resposta anterior, aqui está a última resposta:

                ÚLTIMA RESPOSTA: '{escaped_last_answer}'
                PERGUNTA: '{query}'
                CONTEXTO: '{escaped_context}'
              
              RESPOSTA:
              """
    return prompt

In [21]:
def get_relevant_context_from_db(query):
    context = ""
    embedding_function = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
    vector_db = Chroma(persist_directory="./chroma_db_nccn", embedding_function=embedding_function)
    
    search_results = vector_db.similarity_search(query, k=6)
        
    for result in search_results:
        context += result.page_content + "\n"
    return context

In [22]:
GEMEINI_API_KEY = "AIzaSyDSEo3An9STEo3O_BVSAdCD01KarmrG_iQ"

def generate_answer(prompt):
    genai.configure(api_key=GEMEINI_API_KEY)
    model = genai.GenerativeModel(model_name='gemini-pro')
    answer = model.generate_content(prompt)
    return answer.text


In [23]:
welcome_text = generate_answer("Se apresente brevemente")
print(welcome_text)

Olá, sou uma assistente virtual avançada, projetada para ajudar as pessoas em vários campos. Estou sempre aprendendo e me aprimorando, buscando fornecer informações precisas e assistência abrangente.


In [24]:
while True:
    print("-----------------------------------------------------------------------\n")
    print("O que gostaria de saber?")
    query = input("Resposta: ")

    context = get_relevant_context_from_db(query)
    
    prompt = generate_rag_prompt(query=query, context=context, last_answer=last_answer)
    
    answer = generate_answer(prompt=prompt)
    
    print(answer)
    last_answer = answer  

-----------------------------------------------------------------------

O que gostaria de saber?


Resposta:  Quem foi John Theron Mackenzie?


Sinto muito, mas o contexto fornecido não contém informações sobre quem foi John Theron Mackenzie.
-----------------------------------------------------------------------

O que gostaria de saber?


Resposta:  conte uma a historia de Mackenzie


A Universidade Presbiteriana Mackenzie recebeu o nome do filantropo e advogado norte-americano John Theron Mackenzie, que nasceu em 1818 e faleceu em 1892.
-----------------------------------------------------------------------

O que gostaria de saber?


KeyboardInterrupt: Interrupted by user