## **Basic RAG Pipeline**

In [1]:
import os
import openai
from dotenv import load_dotenv

load_dotenv() # load environment variables from the .env file
openai.api_key = os.getenv("OPENAI_API_KEY") # set the API key


In [2]:
from llama_index import SimpleDirectoryReader 
# SimpleDirectoryReader is a class that reads a list of files 
# and returns a list of dictionaries with the file content and metadata.

documents = SimpleDirectoryReader(
    input_files=["./files/veterinario.txt"] # list of files to index
).load_data()

In [3]:
print(f'type(documents): {type(documents)}')
print(f'len(documents): {len(documents)}')
print(f'type(documents[0]): {type(documents[0])}')
print(f'text: {documents[0]}')

type(documents): <class 'list'>
len(documents): 1
type(documents[0]): <class 'llama_index.schema.Document'>
text: Doc ID: aec1f35d-5bfb-4f84-958c-52237e03897d
Text: Castração de cães e gatos agendamento on-line Portal Rio 1746
Serviços  Animais  Medicina Veterinária 1. O que é o serviço:
Informações sobre marcação de cirurgia para cães e gatos em uma das
duas unidades veterinárias do IVISA-RIO:  Centro de Controle de
Controle de Zoonoses Paulo Dacorso Filho (CCZ): Largo do Bodegão, 150
– Santa Cruz  Centr...


In [4]:
from llama_index import Document 
# Document is a class that represents 
# a document with metadata and text.

document = Document(text="\n\n".join([doc.text for doc in documents]))

In [5]:
from llama_index import VectorStoreIndex 
from llama_index import ServiceContext 
from llama_index.llms import OpenAI

# VectorStoreIndex is a class that indexes a list of 
# documents and allows to search for similar documents.
# ServiceContext is a class that holds 
# the configuration of the service.
# OpenAI is a class that uses the 
# OpenAI API to generate text.

llm = OpenAI(model="gpt-3.5-turbo", temperature=0.1) # create a new OpenAI service

In [None]:
service_context = ServiceContext.from_defaults( # create a new service context
    llm=llm, embed_model="local:BAAI/bge-small-en-v1.5" # set the language model and the embedding model
)


index = VectorStoreIndex.from_documents([document], # create a new index
                                        service_context=service_context)

In [7]:
query_engine = index.as_query_engine() # create a query engine

In [8]:
response = query_engine.query( # query the index
    "Como realizar o agendamento para a castração do meu cachorro?"
)
print(str(response))

Para realizar o agendamento para a castração do seu cachorro, você precisa fazer login no Carioca Digital (www.carioca.rio) e acessar o serviço de agendamento de castração de cães e gatos. Em seguida, selecione o item VISA PETs - Vigilância Sanitária - Serviços de Castração de Animais e escolha a unidade veterinária em que deseja marcar a cirurgia. Indique o tipo de atendimento (para cães), escolha uma data e um horário disponível e confirme o agendamento. Lembre-se de comparecer à unidade escolhida com antecedência no dia marcado, conforme orientação no cadastro online.


In [9]:
response = query_engine.query( # query the index
    "Que horas ocorre a castração?"
)
print(str(response))

A castração ocorre das 8h às 17h, de segunda a sexta-feira.
