## Constru√ß√£o de Pipeline RAG para IA Generativa com Databricks e Python

## 1. Configura√ß√£o de Ambiente

Nesta etapa, realizamos a instala√ß√£o e importa√ß√£o dos pacotes necess√°rios para execu√ß√£o do pipeline.
O ambiente foi preparado de forma a garantir todas as depend√™ncias compat√≠veis para o processamento de dados e a opera√ß√£o dos modelos de IA.

In [None]:
!pip install -q "numpy==1.25.2" databricks-langchain langchain_milvus langchain-huggingface sentence-transformers beautifulsoup4

In [2]:
!pip install -q watermark

In [3]:
!pip install -q databricks-cli databricks-sql-connector

In [5]:
import os
os.environ["USER_AGENT"] = "LangChain (Google Colab)"

In [6]:
# Imports
import bs4
import sentence_transformers
from langchain_community.document_loaders import WebBaseLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_core.runnables import RunnablePassthrough
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from databricks_langchain import ChatDatabricks
from langchain_milvus import Milvus
import warnings
warnings.filterwarnings('ignore')

print("Ambiente Colab funcionando com sucesso.")


Ambiente Colab funcionando com sucesso.


## 2. Configura√ß√£o de Credenciais de Acesso

Nesta etapa, s√£o definidas as credenciais de autentica√ß√£o necess√°rias para conex√£o segura com o ambiente Databricks, garantindo acesso autorizado aos recursos da plataforma.


In [7]:
# Defina as credenciais do Databricks
os.environ["DATABRICKS_HOST"] = "https://dbc-baba4cbd-2594.cloud.databricks.com/"   # Substitua pela URL do seu Databricks
os.environ["DATABRICKS_TOKEN"] = "DATABRICKS_TOKEN"           # Substitua pelo token gerado

## 3. Extra√ß√£o de Dados da Web e Cria√ß√£o de Chunks

Realiza-se a extra√ß√£o dos dados a partir da fonte web definida. Em seguida, o conte√∫do bruto √© segmentado em pequenos blocos (chunks) de texto, otimizando o processamento e a gera√ß√£o de embeddings para consultas posteriores.


In [8]:
# Cria o carregador de dados da web
loader = WebBaseLoader("https://mitsloanreview.com.br/tecnologia/")

In [9]:
# Executa o carregador e extrai os dados da web
documentos = loader.load()

In [10]:
# Cria o separador de texto
text_splitter = RecursiveCharacterTextSplitter(chunk_size = 1800, chunk_overlap = 200)

In [11]:
# Aplica o separador e cria os chunks (documentos)
docs = text_splitter.split_documents(documentos)

In [12]:
len(docs)

27

## 4. Carregamento do Modelo de Embeddings

Inicializa-se o modelo de embeddings pr√©-treinado, que transforma os blocos de texto em vetores num√©ricos. Essa etapa √© fundamental para permitir buscas sem√¢nticas no banco vetorial.


https://huggingface.co/BAAI/bge-small-en-v1.5

In [13]:
# Carrega o modelo de embeddings
embeddings = HuggingFaceEmbeddings(model_name = "BAAI/bge-small-en-v1.5")

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/94.8k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/52.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/743 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/133M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/366 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/711k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/125 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

## 5. Cria√ß√£o e Carregamento do Banco de Dados Vetorial

Configura-se o banco de dados vetorial, respons√°vel por armazenar e indexar os embeddings gerados. Essa estrutura viabiliza a recupera√ß√£o eficiente dos dados relevantes para a gera√ß√£o de respostas.

In [14]:
# Cria o banco de dados vetorial
vector_db = Milvus.from_documents(documents = docs,
                                      embedding = embeddings,
                                      collection_name = 'collection',
                                      index_params = {"index_type": "FLAT"},
                                      connection_args = {"uri": "./milvus.db"})

In [15]:
# Cria o retriever para recuperar os dados do Vector DB
retriever = vector_db.as_retriever()

In [16]:
retriever

VectorStoreRetriever(tags=['Milvus', 'HuggingFaceEmbeddings'], vectorstore=<langchain_milvus.vectorstores.milvus.Milvus object at 0x794e3e56bb10>, search_kwargs={})

In [17]:
# Testando o Retriever

# Define uma frase
query = "Quais s√£o as tend√™ncias de tecnologia discutidas no blog?"

# Busca texto similar a frase dentro do banco vetorial
vector_db.similarity_search(query, k = 1)

[Document(metadata={'description': 'Aprofunde o seu conhecimento sobre tecnologia e saiba como ela est√° revolucionando o mundo em diversos setores.', 'language': 'pt-BR', 'pk': 457618060044664833, 'source': 'https://mitsloanreview.com.br/tecnologia/', 'title': 'Tecnologia: da revolu√ß√£o aos impactos nos dias atuais'}, page_content='INOVA√á√ÉO 20 min de leitura \n\n\t\t\tTecnologia: da revolu√ß√£o aos impactos nos dias atuais\t\t\nSaiba como as inova√ß√µes est√£o moldando um novo mundo ‚Äìe como se adaptar a ele \n\n\n \n\n\n\t\t\t\t\t\tReda√ß√£o MIT Sloan Review Brasil\t\t\t\t\t\n\n19 de julho de 2024\nAtualizado em 22 de janeiro de 2025\n\n\n\nSalvar conte√∫do 2 \n\n\n\n\n\n\n\nEste conte√∫do pertence √† editoria Tecnologia, IA e dados Ver mais conte√∫dos\nLeia a seguir\n\n\n\n\n\n\n\n \n                por \n                \n                    Albert H. Segars                \n\n\nAs 7 tecnologias que est√£o reinventando o mundo\n\n\n\n\n\n\n\n\n\n\n por \n                \n     

## 6. Definindo o Endpoint do Modelo de Linguagem (LLM)

Nesta etapa, configuramos o endpoint do LLM hospedado no Databricks, que ser√° utilizado para a gera√ß√£o das respostas a partir dos dados recuperados do banco vetorial.

In [18]:
# Definimos aqui o endpoint para o LLM no Databricks
llm = ChatDatabricks(endpoint = "databricks-dbrx-instruct", max_tokens = 200)

## 7. Definindo o Prompt Template

Configuramos o template de prompt que orienta o modelo de linguagem na constru√ß√£o das respostas, garantindo consist√™ncia e direcionamento conforme o contexto dos dados extra√≠dos.

In [19]:
# Cria o texto do prompt
PROMPT_TEMPLATE = """
        Humano: Voc√™ √© um assistente de IA e fornece respostas a perguntas do usu√°rio.

        Use as seguintes informa√ß√µes para fornecer uma resposta concisa √† pergunta entre as tags <question>.
        Se voc√™ n√£o sabe a resposta, apenas diga que n√£o sabe, n√£o tente inventar uma resposta.

        <context>
        {context}
        </context>

        <question>
        {question}
        </question>

        A resposta deve ser espec√≠fica e usar apenas informa√ß√µes confi√°veis.

        Assistente:"""

In [20]:
# Cria o prompt template
prompt = PromptTemplate(template = PROMPT_TEMPLATE, input_variables = ["context", "question"])

In [21]:
# Cria o retriever
retriever = vector_db.as_retriever()

In [22]:
# Fun√ß√£o para formatar os dados
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

## 8. Definindo o RAG Chain para o Pipeline

Montamos a cadeia (chain) de componentes respons√°vel por integrar a recupera√ß√£o dos dados relevantes (Retrieval) e a gera√ß√£o de respostas (Generation) no pipeline RAG.

In [23]:
# RAG Chain

rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

O `RunnablePassthrough` no LangChain √© um componente que simplesmente encaminha os dados de entrada para a sa√≠da sem realizar altera√ß√µes. Funciona como um "canal direto" de passagem. Neste projeto, utilizamos o `RunnablePassthrough` para transmitir a quest√£o do usu√°rio sem modifica√ß√µes at√© a pr√≥xima etapa do pipeline.

## 9. Executando o Pipeline

Com todos os componentes configurados, a execu√ß√£o do pipeline consiste em enviar uma pergunta, process√°-la por meio da arquitetura RAG e retornar a resposta gerada com base nos documentos carregados.

In [24]:
# Invoca a chain
resposta = rag_chain.invoke(query)

In [25]:
resposta

'As tend√™ncias de tecnologia discutidas no blog incluem a influ√™ncia da tecnologia na comunica√ß√£o e conectividade, com o advento da internet e smartphones, redes sociais, videoconfer√™ncias, mensagens e sistemas de gest√£o de projetos. Al√©m disso, a tecnologia tamb√©m tem impactado o desenvolvimento econ√¥mico e a ci√™ncia, com a ci√™ncia de dados e a intelig√™ncia artificial se destacando. Outros eventos importantes na √°rea de tecnologia s√£o as confer√™ncias e eventos, como a CES, a Web Summit e a Mobile World Congress.'

In [32]:
# Caixa de digita√ß√£o para fazer perguntas
print("\nüîé Pergunte algo sobre o conte√∫do carregado:")
question = input("> Sua pergunta: ")

print("\n‚è≥ Gerando resposta...")
resposta = rag_chain.invoke(question)

print("\nüì¢ Resposta:\n")
for linha in resposta.split('\n'):
    print(linha)



üîé Pergunte algo sobre o conte√∫do carregado:
> Sua pergunta: Como a intelig√™ncia artificial est√° transformando os neg√≥cios?

‚è≥ Gerando resposta...

üì¢ Resposta:

A intelig√™ncia artificial (IA) est√° transformando os neg√≥cios de v√°rias maneiras. Ela est√° impulsionando a efici√™ncia, a inova√ß√£o e a competitividade em diversos setores, permitindo que as organiza√ß√µes analisem grandes volumes de dados de maneira r√°pida e precisa para identificar padr√µes complexos e tomar decis√µes informadas em tempo real. A IA est√° automatizando tarefas repetitivas, reduzindo custos operacionais e aumentando a produtividade dos funcion√°rios. Al√©m disso, a IA est√° impulsionando novos modelos de neg√≥cios e criando oportunidades para startups e empreendedores inovarem com produtos e servi√ßos disruptivos.


# Fim