# Aula 7: T√©cnicas Avan√ßadas de RAG

## O que vamos aprender:
- **Hybrid Search**: Combinar a busca por palavra-chave (BM25) com a busca sem√¢ntica (FAISS) para obter o melhor dos dois mundos, usando o `EnsembleRetriever`.
- **Multi-vector RAG**: Lidar com documentos complexos criando representa√ß√µes diferentes (resumos e chunks brutos) para uma recupera√ß√£o mais inteligente com o `MultiVectorRetriever`.



## 0. Configura√ß√£o

Instalamos as bibliotecas e configuramos a chave de API do Google.

In [1]:
!pip install langchain langchain-google-genai langchain-community faiss-cpu rank_bm25

Collecting langchain-google-genai
  Downloading langchain_google_genai-2.1.8-py3-none-any.whl.metadata (7.0 kB)
Collecting langchain-community
  Downloading langchain_community-0.3.27-py3-none-any.whl.metadata (2.9 kB)
Collecting faiss-cpu
  Downloading faiss_cpu-1.11.0.post1-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (5.0 kB)
Collecting rank_bm25
  Downloading rank_bm25-0.2.2-py3-none-any.whl.metadata (3.2 kB)
Collecting filetype<2.0.0,>=1.2.0 (from langchain-google-genai)
  Downloading filetype-1.2.0-py2.py3-none-any.whl.metadata (6.5 kB)
Collecting google-ai-generativelanguage<0.7.0,>=0.6.18 (from langchain-google-genai)
  Downloading google_ai_generativelanguage-0.6.18-py3-none-any.whl.metadata (9.8 kB)
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain-community)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting pydantic-settings<3.0.0,>=2.4.0 (from langchain-community)
  Downloading pydantic_settings-2.10.1-py3-none-a

In [2]:
import os

os.environ['GOOGLE_API_KEY'] = 'AIzaSyBDc4dXCuYxVb9bXWERnXNX95qmHtXaVxg'

In [10]:
from langchain.schema import Document  # Importa a classe Document (texto + metadados)
from langchain_google_genai import ChatGoogleGenerativeAI, GoogleGenerativeAIEmbeddings  # LLM Gemini e embeddings

# Componentes principais
llm = ChatGoogleGenerativeAI(model="gemini-1.5-pro-latest", temperature=0)  # Instancia o Gemini 1.5 Pro determin√≠stico
embeddings = GoogleGenerativeAIEmbeddings(model="models/embedding-001")  # Modelo de embeddings do Gemini v001

# Documentos de exemplo para os testes
docs = [
    Document(
        page_content="O erro HTTP 404 Not Found ocorre quando o servidor n√£o encontra o recurso solicitado. Isso pode ser causado por uma URL digitada incorretamente ou um link quebrado.",
        metadata={"source": "doc_http_404"}
    ),
    Document(
        page_content="SSH, ou Secure Shell, √© um protocolo que permite acesso remoto seguro a servidores. Para conectar, utilize a porta padr√£o 22 e um cliente SSH.",
        metadata={"source": "doc_ssh_acesso_remoto"}
    ),
    Document(
        page_content="Para visualizar os cont√™ineres em execu√ß√£o no Docker, use o comando 'docker ps'. Caso apare√ßa o erro 'Cannot connect to the Docker daemon', verifique se o servi√ßo do Docker est√° ativo.",
        metadata={"source": "doc_docker_comandos"}
    ),
    Document(
        page_content="A pol√≠tica de f√©rias corporativa garante 30 dias de descanso por ano. O colaborador deve acessar o portal interno de RH e preencher o formul√°rio 'FRM-01-FERIAS' para formalizar o pedido.",
        metadata={"source": "doc_ferias_com_formulario"}
    ),
    Document(
        page_content="Para solicitar f√©rias, os colaboradores devem acessar o sistema de RH e seguir as etapas descritas no manual, preenchendo o formul√°rio correto para libera√ß√£o.",
        metadata={"source": "doc_ferias_sem_nome_formulario"}
    )
]

## 1. Hybrid Search com `EnsembleRetriever`

A busca vetorial √© √≥tima para sem√¢ntica, mas ruim para palavras-chave. A busca por palavra-chave (BM25) √© o oposto. A busca h√≠brida une as duas. O `EnsembleRetriever` do LangChain faz isso de forma elegante.

**Cen√°rio**: O usu√°rio busca pelo termo exato "FRM-01-FERIAS". Uma busca puramente vetorial pode n√£o dar o devido peso a esse c√≥digo espec√≠fico.

In [11]:
from langchain.retrievers import BM25Retriever, EnsembleRetriever
from langchain_community.vectorstores import FAISS

# Retriever de palavra-chave (Esparso)
bm25_retriever = BM25Retriever.from_documents(docs)
bm25_retriever.k = 2

# Retriever Vetorial (Denso)
faiss_vectorstore = FAISS.from_documents(docs, embeddings)
faiss_retriever = faiss_vectorstore.as_retriever(search_kwargs={"k": 2})

# Ensemble Retriever

ensemble_retriever = EnsembleRetriever(
    retrievers=[bm25_retriever, faiss_retriever],
    weights=[0.5, 0.5]
)

In [16]:
# --- Teste de Recupera√ß√£o ----------------------------------------------------------
query_keyword = "Como pe√ßo f√©rias usando o formul√°rio FRM-01-FERIAS?"

def show_results(titulo, docs, termo="FRM-01-FERIAS"):
    print(f"\n--- {titulo} ---")
    for i, d in enumerate(docs, 1):
        src = d.metadata.get("source", "sem_source")
        print(f"    {d.page_content[:120]}...")  # descomente se quiser ver o in√≠cio do texto

print(f"--- Buscando por: '{query_keyword}' ---")

# Busca vetorial (FAISS)
docs_faiss = faiss_retriever.invoke(query_keyword)
show_results("Resultados da busca vetorial (FAISS)", docs_faiss)

# Busca h√≠brida (BM25 + FAISS via EnsembleRetriever)
docs_ensemble = ensemble_retriever.invoke(query_keyword)
show_results("Resultados da busca h√≠brida (EnsembleRetriever)", docs_ensemble)

# An√°lise autom√°tica simples
faiss_top    = docs_faiss[0].metadata.get("source")
ensemble_top = docs_ensemble[0].metadata.get("source")



--- Buscando por: 'Como pe√ßo f√©rias usando o formul√°rio FRM-01-FERIAS?' ---

--- Resultados da busca vetorial (FAISS) ---
    Para solicitar f√©rias, os colaboradores devem acessar o sistema de RH e seguir as etapas descritas no manual, preenchend...
    A pol√≠tica de f√©rias corporativa garante 30 dias de descanso por ano. O colaborador deve acessar o portal interno de RH ...

--- Resultados da busca h√≠brida (EnsembleRetriever) ---
    A pol√≠tica de f√©rias corporativa garante 30 dias de descanso por ano. O colaborador deve acessar o portal interno de RH ...
    Para solicitar f√©rias, os colaboradores devem acessar o sistema de RH e seguir as etapas descritas no manual, preenchend...


## 2. Multi-vector RAG com `MultiVectorRetriever`

Para documentos longos ou complexos, "embedar" chunks pequenos pode fazer com que o RAG perca o contexto geral. O RAG Multi-vetor resolve isso criando e buscando em resumos dos documentos primeiro, e s√≥ depois recuperando os chunks brutos para a gera√ß√£o da resposta.

**Cen√°rio**: Temos um documento longo e queremos que a busca inicial considere o contexto geral do documento, n√£o apenas pequenos trechos.

In [17]:
import uuid
from langchain.storage import InMemoryStore
from langchain.retrievers.multi_vector import MultiVectorRetriever
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.prompts import ChatPromptTemplate

# Documento longo para o exemplo
doc_longo = [
    Document(
        page_content="""                                                     )
    Introdu√ß√£o √† Seguran√ßa Cibern√©tica (2024)...
    ...
    Uma das t√©cnicas de ataque mais comuns √© o Phishing...
    ...
    Conclus√£o: Manter-se atualizado... A autentica√ß√£o de dois fatores (2FA) deve ser obrigat√≥ria.
    """,
        metadata={"source": "guia_seguranca_ciber.pdf", "ano": 2024}
    )
]

# 1. Splitter para dividir o documento em chunks
text_splitter = RecursiveCharacterTextSplitter(chunk_size=300)
doc_chunks = text_splitter.split_documents(doc_longo)

# 2. Gerador de Resumos
def generate_summaries(docs, llm_model):
    """Gera resumos para uma lista de documentos."""
    prompt = ChatPromptTemplate.from_template(
        "Resuma o seguinte documento em uma frase: {documento}"
    )
    chain = prompt | llm_model
    summaries = chain.batch([{"documento": doc.page_content} for doc in docs])
    return [s.content for s in summaries]



In [18]:
## Configurando o MultiVectorRetriever

doc_ids = [str(uuid.uuid4()) for _ in doc_chunks]

summary_chunks = generate_summaries(doc_chunks, llm)

store = InMemoryStore()
store.mset(list(zip(doc_ids, doc_chunks)))

# Cria vetor-store para os resumos, carregando o id de origem do metadado

summary_vectorstore = FAISS.from_texts(
    summary_chunks,
    embeddings,
 metadatas=[{"doc_id": doc_ids[i]} for i in range(len(summary_chunks))]
)

# Retriever que busca no vetor-store e devolve chunk completo via store

multi_vector_retriever = MultiVectorRetriever(
    vectorstore=summary_vectorstore,
    docstore=store,
    id_key="doc_id",
    search_kwargs={'k': 1}
)



In [19]:
# --- Teste de Recupera√ß√£o ---
query_resumo = "qual a principal defesa contra ataques cibern√©ticos?"

retrieved_docs = multi_vector_retriever.invoke(query_resumo)

print(f"--- Buscando por: '{query_resumo}' ---\n")
print("--- Documento Original Recuperado via Resumo (MultiVectorRetriever) ---")
if retrieved_docs:
    print(retrieved_docs[0].page_content)
else:
    print("No documents were retrieved.")

print("\nüí° **An√°lise**: A busca foi feita nos resumos, que capturam a ess√™ncia de cada parte do documento. "
      "Ao encontrar o resumo relevante sobre 'defesas', o retriever nos entregou o chunk original detalhado sobre "
      "o assunto, contendo a resposta precisa.")

--- Buscando por: 'qual a principal defesa contra ataques cibern√©ticos?' ---

--- Documento Original Recuperado via Resumo (MultiVectorRetriever) ---
)
    Introdu√ß√£o √† Seguran√ßa Cibern√©tica (2024)...
    ...
    Uma das t√©cnicas de ataque mais comuns √© o Phishing...
    ...
    Conclus√£o: Manter-se atualizado... A autentica√ß√£o de dois fatores (2FA) deve ser obrigat√≥ria.

üí° **An√°lise**: A busca foi feita nos resumos, que capturam a ess√™ncia de cada parte do documento. Ao encontrar o resumo relevante sobre 'defesas', o retriever nos entregou o chunk original detalhado sobre o assunto, contendo a resposta precisa.


## üìö Resumo Pr√°tico da Aula 7

- **Hybrid Search (`EnsembleRetriever`)**: Use quando suas buscas precisarem ser boas tanto em significado (sem√¢ntica) quanto em palavras-chave (l√©xica). Essencial para buscas com c√≥digos, siglas ou nomes pr√≥prios.
- **Multi-vector RAG (`MultiVectorRetriever`)**: A escolha ideal para documentos longos e complexos. Permite uma busca inicial mais inteligente em resumos, seguida pela recupera√ß√£o de chunks detalhados para a gera√ß√£o da resposta.
