# Cadeias de Conversação Robusta com LangChain e Google Gemini

## Notebook Prático - Aula 5

**Instrutor:** Leonardo Pena  
**Curso:** LangChain: Criando chatbots inteligentes com RAG

---

Este notebook apresenta implementações práticas dos conceitos abordados na aula sobre **Cadeias de Conversação Robusta**, utilizando o **Google Gemini** como modelo de linguagem, incluindo:

1. **ConversationalRetrievalChain** - Gerenciamento de contexto conversacional
2. **Gerenciamento de Memória** - Técnicas para manter histórico de conversas
3. **Guardrails de Segurança** - Filtros para respostas seguras
4. **Re-ranking** - Melhoria na qualidade da recuperação

---

## 📦 Instalação e Importações

Primeiro, vamos instalar as dependências necessárias e importar as bibliotecas.

In [1]:
!pip install langchain langchain-google-genai langchain-community chromadb tiktoken google-generativeai

Defaulting to user installation because normal site-packages is not writeable
Collecting google-generativeai
  Downloading google_generativeai-0.8.5-py3-none-any.whl.metadata (3.9 kB)
INFO: pip is looking at multiple versions of google-generativeai to determine which version is compatible with other requirements. This could take a while.
  Downloading google_generativeai-0.8.4-py3-none-any.whl.metadata (4.2 kB)
  Downloading google_generativeai-0.8.3-py3-none-any.whl.metadata (3.9 kB)
  Downloading google_generativeai-0.8.2-py3-none-any.whl.metadata (3.9 kB)
  Downloading google_generativeai-0.8.1-py3-none-any.whl.metadata (3.9 kB)
  Downloading google_generativeai-0.8.0-py3-none-any.whl.metadata (3.9 kB)
  Downloading google_generativeai-0.7.2-py3-none-any.whl.metadata (4.0 kB)
  Downloading google_generativeai-0.7.1-py3-none-any.whl.metadata (3.9 kB)
INFO: pip is still looking at multiple versions of google-generativeai to determine which version is compatible with other requirements

  You can safely remove it manually.


In [2]:
# Importações necessárias                                   # título da seção
import os
from langchain.chains import ConversationalRetrievalChain
from langchain.memory import ConversationBufferWindowMemory
from langchain.vectorstores import Chroma
from langchain_google_genai import GoogleGenerativeAIEmbeddings, ChatGoogleGenerativeAI
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.schema import Document
import google.generativeai as genai
import warnings
warnings.filterwarnings('ignore')


  from .autonotebook import tqdm as notebook_tqdm


## 🔧 Configuração Inicial

Vamos configurar a chave de API do Google Gemini e inicializar os componentes básicos.

In [4]:
# Configuração da chave de API do Google Gemini
# Você pode obter sua chave em: https://makersuite.google.com/app/apikey

os.environ['GOOGLE_API_KEY'] = 'AIzaSyAUx0wPEDlS-2NNVh9TGaWMvJ_HTUtiMGw'  # Define a variável de ambiente com a chave da API do Google Gemini (não compartilhe essa chave publicamente)
GOOGLE_API_KEY = os.environ["GOOGLE_API_KEY"]

## 📚 1. Preparação dos Dados

Vamos criar alguns documentos de exemplo para demonstrar os conceitos.

In [5]:
# Criação de documentos de exemplo sobre IA e Machine Learning
documentos_exemplo = [
    """Inteligência Artificial (IA) é um campo da ciência da computação que se concentra
    na criação de sistemas capazes de realizar tarefas que normalmente requerem inteligência humana.
    Isso inclui aprendizado, raciocínio, percepção e tomada de decisões.""",

    """Machine Learning é uma subárea da IA que permite que computadores aprendam e melhorem
    automaticamente através da experiência, sem serem explicitamente programados.
    Os algoritmos de ML identificam padrões em dados e fazem previsões.""",

    """Deep Learning é uma técnica de machine learning baseada em redes neurais artificiais
    com múltiplas camadas. É especialmente eficaz para tarefas como reconhecimento de imagem,
    processamento de linguagem natural e reconhecimento de voz.""",

    """RAG (Retrieval-Augmented Generation) é uma técnica que combina recuperação de informações
    com geração de texto. Permite que modelos de linguagem acessem conhecimento externo
    para gerar respostas mais precisas e atualizadas.""",

    """LangChain é um framework para desenvolvimento de aplicações com modelos de linguagem.
    Facilita a criação de cadeias complexas, gerenciamento de memória e integração
    com diferentes fontes de dados.""",

    """Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar texto, imagens e código. Oferece capacidades avançadas de
    raciocínio e compreensão contextual."""
]

# Conversão para objetos Document
docs = [Document(page_content=doc) for doc in documentos_exemplo]

print(f"✅ Criados {len(docs)} documentos de exemplo")

✅ Criados 6 documentos de exemplo


## 🔍 2. Criação do Vector Store com Gemini Embeddings

Vamos criar um vector store usando Chroma com embeddings do Google Gemini.

In [9]:
# Inicializacao dos embeddings do Google Gemini

embeddings = GoogleGenerativeAIEmbeddings(
    model="models/embedding-001",
    google_api_key=GOOGLE_API_KEY
)

# Criaçao do vector store
vectorstore = Chroma.from_documents(
    documents=docs,
    embedding= embeddings,
    persist_directory="./chroma_db_gemini")

print(f"Número de documentos indexados: {vectorstore._collection.count()}")

Número de documentos indexados: 24


## 🧠 3. Gerenciamento de Memória

Implementação do **ConversationBufferWindowMemory** para manter contexto das conversas.

In [10]:
memory = ConversationBufferWindowMemory(
    k=5,
    memory_key="chat_history",
    return_messages=True,
    output_key="answer"
)


print("✅ Memória configurada!")
print(memory.k)

✅ Memória configurada!
5


## 🔗 4. ConversationalRetrievalChain com Google Gemini

Criação da cadeia conversacional que combina recuperação de documentos com o modelo Gemini.

In [11]:
# Inicializaçao do modelo Google Gemini

llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-pro-latest",
    google_api_key=GOOGLE_API_KEY,
    temperature=0.7,
    convert_system_message_to_human=True
)


# Criaçao da ConversationalRetrievalChain
qa_chain = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
    memory=memory,
    return_source_documents=True,
    verbose=True
)



## 💬 5. Testando a Conversação

Vamos testar nossa cadeia conversacional com algumas perguntas.

In [14]:
def fazer_pergunta(pergunta):
    """Função auxiliar para fazer perguntas à cadeia conversacional"""

    print(f"\n Pergunta: {pergunta}")
    print("-" * 50)

    try:
        resultado = qa_chain({"question": pergunta})

        print(f"🤖 Resposta: {resultado['answer']}")
        print(f"\n📚 Documentos utilizados: {len(resultado['source_documents'])}")

        return resultado
    except Exception as e:
        print(f"❌ Erro: {str(e)}")
        return None

# Primeira pergunta
resultado1 = fazer_pergunta("O que é Inteligência Artificial?")


 Pergunta: O que é Inteligência Artificial?
--------------------------------------------------


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_input_token_count"
  quota_id: "GenerateContentInputTokensPerModelPerMinute-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/gener



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: Use the following pieces of context to answer the user's question.
If you don't know the answer, just say that you don't know, don't try to make up an answer.
----------------
Inteligência Artificial (IA) é um campo da ciência da computação que se concentra
    na criação de sistemas capazes de realizar tarefas que normalmente requerem inteligência humana.
    Isso inclui aprendizado, raciocínio, percepção e tomada de decisões.

Inteligência Artificial (IA) é um campo da ciência da computação que se concentra
    na criação de sistemas capazes de realizar tarefas que normalmente requerem inteligência humana.
    Isso inclui aprendizado, raciocínio, percepção e tomada de decisões.

Inteligência Artificial (IA) é um campo da ciência da computação que se concentra
    na criação de sistemas capazes de realizar tarefas que normalmente requerem intel

In [15]:
resultado2 = fazer_pergunta("Como ela se relaciona com Machine Learning")


 Pergunta: Como ela se relaciona com Machine Learning
--------------------------------------------------


[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: Use the following pieces of context to answer the user's question.
If you don't know the answer, just say that you don't know, don't try to make up an answer.
----------------
Machine Learning é uma subárea da IA que permite que computadores aprendam e melhorem
    automaticamente através da experiência, sem serem explicitamente programados.
    Os algoritmos de ML identificam padrões em dados e fazem previsões.

Machine Learning é uma subárea da IA que permite que computadores aprendam e melhorem
    automaticamente através da experiência, sem serem explicitamente programados.
    Os algoritmos de ML identificam padrões em dados e fazem previsões.

Machine Learning é uma subárea da IA que permite que computadores aprendam e melhorem
    aut

Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_input_token_count"
  quota_id: "GenerateContentInputTokensPerModelPerMinute-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/gener

❌ Erro: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_input_token_count"
  quota_id: "GenerateContentInputTokensPerModelPerMinute-FreeTier"
  quota_dimensions {
    key: 

In [16]:
resultado3 = fazer_pergunta("E o que é Google Gemini como voce mencionou?")


 Pergunta: E o que é Google Gemini como voce mencionou?
--------------------------------------------------


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_input_token_count"
  quota_id: "GenerateContentInputTokensPerModelPerMinute-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/gener



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: Use the following pieces of context to answer the user's question.
If you don't know the answer, just say that you don't know, don't try to make up an answer.
----------------
Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar texto, imagens e código. Oferece capacidades avançadas de
    raciocínio e compreensão contextual.

Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar texto, imagens e código. Oferece capacidades avançadas de
    raciocínio e compreensão contextual.

Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar texto, imagens e código. Oferece capacidades avançadas de
    raciocínio e compreensão contextual.
Human: E o que é Google Gemini como voce mencionou?[0m
❌ Erro: 429 You exceeded your

## 🛡️ 6. Guardrails de Segurança

Implementação de filtros de segurança para prevenir respostas inadequadas.

In [17]:
import re

class GuardrailsSeguranca:
    def __init__(self):
        self.palavras_proibidas = [
            'senha', 'password', 'cpf', 'rg', 'cartão de crédito',
            'dados pessoais', 'informação confidencial', 'api key',
            'chave de api', 'token de acesso'
        ]

        self.padroes_pii = [
            r'\d{3}\.\d{3}\.\d{3}-\d{2}',        # Padrão CPF (999.999.999-99)
            r'\d{4}\s?\d{4}\s?\d{4}\s?\d{4}',    # Padrão cartão de crédito (16 dígitos)
            r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b',  # Padrão e-mail
            r'AIza[0-9A-Za-z\-_]{35}'            # Padrão Google API Key
        ]

    def verificar_pergunta(self, pergunta):
        """Verifica se a pergunta contém conteúdo inadequado"""
        pergunta_lower = pergunta.lower()

        # Verificar palavras proibidas
        for palavra in self.palavras_proibidas:
            if palavra in pergunta_lower:
                return False, f"Pergunta contém termo inadequado: {palavra}"

        # Verificar padrões PII
        for padrao in self.padroes_pii:
            if re.search(padrao, pergunta):
                return False, "Pergunta contém informações pessoais"

        return True, "Pergunta aprovada"

    def verificar_resposta(self, resposta):
        """Verifica se a resposta é adequada"""
        resposta_lower = resposta.lower()

        # Verificar se a resposta está no escopo
        termos_escopo = ['ia', 'inteligência artificial', 'machine learning',
                         'deep learning', 'rag', 'langchain', 'gemini', 'google']  # Tópicos permitidos

        tem_termo_escopo = any(termo in resposta_lower for termo in termos_escopo)  # Confere se la tem pelo menos um termo relevante

        if not tem_termo_escopo and len(resposta) > 50:  # Se não for do escopo e ainda for longa
            return False, "Resposta fora do escopo da aplicação"  # Bloqueia

        # Verificar se não contém informações sensíveis
        for padrao in self.padroes_pii:                 # Percorre cada regex de PII
            if re.search(padrao, resposta):             # Se encontrar dado sensível
                return False, "Resposta contém informações sensíveis"  # Bloqueia

        return True, "Resposta aprovada"  # Retorna sucesso se tudo estiver OK

# Inicialização dos guardrails
guardrails = GuardrailsSeguranca()  # Cria a instância dos guardrails
print("✅ Guardrails de segurança configurados!")


✅ Guardrails de segurança configurados!


In [18]:
def pergunta_segura(pergunta):
    """Função que aplica guardrails antes de processar a pergunta"""
    aprovada, mensagem = guardrails.verificar_pergunta(pergunta)

    if not aprovada:
        print(f"🚫 Pergunta rejeitada: {mensagem}")
        return None

    try:
        # Processar pergunta
        resultado = qa_chain({"question": pergunta})

        # Verificar resposta
        aprovada_resp, mensagem_resp = guardrails.verificar_resposta(
            resultado['answer']
        )

        if not aprovada_resp:
            print(f"🚫 Resposta rejeitada: {mensagem_resp}")
            return None

        print(f"✅ {mensagem}")
        print(f"✅ {mensagem_resp}")
        print(f"\n🤖 Resposta: {resultado['answer']}")

        return resultado

    except Exception as e:
        print(f"❌ Erro ao processar pergunta: {str(e)}")
        return None

# Teste com pergunta adequada
print("=== Teste com pergunta adequada ===")
pergunta_segura("Explique sobre Deep Learning")


=== Teste com pergunta adequada ===


Retrying langchain_google_genai.chat_models._chat_with_retry.<locals>._chat_with_retry in 2.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_input_token_count"
  quota_id: "GenerateContentInputTokensPerModelPerMinute-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-1.5-pro"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
}
violations {
  quota_metric: "generativelanguage.googleapis.com/gener



[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: Use the following pieces of context to answer the user's question.
If you don't know the answer, just say that you don't know, don't try to make up an answer.
----------------
Deep Learning é uma técnica de machine learning baseada em redes neurais artificiais
    com múltiplas camadas. É especialmente eficaz para tarefas como reconhecimento de imagem,
    processamento de linguagem natural e reconhecimento de voz.

Deep Learning é uma técnica de machine learning baseada em redes neurais artificiais
    com múltiplas camadas. É especialmente eficaz para tarefas como reconhecimento de imagem,
    processamento de linguagem natural e reconhecimento de voz.

Deep Learning é uma técnica de machine learning baseada em redes neurais artificiais
    com múltiplas camadas. É especialmente eficaz para tarefas como reconhecimento de imagem,
    processame

In [19]:
# Teste com pergunta inadequada
print("\n=== Teste com pergunta inadequada ===")
pergunta_segura("Qual é a sua chave de API?")


=== Teste com pergunta inadequada ===
🚫 Pergunta rejeitada: Pergunta contém termo inadequado: chave de api


## 🔄 7. Re-ranking Melhorado

Implementação de re-ranking para melhorar a qualidade da recuperação de documentos.

In [21]:
import numpy as np  # Importa NumPy, embora não seja usado diretamente aqui (poderia ser removido)
from sklearn.metrics.pairwise import cosine_similarity  # Função para calcular similaridade cosseno entre vetores

class RerankGemini:  # Classe responsável por reordenar (re-rankear) documentos com base em embeddings do Gemini
    def __init__(self, embeddings_model):  # Construtor que recebe um modelo de embeddings
        self.embeddings_model = embeddings_model  # Armazena o embedder fornecido
        self.nome = "Re-ranking com Gemini Embeddings"  # Nome descritivo para identificação

    def rerank(self, query, documents, top_k=3):  # Método principal de re-ranking; devolve top_k docs mais relevantes
        """Re-ranking baseado em similaridade semântica usando Gemini embeddings"""  # Docstring explicativa
        try:  # Tenta executar o fluxo principal (pode falhar, então há fallback)
            # Gerar embedding da query
            query_embedding = self.embeddings_model.embed_query(query)  # Cria vetor da pergunta usando o modelo de embeddings

            # Gerar embeddings dos documentos
            doc_texts = [doc.page_content if hasattr(doc, 'page_content') else str(doc) for doc in documents]  # Extrai texto de cada Document
            doc_embeddings = self.embeddings_model.embed_documents(doc_texts)  # Converte textos em vetores

            # Calcular similaridades
            similarities = cosine_similarity([query_embedding], doc_embeddings)[0]  # Calcula similaridade cosseno entre query e cada doc

            # Criar lista de documentos com scores
            scored_docs = list(zip(similarities, documents))  # Combina score e doc em tuplas

            # Ordenar por similaridade (maior primeiro)
            scored_docs.sort(key=lambda x: x[0], reverse=True)  # Ordena pelo score decrescente

            # Retornar top_k documentos
            return [doc for _, doc in scored_docs[:top_k]]  # Retorna somente os documentos mais relevantes

        except Exception as e:  # Captura exceções (ex.: falha na API)
            print(f"Erro no re-ranking: {e}")  # Exibe mensagem de erro
            # Fallback para re-ranking simples
            return self._simple_rerank(query, documents, top_k)  # Usa método secundário caso ocorra erro

    def _simple_rerank(self, query, documents, top_k):  # Método de fallback para re-ranking por interseção de palavras
        """Fallback: re-ranking simples baseado em palavras-chave"""  # Docstring
        query_words = set(query.lower().split())  # Divide a query em palavras (lowercase) para comparação

        scored_docs = []  # Lista para (score, doc)
        for doc in documents:  # Itera sobre documentos
            doc_text = doc.page_content if hasattr(doc, 'page_content') else str(doc)  # Obtém texto do doc
            doc_words = set(doc_text.lower().split())  # Converte texto em conjunto de palavras
            score = len(query_words.intersection(doc_words)) / len(query_words) if query_words else 0  # Percentual de palavras em comum
            scored_docs.append((score, doc))  # Adiciona tupla (score, doc) à lista

        scored_docs.sort(key=lambda x: x[0], reverse=True)  # Ordena pelo score de interseção
        return [doc for _, doc in scored_docs[:top_k]]  # Retorna top_k docs após ordenação

# Inicialização do re-ranker com Gemini
reranker = RerankGemini(embeddings)  # Cria instância passando o embedder Gemini previamente configurado
print("✅ Re-ranker com Gemini configurado!")  # Mensagem de sucesso ao criar o re-ranker


✅ Re-ranker com Gemini configurado!


In [22]:
def busca_com_rerank(query, k=5, top_k=3):                                      # Define função que busca e re-ranqueia documentos
    """Busca documentos com re-ranking usando Gemini"""                         # Docstring explicando a função
    print(f"🔍 Buscando documentos para: '{query}'")                            # Mostra a query no console

    try:                                                                        # Inicia bloco try/except para capturar erros
        # Busca inicial (mais documentos)                                       # Comentário: etapa de busca bruta
        docs_iniciais = vectorstore.similarity_search(query, k=k)               # Recupera k documentos mais similares à query
        print(f"📄 Documentos encontrados na busca inicial: {len(docs_iniciais)}")  # Exibe quantidade de docs retornados

        # Re-ranking                                                            # Comentário: etapa de re-ranqueamento semântico
        docs_reranked = reranker.rerank(query, docs_iniciais, top_k=top_k)      # Reordena docs via embeddings Gemini e guarda top_k
        print(f"🎯 Documentos após re-ranking: {len(docs_reranked)}")            # Mostra quantos docs sobraram após o re-rank

        # Mostrar resultados                                                    # Comentário: loop para exibir snippets dos docs
        print("\n📊 Documentos selecionados após re-ranking:")                  # Cabeçalho para a lista de docs finais
        for i, doc in enumerate(docs_reranked, 1):                              # Itera sobre docs reranqueados enumerando a partir de 1
            content = doc.page_content if hasattr(doc, 'page_content') else str(doc)  # Garante texto mesmo se não for Document
            print(f"{i}. {content[:100]}...")                                   # Exibe os primeiros 100 caracteres de cada doc

        return docs_reranked                                                    # Retorna a lista final de documentos

    except Exception as e:                                                      # Captura possíveis exceções
        print(f"❌ Erro na busca: {str(e)}")                                     # Mostra mensagem de erro no console
        return []                                                               # Retorna lista vazia em caso de falha

# Teste do re-ranking                                                           # Comentário: chamada de teste da função
docs_resultado = busca_com_rerank("machine learning algoritmos gemini")         # Executa a função com uma query de exemplo


🔍 Buscando documentos para: 'machine learning algoritmos gemini'
📄 Documentos encontrados na busca inicial: 5
🎯 Documentos após re-ranking: 3

📊 Documentos selecionados após re-ranking:
1. Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar t...
2. Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar t...
3. Google Gemini é um modelo de linguagem multimodal desenvolvido pelo Google,
    capaz de processar t...


## 🎓 10. Conclusão

Neste notebook, exploramos os principais conceitos de **Cadeias de Conversação Robusta** usando o **Google Gemini**:

✅ **ConversationalRetrievalChain**: Implementamos uma cadeia que mantém contexto conversacional com Gemini  
✅ **Gerenciamento de Memória**: Configuramos memória para manter histórico de interações  
✅ **Guardrails de Segurança**: Criamos filtros específicos para proteger informações sensíveis  
✅ **Re-ranking com Gemini**: Implementamos re-ranking usando embeddings do Gemini  

### 🚀 Vantagens do Google Gemini

- **Multimodal**: Capacidade de processar texto, imagens e código
- **Custo-efetivo**: Preços competitivos comparado a outros modelos
- **Integração Google**: Fácil integração com outros serviços Google
- **Performance**: Excelente qualidade de respostas e raciocínio

### 🔧 Próximos Passos

1. **Experimente** com diferentes modelos Gemini (gemini-pro-vision para imagens)
2. **Otimize** custos através de análise de tokens
3. **Implemente** cache de respostas para reduzir chamadas à API
4. **Integre** com Google Cloud para produção
5. **Explore** capacidades multimodais do Gemini

### 📚 Recursos Adicionais

- [Google AI Studio](https://makersuite.google.com/)
- [Documentação Gemini API](https://ai.google.dev/docs)
- [LangChain + Gemini](https://python.langchain.com/docs/integrations/llms/google_ai)
- [Preços do Gemini](https://ai.google.dev/pricing)

---

**Parabéns!** 🎉 Você completou o notebook prático sobre Cadeias de Conversação Robusta com Google Gemini!