# 🔍 RAG com Gemini e FAISS – Recuperação de Documentos

In [12]:
# Instale os pacotes necessários (se ainda não tiver)
# !pip install langchain langchain-google-genai faiss-cpu tiktoken

# Imports


In [None]:
from langchain_community.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
import google.generativeai as genai
import os

from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain.vectorstores import FAISS

from langchain_google_genai import ChatGoogleGenerativeAI

from langchain.chains import RetrievalQA


from langchain.schema import HumanMessage, SystemMessage


# 1. Carregar infos

In [14]:

api_key = "AIzaSyB_zk1mqpX6oYf_Uz8_jhi4-s4SjdoG_a4"
genai.configure(api_key=api_key)

PASTA_DOCS = "Premier"

def carregar_documentos(pasta):
    docs = []
    for nome in os.listdir(pasta):
        if nome.endswith(".txt"):
            caminho = os.path.join(pasta, nome)
            loader = TextLoader(caminho, encoding="utf-8")
            docs.extend(loader.load())
    return docs

documentos = carregar_documentos(PASTA_DOCS)
print(f"{len(documentos)} documentos carregados.")

1 documentos carregados.


In [None]:
splitter = CharacterTextSplitter(chunk_size=500, chunk_overlap=50)
docs_divididos = splitter.split_documents(documentos)
print(f"{len(docs_divididos)} fragmentos gerados.")

6 fragmentos gerados.


## 2. Gerar embeddings e criar índice FAISS

In [16]:

# Carregar embeddings do Gemini
embeddings = GoogleGenerativeAIEmbeddings(
    google_api_key=api_key,
    model="models/embedding-001"
    )

# Criar vetor FAISS
db = FAISS.from_documents(docs_divididos, embeddings)

## 3. Inicializar o modelo Gemini

In [17]:

llm = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash",
    temperature=0.5,
    google_api_key=api_key
)

## 4. Construir o Chain de RAG

In [None]:

# Cria o chain de pergunta-resposta com recuperação
rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=db.as_retriever(),
    return_source_documents=True
)

## 5. Fazer perguntas ao sistema

In [20]:
pergunta = "Times campeões da Premier League"
resposta = rag_chain(pergunta)
print("Resposta:\n", resposta['result'])

Resposta:
 Os times campeões da Premier League são:

* Manchester United
* Manchester City
* Chelsea
* Arsenal
* Leicester City
* Blackburn Rovers
* Liverpool


In [21]:
print("Documentos usados como fonte:")
for doc in resposta['source_documents']:
    print("-", doc.metadata['source'])

Documentos usados como fonte:
- Premier\premier.txt
- Premier\premier.txt
- Premier\premier.txt
- Premier\premier.txt



## Juiz

In [22]:
juiz = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash",
    temperature=0.3,
    google_api_key=api_key
)

In [23]:
prompt_juiz = '''
Você é um avaliador imparcial. Sua tarefa é revisar a resposta de um tutor de IA para uma pessos que gosta muito de futebol .

Critérios:
- A resposta está tecnicamente correta?
- Está clara para o nível da Premier league?
- O próximo passo sugerido está bem formulado?

Se a resposta for boa, diga “✅ Aprovado” e explique por quê.
Se tiver problemas, diga “⚠️ Reprovado” e proponha uma versão melhorada.
'''

In [24]:

def avaliar_resposta(pergunta, resposta_tutor):
    mensagens = [
        SystemMessage(content=prompt_juiz),
        HumanMessage(content=f"Pergunta do fã: {pergunta}\n\nResposta do tutor: {resposta_tutor}")
    ]
    return juiz.invoke(mensagens).content

In [25]:
avaliacao = avaliar_resposta(pergunta, resposta)
print("Avaliação do juiz:\n", avaliacao)

Avaliação do juiz:
 ✅ Aprovado. A resposta está correta, clara e concisa, listando todos os times que já foram campeões da Premier League.
