# Sistema de Perguntas e Respostas com RAG

Este notebook demonstra um sistema de perguntas e respostas que utiliza o modelo de Recuperação-Aumentada por Geração (RAG). Os documentos de entrada são convertidos em vetores e armazenados em um índice FAISS. O sistema suporta arquivos `.pdf`, `.txt`, `.csv` e `.html`.

In [None]:
# Instale as dependências necessárias
!pip install -q langchain langchain-community langchain-huggingface faiss-cpu

In [None]:
# Importação de módulos
from src.parser import load_documents
from src.embedder import embed_and_store
from src.qa import ask_question
from langchain.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings
import os, shutil

In [None]:
# Diretórios
DOCS_DIR = 'data/raw'
INDEX_DIR = 'data/index'

# (Opcional) Limpar índice antigo para reindexação do zero
if os.path.exists(INDEX_DIR):
    shutil.rmtree(INDEX_DIR)

# Carregar e indexar os documentos
docs = load_documents(DOCS_DIR)
print(f"{len(docs)} documentos carregados")
embed_and_store(docs, INDEX_DIR)
print("Indexação concluída")

In [None]:
# Carregar índice e executar uma pergunta
retriever = FAISS.load_local(INDEX_DIR, HuggingFaceEmbeddings(), allow_dangerous_deserialization=True)

pergunta = "Quais são os princípios da LGPD?"
resposta = ask_question(pergunta, retriever)
print("Resposta:", resposta)

## Conclusão

Este sistema permite a indexação e consulta eficiente de documentos diversos, utilizando técnicas modernas de embeddings e modelos de linguagem. Pode ser adaptado facilmente para diferentes domínios e conjuntos de documentos.