# Prometeia – Ferramenta de Estudos com IA (RAG + LLM)
Este notebook demonstra o uso dos módulos da Prometeia para leitura de PDFs, segmentação, vetorização, busca semântica e sumarização.

In [None]:
# Preparação de caminho para importações
import sys
import os

sys.path.append(os.path.abspath(".."))

# Módulo 1 – Ingestão de PDFs
from src.ingestao_pdf import extrair_texto_dos_pdfs
documentos = extrair_texto_dos_pdfs(r'E:\DEV\prometeia\data\pdfs')
print(f"{len(documentos)} documentos carregados:")
for nome in documentos.keys():
    print(f" - {nome}")

In [None]:
# Módulo 2 – Segmentação e Vetorização
from src.vetorizacao import segmentar_documento, vetorizar_segmentos
texto = documentos[list(documentos.keys())[0]]
segmentos = segmentar_documento(texto)
vetores = vetorizar_segmentos(segmentos)

In [None]:
# Módulo 3 – Indexação FAISS
from src.vetorizacao import criar_index_faiss
import numpy as np
index = criar_index_faiss(np.array(vetores))

In [None]:
# Módulo 4 – Busca Semântica e Sumarização
from src.sumarizacao import gerar_resumo
from sentence_transformers import SentenceTransformer
modelo = SentenceTransformer('all-MiniLM-L6-v2')

pergunta = 'Qual papel dos conselhos de gestão?'
query_vec = modelo.encode([pergunta])
D, I = index.search(np.array(query_vec), k=5)
contexto = [segmentos[i] for i in I[0]]
resposta = gerar_resumo(' '.join(contexto))
print(resposta)