# Notebook 04: Testes de Queries RAG

Este notebook testa o sistema RAG completo. Aqui vamos:

1. **Testar** queries de busca no Pinecone
2. **Validar** qualidade da recupera√ß√£o de contexto
3. **Exemplificar** uso pr√°tico do RAG
4. **Avaliar** m√©tricas de qualidade

## üìã Pr√©-requisitos

- Notebook 03 executado com sucesso (dados ingeridos no Pinecone)
- Vari√°veis de ambiente configuradas
- Depend√™ncias instaladas

## üîÑ Ordem de Execu√ß√£o

Execute as c√©lulas **sequencialmente** (de cima para baixo).


In [None]:
# ============================================================================
# ETAPA 0: IMPORTA√á√ÉO DE BIBLIOTECAS E CONFIGURA√á√ïES
# ============================================================================

import sys
from pathlib import Path

# Adiciona o diret√≥rio raiz ao path
root_dir = Path.cwd().parent
sys.path.insert(0, str(root_dir))

# Importa m√≥dulos do pipeline RAG
from scripts.embeddings_manager import EmbeddingsManager
from scripts.rag_query import (
    query_medical_rag,
    format_context_for_llm,
    get_unique_articles,
    filter_by_score
)
from config.settings import get_settings

# Carrega configura√ß√µes
settings = get_settings()

print("‚úÖ Bibliotecas importadas com sucesso!")
settings.print_config()


In [None]:
# ============================================================================
# ETAPA 1: INICIALIZA√á√ÉO DO GERENCIADOR DE EMBEDDINGS
# ============================================================================

print("=" * 80)
print("üîß CONFIGURANDO EMBEDDINGS")
print("=" * 80)

embeddings_manager = EmbeddingsManager()

print(f"Provider: {embeddings_manager.provider}")
print(f"Model: {embeddings_manager.model_name}")
print(f"Dimens√£o: {embeddings_manager.get_embedding_dimension()}")
print("=" * 80)


In [None]:
# ============================================================================
# ETAPA 2: QUERY B√ÅSICA DE TESTE
# ============================================================================
# Testa uma query simples para verificar se o sistema est√° funcionando

print("=" * 80)
print("üîç TESTE 1: QUERY B√ÅSICA")
print("=" * 80)

query = "Do mitochondria play a role in cell death?"
print(f"Query: '{query}'")
print("-" * 80)

# Executa query
results = query_medical_rag(
    query,
    embeddings_manager=embeddings_manager,
    top_k=5
)

print(f"\n‚úÖ Query executada com sucesso!")
print(f"   Resultados encontrados: {len(results)}")
print("\nüìÑ Resultados:")

for i, result in enumerate(results, 1):
    print(f"\n   Resultado {i}:")
    print(f"   - Article ID: {result['article_id']}")
    print(f"   - Score: {result['score']:.3f}")
    print(f"   - Chunk Index: {result['chunk_index']}")
    print(f"   - Texto (primeiros 150 caracteres):")
    print(f"     {result['text'][:150]}...")

print("=" * 80)


In [None]:
# ============================================================================
# ETAPA 3: QUERIES M√âDICAS ESPEC√çFICAS
# ============================================================================
# Testa queries com diferentes temas m√©dicos

print("=" * 80)
print("üîç TESTE 2: QUERIES M√âDICAS ESPEC√çFICAS")
print("=" * 80)

# Lista de queries de teste
test_queries = [
    "What is the role of mitochondria in apoptosis?",
    "How does visual acuity testing work?",
    "What are the symptoms of diabetes?",
    "How is cancer treated?",
    "What causes heart disease?",
]

for query in test_queries:
    print(f"\n{'='*80}")
    print(f"Query: '{query}'")
    print("-" * 80)
    
    results = query_medical_rag(
        query,
        embeddings_manager=embeddings_manager,
        top_k=3
    )
    
    print(f"Resultados: {len(results)}")
    
    if results:
        # Mostra o melhor resultado
        best = results[0]
        print(f"Melhor resultado (Score: {best['score']:.3f}):")
        print(f"  Article ID: {best['article_id']}")
        print(f"  Texto: {best['text'][:200]}...")
    else:
        print("‚ö†Ô∏è  Nenhum resultado encontrado")

print("\n" + "=" * 80)


In [None]:
# ============================================================================
# ETAPA 4: FORMATA√á√ÉO DE CONTEXTO PARA LLM
# ============================================================================
# Demonstra como formatar resultados para uso com LLM

print("=" * 80)
print("üìù TESTE 3: FORMATA√á√ÉO DE CONTEXTO PARA LLM")
print("=" * 80)

query = "mitochondria and programmed cell death"
print(f"Query: '{query}'")
print("-" * 80)

# Busca contexto
results = query_medical_rag(
    query,
    embeddings_manager=embeddings_manager,
    top_k=5
)

# Formata contexto para LLM
context = format_context_for_llm(results)

print("\nüìÑ Contexto formatado para LLM:")
print("-" * 80)
print(context)
print("-" * 80)

print(f"\n‚úÖ Contexto formatado com {len(results)} resultados")
print("=" * 80)


In [None]:
# ============================================================================
# ETAPA 5: FILTRAGEM POR SCORE
# ============================================================================
# Demonstra como filtrar resultados por score m√≠nimo de similaridade

print("=" * 80)
print("üéØ TESTE 4: FILTRAGEM POR SCORE")
print("=" * 80)

query = "cell death mechanisms"
print(f"Query: '{query}'")
print("-" * 80)

# Busca com mais resultados
results = query_medical_rag(
    query,
    embeddings_manager=embeddings_manager,
    top_k=10
)

print(f"Total de resultados: {len(results)}")

# Filtra por score m√≠nimo
min_score = 0.7
filtered_results = filter_by_score(results, min_score=min_score)

print(f"\nResultados com score >= {min_score}: {len(filtered_results)}")
print("\nDistribui√ß√£o de scores:")
for i, result in enumerate(results[:5], 1):
    print(f"  {i}. Score: {result['score']:.3f}")

print("=" * 80)


In [None]:
# ============================================================================
# ETAPA 6: AN√ÅLISE DE ARTIGOS √öNICOS
# ============================================================================
# Analisa quantos artigos √∫nicos foram recuperados

print("=" * 80)
print("üìä TESTE 5: AN√ÅLISE DE ARTIGOS √öNICOS")
print("=" * 80)

query = "medical research findings"
print(f"Query: '{query}'")
print("-" * 80)

results = query_medical_rag(
    query,
    embeddings_manager=embeddings_manager,
    top_k=10
)

# Obt√©m artigos √∫nicos
unique_articles = get_unique_articles(results)

print(f"Total de resultados: {len(results)}")
print(f"Artigos √∫nicos: {len(unique_articles)}")
print(f"Diversidade: {len(unique_articles)/len(results)*100:.1f}%")
print(f"\nIDs dos artigos √∫nicos:")
for article_id in unique_articles[:10]:
    print(f"  - {article_id}")

print("=" * 80)


## ‚úÖ Conclus√£o da Etapa 4

Neste notebook voc√™:
- ‚úÖ Testou queries b√°sicas no sistema RAG
- ‚úÖ Validou recupera√ß√£o de contexto relevante
- ‚úÖ Formatou contexto para uso com LLM
- ‚úÖ Analisou qualidade dos resultados
- ‚úÖ Explorou funcionalidades avan√ßadas (filtros, an√°lise)

## üéâ Pipeline RAG Completo!

O sistema RAG est√° funcionando e pronto para uso! Voc√™ pode agora:
- Integrar com seu backend (Node.js)
- Usar em aplica√ß√µes de assistente m√©dico
- Expandir com mais dados ou funcionalidades

## üìå Pr√≥ximos Passos Sugeridos

1. **Integra√ß√£o com Backend**: Use os scripts Python ou integre diretamente com Node.js
2. **Otimiza√ß√£o**: Ajuste chunk_size, top_k, e outros par√¢metros conforme necess√°rio
3. **Monitoramento**: Implemente logging e m√©tricas de uso
4. **Expans√£o**: Adicione mais dados m√©dicos ao Pinecone
