# VerbaFlow - Experimenta√ß√£o com Agentes

Este notebook demonstra o uso dos agentes CrewAI do VerbaFlow para classifica√ß√£o e enriquecimento de textos.

## Objetivo

Testar o sistema multi-agente sem a interface Streamlit, permitindo experimenta√ß√£o direta com os componentes.


In [None]:
# Importa√ß√µes necess√°rias
import os
import sys
from pathlib import Path
from dotenv import load_dotenv

# Carregar vari√°veis de ambiente do arquivo .env
load_dotenv()

# Adicionar diret√≥rio raiz ao path
project_root = Path().resolve().parent
sys.path.insert(0, str(project_root))

# Importar m√≥dulos do VerbaFlow
from src.utils import fetch_newsgroups_samples, clean_text, extract_ground_truth_from_filename, get_text_from_file
from src.agents import get_llm, create_analyst_agent, create_researcher_agent, create_editor_agent
from src.tasks import create_classification_task, create_enrichment_task, create_reporting_task
from crewai import Crew, Process

print("‚úÖ M√≥dulos importados com sucesso!")


‚úÖ M√≥dulos importados com sucesso!


## Configura√ß√£o de API Keys

Configure suas chaves de API nas vari√°veis de ambiente antes de executar.


In [None]:
# Configurar API Keys
# IMPORTANTE: Substitua pelos seus valores reais ou use vari√°veis de ambiente
os.environ["GROQ_API_KEY"] = "sua-groq-api-key-aqui"
os.environ["TAVILY_API_KEY"] = "sua-tavily-api-key-aqui"

print("‚ö†Ô∏è Lembre-se de configurar suas API keys antes de executar!")


## Carregar Dados de Exemplo

Vamos carregar uma amostra do dataset 20 Newsgroups para testar.


In [None]:
# Carregar uma amostra do dataset
# Se j√° tiver amostras salvas, pode usar diretamente
sample_file = "data/samples/rec.sport.hockey___1.txt"

# Se n√£o existir, vamos gerar uma amostra
if not os.path.exists(sample_file):
    print("Gerando amostras do dataset 20 Newsgroups...")
    samples = fetch_newsgroups_samples(num_samples=1)
    sample_file = samples[0] if samples else None

if sample_file and os.path.exists(sample_file):
    # Carregar texto
    raw_text = get_text_from_file(sample_file)
    ground_truth = extract_ground_truth_from_filename(sample_file)
    
    print(f"üìÑ Arquivo: {os.path.basename(sample_file)}")
    print(f"üè∑Ô∏è Categoria Real: {ground_truth}")
    print(f"\nüìù Texto (primeiros 500 caracteres):\n{raw_text[:500]}...")
else:
    print("‚ùå Erro ao carregar amostra")


## Pr√©-processamento do Texto

Limpar e preparar o texto para classifica√ß√£o.


In [None]:
# Limpar texto
cleaned_text = clean_text(raw_text)
print(f"‚úÖ Texto limpo ({len(cleaned_text)} caracteres)")
print(f"\nPrimeiros 300 caracteres do texto limpo:\n{cleaned_text[:300]}...")


## Criar Agentes

Inicializar os tr√™s agentes do sistema VerbaFlow.


In [None]:
# Criar LLM
llm = get_llm()

# Criar agentes
analyst = create_analyst_agent(llm)
researcher = create_researcher_agent(llm)
editor = create_editor_agent(llm)

print("‚úÖ Agentes criados com sucesso!")
print(f"  - {analyst.role}")
print(f"  - {researcher.role}")
print(f"  - {editor.role}")


## Criar Tasks

Definir as tr√™s tasks sequenciais do pipeline.


In [None]:
# Criar tasks
task1 = create_classification_task(analyst, cleaned_text)
task2 = create_enrichment_task(researcher, task1)
task3 = create_reporting_task(editor, task1, task2)

print("‚úÖ Tasks criadas com sucesso!")
print(f"  - Task 1: Classifica√ß√£o")
print(f"  - Task 2: Enriquecimento (depende de Task 1)")
print(f"  - Task 3: Relat√≥rio (depende de Task 1 e 2)")


## Executar Crew

Executar o pipeline completo com os agentes trabalhando em sequ√™ncia.


In [None]:
# Definir OPENAI_API_KEY como dummy para evitar erro de importa√ß√£o
# (CrewAI tenta importar OpenAI mesmo quando usamos LLM customizado)
if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = "dummy-key-to-prevent-openai-import-error"

# Definir OPENAI_API_KEY como dummy para evitar erro de importa√ß√£o
# (CrewAI tenta importar OpenAI mesmo quando usamos LLM customizado)
if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = "dummy-key-to-prevent-openai-import-error"

# Criar crew com LLM configurado explicitamente com LLM configurado explicitamente
crew = Crew(
    agents=[analyst, researcher, editor],
    tasks=[task1, task2, task3],
    process=Process.sequential,
    verbose=True,
    llm=llm  # Especificar LLM explicitamente
)

print("üöÄ Executando VerbaFlow...")
print("=" * 50)

# Executar
result = crew.kickoff()

print("=" * 50)
print("‚úÖ Execu√ß√£o conclu√≠da!")


## Resultados

Exibir o resultado final e validar a classifica√ß√£o.


In [None]:
import re

# Extrair categoria prevista
predicted_category = ""
category_match = re.search(r'Category:\s*([^\n]+)', str(result), re.IGNORECASE)
if category_match:
    predicted_category = category_match.group(1).strip()

# Comparar com ground truth
is_correct = predicted_category.lower() == ground_truth.lower()

print("üìä Resultados da Valida√ß√£o")
print(f"  Categoria Real: {ground_truth}")
print(f"  Categoria Prevista: {predicted_category if predicted_category else 'N√£o encontrada'}")
print(f"  Status: {'‚úÖ CORRETO' if is_correct else '‚ùå INCORRETO'}")


## Relat√≥rio Completo

Exibir o relat√≥rio enriquecido completo gerado pelo Editor Chefe.


In [None]:
# Exibir relat√≥rio completo
print("\n" + "=" * 50)
print("üìã RELAT√ìRIO ENRIQUECIDO COMPLETO")
print("=" * 50 + "\n")
print(result)
