# Teste Rápido dos Classificadores

Notebook para testar rapidamente cada abordagem com dataset pequeno.

In [None]:
import sys
sys.path.append('..')

from dotenv import load_dotenv
load_dotenv()

## 1. Carregar Dados

In [None]:
from utils.data_loader import load_and_prepare_dataset

# Carregar apenas 500 amostras para teste rápido
train_df, test_df, id2label, label2id = load_and_prepare_dataset(max_samples=500)

print(f"Treino: {len(train_df)} amostras")
print(f"Teste: {len(test_df)} amostras")
print(f"Classes: {list(id2label.values())}")

## 2. Testar Embedding Classifier

In [None]:
from models.embedding_classifier import EmbeddingClassifier

embedding_clf = EmbeddingClassifier()
embedding_clf.fit(train_df['text'].tolist(), train_df['label'].tolist())

# Testar com 3 amostras
test_texts = test_df['text'].head(3).tolist()
predictions = embedding_clf.predict(test_texts)

for text, pred in zip(test_texts, predictions):
    print(f"Texto: {text[:50]}...")
    print(f"Predição: {id2label[pred]}\n")

## 3. Testar Fine-tuned Classifier (opcional - demora mais)

In [None]:
# Descomente para testar (demora ~10-30 min na CPU)

# from models.finetuned_classifier import FinetunedClassifier

# finetuned_clf = FinetunedClassifier(
#     num_labels=len(id2label),
#     id2label=id2label,
#     label2id=label2id
# )

# finetuned_clf.train(
#     train_df['text'].tolist(),
#     train_df['label'].tolist(),
#     epochs=1  # Apenas 1 época para teste rápido
# )

## 4. Testar LLM Classifier

In [None]:
from models.llm_classifier import LLMClassifier
from utils.data_loader import get_few_shot_examples

# Preparar few-shot examples
few_shot = get_few_shot_examples(train_df, id2label, num_examples=2)

llm_clf = LLMClassifier(
    labels=list(id2label.values()),
    few_shot_examples=few_shot
)

# Testar com 3 amostras apenas
test_texts = test_df['text'].head(3).tolist()
predictions = llm_clf.predict(test_texts)

for text, pred in zip(test_texts, predictions):
    print(f"Texto: {text[:50]}...")
    print(f"Predição: {pred}\n")