# 🧠 API de Análise de Sentimentos com RAG e LLM

Esta API tem como objetivo transformar **reviews de clientes** em **inteligência de produto**. Ela combina a robustez da **busca semântica** com a geração de linguagem natural para extrair **sentimentos, resumos e insights estruturados**.

---

## ⚙️ Como Funciona

1. **Entrada**: um `product_id` válido.
2. A API busca os **reviews semanticamente mais relevantes** desse produto no banco vetorial FAISS.
3. Um modelo de linguagem (LLM) da Hugging Face resume os reviews e extrai:
   - Sentimento predominante
   - Pontos positivos
   - Pontos negativos
   - Comentários representativos
4. Retorna um **JSON explicativo** com todos esses elementos.

---

## 🔐 O que são "tokens" e por que importam?

Modelos de linguagem como os da Hugging Face (ex: `facebook/bart-large-cnn`) não leem o texto da mesma forma que humanos — eles processam o texto em unidades chamadas **tokens**.

- Um *token* pode ser uma palavra inteira ou apenas parte dela (ex: "super" → `sup`, `er`)
- Modelos como BART têm **limite máximo de tokens por entrada** (ex: 1024 tokens)
- Por isso, a API limita o número de reviews concatenados ou corta o texto se exceder esse limite

✅ Isso garante que a chamada ao modelo seja **eficiente e válida** — sem travar, corromper ou ignorar dados.

---

## 📦 Tecnologias utilizadas

| Componente         | Descrição |
|--------------------|-----------|
| `FAISS`            | Banco vetorial de busca semântica para encontrar reviews relevantes |
| `Sentence Transformers` | Geração de embeddings vetoriais a partir de texto livre |
| `Transformers (Hugging Face)` | Modelos LLM como `facebook/bart-large-cnn` e `cardiffnlp/twitter-roberta-base-sentiment` |
| `Pandas`           | Manipulação de dados tabulares dos reviews |
| `JSON`             | Saída estruturada da API |

---

## 🧪 Exemplo de Resposta

```json
{
  "product_id": "abc123",
  "relevant_review_count": 10,
  "sentiment": "Positivo",
  "summary": "O produto é elogiado por sua qualidade e entrega eficiente, com raras reclamações de cor.",
  "positive_points": ["Entrega rápida", "Alta qualidade", "Bem embalado"],
  "negative_points": ["Manual não veio em português"],
  "top_reviews": [
    "Excelente produto, entrega no dia seguinte!",
    "Qualidade acima do esperado. Muito satisfeito.",
    "A cor é um pouco diferente, mas nada que desabone."
  ]
}


✅ Por que escolhi API BART?

Vantagem	Descrição

💻 Offline-friendly	Pode ser executado localmente ou hospedado com controle total

🚀 Rápido e leve	Ótimo custo-benefício para resumos

🧠 Qualidade comprovada	Modelo robusto e consolidado em NLP

❌ Sem dependência de tokens pagos	Evita billing do Hugging Face Inference API