# üî¨ Laborat√≥rio: Compara√ß√£o de Modelos de Embeddings do Ollama

## Objetivo do Notebook

Neste laborat√≥rio, voc√™ aprender√° a **comparar diferentes modelos de embeddings** dispon√≠veis via Ollama. O foco √© entender:

- **O que s√£o embeddings** e por que s√£o fundamentais para busca sem√¢ntica
- **Como diferentes modelos** (all-minilm, nomic-embed-text, mxbai-embed-large) produzem resultados distintos
- **Impacto da dimensionalidade** dos vetores no desempenho e precis√£o
- **Como interpretar scores de similaridade** e escolher o modelo adequado

### Por que comparar modelos?

Cada modelo de embedding tem caracter√≠sticas √∫nicas:
- **Dimensionalidade**: modelos com mais dimens√µes podem capturar nuances, mas consomem mais recursos
- **Velocidade**: modelos menores s√£o mais r√°pidos
- **Qualidade sem√¢ntica**: alguns modelos entendem melhor contextos espec√≠ficos (t√©cnico, casual, multil√≠ngue)

üí° **Exemplo pr√°tico**: Se voc√™ est√° construindo um chatbot t√©cnico, precisa saber qual modelo melhor entende jarg√µes da sua √°rea.

## Pr√©-requisitos e Ferramentas

Para realizar as compara√ß√µes, utilizaremos:

1. **LangChain**: Framework que facilita a integra√ß√£o com diferentes modelos de embeddings
2. **Ollama**: Plataforma para rodar modelos localmente (sem custos de API externa)
3. **FAISS**: Biblioteca de busca vetorial eficiente (criada pelo Facebook/Meta)

### Por que Ollama?

‚úÖ **Gratuito** - N√£o h√° custos por requisi√ß√£o  
‚úÖ **Privacidade** - Seus dados n√£o saem do seu computador  
‚úÖ **Variedade** - Diversos modelos dispon√≠veis para teste  
‚úÖ **Rapidez** - Lat√™ncia baixa (sem lat√™ncia de rede para APIs externas)

## üìä Dataset de Teste

Vamos usar documentos de **tr√™s categorias distintas** para testar a capacidade dos modelos de distinguir contextos:

- **Tecnologia** (hardware, gadgets)
- **Culin√°ria** (receitas, t√©cnicas)
- **Esportes** (futebol, competi√ß√µes)

**Por que isso importa?** Modelos de qualidade devem conseguir identificar que "iPhone" e "RTX 4090" est√£o mais pr√≥ximos semanticamente entre si do que com "bolo" ou "gol".

In [1]:
%pip install faiss-cpu>=1.13.1 langchain-openai==1.1.0  langchain-ollama==1.0.0 ollama==0.6.1 langchain-community>=0.4.1

Note: you may need to restart the kernel to use updated packages.


In [2]:
import os
import requests
from pathlib import Path
from dotenv import load_dotenv
from langchain_community.vectorstores import FAISS

# Se preferir usar Ollama Embeddings
from langchain_ollama import OllamaEmbeddings


In [3]:
# 2) Configura√ß√£o e carregamento do .env (simplificado)
env_path = Path.cwd().joinpath('..', '..', '.env').resolve()
if env_path.exists():
    load_dotenv(env_path)
    print(f'üîé .env carregado -> {env_path.resolve()}')
else:
    print('‚ö†Ô∏è  .env n√£o encontrado. Defina as vari√°veis de ambiente manualmente.')


‚ö†Ô∏è  .env n√£o encontrado. Defina as vari√°veis de ambiente manualmente.


In [4]:
# Configura√ß√£o do Ollama (ajuste conforme necess√°rio)
# - Dentro do Docker: http://ollama:11434
# - Fora do Docker: http://localhost:11434
OLLAMA_API_URL = os.getenv('OLLAMA_API_URL', 'http://localhost:11434')

# Verificar se Ollama est√° online
def check_ollama_health() -> bool:
    try:
        response = requests.get(f'{OLLAMA_API_URL}/api/tags', timeout=5)
        if response.status_code == 200:
            models = response.json().get('models', [])
            print(f'‚úÖ Ollama est√° online! Modelos dispon√≠veis: {len(models)}')
            for model in models:
                name = model.get('name', 'unknown')
                size = model.get('size', 0) / (1024**3)  # Convert to GB
                print(f'   - {name} ({size:.2f} GB)')
            return True
        else:
            print(f'‚ùå Ollama retornou status {response.status_code}')
            return False
    except Exception as e:
        print(f'‚ùå Erro ao conectar com Ollama: {e}')
        return False

# Testar conex√£o
check_ollama_health()

‚úÖ Ollama est√° online! Modelos dispon√≠veis: 3
   - all-minilm:latest (0.04 GB)
   - mxbai-embed-large:latest (0.62 GB)
   - nomic-embed-text:latest (0.26 GB)


True

## Nossos "Documentos" (Textos crus)

Note que s√£o t√≥picos bem diferentes.

In [5]:

meus_textos = [
    "O novo iPhone 15 tem uma lente perisc√≥pica incr√≠vel.",    # Tecnologia
    "Para fazer um bolo macio, bata as claras em neve.",       # Culin√°ria
    "O atacante chutou a bola no √¢ngulo e foi gol.",           # Esporte
    "A placa de v√≠deo RTX 4090 roda jogos em 4K.",             # Tecnologia
    "Receita de lasanha √† bolonhesa com muito queijo."         # Culin√°ria
]

## üß™ Compara√ß√£o de Modelos do Ollama

Agora vem a parte central do laborat√≥rio! Vamos testar **3 modelos populares** e comparar seus resultados.

### üìñ Conceitos Fundamentais

#### O que √© um Embedding?

Um **embedding** √© uma representa√ß√£o num√©rica (vetor) de um texto. Por exemplo:

```
Texto: "gato"
Embedding: [0.12, -0.34, 0.56, ..., 0.78]  ‚Üê vetor com 768 n√∫meros
```

**Por que isso √© √∫til?** Textos semanticamente similares geram vetores pr√≥ximos no espa√ßo matem√°tico.

**Exemplo intuitivo:**
- `"gato"` e `"felino"` ‚Üí vetores pr√≥ximos (conceitos similares)
- `"gato"` e `"carro"` ‚Üí vetores distantes (conceitos diferentes)

#### O que √© Dimensionalidade?

√â o **n√∫mero de componentes** do vetor:

- **all-minilm**: 384 dimens√µes (r√°pido, leve)
- **nomic-embed-text**: 768 dimens√µes (balanceado)
- **mxbai-embed-large**: 1024 dimens√µes (mais rico, mais lento)

**Analogia**: Pense em dimens√µes como "caracter√≠sticas" que descrevem o texto:
- 384 dimens√µes = descrever uma pessoa com 384 adjetivos
- 1024 dimens√µes = descrever com 1024 adjetivos (mais detalhado, mas mais pesado)

#### Como funciona a Busca?

1. **Indexa√ß√£o**: Todos os textos viram vetores e s√£o armazenados no FAISS
2. **Query**: Sua pergunta tamb√©m vira um vetor
3. **Compara√ß√£o**: FAISS calcula a dist√¢ncia entre o vetor da pergunta e todos os vetores armazenados
4. **Ranking**: Retorna os k documentos mais pr√≥ximos (menor dist√¢ncia = mais similar)

**M√©tricas de similaridade:**
- **Dist√¢ncia Euclidiana**: dist√¢ncia "em linha reta" entre vetores
- **Similaridade Cosseno**: √¢ngulo entre vetores (usado pelo FAISS por padr√£o)

**Score:** Quanto **menor** o score, **mais similar** o documento (pense em "dist√¢ncia")

### üéØ O que vamos testar?

Faremos a **mesma pergunta** para os 3 modelos e compararemos:
- Quais documentos cada modelo considera mais relevantes
- Os scores de similaridade
- A dimensionalidade dos embeddings

In [6]:
# Fun√ß√µes para comparar modelos Ollama (langchain_ollama x langchain_community)
from typing import List, Dict, Any
from IPython.display import display, Markdown

# Tentamos importar ambas as implementa√ß√µes (preferir langchain_ollama)
try:
    from langchain_ollama import OllamaEmbeddings as LC_OllamaEmbeddings
except Exception:
    LC_OllamaEmbeddings = None

try:
    from langchain_community.embeddings import OllamaEmbeddings as CommunityOllamaEmbeddings
except Exception:
    CommunityOllamaEmbeddings = None

def build_embeddings_for_model(model_name: str, base_url: str = OLLAMA_API_URL):
    """Tenta criar uma inst√¢ncia de embeddings para o modelo especificado.
    Retorna (embeddings_instance, implementation_name).
    """
    client_kwargs = {"headers": {"Authorization": f"Bearer {os.getenv('OLLAMA_API_KEY')}"}} if os.getenv('OLLAMA_API_KEY') else {}
    # 1) Preferir langchain_ollama
    if LC_OllamaEmbeddings is not None:
        try:
            emb = LC_OllamaEmbeddings(
                model=model_name,
                base_url=base_url,
                client_kwargs=client_kwargs,
                validate_model_on_init=False,
                keep_alive=5 * 60,
            )
            return emb, 'langchain_ollama'
        except Exception as e:
            last_err = e
    else:
        last_err = None
    # 2) Tentar community implementation
    if CommunityOllamaEmbeddings is not None:
        try:
            emb = CommunityOllamaEmbeddings(
                model=model_name,
                base_url=base_url,
                embed_instruction="",
                query_instruction="",
                headers=client_kwargs.get("headers") if client_kwargs else None,
                show_progress=False,
            )
            return emb, 'langchain_community'
        except Exception as e:
            last_err = e
    raise Exception(f'N√£o foi poss√≠vel instanciar embeddings para {model_name}. Erro: {last_err}')

def compare_models(models: List[str], texts: List[str], query: str, k: int = 2, base_url: str = OLLAMA_API_URL) -> List[Dict[str, Any]]:
    """Compara uma lista de modelos: para cada modelo, instancia embeddings, constr√≥i um FAISS index e executa uma busca.
    Retorna lista de dicion√°rios com model, implementacao, dim e hits (texto + score) ou error.
    """
    report = []
    for m in models:
        try:
            emb, impl = build_embeddings_for_model(m, base_url=base_url)
            # conferindo a dimens√£o do embedding (usa embed_query como exemplo)
            emb_example = emb.embed_query("teste de dimens√£o")
            dim = len(emb_example)
            # construir √≠ndice FAISS e buscar
            vstore = FAISS.from_texts(texts, emb)
            hits = vstore.similarity_search_with_score(query, k=k)
            formatted_hits = [{"text": doc.page_content, "score": score} for doc, score in hits]
            report.append({"model": m, "impl": impl, "dim": dim, "hits": formatted_hits})
        except Exception as e:
            report.append({"model": m, "error": str(e)})
    return report

### üîß Fun√ß√µes Auxiliares

As fun√ß√µes abaixo automatizam o processo de compara√ß√£o:

- **`build_embeddings_for_model()`**: Tenta instanciar um modelo de embeddings
  - Prioriza `langchain_ollama` (mais recente)
  - Faz fallback para `langchain_community` se necess√°rio
  
- **`compare_models()`**: Para cada modelo:
  1. Cria uma inst√¢ncia de embeddings
  2. Verifica a dimensionalidade (com um embed de teste)
  3. Constr√≥i um √≠ndice FAISS com os textos
  4. Executa a busca e retorna os top-k resultados

**Por que duas implementa√ß√µes?** O LangChain est√° em transi√ß√£o: `langchain_ollama` √© o pacote moderno, mas `langchain_community` ainda √© amplamente usado. Nossa fun√ß√£o suporta ambos para m√°xima compatibilidade.

### üîç Definindo a Query de Teste

Vamos usar uma pergunta que **n√£o cont√©m palavras-chave exatas** dos documentos. Isso for√ßa os modelos a entender o **significado sem√¢ntico**.

**Pergunta:** "Quero sugest√µes de hardware para computador ou celular"

**Desafio para o modelo:**
- A palavra "iPhone" n√£o aparece na pergunta
- A palavra "RTX 4090" n√£o aparece na pergunta
- Mas ambos s√£o **hardware** para **celular** e **computador**

Um modelo de qualidade deve:
‚úÖ Retornar os documentos sobre iPhone e RTX 4090  
‚ùå N√ÉO retornar documentos sobre receitas ou esportes

In [7]:
pergunta = "Quero sugest√µes de hardware para computador ou celular"
print(f"Query de teste: '{pergunta}'")

Query de teste: 'Quero sugest√µes de hardware para computador ou celular'


In [8]:
# Executar compara√ß√£o entre alguns modelos comuns do Ollama
models_to_compare = ["all-minilm", "nomic-embed-text", "mxbai-embed-large"]

print('='*60)
print('üöÄ INICIANDO COMPARA√á√ÉO DE MODELOS')
print('='*60)
print(f'Modelos a comparar: {", ".join(models_to_compare)}')
print(f'Query: "{pergunta}"')
print(f'Documentos no √≠ndice: {len(meus_textos)}')
print(f'Top-K resultados por modelo: 2')
print('='*60 + '\n')

comp_results = compare_models(models_to_compare, meus_textos, pergunta, k=2)

# Exibir resultados de forma leg√≠vel
for res in comp_results:
    if 'error' in res:
        display(Markdown(f"### ‚ùå {res['model']}"))
        display(Markdown(f"**Erro:** {res['error']}"))
        display(Markdown("---"))
        continue
    
    display(Markdown(f"### ‚úÖ {res['model']}"))
    display(Markdown(f"**Implementa√ß√£o:** `{res['impl']}`  |  **Dimens√µes:** `{res['dim']}`"))
    display(Markdown("**Resultados:**"))
    
    for i, h in enumerate(res['hits'], 1):
        score_emoji = "ü•á" if i == 1 else "ü•à"
        display(Markdown(f"{score_emoji} **Score: {h['score']:.4f}** ‚Üí *{h['text']}*"))
    
    display(Markdown("---"))

üöÄ INICIANDO COMPARA√á√ÉO DE MODELOS
Modelos a comparar: all-minilm, nomic-embed-text, mxbai-embed-large
Query: "Quero sugest√µes de hardware para computador ou celular"
Documentos no √≠ndice: 5
Top-K resultados por modelo: 2



### ‚úÖ all-minilm

**Implementa√ß√£o:** `langchain_ollama`  |  **Dimens√µes:** `384`

**Resultados:**

ü•á **Score: 1.2114** ‚Üí *A placa de v√≠deo RTX 4090 roda jogos em 4K.*

ü•à **Score: 1.4282** ‚Üí *Receita de lasanha √† bolonhesa com muito queijo.*

---

### ‚úÖ nomic-embed-text

**Implementa√ß√£o:** `langchain_ollama`  |  **Dimens√µes:** `768`

**Resultados:**

ü•á **Score: 0.7295** ‚Üí *Para fazer um bolo macio, bata as claras em neve.*

ü•à **Score: 0.7368** ‚Üí *O atacante chutou a bola no √¢ngulo e foi gol.*

---

### ‚úÖ mxbai-embed-large

**Implementa√ß√£o:** `langchain_ollama`  |  **Dimens√µes:** `1024`

**Resultados:**

ü•á **Score: 0.7448** ‚Üí *A placa de v√≠deo RTX 4090 roda jogos em 4K.*

ü•à **Score: 0.8314** ‚Üí *O novo iPhone 15 tem uma lente perisc√≥pica incr√≠vel.*

---

## üìä Como Interpretar os Resultados

### An√°lise dos Scores

**O que significa o score?**
- √â a **dist√¢ncia** entre o vetor da query e o vetor do documento
- **Menor score = maior similaridade**
- Scores n√£o t√™m unidade fixa (dependem da m√©trica usada)

**Exemplo de interpreta√ß√£o real dos resultados acima:**

```text
Query: "Quero sugest√µes de hardware para computador ou celular"

‚úÖ all-minilm (384 dims)
ü•á Score: 1.2114 ‚Üí RTX 4090
ü•à Score: 1.4282 ‚Üí Lasanha

‚úÖ nomic-embed-text (768 dims)
ü•á Score: 0.7295 ‚Üí Bolo
ü•à Score: 0.7368 ‚Üí Gol

‚úÖ mxbai-embed-large (1024 dims)
ü•á Score: 0.7448 ‚Üí RTX 4090
ü•à Score: 0.8314 ‚Üí iPhone 15
```



### An√°lise Cr√≠tica dos Resultados

**üéØ Modelo `mxbai-embed-large` - O MELHOR**
- ‚úÖ **Top-1:** RTX 4090 (score: 0.7448) - CORRETO! Hardware para computador
- ‚úÖ **Top-2:** iPhone 15 (score: 0.8314) - CORRETO! Hardware para celular
- **Conclus√£o:** Entendeu perfeitamente a query, retornando exatamente os 2 documentos de hardware

**‚ö†Ô∏è Modelo `all-minilm` - PARCIAL**
- ‚úÖ **Top-1:** RTX 4090 (score: 1.2114) - CORRETO! 
- ‚ùå **Top-2:** Lasanha (score: 1.4282) - INCORRETO! N√£o √© hardware
- **Conclus√£o:** Acertou o primeiro resultado, mas trouxe um documento irrelevante em segundo lugar

**‚ùå Modelo `nomic-embed-text` - FALHOU**
- ‚ùå **Top-1:** Bolo (score: 0.7295) - INCORRETO! Receita, n√£o hardware
- ‚ùå **Top-2:** Gol (score: 0.7368) - INCORRETO! Esporte, n√£o hardware
- **Conclus√£o:** N√£o entendeu a query, retornou documentos completamente irrelevantes



### üîç Por que esses resultados?

**Observa√ß√µes importantes:**

1. **Scores n√£o s√£o compar√°veis entre modelos diferentes**
   - `all-minilm` tem scores maiores (~1.2) 
   - `nomic-embed-text` e `mxbai-embed-large` t√™m scores menores (~0.7-0.8)
   - Isso √© normal! Cada modelo usa um espa√ßo vetorial diferente

2. **Mais dimens√µes ‚Üí Melhor compreens√£o sem√¢ntica?**
   - ‚úÖ `mxbai-embed-large` (1024 dims): 2/2 acertos
   - ‚ö†Ô∏è `all-minilm` (384 dims): 1/2 acertos
   - ‚ùå `nomic-embed-text` (768 dims): 0/2 acertos
   - **Conclus√£o:** Neste caso, o modelo maior teve melhor desempenho, mas dimensionalidade sozinha n√£o garante qualidade!

3. **`nomic-embed-text` falhou inesperadamente**
   - √â um modelo popular e geralmente bom
   - Pode ter sido treinado em dados diferentes
   - Pode ter interpreta√ß√£o diferente de "hardware" e "sugest√µes"
   - **Li√ß√£o:** Sempre teste com SEU dom√≠nio espec√≠fico!

### üìä Tabela Comparativa Real

| Modelo | Dims | Top-1 (Score) | Top-2 (Score) | Acertos | Qualidade |
|--------|------|---------------|---------------|---------|-----------|
| **mxbai-embed-large** | 1024 | RTX 4090 (0.74) | iPhone 15 (0.83) | ‚úÖ‚úÖ 2/2 | üèÜ Excelente |
| **all-minilm** | 384 | RTX 4090 (1.21) | ‚ùå Lasanha (1.42) | ‚úÖ 1/2 | ‚ö†Ô∏è Parcial |
| **nomic-embed-text** | 768 | ‚ùå Bolo (0.73) | ‚ùå Gol (0.74) | ‚ùå 0/2 | üí• Falhou |

### üéØ Conclus√£o desta Compara√ß√£o

**Para esta query espec√≠fica e este dataset:**

ü•á **Vencedor: `mxbai-embed-large`**
- √önica compreens√£o correta da query
- Trouxe exatamente os documentos relevantes
- Ordem dos resultados faz sentido (RTX mais pr√≥ximo que iPhone)

ü•à **Segundo lugar: `all-minilm`**
- Acertou o documento mais relevante
- R√°pido e leve (384 dims)
- Mas trouxe um falso positivo

ü•â **Terceiro lugar: `nomic-embed-text`**
- Falhou completamente nesta query
- Pode ter boa performance em outros dom√≠nios
- N√£o recomendado para este tipo de busca

### üí° Li√ß√µes Aprendidas

1. **N√£o confie cegamente em benchmarks p√∫blicos** - teste com seus dados!
2. **Modelo maior NEM SEMPRE √© melhor** - mas neste caso foi
3. **Um modelo popular pode falhar** - como o `nomic-embed-text` falhou aqui
4. **Contexto importa** - estes modelos podem ter sido treinados em dom√≠nios diferentes

## üß† Exerc√≠cios Pr√°ticos

### Exerc√≠cio 1: Testando Outras Queries

Modifique a vari√°vel `pergunta` e reexecute a compara√ß√£o. Tente:

```python
# Teste 1: Query muito espec√≠fica
pergunta = "processador Intel i9 13¬™ gera√ß√£o"

# Teste 2: Query amb√≠gua
pergunta = "como melhorar performance"

# Teste 3: Query de outro dom√≠nio
pergunta = "receitas r√°pidas para o jantar"
```

**Perguntas para reflex√£o:**
- Os modelos concordam nos resultados?
- Algum modelo se saiu melhor em um tipo espec√≠fico de query?
- Queries mais espec√≠ficas geram scores menores (mais confian√ßa)?



### Exerc√≠cio 2: Expandindo o Dataset

Adicione mais documentos em `meus_textos`:

```python
meus_textos = [
    # ... documentos existentes ...
    "O SSD NVMe de 2TB tem velocidades de leitura de 7000 MB/s",
    "Mem√≥ria RAM DDR5 de 32GB para multitarefas pesadas",
    "Tutorial de massa de pizza caseira com fermenta√ß√£o natural",
]
```

**Observe:** Como a adi√ß√£o de documentos similares afeta os scores?



### Exerc√≠cio 3: Ajustando k (Top-K)

Altere o par√¢metro `k` na fun√ß√£o `compare_models()`:

```python
comp_results = compare_models(models_to_compare, meus_textos, pergunta, k=3)  # Top-3
```

**An√°lise:** 
- O 3¬∫ resultado √© relevante?
- H√° um "gap" grande entre o score do 2¬∫ e 3¬∫ resultados?



### Exerc√≠cio 4: Testando Modelos Adicionais

Se voc√™ tem outros modelos instalados no Ollama, teste-os:

```python
models_to_compare = ["all-minilm", "nomic-embed-text", "mxbai-embed-large", "llama2"]
```

‚ö†Ô∏è **Aten√ß√£o:** Nem todos os modelos do Ollama s√£o embeddings! Modelos como `llama2` s√£o LLMs (gera√ß√£o de texto), n√£o embeddings. A compara√ß√£o falhar√° graciosamente com mensagem de erro.



### üèÜ Desafio Final

**Crie um benchmark completo:**

1. Defina 5 queries diferentes (variando especificidade e dom√≠nio)
2. Execute todas contra os 3 modelos
3. Calcule m√©tricas agregadas:
   - M√©dia dos scores por modelo
   - Taxa de concord√¢ncia (quantas vezes o top-1 coincide?)
   - Tempo de execu√ß√£o (use `time.time()`)

4. **Escolha o vencedor** baseado no seu caso de uso:
   - Se precisar de velocidade: `all-minilm`
   - Se precisar de balanceamento: `nomic-embed-text`
   - Se precisar de m√°xima qualidade: `mxbai-embed-large`

## üìö Resumo e Pr√≥ximos Passos

### O que voc√™ aprendeu

‚úÖ **Embeddings** s√£o representa√ß√µes num√©ricas de textos que capturam significado sem√¢ntico  
‚úÖ **Dimensionalidade** afeta qualidade, velocidade e consumo de recursos  
‚úÖ **Modelos diferentes** podem ter interpreta√ß√µes distintas do mesmo texto  
‚úÖ **Scores menores** indicam maior similaridade (menor dist√¢ncia vetorial)  
‚úÖ **Compara√ß√µes sistem√°ticas** s√£o essenciais para escolher o modelo ideal  

### Conceitos-chave para lembrar

1. **N√£o existe modelo perfeito** - tudo √© trade-off (velocidade vs. qualidade)
2. **Sempre teste com dados reais** do seu dom√≠nio
3. **FAISS √© local e r√°pido** - ideal para prototipagem
4. **Ollama √© gratuito** - aproveite para experimentar!


### üìñ Recursos Adicionais

- [Ollama Models](https://ollama.ai/library) - Cat√°logo completo de modelos
- [FAISS Documentation](https://github.com/facebookresearch/faiss/wiki) - Guias e tutoriais
- [LangChain Embeddings](https://python.langchain.com/docs/modules/data_connection/text_embedding/) - Refer√™ncia oficial
- [MTEB Leaderboard](https://huggingface.co/spaces/mteb/leaderboard) - Benchmark de embeddings

---

**üéì Parab√©ns por completar o laborat√≥rio!** Agora voc√™ tem as ferramentas para tomar decis√µes informadas sobre modelos de embeddings.