# üåå Visualiza√ß√£o de Espa√ßo Vetorial Sem√¢ntico 3D

## üéØ Objetivo da Pr√°tica

Neste laborat√≥rio, voc√™ ir√°:
1. Visualizar **vetores sem√¢nticos** em um espa√ßo tridimensional
2. Entender como **conceitos** (palavras, objetos) podem ser representados como **pontos no espa√ßo**
3. Compreender que **proximidade no espa√ßo = similaridade sem√¢ntica**
4. Preparar-se para trabalhar com embeddings de alta dimens√£o (768, 1536 dimens√µes)

## üìñ Conceito Fundamental

### O que √© um Espa√ßo Vetorial Sem√¢ntico?

Imagine que voc√™ quer representar diferentes conceitos (gatinho, rob√¥, martelo, cachorro) de forma que um **computador entenda** suas caracter√≠sticas. A solu√ß√£o: transformar cada conceito em um **vetor num√©rico**!

**Analogia:**
- Se voc√™ descreve uma pessoa por: altura, peso, idade ‚Üí voc√™ tem um vetor de 3 dimens√µes
- Aqui, descrevemos conceitos por: **Fofura**, **Animal**, **Metal** ‚Üí vetor de 3 dimens√µes

**Exemplo:**
- üê± "Gatinho dormindo" = `[0.99, 0.95, 0.00]` 
  - Fofura: 0.99 (muito fofo!)
  - Animal: 0.95 (√© um animal)
  - Metal: 0.00 (nada de metal)

### Por que isso √© importante?

No mundo real dos bancos de dados vetoriais:
- ‚úÖ Modelos de embedding convertem **texto** em vetores de 768+ dimens√µes
- ‚úÖ Busca sem√¢ntica encontra vetores **pr√≥ximos** (similares)
- ‚úÖ Este laborat√≥rio usa **apenas 3 dimens√µes** para voc√™ **visualizar** o conceito

---

## üõ†Ô∏è Passo 1: Importar Bibliotecas

Vamos importar as ferramentas necess√°rias para criar nossa visualiza√ß√£o 3D interativa.

In [4]:
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
import plotly.graph_objects as go


## üìä Passo 2: Definir Vetores Sem√¢nticos

Agora vamos criar nossos vetores! Cada linha representa um conceito diferente no espa√ßo 3D.

### üßÆ Estrutura dos Vetores

Cada vetor tem **3 coordenadas**: `[Fofura, Animal, Metal]`

Valores variam de **0.00** (aus√™ncia total) a **1.00** (presen√ßa m√°xima)

### üîç An√°lise dos Vetores:

| Conceito | Fofura | Animal | Metal | Interpreta√ß√£o |
|----------|--------|--------|-------|---------------|
| üê± **A: Gatinho dormindo** | 0.99 | 0.95 | 0.00 | Muito fofo, √© animal, zero metal |
| ü§ñ **B: Rob√¥ industrial** | 0.00 | 0.00 | 0.99 | Nada fofo, n√£o √© animal, muito metal |
| üî® **C: Martelo de a√ßo** | 0.00 | 0.00 | 0.95 | Nada fofo, n√£o √© animal, quase todo metal |
| üê∂ **Q: Filhote de c√£o** | 0.98 | 0.90 | 0.00 | Muito fofo, √© animal, zero metal |

### üí° Observe:

- **A (Gatinho)** e **Q (Filhote)** t√™m valores **similares** ‚Üí Est√£o pr√≥ximos no espa√ßo!
- **B (Rob√¥)** e **C (Martelo)** tamb√©m s√£o parecidos ‚Üí Ambos s√£o de metal
- **A** est√° **longe** de **B** ‚Üí Conceitos muito diferentes (animal fofo vs. metal)

In [5]:

# Definindo os vetores e r√≥tulos
vectors = np.array([
    [0.99, 0.95, 0.00], # A: Gatinho
    [0.00, 0.00, 0.99], # B: Rob√¥
    [0.00, 0.00, 0.95], # C: Martelo
    [0.98, 0.90, 0.00]  # Q: Filhote de c√£o (Query)
])

labels = [
    "A: Gatinho dormindo",
    "B: Rob√¥ industrial",
    "C: Martelo de a√ßo",
    "Q: Filhote de c√£o"
]

colors = ['red', 'blue', 'black', 'green'] # Cores para diferenciar os pontos


## üé® Passo 3: Criar Visualiza√ß√£o Interativa 3D

Agora vamos plotar nossos vetores em um gr√°fico 3D interativo usando **Plotly**.

### üìê Componentes do Gr√°fico:

1. **Eixos:**
   - **Eixo X:** Fofura (0 = nada fofo, 1 = muito fofo)
   - **Eixo Y:** Animal (0 = n√£o √© animal, 1 = √© animal)
   - **Eixo Z:** Metal (0 = sem metal, 1 = todo de metal)

2. **Vetores:**
   - Cada vetor √© uma **seta tracejada** partindo da origem `(0,0,0)` at√© o ponto
   - A cor diferencia os conceitos

3. **Interatividade:**
   - Voc√™ pode **rotacionar** o gr√°fico com o mouse
   - **Zoom** in/out com a roda do mouse
   - **Hover** sobre os pontos para ver detalhes

### üéØ O que Observar no Gr√°fico:

1. **Proximidade = Similaridade:**
   - Gatinho (vermelho) e Filhote (verde) aparecem **pr√≥ximos** ‚Üí conceitos similares
   - Rob√¥ (azul) e Martelo (preto) aparecem **pr√≥ximos** ‚Üí ambos de metal

2. **Dist√¢ncia = Diferen√ßa:**
   - Gatinho est√° **longe** de Rob√¥ ‚Üí conceitos opostos
   - Animais (alto no eixo Y) vs. Metais (alto no eixo Z)

3. **Consulta (Query):**
   - O ponto **Q (verde)** √© nossa "busca"
   - Em um sistema RAG real, buscar√≠amos vetores pr√≥ximos a Q
   - Resultado esperado: **A (Gatinho)** seria retornado (mais similar)

In [12]:

# Configurando o gr√°fico 3D com Plotly
traces = []
origin = [0, 0, 0]

for i in range(len(vectors)):
    v = vectors[i]
    # Linha do vetor (origem -> ponto)
    traces.append(
        go.Scatter3d(
            x=[origin[0], v[0]],
            y=[origin[1], v[1]],
            z=[origin[2], v[2]],
            mode='lines',
            line=dict(color=colors[i], width=4, dash='dash'),
            name=f"{labels[i]} (linha)",
            showlegend=False,  # desativa duplicatas de legenda
            hoverinfo='text',
            text=[labels[i]]
        )
    )
    # Ponto final do vetor (scatter + label)
    traces.append(
        go.Scatter3d(
            x=[v[0]],
            y=[v[1]],
            z=[v[2]],
            mode='markers+text',
            marker=dict(size=6, color=colors[i]),
            text=[labels[i]],
            textposition='top center',
            name=labels[i],
            hoverinfo='text'
        )
    )

layout = go.Layout(
    title="Espa√ßo Vetorial Sem√¢ntico de 3 Eixos (Plotly)",
    height=900,  # Aumentado de padr√£o para 900px
    width=1400,   # Aumentado de padr√£o para 1400px
    margin=dict(l=0, r=0, b=0, t=40),
    scene=dict(
        xaxis=dict(title='Eixo X (Fofura)', range=[0, 1]),
        yaxis=dict(title='Eixo Y (Animal)', range=[0, 1]),
        zaxis=dict(title='Eixo Z (Metal)', range=[0, 1]),
        aspectmode='cube'
    ),
    legend=dict(itemsizing='constant')
)

fig = go.Figure(data=traces, layout=layout)

# Camera inicial
fig.update_layout(scene_camera=dict(eye=dict(x=1.5, y=1.2, z=0.8)))

# Exibir no notebook (VS Code/ Jupyter)
fig.show()

---

## üéì Conclus√µes e Aprendizados

### ‚úÖ O que voc√™ aprendeu neste laborat√≥rio:

1. **Vetores representam conceitos**
   - Cada conceito (palavra, objeto) pode ser um ponto no espa√ßo
   - Coordenadas num√©ricas capturam "caracter√≠sticas sem√¢nticas"

2. **Proximidade = Similaridade**
   - Vetores pr√≥ximos = conceitos similares
   - Vetores distantes = conceitos diferentes
   - Este √© o princ√≠pio fundamental da **busca sem√¢ntica**!

3. **Dimens√µes s√£o caracter√≠sticas**
   - Aqui usamos 3 dimens√µes (Fofura, Animal, Metal)
   - Em bancos vetoriais reais: 768, 1536, 3072 dimens√µes!
   - Modelos de embedding aprendem essas dimens√µes automaticamente

### üîó Conex√£o com RAG e Bancos Vetoriais

**No mundo real:**

```python
# Exemplo conceitual
texto = "Filhote de c√£o brincando"
embedding = modelo.encode(texto)  # Retorna vetor de 768 dimens√µes
# embedding ‚âà [0.23, -0.45, 0.89, ..., 0.12]  (768 valores)

# Busca no banco vetorial
resultados = qdrant.search(
    collection="documentos",
    query_vector=embedding,
    limit=5  # Retorna os 5 mais pr√≥ximos
)
```

**Por que funciona?**
- Textos similares geram embeddings **pr√≥ximos** no espa√ßo de 768D
- Assim como "Gatinho" e "Filhote" ficaram pr√≥ximos no nosso espa√ßo 3D!


### üß™ Desafios Pr√°ticos

**Desafio 1:** Modifique os vetores e observe como a visualiza√ß√£o muda:
```python
# Experimente:
# - Adicionar um novo conceito: "P√°ssaro cantando"
# - Mudar as coordenadas de "Rob√¥" para torn√°-lo mais "fofo"
# - O que acontece com a dist√¢ncia entre os pontos?
```

**Desafio 2:** Calcule manualmente a dist√¢ncia entre dois vetores:
```python
# Dist√¢ncia Euclidiana entre Gatinho e Filhote:
# d = sqrt((0.99-0.98)¬≤ + (0.95-0.90)¬≤ + (0.00-0.00)¬≤)
# Implemente e compare com a dist√¢ncia visual no gr√°fico
```

**Desafio 3:** Pense em como adicionar uma 4¬™ dimens√£o:
```python
# Se adicion√°ssemos "Tamanho" (pequeno=0, grande=1):
# - Como isso mudaria a representa√ß√£o?
# - Ainda conseguir√≠amos visualizar? (spoiler: n√£o em 3D!)
# - √â por isso que usamos matem√°tica e n√£o gr√°ficos para 768D
```

---

**Parab√©ns! üéâ** Voc√™ deu o primeiro passo para entender como bancos de dados vetoriais e sistemas RAG funcionam!