# Vector Databases 


## 1. O que são vetores:
Vetores, nesse contexto, um vetor é simplesmente uma lista de números. Sozinho isso não diz nada. Mas… Esses números representam o significado de algo (texto, imagem, áudio).


## 2. O que é um embedding?
- **Embedding = texto → números**

Um embedding é o processo de transformar algo humano em algo matemático. 

Exemplo:
- "Eu gosto de cachorro" -> [0.21, 0.88, -0.12]
- "Eu amo cães"	-> [0.20, 0.86, -0.10]
- "Eu gosto de pizza" -> [-0.75, 0.10, 0.60]

Note que, frases com significado parecido geram vetores parecidose e frases com significado diferente ficam distantes


## 3. O que é uma Vector Database?

### 3.1 Definição:

Uma vector database é um banco de dados especializado em armazenar vetores e buscar vetores parecidos. Em vez de perguntar "Esse texto é exatamente igual?", ele pergunta "Esse texto é semelhante?" 

### 3.2 O que ela armazena:

Vetores (embeddings), texto original, metadados (id, categoria, data, etc)

### 3.3 Por que vector databases foram criadas?**

- **Problema dos bancos tradicionais:**

Imagine um banco SQL. Você consegue buscar:

```SQL
SELECT * FROM textos WHERE texto LIKE '%cachorro%'
```

Mas isso não entende significado. Por exemplo: "cachorro", "pet", "cão", "animal doméstico", para o SQL são palavras distintas enquanto para nós são conceitos semelhantes

- **A solução:**

Vector databases foram criadas para trabalhar com significado, não apenas texto, azer busca semântica, encontrar coisas parecidas, mesmo sem palavras iguais

### 3.4 Onde vector databases são utilizadas?

**LLMs (principal uso hoje)**

- Chatbots inteligentes
- RAG (Retrieval Augmented Generation)
- Assistentes personalizados

**Busca semântica**

- "Quero algo parecido com isso"
- Pesquisa em documentos longos
- Recomendação
- Produtos similares
- Filmes parecidos
- Conteúdo relacionado

**Imagens e áudio**

- Buscar imagens parecidas
- Reconhecimento de voz
- Similaridade de sons

## 4. Workflow

- 1. Você tem um texto: "LangChain é uma ferramenta para LLMs"
- 2. Cria o embedding: [0.44, -0.22, 0.91, ...]
- 3. Salva esse vetor no vector database 
- 4. Um usuário faz uma pergunta: "Ferramentas para trabalhar com LLM"
- 5. A pergunta também vira um vetor e o banco de dados calcula: "quais vetores estão mais próximos" (Normalmente usando Cosine similarity ou Distância euclidiana)

**Observação: Mas você não precisa implementar isso — o banco faz.**

## 5. Vector databases + LLMs (parte crucial)

**Problema dos LLMs**

- LLMs não sabem seus dados privados
- Contexto limitado (tokens)
- Podem alucinar

**Solução: RAG (Retrieval Augmented Generation)**

- 1. Seus documentos → limpeza do texto → chunks -> embeddings → vector database
- 2. Usuário pergunta algo
- 3. Pergunta → embedding
- 4. Busca textos mais relevantes
- 5. Envia esses textos junto com a pergunta para o LLM
- 6. O LLM responde usando seus dados, sem treinar nada

# Hands-on