<a href="https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/gabs-short-intro-to-vector-db.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Workshop - Redis como VectorDB - INTRO (TEM OUTROS!)

## Vector Searches & Large Language Models

![Redis](https://redis.io/wp-content/uploads/2024/04/Logotype.svg?auto=webp&quality=85,75&width=120)


Bem-vind[ao]s ao Workshop! Vamos ter uma experi√™ncia hands-on sobre alguns temas centrais do Redis, bem al√©m do Caching.


Para uma experi√™ncia premium, como a que eu quero que voc√™s tenham, recomendo MUITO utilizar o Redis Insight (App ou Web) pra apoiar na visualiza√ß√£o dos dados.

https://redis.com/redis-enterprise/redis-insight/

---

Novamente, vamos direto ao ponto. Para pegar o fio da meada, passando pela introdu√ß√£o, veja este outro notebook [aqui](https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/redis-workshop-vector-similarity-search.ipynb).

---

## Objetivos do Workshop

Este Notebook √© uma pequena demonstra√ß√£o do Redis como um Vector DB. Depois, vamos ver uma implementa√ß√£o de RAG e Semantic/LLM Caching.


Espero que gostem! üññ


## Conceito - Bancos de dados de vetores

Os dados s√£o frequentemente n√£o estruturados, o que significa que n√£o s√£o descritos por um esquema bem definido. Exemplos de dados n√£o estruturados incluem trechos de texto, imagens, v√≠deos ou √°udio. Uma abordagem para armazenar e pesquisar dados n√£o estruturados √© usar embeddings de vetores.

**O que s√£o vetores?**\
Em aprendizado de m√°quina e IA, vetores s√£o sequ√™ncias de n√∫meros que representam dados. Eles s√£o as entradas e sa√≠das dos modelos, encapsulando informa√ß√µes subjacentes em uma forma num√©rica. Vetores transformam dados n√£o estruturados, como textos, imagens, v√≠deos e √°udios, em um formato que os modelos de aprendizado de m√°quina podem processar.

**Por que eles s√£o importantes?**\
Vetores capturam padr√µes complexos e significados sem√¢nticos inerentes aos dados, tornando-os ferramentas poderosas para uma variedade de aplica√ß√µes. Eles permitem que modelos de aprendizado de m√°quina compreendam e manipulem dados n√£o estruturados de forma mais eficaz.

**Melhorando a busca tradicional.**\
A busca tradicional por palavras-chave ou lexical depende de correspond√™ncias exatas de palavras ou frases, o que pode ser limitante. Em contraste, a busca vetorial, ou busca sem√¢ntica, aproveita a rica informa√ß√£o capturada nos embeddings de vetores. Ao mapear dados em um espa√ßo vetorial, itens semelhantes s√£o posicionados pr√≥ximos uns dos outros com base em seu significado. Essa abordagem permite resultados de busca mais precisos e significativos, pois considera o contexto e o conte√∫do sem√¢ntico da consulta, e n√£o apenas as palavras exatas usadas.

# Passo 1 - Criar uma conta Free no Redis Cloud

Basta seguir o passo a passo [aqui](https://colab.research.google.com/github/gacerioni/redis-workshop-notebook-validator/blob/master/redis-workshop-setup-notebook-validator.ipynb)!

# Passo 2 - Setup R√°pido

## Instala√ßao das libs do Python e redis-cli

In [27]:
# Instale as deps, como redis, sentence transformers, etc
# equivale a
# pip install redis pandas sentence-transformers tabulate numpy requests
!pip install -r https://raw.githubusercontent.com/gacerioni/redis-workshop-json-search-vs/master/deps/vector-intro/requirements.txt

# E instalar a CLI, via redis-tools, que inclui a famosa redis-cli
!apt-get update
!apt-get install -y redis-tools

Hit:1 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease
Hit:2 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64  InRelease
Hit:3 http://archive.ubuntu.com/ubuntu jammy InRelease
Get:4 http://security.ubuntu.com/ubuntu jammy-security InRelease [129 kB]
Get:5 http://archive.ubuntu.com/ubuntu jammy-updates InRelease [128 kB]
Hit:6 http://archive.ubuntu.com/ubuntu jammy-backports InRelease
Get:7 http://archive.ubuntu.com/ubuntu jammy-updates/main amd64 Packages [2,258 kB]
Hit:8 https://ppa.launchpadcontent.net/c2d4u.team/c2d4u4.0+/ubuntu jammy InRelease
Hit:9 https://ppa.launchpadcontent.net/deadsnakes/ppa/ubuntu jammy InRelease
Hit:10 https://ppa.launchpadcontent.net/graphics-drivers/ppa/ubuntu jammy InRelease
Hit:11 https://ppa.launchpadcontent.net/ubuntugis/ppa/ubuntu jammy InRelease
Fetched 2,515 kB in 1s (2,188 kB/s)
Reading package lists... Done
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done

# Iniciando os trabalhos - All hands on deck!

## Conectando com o Redis server

In [28]:
import os

# Coloque aqui os dados do seu DB do Redis Cloud
REDIS_HOST="redis-18884.c98.us-east-1-4.ec2.redns.redis-cloud.com"
REDIS_PORT=18884
REDIS_PASSWORD="lgZgS90vZJpnS4F2Y5EJ97YJTFGUUdvF"

# Caso o SSL esteja ativo pro endpoint, adicione --tls
# Recomendo n√£o misturar l√© com cr√© aqui, visto que n√£o vamos ter nenhuma informa√ß√£o sens√≠vel passando pelo fio.
if REDIS_PASSWORD!="":
  os.environ["REDIS_CONN"]=f"-h {REDIS_HOST} -p {REDIS_PORT} -a {REDIS_PASSWORD} --no-auth-warning"
else:
  os.environ["REDIS_CONN"]=f"-h {REDIS_HOST} -p {REDIS_PORT}"

# Caso o SSL esteja ativo pro endpoint, use rediss:// como o URL prefix
REDIS_URL = f"redis://:{REDIS_PASSWORD}@{REDIS_HOST}:{REDIS_PORT}"
INDEX_NAME = f"qna:idx"

# Teste a Redis connection
!redis-cli $REDIS_CONN PING

PONG


In [29]:
# Testando via Python (redis-py)
import redis
redis = redis.Redis(
  host=REDIS_HOST,
  port=REDIS_PORT,
  password=REDIS_PASSWORD)
redis.ping()

True

## 1 - Importando e preparando as libs que iremos usar

Este primeiro bloco vai garantir que todas as depend√™ncias estejam prontas pra gente brincar com o lab.

In [30]:
import json
import time

import numpy as np
import pandas as pd
import requests
import redis
from redis.commands.search.field import (
    NumericField,
    TagField,
    TextField,
    VectorField,
)
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
from redis.commands.search.query import Query
from sentence_transformers import SentenceTransformer

redis = redis.Redis(
  host=REDIS_HOST,
  port=REDIS_PORT,
  password=REDIS_PASSWORD,
  decode_responses=True)


redis.ping()

True


## 2 - Carregando a massa de dados - Bikes

Vamos ingerir uma pequena massa de dados que cont√©m bikes e suas descri√ß√µes... como um SKU da vida.





In [31]:
URL = "https://raw.githubusercontent.com/gacerioni/redis-workshop-json-search-vs/master/deps/vector-intro/data/bikes.json"
response = requests.get(URL, timeout=10)
bikes = response.json()

# vamos ver o que foi carregado
json.dumps(bikes[0], indent=2)

'{\n  "model": "Jigger",\n  "brand": "Velorim",\n  "price": 270,\n  "type": "Bicicletas Infantis",\n  "specs": {\n    "material": "alum\\u00ednio",\n    "weight": "10"\n  },\n  "description": "Pequena e poderosa, a Jigger \\u00e9 a melhor pedalada para os menores ciclistas! Esta \\u00e9 a menor bicicleta infantil com pedal no mercado dispon\\u00edvel sem freio de contrapedal, a Jigger \\u00e9 a escolha ideal para o raro pequeno tenaz pronto para partir. Dizemos raro porque esta pequena bicicleta n\\u00e3o \\u00e9 ideal para um iniciante nervoso, mas \\u00e9 um verdadeiro galope para um verdadeiro velocista. A Jigger \\u00e9 uma bicicleta infantil leve de 12 polegadas e atender\\u00e1 \\u00e0 necessidade de velocidade do seu pequeno. \\u00c9 uma bicicleta de uma \\u00fanica velocidade que torna o aprendizado a pedalar simples e intuitivo. Ela at\\u00e9 tem uma al\\u00e7a na parte inferior do selim para que voc\\u00ea possa ajudar seu filho facilmente durante o treinamento! A Jigger est\

## 3 - Carregar os dados no Redis como JSON - Binary Tree (n√£o √© uma String)

Vamos carregar essas bikes como documentos no Redis. Documentos JSON, claro!

Vamos usar o conceito de pipeline, que pode ser muito √∫til com volumes maiores de dados. O Redis Cloud tem um proxy zero-latency aqui pra cuidar do multiplexing.

In [32]:
pipeline = redis.pipeline()
for i, bike in enumerate(bikes, start=1):
    redis_key = f"bikes:{i:03}"
    pipeline.json().set(redis_key, "$", bike)
res = pipeline.execute()

Com os dados carregados, podemos pegar trechos do documento JSON dessa maneira:

In [33]:
res = redis.json().get("bikes:010", "$.model")
print(res)

['Summit']


## 4 - Escolha um modelo de embedding que entenda o Portugu√™s Brasileiro

A **HuggingFace** possui um extenso cat√°logo de modelos de **embedding** de texto que podem ser servidos localmente atrav√©s do framework **SentenceTransformers**.

Os gringos costumam usar o modelo MS MARCO, amplamente utilizado em mecanismos de busca, chatbots e outras aplica√ß√µes de IA.

Entretanto, quero que este lab funcione com o nosso lindo idioma. Vamos fazer com `paraphrase-multilingual-MiniLM-L12-v2`

In [34]:
from sentence_transformers import SentenceTransformer

embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

## 5 - Hora do Show: Gerando os embeddings no Redis!

O primeiro passo aqui √© iterar e selecionar as chaves que vamos trabalhar. Neste caso, s√£o as `bikes::`

In [35]:
keys = sorted(redis.keys("bikes:*"))

Agora, use as chaves como entrada para o comando `JSON.MGET`, juntamente com o campo `$.description`, para coletar as descri√ß√µes em uma lista.

Em seguida, passe a lista de descri√ß√µes para o m√©todo `.encode()`:

In [36]:
descriptions = redis.json().mget(keys, "$.description")

descriptions = [item for sublist in descriptions for item in sublist]

embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

embeddings = embedder.encode(descriptions).astype(np.float32).tolist()

VECTOR_DIMENSION = len(embeddings[0])

print("Gabs says: This ST creates embeddings with {0} dimensions. Redis MUST know that. :D".format(VECTOR_DIMENSION))

Gabs says: This ST creates embeddings with 384 dimensions. Redis MUST know that. :D


Finalmente, insira as descri√ß√µes vetorizadas nos documentos de bicicletas no Redis usando o comando `JSON.SET`.

O seguinte comando insere um novo campo em cada um dos documentos sob o **JSONPath** `$.description_embeddings`.

Mais uma vez, fa√ßa isso usando um **pipeline** para evitar viagens desnecess√°rias pela rede:

In [37]:
#print(keys/embeddings)

pipeline = redis.pipeline()
for key, embedding in zip(keys, embeddings):
    pipeline.json().set(key, "$.description_embeddings", embedding)
pipeline.execute()

[True, True, True, True, True, True, True, True, True, True, True]

Vai ficar meio polu√≠do aqui... mas olhem s√≥ como o dado est√° no Redis.

Podem usar o RedisInsight tamb√©m!

In [38]:
import json

res = redis.json().get("bikes:010")
pretty_res = json.dumps(res, indent=4, ensure_ascii=False)
print(pretty_res)


{
    "model": "Summit",
    "brand": "nHill",
    "price": 1200,
    "type": "Bicicleta de Montanha",
    "specs": {
        "material": "liga",
        "weight": "11.3"
    },
    "description": "Esta bicicleta de montanha econ√¥mica da nHill tem um bom desempenho tanto em ciclovias quanto em trilhas. O garfo com 100mm de curso absorve terrenos acidentados. Pneus largos Kenda Booster oferecem ader√™ncia em curvas e trilhas molhadas. A transmiss√£o Shimano Tourney oferece engrenagens suficientes para encontrar um ritmo confort√°vel para subir, e os freios a disco hidr√°ulicos Tektro freiam suavemente. Se voc√™ quer uma bicicleta acess√≠vel que pode levar para o trabalho, mas tamb√©m levar para trilhas nos fins de semana, ou est√° apenas atr√°s de uma pedalada est√°vel e confort√°vel na ciclovia, a Summit oferece um bom custo-benef√≠cio.",
    "description_embeddings": [
        0.028230920433998108,
        0.1364552080631256,
        -0.06720077246427536,
        -0.00928133446723222

## 6 - Index e FT - Habilitando o Redis Query Engine nos dados

Agora, devemos criar um **INDEX** para consultar metadados de documentos ou realizar buscas vetoriais tamb√©m. Use o comando `FT.CREATE`.

Aqui vai uma descri√ß√£o mais completa do que estamos fazendo pro Redis entender o embedding como um vector array que pode ser usado nas consultas.

Voc√™ pode encontrar mais detalhes sobre todas essas op√ß√µes na documenta√ß√£o de refer√™ncia de vetores.


- **$.description_embeddings AS vector:** O caminho JSON do campo vetorial e seu alias de campo vector.
- **FLAT:** Especifica o m√©todo de indexa√ß√£o, que pode ser um √≠ndice plano (flat index) ou um gr√°fico hier√°rquico naveg√°vel pequeno mundo (HNSW).
- **TYPE FLOAT32:** Define a precis√£o de ponto flutuante de um componente do vetor, neste caso, um n√∫mero de ponto flutuante de 32 bits.
- **DIM 384:** O comprimento ou dimens√£o dos embeddings, determinado pelo modelo de incorpora√ß√£o escolhido.
- **DISTANCE_METRIC COSINE:** A fun√ß√£o de dist√¢ncia escolhida: dist√¢ncia cosseno.


In [39]:
from redis.commands.search.field import (
    NumericField,
    TagField,
    TextField,
    VectorField,
)
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
from redis.exceptions import ResponseError

# Function to check if the index exists
def index_exists(index_name):
    try:
        # This will throw an error if the index does not exist
        redis.ft(index_name).info()
        return True
    except ResponseError:
        return False

index_name = "idx:bikes_vss"

# Check if the index exists and drop it if it does
if index_exists(index_name):
    print("Deleting older index version...")
    redis.execute_command("FT.DROPINDEX", index_name)

# Define the schema
schema = (
    TextField("$.model", no_stem=True, as_name="model"),
    TextField("$.brand", no_stem=True, as_name="brand"),
    NumericField("$.price", as_name="price"),
    TagField("$.type", as_name="type"),
    TextField("$.description", as_name="description"),
    VectorField(
        "$.description_embeddings",
        "FLAT",
        {
            "TYPE": "FLOAT32",
            "DIM": VECTOR_DIMENSION,
            "DISTANCE_METRIC": "COSINE",
        },
        as_name="vector",
    ),
)

# Define the index definition
definition = IndexDefinition(prefix=["bikes:"], index_type=IndexType.JSON)

# Create the index
res = redis.ft(index_name).create_index(fields=schema, definition=definition)

print(res)

OK


Agora, vamos apenas garantir que a indexa√ß√£o foi tranquila... sem surpresas!

In [40]:
info = redis.ft("idx:bikes_vss").info()
num_docs = info["num_docs"]
indexing_failures = info["hash_indexing_failures"]

print("Documentos indexados: {0}".format(num_docs))

print("Falhas de Indexa√ß√£o: {0}".format(indexing_failures))

Documentos indexados: 11
Falhas de Indexa√ß√£o: 0


# Segunda Parte - Usando o Redis como um Vector DB pra valer

Vou continuar no passo 7, pra n√£o confundir voc√™s. Agora, vamos come√ßar a brincar com os dados que est√£o l√° no Redis.

Acredito que o caminho mais racional e simples ser√° fazer o embedding das queries que clientes fariam normalmente.

Na minha humilde opini√£o, √© o primeiro passo pra usar o Redis numa arquitetura RAG: vetores.

## 7 - Carregando algumas queries no Python

In [41]:
queries = [
           "Bicicleta para crian√ßas pequenas",
           "Melhores bicicletas de montanha para crian√ßas",
           "Bicicleta de montanha barata para crian√ßas",
           "Bicicleta de montanha espec√≠fica para mulheres",
           "Bicicleta de estrada para iniciantes",
           "Bicicleta de comuta√ß√£o para pessoas com mais de 60 anos",
           "Bicicleta de comuta√ß√£o confort√°vel",
           "Boa bicicleta para estudantes universit√°rios",
           "Bicicleta de montanha para iniciantes",
           "Bicicleta vintage",
           "Bicicleta confort√°vel para a cidade"
           ]


Vamos fazer o embedding de cada uma dessas queries... jogo r√°pido!

In [42]:
encoded_queries = embedder.encode(queries)
len(encoded_queries)

print(encoded_queries)

[[ 0.02001647  0.737069   -0.16359873 ...  0.22224252  0.13291176
   0.1805346 ]
 [-0.11804421  0.6186317   0.02967137 ... -0.06789754  0.01700302
   0.14308521]
 [-0.07540765  0.7579044  -0.174123   ... -0.10637357 -0.18678775
   0.04395986]
 ...
 [-0.09652202  0.41005573 -0.2518025  ... -0.05905791 -0.03811348
  -0.12661776]
 [-0.14603637  0.73481745 -0.09919461 ... -0.27685368  0.26435688
   0.16712727]
 [ 0.51777124  0.49398148 -0.26587296 ...  0.13598055 -0.13339096
   0.14764398]]


## 8 - Busca K-nearest neighbors (KNN)

O algoritmo **KNN** calcula a dist√¢ncia entre o vetor de consulta e cada vetor no Redis com base na fun√ß√£o de dist√¢ncia escolhida. Cosine, no nosso caso.

Em seguida, retorna os **top K** itens com as menores dist√¢ncias ao vetor de consulta. *Estes s√£o os itens mais semanticamente similares.*

**Agora, construa uma consulta para fazer exatamente isso:**

In [43]:
query = (
    Query('(*)=>[KNN 3 @vector $query_vector AS vector_score]')
     .sort_by('vector_score')
     .return_fields('vector_score', 'id', 'brand', 'model', 'description')
     .dialect(2)
)

**Permita-me explicar aqui:**

- A express√£o de filtro (*) significa todos. Em outras palavras, nenhum filtro foi aplicado. Voc√™ pode substitu√≠-la por uma express√£o que filtre por metadados adicionais. Inclusive GeoLocation.

- A parte **KNN** da consulta procura os 3 vizinhos mais pr√≥ximos.
- O vetor de consulta deve ser passado como o par√¢metro `query_vector`.
- A dist√¢ncia ao vetor de consulta √© retornada como `vector_score`.
- Os resultados s√£o classificados por este `vector_score`.
- Por fim, retorna os campos `vector_score, id, brand, model e description` para cada resultado.


## 9 - Como usar a query contra o Redis?

**Agora, voc√™ deve passar a consulta vetorizada como um array de bytes com o nome do par√¢metro query_vector.**\
O c√≥digo a seguir cria um array **NumPy** em Python a partir do vetor de consulta e o converte em uma representa√ß√£o compacta em n√≠vel de byte que pode ser passada como um par√¢metro para a consulta:

```
redis.ft('idx:bikes_vss').search(
    query,
    {
      'query_vector': np.array(encoded_query, dtype=np.float32).tobytes()
    }
).docs
```

Com o template para a consulta pronto, voc√™ pode executar todas as consultas em um loop. Observe que o script calcula o vector_score para cada resultado como 1 - doc.vector_score. Como a dist√¢ncia cosseno √© usada como a m√©trica, os itens com a menor dist√¢ncia est√£o mais pr√≥ximos e, portanto, s√£o mais similares √† consulta.

Em seguida, fa√ßa um loop sobre os documentos correspondentes e crie uma lista de resultados que pode ser convertida em uma tabela Pandas para visualizar os resultados:

In [44]:
def create_query_table(query, queries, encoded_queries, extra_params=None):
    """
    Creates a query table.
    """
    results_list = []
    for i, encoded_query in enumerate(encoded_queries):
        result_docs = (
            redis.ft("idx:bikes_vss")
            .search(
                query,
                {"query_vector": np.array(encoded_query, dtype=np.float32).tobytes()}
                | (extra_params if extra_params else {}),
            )
            .docs
        )
        for doc in result_docs:
            vector_score = round(1 - float(doc.vector_score), 2)
            results_list.append(
                {
                    "query": queries[i],
                    "score": vector_score,
                    "id": doc.id,
                    "brand": doc.brand,
                    "model": doc.model,
                    "description": doc.description,
                }
            )

    # Optional: convert the table to Markdown using Pandas
    queries_table = pd.DataFrame(results_list)
    queries_table.sort_values(
        by=["query", "score"], ascending=[True, False], inplace=True
    )
    queries_table["query"] = queries_table.groupby("query")["query"].transform(
        lambda x: [x.iloc[0]] + [""] * (len(x) - 1)
    )
    queries_table["description"] = queries_table["description"].apply(
        lambda x: (x[:497] + "...") if len(x) > 500 else x
    )
    return queries_table.to_markdown(index=False)

Os resultados da consulta mostram as tr√™s melhores correspond√™ncias (nosso par√¢metro K) de cada consulta individual, juntamente com o id, a marca e o modelo da bicicleta para cada consulta.

Por exemplo, para a consulta "Melhores bicicletas de montanha para crian√ßas", a maior pontua√ß√£o de similaridade (>0.60) e, portanto, a correspond√™ncia mais pr√≥xima foi a bicicleta da marca 'Nord' modelo 'Chook air 5', descrita como:



> A Chook Air 5 oferece √†s crian√ßas a partir de seis anos uma bicicleta de montanha dur√°vel e superleve para sua primeira experi√™ncia em trilhas e cruzeiros f√°ceis por florestas e campos. O tubo superior mais baixo facilita montar e desmontar em qualquer situa√ß√£o, proporcionando mais seguran√ßa para seus filhos nas trilhas. A Chook Air 5 √© a introdu√ß√£o perfeita ao mountain biking.

Pela descri√ß√£o, esta bicicleta √© uma excelente escolha para crian√ßas mais novas, e os embeddings capturaram com precis√£o a sem√¢ntica da descri√ß√£o.



In [45]:
query = (
    Query("(*)=>[KNN 3 @vector $query_vector AS vector_score]")
    .sort_by("vector_score")
    .return_fields("vector_score", "id", "brand", "model", "description")
    .dialect(2)
)

table = create_query_table(query, queries, encoded_queries)
print(table)

| query                                                   |   score | id        | brand      | model         | description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
|:--------------------------------------------------------|--------:|:----------|:-----------|:--------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------