<a href="https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/redis_workshop_vector_intro_pt_br_gabs.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Workshop - Redis como VectorDB - INTRO (TEM OUTROS!)

## Vector Searches & Large Language Models

![Redis](https://redis.io/wp-content/uploads/2024/04/Logotype.svg?auto=webp&quality=85,75&width=120)


Bem-vind[ao]s ao Workshop! Vamos ter uma experiÃªncia hands-on sobre alguns temas centrais do Redis, bem alÃ©m do Caching.


Para uma experiÃªncia premium, como a que eu quero que vocÃªs tenham, recomendo MUITO utilizar o Redis Insight (App ou Web) pra apoiar na visualizaÃ§Ã£o dos dados.

https://redis.com/redis-enterprise/redis-insight/

---

Novamente, vamos direto ao ponto. Para pegar o fio da meada, passando pela introduÃ§Ã£o, veja este outro notebook [aqui](https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/redis-workshop-vector-similarity-search.ipynb).

---

## Objetivos do Workshop

Este Notebook Ã© uma pequena demonstraÃ§Ã£o do Redis como um Vector DB. Depois, vamos ver uma implementaÃ§Ã£o de RAG e Semantic/LLM Caching.


Espero que gostem! ðŸ––


## Conceito - Bancos de dados de vetores

Os dados sÃ£o frequentemente nÃ£o estruturados, o que significa que nÃ£o sÃ£o descritos por um esquema bem definido. Exemplos de dados nÃ£o estruturados incluem trechos de texto, imagens, vÃ­deos ou Ã¡udio. Uma abordagem para armazenar e pesquisar dados nÃ£o estruturados Ã© usar embeddings de vetores.

**O que sÃ£o vetores?**\
Em aprendizado de mÃ¡quina e IA, vetores sÃ£o sequÃªncias de nÃºmeros que representam dados. Eles sÃ£o as entradas e saÃ­das dos modelos, encapsulando informaÃ§Ãµes subjacentes em uma forma numÃ©rica. Vetores transformam dados nÃ£o estruturados, como textos, imagens, vÃ­deos e Ã¡udios, em um formato que os modelos de aprendizado de mÃ¡quina podem processar.

**Por que eles sÃ£o importantes?**\
Vetores capturam padrÃµes complexos e significados semÃ¢nticos inerentes aos dados, tornando-os ferramentas poderosas para uma variedade de aplicaÃ§Ãµes. Eles permitem que modelos de aprendizado de mÃ¡quina compreendam e manipulem dados nÃ£o estruturados de forma mais eficaz.

**Melhorando a busca tradicional.**\
A busca tradicional por palavras-chave ou lexical depende de correspondÃªncias exatas de palavras ou frases, o que pode ser limitante. Em contraste, a busca vetorial, ou busca semÃ¢ntica, aproveita a rica informaÃ§Ã£o capturada nos embeddings de vetores. Ao mapear dados em um espaÃ§o vetorial, itens semelhantes sÃ£o posicionados prÃ³ximos uns dos outros com base em seu significado. Essa abordagem permite resultados de busca mais precisos e significativos, pois considera o contexto e o conteÃºdo semÃ¢ntico da consulta, e nÃ£o apenas as palavras exatas usadas.

# Passo 1 - Criar uma conta Free no Redis Cloud

Basta seguir o passo a passo [aqui](https://colab.research.google.com/github/gacerioni/redis-workshop-notebook-validator/blob/master/redis-workshop-setup-notebook-validator.ipynb)!

# Passo 2 - Setup RÃ¡pido

## InstalaÃ§ao das libs do Python e redis-cli

In [None]:
# Instale as deps, como redis, sentence transformers, etc
# equivale a
# pip install redis pandas sentence-transformers tabulate numpy requests
!pip install -r https://raw.githubusercontent.com/gacerioni/redis-workshop-json-search-vs/master/deps/vector-intro/requirements.txt

# E instalar a CLI, via redis-tools, que inclui a famosa redis-cli
!apt-get update
!apt-get install -y redis-tools

# Iniciando os trabalhos - All hands on deck!

## Conectando com o Redis server

In [None]:
import os

# Coloque aqui os dados do seu DB do Redis Cloud
REDIS_HOST="redis-18884.c98.us-east-1-4.ec2.redns.redis-cloud.com"
REDIS_PORT=18884
REDIS_PASSWORD="lgZgS90vZJpnS4F2Y5EJ97YJTFGUUdvF"

# Caso o SSL esteja ativo pro endpoint, adicione --tls
# Recomendo nÃ£o misturar lÃ© com crÃ© aqui, visto que nÃ£o vamos ter nenhuma informaÃ§Ã£o sensÃ­vel passando pelo fio.
if REDIS_PASSWORD!="":
  os.environ["REDIS_CONN"]=f"-h {REDIS_HOST} -p {REDIS_PORT} -a {REDIS_PASSWORD} --no-auth-warning"
else:
  os.environ["REDIS_CONN"]=f"-h {REDIS_HOST} -p {REDIS_PORT}"

# Caso o SSL esteja ativo pro endpoint, use rediss:// como o URL prefix
REDIS_URL = f"redis://:{REDIS_PASSWORD}@{REDIS_HOST}:{REDIS_PORT}"
INDEX_NAME = f"qna:idx"

# Teste a Redis connection
!redis-cli $REDIS_CONN PING

In [None]:
# Testando via Python (redis-py)
import redis
redis = redis.Redis(
  host=REDIS_HOST,
  port=REDIS_PORT,
  password=REDIS_PASSWORD)
redis.ping()

## 1 - Importando e preparando as libs que iremos usar

Este primeiro bloco vai garantir que todas as dependÃªncias estejam prontas pra gente brincar com o lab.

In [None]:
import json
import time

import numpy as np
import pandas as pd
import requests
import redis
from redis.commands.search.field import (
    NumericField,
    TagField,
    TextField,
    VectorField,
)
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
from redis.commands.search.query import Query
from sentence_transformers import SentenceTransformer

redis = redis.Redis(
  host=REDIS_HOST,
  port=REDIS_PORT,
  password=REDIS_PASSWORD,
  decode_responses=True)


redis.ping()


## 2 - Carregando a massa de dados - Bikes

Vamos ingerir uma pequena massa de dados que contÃ©m bikes e suas descriÃ§Ãµes... como um SKU da vida.





In [None]:
URL = "https://raw.githubusercontent.com/gacerioni/redis-workshop-json-search-vs/master/deps/vector-intro/data/bikes.json"
response = requests.get(URL, timeout=10)
bikes = response.json()

# vamos ver o que foi carregado
json.dumps(bikes[0], indent=2)

## 3 - Carregar os dados no Redis como JSON - Binary Tree (nÃ£o Ã© uma String)

Vamos carregar essas bikes como documentos no Redis. Documentos JSON, claro!

Vamos usar o conceito de pipeline, que pode ser muito Ãºtil com volumes maiores de dados. O Redis Cloud tem um proxy zero-latency aqui pra cuidar do multiplexing.

In [None]:
pipeline = redis.pipeline()
for i, bike in enumerate(bikes, start=1):
    redis_key = f"bikes:{i:03}"
    pipeline.json().set(redis_key, "$", bike)
res = pipeline.execute()

Com os dados carregados, podemos pegar trechos do documento JSON dessa maneira:

In [None]:
res = redis.json().get("bikes:010", "$.model")
print(res)

## 4 - Escolha um modelo de embedding que entenda o PortuguÃªs Brasileiro

A **HuggingFace** possui um extenso catÃ¡logo de modelos de **embedding** de texto que podem ser servidos localmente atravÃ©s do framework **SentenceTransformers**.

Os gringos costumam usar o modelo MS MARCO, amplamente utilizado em mecanismos de busca, chatbots e outras aplicaÃ§Ãµes de IA.

Entretanto, quero que este lab funcione com o nosso lindo idioma. Vamos fazer com `paraphrase-multilingual-MiniLM-L12-v2`

In [None]:
from sentence_transformers import SentenceTransformer

embedder = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')

## 5 - Hora do Show: Gerando os embeddings no Redis!

O primeiro passo aqui Ã© iterar e selecionar as chaves que vamos trabalhar. Neste caso, sÃ£o as `bikes::`

In [None]:
keys = sorted(redis.keys("bikes:*"))

Agora, use as chaves como entrada para o comando `JSON.MGET`, juntamente com o campo `$.description`, para coletar as descriÃ§Ãµes em uma lista.

Em seguida, passe a lista de descriÃ§Ãµes para o mÃ©todo `.encode()`:

In [None]:
descriptions = redis.json().mget(keys, "$.description")

descriptions = [item for sublist in descriptions for item in sublist]

embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

embeddings = embedder.encode(descriptions).astype(np.float32).tolist()

VECTOR_DIMENSION = len(embeddings[0])

print("Gabs says: This ST creates embeddings with {0} dimensions. Redis MUST know that. :D".format(VECTOR_DIMENSION))

Finalmente, insira as descriÃ§Ãµes vetorizadas nos documentos de bicicletas no Redis usando o comando `JSON.SET`.

O seguinte comando insere um novo campo em cada um dos documentos sob o **JSONPath** `$.description_embeddings`.

Mais uma vez, faÃ§a isso usando um **pipeline** para evitar viagens desnecessÃ¡rias pela rede:

In [None]:
#print(keys/embeddings)

pipeline = redis.pipeline()
for key, embedding in zip(keys, embeddings):
    pipeline.json().set(key, "$.description_embeddings", embedding)
pipeline.execute()

Vai ficar meio poluÃ­do aqui... mas olhem sÃ³ como o dado estÃ¡ no Redis.

Podem usar o RedisInsight tambÃ©m!

In [None]:
import json

res = redis.json().get("bikes:010")
pretty_res = json.dumps(res, indent=4, ensure_ascii=False)
print(pretty_res)


## 6 - Index e FT - Habilitando o Redis Query Engine nos dados

Agora, devemos criar um **INDEX** para consultar metadados de documentos ou realizar buscas vetoriais tambÃ©m. Use o comando `FT.CREATE`.

Aqui vai uma descriÃ§Ã£o mais completa do que estamos fazendo pro Redis entender o embedding como um vector array que pode ser usado nas consultas.

VocÃª pode encontrar mais detalhes sobre todas essas opÃ§Ãµes na documentaÃ§Ã£o de referÃªncia de vetores.


- **$.description_embeddings AS vector:** O caminho JSON do campo vetorial e seu alias de campo vector.
- **FLAT:** Especifica o mÃ©todo de indexaÃ§Ã£o, que pode ser um Ã­ndice plano (flat index) ou um grÃ¡fico hierÃ¡rquico navegÃ¡vel pequeno mundo (HNSW).
- **TYPE FLOAT32:** Define a precisÃ£o de ponto flutuante de um componente do vetor, neste caso, um nÃºmero de ponto flutuante de 32 bits.
- **DIM 384:** O comprimento ou dimensÃ£o dos embeddings, determinado pelo modelo de incorporaÃ§Ã£o escolhido.
- **DISTANCE_METRIC COSINE:** A funÃ§Ã£o de distÃ¢ncia escolhida: distÃ¢ncia cosseno.


In [None]:
from redis.commands.search.field import (
    NumericField,
    TagField,
    TextField,
    VectorField,
)
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
from redis.exceptions import ResponseError

# Function to check if the index exists
def index_exists(index_name):
    try:
        # This will throw an error if the index does not exist
        redis.ft(index_name).info()
        return True
    except ResponseError:
        return False

index_name = "idx:bikes_vss"

# Check if the index exists and drop it if it does
if index_exists(index_name):
    print("Deleting older index version...")
    redis.execute_command("FT.DROPINDEX", index_name)

# Define the schema
schema = (
    TextField("$.model", no_stem=True, as_name="model"),
    TextField("$.brand", no_stem=True, as_name="brand"),
    NumericField("$.price", as_name="price"),
    TagField("$.type", as_name="type"),
    TextField("$.description", as_name="description"),
    VectorField(
        "$.description_embeddings",
        "FLAT",
        {
            "TYPE": "FLOAT32",
            "DIM": VECTOR_DIMENSION,
            "DISTANCE_METRIC": "COSINE",
        },
        as_name="vector",
    ),
)

# Define the index definition
definition = IndexDefinition(prefix=["bikes:"], index_type=IndexType.JSON)

# Create the index
res = redis.ft(index_name).create_index(fields=schema, definition=definition)

print(res)

Agora, vamos apenas garantir que a indexaÃ§Ã£o foi tranquila... sem surpresas!

In [None]:
info = redis.ft("idx:bikes_vss").info()
num_docs = info["num_docs"]
indexing_failures = info["hash_indexing_failures"]

print("Documentos indexados: {0}".format(num_docs))

print("Falhas de IndexaÃ§Ã£o: {0}".format(indexing_failures))

# Segunda Parte - Usando o Redis como um Vector DB pra valer

Vou continuar no passo 7, pra nÃ£o confundir vocÃªs. Agora, vamos comeÃ§ar a brincar com os dados que estÃ£o lÃ¡ no Redis.

Acredito que o caminho mais racional e simples serÃ¡ fazer o embedding das queries que clientes fariam normalmente.

Na minha humilde opiniÃ£o, Ã© o primeiro passo pra usar o Redis numa arquitetura RAG: vetores.

## 7 - Carregando algumas queries no Python

In [None]:
queries = [
           "Bicicleta para crianÃ§as pequenas",
           "Melhores bicicletas de montanha para crianÃ§as",
           "Bicicleta de montanha barata para crianÃ§as",
           "Bicicleta de montanha especÃ­fica para mulheres",
           "Bicicleta de estrada para iniciantes",
           "Bicicleta de comutaÃ§Ã£o para pessoas com mais de 60 anos",
           "Bicicleta de comutaÃ§Ã£o confortÃ¡vel",
           "Boa bicicleta para estudantes universitÃ¡rios",
           "Bicicleta de montanha para iniciantes",
           "Bicicleta vintage",
           "Bicicleta confortÃ¡vel para a cidade"
           ]


Vamos fazer o embedding de cada uma dessas queries... jogo rÃ¡pido!

In [None]:
encoded_queries = embedder.encode(queries)
len(encoded_queries)

print(encoded_queries)

## 8 - Busca K-nearest neighbors (KNN)

O algoritmo **KNN** calcula a distÃ¢ncia entre o vetor de consulta e cada vetor no Redis com base na funÃ§Ã£o de distÃ¢ncia escolhida. Cosine, no nosso caso.

Em seguida, retorna os **top K** itens com as menores distÃ¢ncias ao vetor de consulta. *Estes sÃ£o os itens mais semanticamente similares.*

**Agora, construa uma consulta para fazer exatamente isso:**

In [None]:
query = (
    Query('(*)=>[KNN 3 @vector $query_vector AS vector_score]')
     .sort_by('vector_score')
     .return_fields('vector_score', 'id', 'brand', 'model', 'description')
     .dialect(2)
)

**Permita-me explicar aqui:**

- A expressÃ£o de filtro (*) significa todos. Em outras palavras, nenhum filtro foi aplicado. VocÃª pode substituÃ­-la por uma expressÃ£o que filtre por metadados adicionais. Inclusive GeoLocation.

- A parte **KNN** da consulta procura os 3 vizinhos mais prÃ³ximos.
- O vetor de consulta deve ser passado como o parÃ¢metro `query_vector`.
- A distÃ¢ncia ao vetor de consulta Ã© retornada como `vector_score`.
- Os resultados sÃ£o classificados por este `vector_score`.
- Por fim, retorna os campos `vector_score, id, brand, model e description` para cada resultado.


## 9 - Como usar a query contra o Redis?

**Agora, vocÃª deve passar a consulta vetorizada como um array de bytes com o nome do parÃ¢metro query_vector.**\
O cÃ³digo a seguir cria um array **NumPy** em Python a partir do vetor de consulta e o converte em uma representaÃ§Ã£o compacta em nÃ­vel de byte que pode ser passada como um parÃ¢metro para a consulta:

```
redis.ft('idx:bikes_vss').search(
    query,
    {
      'query_vector': np.array(encoded_query, dtype=np.float32).tobytes()
    }
).docs
```

Com o template para a consulta pronto, vocÃª pode executar todas as consultas em um loop. Observe que o script calcula o vector_score para cada resultado como 1 - doc.vector_score. Como a distÃ¢ncia cosseno Ã© usada como a mÃ©trica, os itens com a menor distÃ¢ncia estÃ£o mais prÃ³ximos e, portanto, sÃ£o mais similares Ã  consulta.

Em seguida, faÃ§a um loop sobre os documentos correspondentes e crie uma lista de resultados que pode ser convertida em uma tabela Pandas para visualizar os resultados:

In [None]:
def create_query_table(query, queries, encoded_queries, extra_params=None):
    """
    Creates a query table.
    """
    results_list = []
    for i, encoded_query in enumerate(encoded_queries):
        result_docs = (
            redis.ft("idx:bikes_vss")
            .search(
                query,
                {"query_vector": np.array(encoded_query, dtype=np.float32).tobytes()}
                | (extra_params if extra_params else {}),
            )
            .docs
        )
        for doc in result_docs:
            vector_score = round(1 - float(doc.vector_score), 2)
            results_list.append(
                {
                    "query": queries[i],
                    "score": vector_score,
                    "id": doc.id,
                    "brand": doc.brand,
                    "model": doc.model,
                    "description": doc.description,
                }
            )

    # Optional: convert the table to Markdown using Pandas
    queries_table = pd.DataFrame(results_list)
    queries_table.sort_values(
        by=["query", "score"], ascending=[True, False], inplace=True
    )
    queries_table["query"] = queries_table.groupby("query")["query"].transform(
        lambda x: [x.iloc[0]] + [""] * (len(x) - 1)
    )
    queries_table["description"] = queries_table["description"].apply(
        lambda x: (x[:497] + "...") if len(x) > 500 else x
    )
    return queries_table.to_markdown(index=False)

Os resultados da consulta mostram as trÃªs melhores correspondÃªncias (nosso parÃ¢metro K) de cada consulta individual, juntamente com o id, a marca e o modelo da bicicleta para cada consulta.

Por exemplo, para a consulta "Melhores bicicletas de montanha para crianÃ§as", a maior pontuaÃ§Ã£o de similaridade (>0.60) e, portanto, a correspondÃªncia mais prÃ³xima foi a bicicleta da marca 'Nord' modelo 'Chook air 5', descrita como:



> A Chook Air 5 oferece Ã s crianÃ§as a partir de seis anos uma bicicleta de montanha durÃ¡vel e superleve para sua primeira experiÃªncia em trilhas e cruzeiros fÃ¡ceis por florestas e campos. O tubo superior mais baixo facilita montar e desmontar em qualquer situaÃ§Ã£o, proporcionando mais seguranÃ§a para seus filhos nas trilhas. A Chook Air 5 Ã© a introduÃ§Ã£o perfeita ao mountain biking.

Pela descriÃ§Ã£o, esta bicicleta Ã© uma excelente escolha para crianÃ§as mais novas, e os embeddings capturaram com precisÃ£o a semÃ¢ntica da descriÃ§Ã£o.



In [None]:
query = (
    Query("(*)=>[KNN 3 @vector $query_vector AS vector_score]")
    .sort_by("vector_score")
    .return_fields("vector_score", "id", "brand", "model", "description")
    .dialect(2)
)

table = create_query_table(query, queries, encoded_queries)
print(table)