<a href="https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/redis_workshop_vector_intro_pt_br_gabs.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Workshop - Redis como VectorDB - INTRO (TEM OUTROS!)

## Vector Searches & Large Language Models

![Redis](https://redis.io/wp-content/uploads/2024/04/Logotype.svg?auto=webp&quality=85,75&width=120)


Bem-vind[ao]s ao Workshop! Vamos ter uma experi√™ncia hands-on sobre alguns temas centrais do Redis, bem al√©m do Caching.


Para uma experi√™ncia premium, como a que eu quero que voc√™s tenham, recomendo MUITO utilizar o Redis Insight (App ou Web) pra apoiar na visualiza√ß√£o dos dados.

https://redis.com/redis-enterprise/redis-insight/

---

Novamente, vamos direto ao ponto. Para pegar o fio da meada, passando pela introdu√ß√£o, veja este outro notebook [aqui](https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/redis-workshop-vector-similarity-search.ipynb).

---

## Objetivos do Workshop

Este Notebook √© uma pequena demonstra√ß√£o do Redis como um Vector DB. Depois, vamos ver uma implementa√ß√£o de RAG e Semantic/LLM Caching.


Espero que gostem! üññ


## Conceito - Bancos de dados de vetores

Os dados s√£o frequentemente n√£o estruturados, o que significa que n√£o s√£o descritos por um esquema bem definido. Exemplos de dados n√£o estruturados incluem trechos de texto, imagens, v√≠deos ou √°udio. Uma abordagem para armazenar e pesquisar dados n√£o estruturados √© usar embeddings de vetores.

**O que s√£o vetores?**\
Em aprendizado de m√°quina e IA, vetores s√£o sequ√™ncias de n√∫meros que representam dados. Eles s√£o as entradas e sa√≠das dos modelos, encapsulando informa√ß√µes subjacentes em uma forma num√©rica. Vetores transformam dados n√£o estruturados, como textos, imagens, v√≠deos e √°udios, em um formato que os modelos de aprendizado de m√°quina podem processar.

**Por que eles s√£o importantes?**\
Vetores capturam padr√µes complexos e significados sem√¢nticos inerentes aos dados, tornando-os ferramentas poderosas para uma variedade de aplica√ß√µes. Eles permitem que modelos de aprendizado de m√°quina compreendam e manipulem dados n√£o estruturados de forma mais eficaz.

**Melhorando a busca tradicional.**\
A busca tradicional por palavras-chave ou lexical depende de correspond√™ncias exatas de palavras ou frases, o que pode ser limitante. Em contraste, a busca vetorial, ou busca sem√¢ntica, aproveita a rica informa√ß√£o capturada nos embeddings de vetores. Ao mapear dados em um espa√ßo vetorial, itens semelhantes s√£o posicionados pr√≥ximos uns dos outros com base em seu significado. Essa abordagem permite resultados de busca mais precisos e significativos, pois considera o contexto e o conte√∫do sem√¢ntico da consulta, e n√£o apenas as palavras exatas usadas.

# Passo 1 - Criar uma conta Free no Redis Cloud

Basta seguir o passo a passo [aqui](https://colab.research.google.com/github/gacerioni/redis-workshop-notebook-validator/blob/master/redis-workshop-setup-notebook-validator.ipynb)!

# Setup R√°pido

## Instala√ßao das libs do Python e redis-cli

In [None]:
# Instale o Redis client e tambem o Hugging Face sentence transformers, pois vamos gerar os vetores aqui mesmo
!pip install -q redis sentence_transformers

# Instale tbm algumas libs pra gente brincar com LLM
# este comando baixa umas paradas de 700MB+, ok? Leva dois minutinhos.
!pip install -r https://raw.githubusercontent.com/gacerioni/redis-workshop-json-search-vs/master/deps/llm-movies/requirements.txt

# E instalar a CLI, via redis-tools, que inclui a famosa redis-cli
!apt-get update
!apt-get install -y redis-tools

## Deployment do Redis Stack - Um passo importante para esta demo em espec√≠fico

Pessoal, esse Workshop de VectorSearch vai passar de 30MB.

---

**Ou seja: pra gente poder fazer esse e os futuros de Vector com LLM, vamos rodar o `redis-stack` aqui, locamente, neste notebook mesmo.**

---

Para isso, basta executar:

In [None]:
%%sh
curl -fsSL https://packages.redis.io/gpg | sudo gpg --dearmor -o /usr/share/keyrings/redis-archive-keyring.gpg
echo "deb [signed-by=/usr/share/keyrings/redis-archive-keyring.gpg] https://packages.redis.io/deb $(lsb_release -cs) main" | sudo tee /etc/apt/sources.list.d/redis.list
sudo apt-get update  > /dev/null 2>&1
sudo apt-get install redis-stack-server  > /dev/null 2>&1
redis-stack-server --daemonize yes

### Conectando com o Redis server

In [None]:
import os

# Coloque aqui os dados do seu DB do Redis Cloud
REDIS_HOST="localhost"
REDIS_PORT=6379
REDIS_PASSWORD=""

# Caso o SSL esteja ativo pro endpoint, adicione --tls
# Recomendo n√£o misturar l√© com cr√© aqui, visto que n√£o vamos ter nenhuma informa√ß√£o sens√≠vel passando pelo fio.
if REDIS_PASSWORD!="":
  os.environ["REDIS_CONN"]=f"-h {REDIS_HOST} -p {REDIS_PORT} -a {REDIS_PASSWORD} --no-auth-warning"
else:
  os.environ["REDIS_CONN"]=f"-h {REDIS_HOST} -p {REDIS_PORT}"

# Caso o SSL esteja ativo pro endpoint, use rediss:// como o URL prefix
REDIS_URL = f"redis://:{REDIS_PASSWORD}@{REDIS_HOST}:{REDIS_PORT}"
INDEX_NAME = f"qna:idx"

# Teste a Redis connection
!redis-cli $REDIS_CONN PING

In [None]:
# Testando via Python (redis-py)
import redis
redis = redis.Redis(
  host=REDIS_HOST,
  port=REDIS_PORT,
  password=REDIS_PASSWORD)
redis.ping()

## Importando e preparando as libs que iremos usar

Este primeiro bloco vai garantir que todas as depend√™ncias estejam prontas pra gente brincar com o ChatGPT usando o Redis como um c√©rebro extra e atualizado.

O bloco de vari√°veis ali √© basicamente eu explicando algumas prefer√™ncias minhas pro Vector Search, como quantas dimens√µes meus vetores possuem. 384, neste caso.

In [None]:
import redis
import csv
import os
import numpy as np
from sentence_transformers import *
from redis.commands.search.query import Query
from redis.commands.search.field import TextField, TagField, VectorField
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
import openai
import tiktoken


redis = redis.Redis(
  host=REDIS_HOST,
  port=REDIS_PORT,
  password=REDIS_PASSWORD,
  decode_responses=True)

# Preferencias acerca do nosso Vector Search e como o Redis deve indexar os embeddings
VSS_INDEX_TYPE = "HNSW"
VSS_DATA_TYPE = "FLOAT32"
VSS_DISTANCE = "COSINE"
VSS_DIMENSION = 384
VSS_MINIMUM_SCORE = 2

MAX_MOVIES = 5000000


redis.ping()


# Iniciando os trabalhos

## Passo 1 - Carregando os filmes no Redis

Primeiro, vamos baixar o CSV do nosso GitHub, contendo um monte de filmes.\
Eu fiz um dump da base do **[IMDB](https://www.imdb.com/)**, caso estejam curiosos.






In [None]:
# Baixando
!wget https://raw.githubusercontent.com/gacerioni/gabs-chatbot-llm-gpt-redis-vector-rag-demo/main/data/movies/imdb_movies.csv

In [None]:
def load():
    with open("imdb_movies.csv", encoding='utf-8') as csvf:
        csvReader = csv.DictReader(csvf)
        cnt = 0
        for row in csvReader:
            redis.json().set(f'moviebot:movie:{cnt}', '$', row)
            cnt = cnt + 1
            if (cnt > MAX_MOVIES):
                break
        print("Data was loaded into Redis!")

# Flush no DB, pra gente come√ßar do 0
redis.flushdb()

# Carregar os dados no Redis
load()


# Contar as chaves no Redis, s√≥ pra ver se tudo foi carregado
key_count = redis.dbsize()
print(f"Total de chaves no Redis: {key_count}")

E ver alguns dados, s√≥ pra ter certeza que subiram para o Redis.

Notem que a gente n√£o criou os vetores ainda, bel√™?

In [None]:
redis.json().get("moviebot:movie:1")

## Passo 2 - Embedding - Hora de gerar vetores!

Finalmente, vamos ver nosso banco de vetores tomando forma.

Para isso, pegaremos alguns campos de informa√ß√µes n√£o estruturadas de cada filme. Vamos concatenar dados interessantes como t√≠tulo, g√™nero, equipe, pontua√ß√£o e sinopse.

Com essa string concatenada, geraremos vetores que representam cada filme de maneira embutida. Esses vetores ser√£o armazenados no Redis, permitindo buscas e an√°lises sem√¢nticas avan√ßadas sobre os filmes.

In [None]:
# esse comando pode levar 1-2 minutos, ok?
def create_embeddings():
    model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
    for key in redis.scan_iter(match='moviebot:movie:*'):
        print(f"creating the embedding for {key}")
        result = redis.json().get(key, "$.names", "$.overview", "$.crew", "$.score", "$.genre")
        movie = f"movie title is: {result['$.names'][0]}\n"
        movie += f"movie genre is: {result['$.genre'][0]}\n"
        movie += f"movie crew is: {result['$.crew'][0]}\n"
        movie += f"movie score is: {result['$.score'][0]}\n"
        movie += f"movie overview is: {result['$.overview'][0]}\n"
        redis.json().set(key, "$.overview_embedding", model.encode(movie).astype(np.float32).tolist())

create_embeddings()

#### Checkpoint - vamos entender o que temos no Redis agora

N√≥s criamos o embedding usando outros atributos do filme, e guardamos esse "fingerprint" junto do pr√≥prio documento JSON que representa cada filme.

Olha s√≥ como ficou agora:

In [None]:
import json

movie_with_embedding = redis.json().get("moviebot:movie:1")
pretty_json = json.dumps(movie_with_embedding, indent=4, ensure_ascii=False)
print(pretty_json)

## Passo 3 - Criando o √≠ndex para o JSON do Filme

Vamos criar o √≠ndex, sem segredo, pra gente fazer as queries depois.

In [None]:
import time

def create_index():
    indexes = redis.execute_command("FT._LIST")
    if "movie_idx" not in indexes:
        index_def = IndexDefinition(prefix=["moviebot:movie:"], index_type=IndexType.JSON)
        schema = (TextField("$.crew", as_name="crew"),
                  TextField("$.overview", as_name="overview"),
                  TagField("$.genre", as_name="genre"),
                  TagField("$.names", as_name="names"),
                  VectorField("$.overview_embedding", VSS_INDEX_TYPE,
                              {"TYPE": VSS_DATA_TYPE, "DIM": VSS_DIMENSION, "DISTANCE_METRIC": VSS_DISTANCE},
                              as_name="embedding"))
        redis.ft('movie_idx').create_index(schema, definition=index_def)
        print("The index has been created")
    else:
        print("The index exists")

# Cria o index aqui mesmo
create_index()

E vamos testar o index por aqui mesmo tamb√©m, fazendo uma Full Text Search bem pregui√ßosa

In [None]:
# Testa aqui mesmo
time.sleep(2)

# Executar a busca, direto aqui mesmo
# Redis √© binary safe, ent√£o esse abaixo, com √±, precisa funfar de boa
search_result = redis.execute_command("FT.SEARCH", "movie_idx", "@crew:'Zoe Salda√±a'")
print(search_result)

# Passo 4 - Criando as fun√ß√µes Python de apoio ao ChatGPT LLM

Vamos usar este pequeno bloco de c√≥digo para configurar alguns detalhes para fazer funcionar toda a nossa integra√ß√£o.

---

### O que deve acontecer agora?

**Estas duas fun√ß√µes abaixo s√£o para orquestrar a comunica√ß√£o entre o usu√°rio/cliente e o chatgpt.**

Isso por si s√≥ j√° √© um RAG! Em detalhes, √© isso que ocorre:



*   Pedimos para o usu√°rio fazer uma pergunta em linguagem natural. Neste caso, buscando por filmes.
*   Transformamos a busca do cliente em um vetor usando o mesmo modelo utilizado para criar os embeddings.
*   Realizamos a busca no Redis usando o vetor. Um Vector Search por dist√¢ncia de cosseno, pois funciona bem pro nosso caso de uso.
*   Pegamos os filmes encontrados, e vamos us√°-los como contexto pro ChatGPT ficar mais ligeiro sobre o assunto que estamos falando. √â aqui que a gente come√ßa a diminuir as temidas alucina√ß√µes do GPT4!
*   Preparamos uma mensagem sist√™mica para definir o tom do LLM e especificar o que esperamos dele. Enviamos em texto pro chatgpt, dizendo o que esperamos dele.
*   Geramos a intera√ß√£o, guardamos a resposta, e entregamos ao cliente.

In [None]:
VSS_LLM_RAG_MODEL = "gpt-3.5-turbo-0613"
OPENAI_API_KEY = "nada"
VSS_MODEL = "sentence-transformers/all-MiniLM-L6-v2"

def get_prompt(model, query):
    context = ""
    prompt = ""

    # Configura a query de busca vetorial no Redis
    q = Query("@embedding:[VECTOR_RANGE $radius $vec]=>{$YIELD_DISTANCE_AS: score}") \
        .sort_by("score", asc=True) \
        .return_fields("overview", "names", "score", "$.crew", "$.genre", "$.score") \
        .paging(0, 5) \
        .dialect(2)

    # Define os par√¢metros da query
    query_params = {
        "radius": VSS_MINIMUM_SCORE,
        "vec": model.encode(query).astype(np.float32).tobytes()
    }

    # Executa a busca no Redis
    res = redis.ft("movie_idx").search(q, query_params)

    # Processa os resultados da busca
    if (res is not None) and len(res.docs):
        it = iter(res.docs[0:])
        for x in it:
            movie = f"movie title is: {x['names']}\n"
            movie += f"movie genre is: {x['$.genre']}\n"
            movie += f"movie crew is: {x['$.crew']}\n"
            movie += f"movie score is: {x['$.score']}\n"
            movie += f"movie overview is: {x['overview']}\n"
            context += movie + "\n"

    # Cria o prompt para o LLM
    if len(context) > 0:
        prompt = '''Use the provided information to answer the search query the user has sent. The information in the
        database provides three movies, choose the one or the ones that fit most. If you can't answer the user's
        question, say "Sorry, I am unable to answer the question, try to refine your question". Do not guess. You
        must deduce the answer exclusively from the information provided. The answer must be formatted in markdown or
        HTML. Do not make things up. Do not add personal opinions. Do not add any disclaimer.

            Search query:

            {}

            Information in the database:

            {}
            '''.format(query, context)

    return prompt

def getOpenAIGPT35(prompt):
    # Define a mensagem do sistema
    system_msg = ('You are a smart and knowledgeable AI assistant with expertise in all kinds of movies. You are a '
                  'very friendly and helpful AI. You are empowered to recommend movies based on the provided context. '
                  'Do NOT make anything up. Do NOT engage in topics that are not about movies.')

    # Define a codifica√ß√£o
    encoding = tiktoken.encoding_for_model(VSS_LLM_RAG_MODEL)

    try:
        openai.api_key = OPENAI_API_KEY
        response = openai.ChatCompletion.create(model=VSS_LLM_RAG_MODEL,
                                                stream=False,
                                                messages=[{"role": "system", "content": system_msg},
                                                          {"role": "user", "content": prompt}])
        return response["choices"][0]["message"]["content"]
    except openai.error.OpenAIError as e:
        # Trata erros
        if "context window is too large" in str(e):
            print("Error: Maximum context length exceeded. Please shorten your input.")
            return "Maximum context length exceeded"
        else:
            print("An unexpected error occurred:", e)
            return "An unexpected error occurred"

# Passo 5 - Hora de testar pra valer!

**Parab√©ns por ter chegado at√© aqui!**

Vamos fazer algo bem simples, pra fechar com chave de ouro.

Vamos criar um loop pra fazer essa ponte entre a nossa APP e o ChatGPT.\
Isso √© literalmente o que vemos em produ√ß√£o, nos clientes.







In [None]:
def render():
    model = SentenceTransformer(VSS_MODEL)
    # Reage √† entrada do usu√°rio
    while True:
        question = input("Me pe√ßa indica√ß√µes sobre filmes:\n")  # Pede para o usu√°rio fazer uma pergunta
        reply = f"Sua pergunta foi: {question}"
        prompt = get_prompt(model, question)  # Gera o prompt a partir da pergunta do usu√°rio
        response = getOpenAIGPT35(prompt)  # Obt√©m a resposta do LLM
        print(response)  # Exibe a resposta
        print("--------------------------------")

# Chama o loop por tempo indeterminado
render()