<a href="https://colab.research.google.com/github/gacerioni/redis-workshop-json-search-vs/blob/master/redis_workshop_alem_do_cache_nov_2024.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Workshop - Redis muito além do Cache - 2024

![Redis](https://redis.io/wp-content/uploads/2024/04/Logotype.svg?auto=webp&quality=85,75&width=120)



Bem-vindo ao workshop hands-on "Redis Muito Além do Cache"! Aqui, você terá uma experiência prática com os principais data types do Redis, explorando além do uso básico como cache. Vamos focar em como o Redis pode ser usado como um banco de dados completo e versátil.


Para uma experiência premium, como a que eu quero que vocês tenham, recomendo MUITO utilizar o Redis Insight (App ou Web) pra apoiar na visualização dos dados.

https://redis.com/redis-enterprise/redis-insight/

## Objetivos do Workshop

O objetivo deste notebook é apresentar as principais estruturas de dados do Redis e proporcionar uma prática interativa com cada uma delas. Nosso foco será na execução de comandos e na manipulação de dados em tempo real, com exemplos que você pode adaptar para suas próprias aplicações.

**Nota**: Já configuramos um ambiente de desenvolvimento no Google Colab para você começar imediatamente.

## Setup Inicial

Antes de começar a explorar, vamos configurar o ambiente e garantir que você esteja pronto para executar comandos Redis diretamente no Google Colab.

In [1]:
# Instala a biblioteca Redis para Python
!pip install -q redis

# Instala a CLI do Redis (redis-tools) para executar comandos diretamente
!apt-get update -qq
!apt-get install -y -qq redis-tools

# Configuração da conexão com o Redis Cloud (preencha com suas credenciais)
import os

REDIS_HOST = "redis-18443.c309.us-east-2-1.ec2.redns.redis-cloud.com"  # Exemplo: "redis-12345.c1.sa-east-1-3.ec2.cloud.redislabs.com"
REDIS_PORT = 18443             # Porta do seu Redis
REDIS_PASSWORD = "Secret@42"   # Senha do Redis

# Definindo a variável de ambiente para usar a redis-cli
os.environ["REDIS_CONN"] = f"-h {REDIS_HOST} -p {REDIS_PORT} -a {REDIS_PASSWORD} --no-auth-warning"

# Testando a conexão com o Redis Cloud
!redis-cli $REDIS_CONN PING

# Importando a biblioteca redis-py e testando a conexão
import redis

r = redis.Redis(
    host=REDIS_HOST,
    port=REDIS_PORT,
    password=REDIS_PASSWORD,
    decode_responses=True
)

# Testando a conexão com o Redis usando redis-py
if r.ping():
    print("Conexão com o Redis bem-sucedida!")
else:
    print("Erro ao conectar com o Redis.")

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/261.4 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━[0m [32m184.3/261.4 kB[0m [31m6.3 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m261.4/261.4 kB[0m [31m3.7 MB/s[0m eta [36m0:00:00[0m
[?25hW: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' does not seem to provide it (sources.list entry misspelt?)
Selecting previously unselected package libjemalloc2:amd64.
(Reading database ... 123623 files and directories currently installed.)
Preparing to unpack .../0-libjemalloc2_5.2.1-4ubuntu1_amd64.deb ...
Unpacking libjemalloc2:amd64 (5.2.1-4ubuntu1) ...
Selecting previously unselected package liblua5.1-0:amd64.
Preparing to unpack .../1-liblua5.1-0_5.1.5-8.1build4_amd64.deb ...
Unpacking liblua5.1-0:amd64 (5.1.5-8.1build4) ...
Select

Agora que você está com tudo configurado, vamos começar a explorar os data types básicos do Redis e realizar alguns exercícios interativos para entender como eles funcionam na prática.

# Data Types Básicos no Redis

**O Redis oferece uma variedade de estruturas de dados, cada uma otimizada para diferentes cenários de uso. Aqui, vamos explorar os principais data types com exemplos rápidos para entender suas funcionalidades.**

## 1. Strings
As **Strings** são o data type mais simples no Redis, armazenando qualquer sequência de bytes, como texto ou números. Elas são amplamente usadas para contadores, sessões de usuário, e caching de valores simples.

**Exemplo de Caso de Uso**: Cache Aside, contadores e KV-stores, Lock Distribuído, Rate Limiter, Session Storage, Feature Flags, Gaming, etc.

### Exemplo com Strings



In [6]:
# Armazenar um valor simples (pode ser uma configuração ou dado de cache)
r.set("config:modo", "produção")
print("Modo atual:", r.get("config:modo"))

# Atualizar o valor (simular uma mudança de configuração)
r.set("config:modo", "manutenção")
print("Modo atualizado:", r.get("config:modo"))

# Usar Strings como um contador para likes em um post
r.set("post:123:likes", 10)
print("Likes iniciais:", r.get("post:123:likes"))

# Incrementar e decrementar o contador de likes
r.incr("post:123:likes")
print("Likes após um incremento:", r.get("post:123:likes"))
r.decr("post:123:likes")
print("Likes após um decremento:", r.get("post:123:likes"))

# Simular uma expiração (TTL) para uma sessão de usuário
r.setex("sessao:usuario:456", 30, "ativo")
print("Sessão de usuário criada com TTL de 30 segundos.")

Modo atual: produção
Modo atualizado: manutenção
Likes iniciais: 10
Likes após um incremento: 11
Likes após um decremento: 10
Sessão de usuário criada com TTL de 30 segundos.


## 2. Lists

As **Lists** são coleções ordenadas de strings, úteis para filas de tarefas ou logs. Podem funcionar como uma fila (FIFO) ou uma pilha (LIFO). A API do Redis fornece muitos comandos seguros, atômicos e previsíveis para você implementar arquiteturas e filas robustas e prontas para PROD. Simples é bem diferente de frágil. 90% de todas as transações financeiras que você faz em um dia passaram por um Redis.

Caso de Uso: Implementar filas simples de mensagens, arquiteturas desacopladas, arquiteturas assíncronas, sistemas de vazão, integração com Lambdas, Triggers, Filas de Trabalho, etc.

### Exemplo com Lists


In [7]:
# Simular uma fila de tarefas com LPUSH e RPOP (FIFO)
r.lpush("fila:tarefas", "tarefa1", "tarefa2", "tarefa3")
print("Tarefas na fila (FIFO):", r.lrange("fila:tarefas", 0, -1))

# Remover e processar a tarefa mais antiga
tarefa = r.rpop("fila:tarefas")
print("Processando:", tarefa)
print("Tarefas restantes na fila:", r.lrange("fila:tarefas", 0, -1))

# Simular uma pilha de mensagens (LIFO)
r.rpush("pilha:mensagens", "mensagem1", "mensagem2", "mensagem3")
print("Mensagens na pilha (LIFO):", r.lrange("pilha:mensagens", 0, -1))

# Remover e processar a mensagem mais recente
mensagem = r.rpop("pilha:mensagens")
print("Processando mensagem:", mensagem)
print("Mensagens restantes na pilha:", r.lrange("pilha:mensagens", 0, -1))

Tarefas na fila (FIFO): ['tarefa3', 'tarefa2', 'tarefa1']
Processando: tarefa1
Tarefas restantes na fila: ['tarefa3', 'tarefa2']
Mensagens na pilha (LIFO): ['mensagem1', 'mensagem2', 'mensagem3']
Processando mensagem: mensagem3
Mensagens restantes na pilha: ['mensagem1', 'mensagem2']


## 3. Sets

Os **Sets** são coleções de strings únicas, ideais para armazenar elementos sem duplicatas. São úteis para deduplicação, gerenciamento de IDs únicos, ou até para operações de conjuntos, como interseção e união.

Caso de Uso: Listar usuários únicos online em uma aplicação, deduplicar itens, aplicar teoria dos conjuntos, ou até criar índices secundários personalizados.

### Exemplo com Sets

In [8]:
# Adicionar usuários únicos online
r.sadd("usuarios:online", "alice", "bob", "carol")
print("Usuários online:", r.smembers("usuarios:online"))

# Adicionar um usuário duplicado (não será adicionado novamente)
r.sadd("usuarios:online", "alice")
print("Usuários online (após tentativa de duplicação):", r.smembers("usuarios:online"))

# Remover um usuário que saiu
r.srem("usuarios:online", "bob")
print("Usuários online (após saída de Bob):", r.smembers("usuarios:online"))

# Operações de conjuntos: Simular interseção com outro set de usuários
r.sadd("usuarios:ativos", "alice", "dave", "carol")
interseccao = r.sinter("usuarios:online", "usuarios:ativos")
print("Usuários online e ativos:", interseccao)

Usuários online: {'carol', 'bob', 'alice'}
Usuários online (após tentativa de duplicação): {'carol', 'bob', 'alice'}
Usuários online (após saída de Bob): {'carol', 'alice'}
Usuários online e ativos: {'carol', 'alice'}


## 4. Sorted Sets

Os **Sorted Sets** são como sets, mas com uma pontuação associada a cada elemento, o que permite manter os elementos ordenados. Eles são ideais para rankings, agendamentos, e qualquer caso em que a ordem baseada em pontuação seja importante.

Caso de Uso: Classificação de jogadores em um jogo, leaderboards em geral, análises em tempo real, agendamento de tarefas, ou filas de prioridade.

### Exemplo com Sorted Sets



In [9]:
# Adicionar jogadores com suas pontuações
r.zadd("jogo:ranking", {"player1": 1500, "player2": 3000, "player3": 2500})
print("Ranking dos jogadores (do menor para o maior):", r.zrange("jogo:ranking", 0, -1, withscores=True))

# Consultar o ranking em ordem decrescente (do maior para o menor)
print("Ranking dos jogadores (do maior para o menor):", r.zrevrange("jogo:ranking", 0, -1, withscores=True))

# Atualizar a pontuação de um jogador
r.zincrby("jogo:ranking", 500, "player1")
print("Ranking atualizado (do maior para o menor):", r.zrevrange("jogo:ranking", 0, -1, withscores=True))

# Consultar a posição de um jogador
posicao = r.zrevrank("jogo:ranking", "player1")
print("Posição do player1 no ranking:", posicao + 1)  # +1 para uma posição humana (começando do 1)

# Remover um jogador do ranking
r.zrem("jogo:ranking", "player2")
print("Ranking após remoção de player2:", r.zrevrange("jogo:ranking", 0, -1, withscores=True))

Ranking dos jogadores (do menor para o maior): [('player1', 1500.0), ('player3', 2500.0), ('player2', 3000.0)]
Ranking dos jogadores (do maior para o menor): [('player2', 3000.0), ('player3', 2500.0), ('player1', 1500.0)]
Ranking atualizado (do maior para o menor): [('player2', 3000.0), ('player3', 2500.0), ('player1', 2000.0)]
Posição do player1 no ranking: 3
Ranking após remoção de player2: [('player3', 2500.0), ('player1', 2000.0)]


## 5. Hashes

Os **Hashes** são coleções de pares campo-valor, úteis para armazenar objetos, como perfis de usuários ou configurações. Você também pode setar TTLs para cada sub-key, abrindo ainda mais possibilidades e controle.

Caso de Uso: Armazenar informações de usuário de maneira estruturada, banco de dados primário, NoSQL, ORM, Session Storage, AIML Feature Stores, etc.

### Exemplo com Hashes

In [10]:
# Criar um hash com informações de usuário
r.hset("usuario:1001", mapping={"nome": "Gabriel", "email": "gabriel@example.com", "idade": "32"})
print("Perfil do usuário:", r.hgetall("usuario:1001"))

# Recuperar apenas um campo específico (email)
email = r.hget("usuario:1001", "email")
print("Email do usuário:", email)

# Atualizar a idade do usuário
r.hset("usuario:1001", "idade", "33")
print("Perfil atualizado:", r.hgetall("usuario:1001"))

# Remover um campo do hash (por exemplo, o email)
r.hdel("usuario:1001", "email")
print("Perfil após remoção do email:", r.hgetall("usuario:1001"))

# Definir um TTL para a chave do usuário (expira após 60 segundos)
r.expire("usuario:1001", 60)
print("TTL definido para a chave 'usuario:1001' (60 segundos)")

Perfil do usuário: {'nome': 'Gabriel', 'email': 'gabriel@example.com', 'idade': '32'}
Email do usuário: gabriel@example.com
Perfil atualizado: {'nome': 'Gabriel', 'email': 'gabriel@example.com', 'idade': '33'}
Perfil após remoção do email: {'nome': 'Gabriel', 'idade': '33'}
TTL definido para a chave 'usuario:1001' (60 segundos)


### Exercício com Hashes - HASH Sub-Key Expiration

Com o Redis 7.4, é possível aplicar expirações (TTL) a campos individuais, o que abre novas possibilidades para gerenciar dados temporários.

In [20]:
# Criar um hash simulando dados de sessão do usuário
r.hset("sessao:usuario:1337", mapping={
    "nome": "Gabriel",
    "sobrenome": "Cerioni",
    "token": "super-token-secreto<....>",            # Token que expira
    "ultimo_login": "2024-11-04",
    "pais_origem": "BRA",
    "geoloc_estimado": "-46.63389,-23.55028",        # Praça da Sé, SP
    "user_tier_level": 3                             # Imagine um sistema de Tier de 0-10 (noob to VIP)
})
print("Dados da sessão:", r.hgetall("sessao:usuario:1337"))

# Aplicar um TTL de 30 segundos apenas ao campo 'token' usando HEXPIRE
r.execute_command("HEXPIRE", "sessao:usuario:1337", 30, "FIELDS", 1, "token")
print("TTL de 30 segundos definido para o campo 'token'.")

# Verificar os dados da sessão (o token ainda está presente)
print("Dados da sessão (após definir TTL):")
for campo, valor in r.hgetall("sessao:usuario:1337").items():
    print(f"{campo}: {valor}")

# Após 30 segundos, o campo 'token' será automaticamente removido. Aguarde para ver o efeito.

# OPCIONAL - Remover o TTL do campo 'token', tornando-o persistente novamente
#r.execute_command("HPERSIST", "sessao:usuario:1337", "FIELDS", 1, "token")
#print("O campo 'token' agora é persistente novamente:", r.hgetall("sessao:usuario:1337"))

Dados da sessão: {'nome': 'Gabriel', 'ultimo_login': '2024-11-04', 'sobrenome': 'Cerioni', 'pais_origem': 'BRA', 'geoloc_estimado': '-46.63389,-23.55028', 'user_tier_level': '3', 'token': 'super-token-secreto<....>'}
TTL de 30 segundos definido para o campo 'token'.
Dados da sessão (após definir TTL):
token: super-token-secreto<....>
nome: Gabriel
ultimo_login: 2024-11-04
sobrenome: Cerioni
pais_origem: BRA
geoloc_estimado: -46.63389,-23.55028
user_tier_level: 3


### Teaser de Indexação com RediSearch
#### *Calma, você ainda vai aprender a usar o `Redis Search and Query Engine`!*

Agora que você aprendeu a manipular dados estruturados com Hashes, imagine o poder de realizar buscas otimizadas e complexas. No **Redis**, com **RediSearch**, é possível indexar campos de forma poderosa e eficiente, como neste exemplo rápido de indexação e busca que veremos mais a fundo na próxima sessão:





In [22]:
from redis.commands.search.field import TagField, NumericField, GeoField
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
from redis.commands.search.query import Query

# 1. Deletar o índice se ele já existir, para garantir que começamos do zero
try:
    r.ft("idx:sessao_usuarios").dropindex(delete_documents=False)
except:
    pass

# 2. Criar o índice para o hash 'sessao:usuario:'
r.ft("idx:sessao_usuarios").create_index(
    [
        TagField("pais_origem"),
        NumericField("user_tier_level"),
        GeoField("geoloc_estimado")
    ],
    definition=IndexDefinition(prefix=["sessao:usuario:"], index_type=IndexType.HASH)
)

# 3. Indexar um hash de exemplo com dados de sessão do usuário
r.hset("sessao:usuario:1337", mapping={
    "nome": "Gabriel",
    "sobrenome": "Cerioni",
    "token": "super-token-secreto<....>",
    "ultimo_login": "2024-11-04",
    "pais_origem": "BRA",
    "geoloc_estimado": "-46.63389,-23.55028",  # Praça da Sé, SP
    "user_tier_level": 3
})
print("✅ Dados de sessão indexados com sucesso!")

# 4. Executar uma busca única: usuários do Brasil, nível de tier entre 2 e 5, próximos ao centro de SP
query = Query("@pais_origem:{BRA} @user_tier_level:[2 5] @geoloc_estimado:[-46.63389 -23.55028 5 km]")

# 5. Executar a busca e exibir os resultados
res = r.ft("idx:sessao_usuarios").search(query)
print("🔍 Resultado da busca com RediSearch:")
for doc in res.docs:
    print(doc.__dict__)

✅ Dados de sessão indexados com sucesso!
🔍 Resultado da busca com RediSearch:
{'id': 'sessao:usuario:1337', 'payload': None, 'nome': 'Gabriel', 'ultimo_login': '2024-11-04', 'sobrenome': 'Cerioni', 'pais_origem': 'BRA', 'geoloc_estimado': '-46.63389,-23.55028', 'user_tier_level': '3', 'token': 'super-token-secreto<....>'}
