# üìä Tipos de Datos en Redis - Pr√°ctica con Python

*Autor: @mC√°rdenas 2025*

En este notebook exploraremos todos los tipos de datos de Redis con ejemplos pr√°cticos.

## üîå Conexi√≥n a Redis

In [None]:
import redis
import json
from datetime import datetime

# Conectar a Redis
r = redis.Redis(host='localhost', port=6379, decode_responses=True)

# Verificar conexi√≥n
print(f"‚úÖ Conexi√≥n exitosa: {r.ping()}")
print(f"üìä Versi√≥n: {r.info('server')['redis_version']}")

## üìù 1. STRINGS

El tipo m√°s b√°sico. Puede almacenar texto, n√∫meros o datos binarios.

In [None]:
# Limpiar datos anteriores
r.flushdb()

# SET y GET b√°sico
r.set('saludo', 'Hola, Redis!')
print(f"GET saludo: {r.get('saludo')}")

# SET con expiraci√≥n (TTL)
r.setex('sesion:abc123', 60, 'datos_de_sesion')  # Expira en 60 segundos
print(f"TTL sesion:abc123: {r.ttl('sesion:abc123')} segundos")

# Contadores con INCR/DECR
r.set('visitas', 0)
r.incr('visitas')  # 1
r.incr('visitas')  # 2
r.incrby('visitas', 10)  # 12
print(f"Visitas: {r.get('visitas')}")

# MSET y MGET (m√∫ltiples operaciones)
r.mset({'color:1': 'rojo', 'color:2': 'azul', 'color:3': 'verde'})
print(f"Colores: {r.mget('color:1', 'color:2', 'color:3')}")

# SETNX - Solo si no existe
resultado = r.setnx('clave_unica', 'primer_valor')
print(f"Primera vez: {resultado}")
resultado = r.setnx('clave_unica', 'segundo_valor')  # No sobrescribe
print(f"Segunda vez: {resultado}")
print(f"Valor: {r.get('clave_unica')}")

## üìã 2. LISTS

Listas ordenadas, perfectas para colas y pilas.

In [None]:
# LPUSH y RPUSH - Insertar elementos
r.delete('tareas')
r.rpush('tareas', 'tarea1', 'tarea2', 'tarea3')  # A√±adir al final
r.lpush('tareas', 'tarea0')  # A√±adir al inicio

# LRANGE - Ver la lista
print(f"Todas las tareas: {r.lrange('tareas', 0, -1)}")

# LPOP y RPOP - Extraer elementos
primera = r.lpop('tareas')
print(f"Primera extra√≠da: {primera}")

ultima = r.rpop('tareas')
print(f"√öltima extra√≠da: {ultima}")

# LLEN - Longitud
print(f"Tareas restantes: {r.llen('tareas')}")

# LINDEX - Acceso por √≠ndice
print(f"Elemento en √≠ndice 0: {r.lindex('tareas', 0)}")

# Ejemplo: Cola de trabajos (FIFO)
r.delete('cola_trabajos')
for i in range(5):
    r.rpush('cola_trabajos', f'trabajo_{i}')
    
print("\nüì• Cola de trabajos:")
while r.llen('cola_trabajos') > 0:
    trabajo = r.lpop('cola_trabajos')
    print(f"  Procesando: {trabajo}")

## üîµ 3. SETS

Conjuntos de elementos √∫nicos, sin orden.

In [None]:
# SADD - A√±adir elementos
r.delete('frutas')
r.sadd('frutas', 'manzana', 'naranja', 'pl√°tano', 'manzana')  # Duplicado ignorado

# SMEMBERS - Ver todos
print(f"Frutas: {r.smembers('frutas')}")

# SISMEMBER - ¬øPertenece?
print(f"¬øHay manzana? {r.sismember('frutas', 'manzana')}")
print(f"¬øHay uva? {r.sismember('frutas', 'uva')}")

# SCARD - Cardinalidad
print(f"Total frutas: {r.scard('frutas')}")

# Operaciones de conjuntos
r.delete('set_a', 'set_b')
r.sadd('set_a', 1, 2, 3, 4)
r.sadd('set_b', 3, 4, 5, 6)

print(f"\nSet A: {r.smembers('set_a')}")
print(f"Set B: {r.smembers('set_b')}")
print(f"Intersecci√≥n (A ‚à© B): {r.sinter('set_a', 'set_b')}")
print(f"Uni√≥n (A ‚à™ B): {r.sunion('set_a', 'set_b')}")
print(f"Diferencia (A - B): {r.sdiff('set_a', 'set_b')}")

## üèÜ 4. SORTED SETS (ZSETS)

Sets ordenados por un score num√©rico. Ideal para rankings.

In [None]:
# ZADD - A√±adir con score
r.delete('leaderboard')
r.zadd('leaderboard', {
    'player1': 1500,
    'player2': 2000,
    'player3': 1800,
    'player4': 2200,
    'player5': 1600
})

# ZRANGE - Por posici√≥n (ascendente)
print("Top 3 (menor a mayor):")
print(r.zrange('leaderboard', 0, 2, withscores=True))

# ZREVRANGE - Por posici√≥n (descendente)
print("üèÜ Top 3 (mayor a menor):")
for i, (player, score) in enumerate(r.zrevrange('leaderboard', 0, 2, withscores=True), 1):
    medalla = ['ü•á', 'ü•à', 'ü•â'][i-1]
    print(f"  {medalla} {player}: {int(score)} pts")

# ZSCORE - Obtener score
print(f"Score de player3: {r.zscore('leaderboard', 'player3')}")

# ZRANK / ZREVRANK - Posici√≥n
print(f"Posici√≥n de player3 (0-indexed, desc): {r.zrevrank('leaderboard', 'player3')}")

# ZINCRBY - Actualizar score
r.zincrby('leaderboard', 500, 'player3')
print(f"Nuevo score player3: {r.zscore('leaderboard', 'player3')}")

# Nuevo ranking
print("üèÜ Nuevo ranking:")
for i, (player, score) in enumerate(r.zrevrange('leaderboard', 0, 4, withscores=True), 1):
    print(f"  #{i} {player}: {int(score)} pts")

## üóÇÔ∏è 5. HASHES

Mapas campo-valor, ideales para objetos.

In [None]:
# HSET - Establecer campos
r.delete('usuario:1')
r.hset('usuario:1', mapping={
    'nombre': 'Mar√≠a Garc√≠a',
    'email': 'maria@email.com',
    'edad': 28,
    'ciudad': 'Madrid',
    'visitas': 0
})

# HGET - Obtener un campo
print(f"Nombre: {r.hget('usuario:1', 'nombre')}")

# HGETALL - Obtener todo
print(f"Perfil completo:")
for campo, valor in r.hgetall('usuario:1').items():
    print(f"  {campo}: {valor}")

# HINCRBY - Incrementar campo num√©rico
r.hincrby('usuario:1', 'visitas', 1)
r.hincrby('usuario:1', 'edad', 1)  # Cumplea√±os
print(f"Visitas: {r.hget('usuario:1', 'visitas')}")
print(f"Nueva edad: {r.hget('usuario:1', 'edad')}")

# HEXISTS - ¬øExiste campo?
print(f"¬øTiene tel√©fono? {r.hexists('usuario:1', 'telefono')}")

# HDEL - Eliminar campo
r.hset('usuario:1', 'temporal', 'dato')
r.hdel('usuario:1', 'temporal')

## üåä 6. STREAMS

Logs append-only para event sourcing.

In [None]:
# XADD - A√±adir eventos
r.delete('eventos')

# Simular eventos de usuario
eventos_ejemplo = [
    {'tipo': 'login', 'usuario': 'user123', 'ip': '192.168.1.1'},
    {'tipo': 'click', 'usuario': 'user123', 'pagina': '/productos'},
    {'tipo': 'compra', 'usuario': 'user123', 'producto': 'ABC', 'precio': '99.99'},
    {'tipo': 'logout', 'usuario': 'user123'}
]

for evento in eventos_ejemplo:
    id_evento = r.xadd('eventos', evento)
    print(f"Evento a√±adido: {id_evento}")

# XLEN - Longitud del stream
print(f"Total eventos: {r.xlen('eventos')}")

# XRANGE - Leer eventos
print("üìú Historial de eventos:")
for id_evento, campos in r.xrange('eventos', '-', '+'):
    print(f"  [{id_evento}] {campos}")

# XREAD - Leer desde un punto
print("üìñ √öltimos 2 eventos:")
eventos = r.xrevrange('eventos', '+', '-', count=2)
for id_evento, campos in eventos:
    print(f"  {campos['tipo']}: {campos}")

## üî¢ 7. BITMAPS

Operaciones a nivel de bits. Muy eficiente en memoria.

In [None]:
# Ejemplo: Registro de asistencia diaria
# Cada bit representa un usuario (0=ausente, 1=presente)
r.delete('asistencia:2024:01:15')

# Usuarios 1, 5, 10, 100 asistieron
usuarios_presentes = [1, 5, 10, 100, 150, 200]
for user_id in usuarios_presentes:
    r.setbit('asistencia:2024:01:15', user_id, 1)

# ¬øAsisti√≥ usuario 5?
print(f"¬øUsuario 5 asisti√≥? {r.getbit('asistencia:2024:01:15', 5)}")

# ¬øAsisti√≥ usuario 7?
print(f"¬øUsuario 7 asisti√≥? {r.getbit('asistencia:2024:01:15', 7)}")

# ¬øCu√°ntos asistieron?
print(f"Total asistentes: {r.bitcount('asistencia:2024:01:15')}")

# Simular otro d√≠a
r.delete('asistencia:2024:01:16')
for user_id in [1, 10, 15, 100]:  # Menos gente
    r.setbit('asistencia:2024:01:16', user_id, 1)

# Usuarios que asistieron AMBOS d√≠as (AND)
r.bitop('AND', 'asistencia:ambos_dias', 'asistencia:2024:01:15', 'asistencia:2024:01:16')
print(f"Asistieron ambos d√≠as: {r.bitcount('asistencia:ambos_dias')}")

## üé≤ 8. HYPERLOGLOG

Conteo probabil√≠stico de elementos √∫nicos. M√°ximo 12KB de memoria.

In [None]:
import random
import string

# Simular visitantes √∫nicos
r.delete('visitantes:hoy')

# Generar 10,000 visitas de ~5,000 usuarios √∫nicos
usuarios_unicos = [f"user_{i}" for i in range(5000)]

for _ in range(10000):
    usuario = random.choice(usuarios_unicos)
    r.pfadd('visitantes:hoy', usuario)

# Contar √∫nicos (aproximado)
conteo = r.pfcount('visitantes:hoy')
print(f"Visitantes √∫nicos (aproximado): {conteo}")
print(f"Visitantes reales: 5000")
print(f"Error: {abs(conteo - 5000) / 5000 * 100:.2f}%")

# HyperLogLog usa solo ~12KB sin importar cu√°ntos elementos
print(f"üí° Memoria usada: ~12KB (constante)")
print(f"   Si us√°ramos SET: ~{5000 * 10 / 1024:.1f}KB m√≠nimo")

## üìç 9. GEOSPATIAL

Almacenamiento y consultas geogr√°ficas.

In [None]:
# A√±adir ubicaciones (longitud, latitud)
r.delete('restaurantes')

restaurantes = {
    'La Barraca': (-3.7037, 40.4168),      # Centro Madrid
    'El Corte': (-3.6897, 40.4200),        # Cerca
    'Casa Lucio': (-3.7074, 40.4138),      # Cerca
    'Sobrino Botin': (-3.7075, 40.4141),   # Muy cerca
    'DiverXO': (-3.6765, 40.4570),         # Norte (lejos)
}

for nombre, (lng, lat) in restaurantes.items():
    r.geoadd('restaurantes', (lng, lat, nombre))

# Obtener coordenadas
pos = r.geopos('restaurantes', 'La Barraca')
print(f"Coordenadas La Barraca: {pos}")

# Distancia entre dos restaurantes
dist = r.geodist('restaurantes', 'La Barraca', 'DiverXO', 'km')
print(f"Distancia La Barraca ‚Üí DiverXO: {dist:.2f} km")

# Buscar restaurantes en radio de 1km desde La Barraca
print("üçΩÔ∏è Restaurantes a menos de 1km de La Barraca:")
cercanos = r.geosearch('restaurantes', member='La Barraca', radius=1, unit='km', withdist=True)
for nombre, distancia in cercanos:
    print(f"  üìç {nombre}: {distancia:.2f} km")

# Buscar por coordenadas espec√≠ficas
print("üçΩÔ∏è Restaurantes a 500m de Puerta del Sol:")
cercanos = r.geosearch('restaurantes', longitude=-3.7037, latitude=40.4168, radius=500, unit='m', withdist=True)
for nombre, distancia in cercanos:
    print(f"  üìç {nombre}: {distancia:.0f} m")

## üìÑ 10. JSON (RedisStack)

Documentos JSON nativos con acceso parcial.

In [None]:
# JSON requiere RedisStack
try:
    # Crear documento JSON complejo
    producto = {
        "nombre": "Laptop Gaming Pro",
        "precio": 1299.99,
        "stock": 50,
        "specs": {
            "cpu": "Intel i9",
            "ram": "32GB",
            "gpu": "RTX 4080"
        },
        "tags": ["gaming", "laptop", "premium"],
        "activo": True
    }
    
    # JSON.SET
    r.json().set('producto:json:1', '$', producto)
    print("‚úÖ Producto creado")
    
    # JSON.GET - Todo el documento
    doc = r.json().get('producto:json:1')
    print(f"üì¶ Documento completo:")
    print(json.dumps(doc, indent=2, ensure_ascii=False))
    
    # JSON.GET - Acceso parcial
    precio = r.json().get('producto:json:1', '$.precio')
    print(f"üí∞ Precio: {precio}")
    
    cpu = r.json().get('producto:json:1', '$.specs.cpu')
    print(f"üñ•Ô∏è CPU: {cpu}")
    
    # JSON.NUMINCRBY - Decrementar stock
    r.json().numincrby('producto:json:1', '$.stock', -5)
    stock = r.json().get('producto:json:1', '$.stock')
    print(f"üì¶ Nuevo stock: {stock}")
    
    # JSON.ARRAPPEND - A√±adir tag
    r.json().arrappend('producto:json:1', '$.tags', 'oferta')
    tags = r.json().get('producto:json:1', '$.tags')
    print(f"üè∑Ô∏è Tags: {tags}")
    
except Exception as e:
    print(f"‚ö†Ô∏è JSON requiere RedisStack: {e}")

## üîç 11. SEARCH (RedisStack)

B√∫squeda full-text e √≠ndices secundarios.

In [None]:
from redis.commands.search.field import TextField, NumericField, TagField
from redis.commands.search.index_definition import IndexDefinition, IndexType
from redis.commands.search.query import Query

try:
    # Eliminar √≠ndice si existe
    try:
        r.ft('idx:productos').dropindex(delete_documents=True)
    except:
        pass
    
    # Crear √≠ndice
    schema = (
        TextField('nombre', sortable=True),
        NumericField('precio', sortable=True),
        TagField('categoria')
    )
    
    r.ft('idx:productos').create_index(
        schema,
        definition=IndexDefinition(prefix=['producto:'], index_type=IndexType.HASH)
    )
    print("‚úÖ √çndice creado")
    
    # Crear productos
    productos = [
        {'nombre': 'Laptop Gaming RTX', 'precio': 1500, 'categoria': 'electronica'},
        {'nombre': 'Laptop Oficina', 'precio': 800, 'categoria': 'electronica'},
        {'nombre': 'Monitor 4K', 'precio': 400, 'categoria': 'electronica'},
        {'nombre': 'Silla Ergon√≥mica', 'precio': 300, 'categoria': 'muebles'},
        {'nombre': 'Mesa Gaming RGB', 'precio': 250, 'categoria': 'muebles'},
    ]
    
    for i, prod in enumerate(productos, 1):
        r.hset(f'producto:{i}', mapping=prod)
    print(f"‚úÖ {len(productos)} productos creados")
    
    # Buscar por texto
    print("üîç B√∫squeda: 'Laptop'")
    result = r.ft('idx:productos').search('Laptop')
    for doc in result.docs:
        print(f"  - {doc.nombre} (${doc.precio})")
    
    # Buscar con filtro num√©rico
    print("üîç B√∫squeda: precio < 500")
    result = r.ft('idx:productos').search('@precio:[0 500]')
    for doc in result.docs:
        print(f"  - {doc.nombre} (${doc.precio})")
    
    # Buscar por categor√≠a
    print("üîç B√∫squeda: categor√≠a = muebles")
    result = r.ft('idx:productos').search('@categoria:{muebles}')
    for doc in result.docs:
        print(f"  - {doc.nombre} (${doc.precio})")
        
except Exception as e:
    print(f"‚ö†Ô∏è Search requiere RedisStack: {e}")

## üßπ Limpieza

In [None]:
# Opcional: Limpiar todas las claves creadas
# r.flushdb()
# print("‚úÖ Base de datos limpiada")

print(f"üìä Total claves en DB: {r.dbsize()}")

## üìö Resumen

| Tipo | Uso Principal | Comando Clave |
|------|---------------|---------------|
| **String** | Valores simples, contadores | `SET`, `GET`, `INCR` |
| **List** | Colas, pilas, historial | `LPUSH`, `RPOP`, `LRANGE` |
| **Set** | Elementos √∫nicos, tags | `SADD`, `SMEMBERS`, `SINTER` |
| **Sorted Set** | Rankings, ordenaci√≥n | `ZADD`, `ZREVRANGE`, `ZINCRBY` |
| **Hash** | Objetos, perfiles | `HSET`, `HGET`, `HGETALL` |
| **Stream** | Event sourcing, logs | `XADD`, `XREAD`, `XRANGE` |
| **Bitmap** | Flags, presencia | `SETBIT`, `GETBIT`, `BITCOUNT` |
| **HyperLogLog** | Conteo aproximado | `PFADD`, `PFCOUNT` |
| **Geospatial** | Ubicaciones | `GEOADD`, `GEOSEARCH` |
| **JSON** | Documentos complejos | `JSON.SET`, `JSON.GET` |
| **Search** | B√∫squeda full-text | `FT.SEARCH`, `FT.CREATE` |