# Intro au caching - Redis

**Exos sans recours aux use-cases 1-5**

Les caches sont des instances qui permettent de retenir ponctuellement des paires clef/valeur lorsque l'obtention des valeurs est couteuse/longue. Voyons les caches comme des dictionnaires / hashmap qui permettent une récupération très rapides de ces valeur indexées par une clef. Le stockage du dictionnaire se fait souvent en RAM pour accélérer l'insertion et la récupération.

## Principe de fonctionnement

Un cache est un intermédiaire entre 2 services : un `client` et un `serveur`. Plutôt que d'interroger directement le `serveur` pour obtenir une réponse à propos d'un objet (quelconque) `A`, le `client` va interroger le cache pour savoir s'il connait une clef qui correspond à `A` : `KEY:A`. Alors :
- si le cache ne connaît pas la clef `KEY:A`, alors
  - le `serveur` est tout de même interroger et renvoie la réponse `RESP(A)`
  - le cache intercepte `RESP(A)` et crée une entrée `KEY:A -> RESP(A)` dans son dictionnaire
  - le cache renvoie `RESP(A)` au client
- si le cache connaît `KEY:A`, alors il renvoie `RESP(A)` au `client` sans interroger le serveur

2 cas de figure peuvent justifier le recours à un cache : économiser de l'argent ou du temps.

### Caching pour économiser de l'argent
Supposons qu'un service distant doive être appelé par une notre archi logicielle. Supposons que 
- ce service ait un coût ; soit car il nécessite de payer un service tiers à l'appel (exemple: ChatGPT), soit parce que le volume d'appel engendré implique un agrandissement des ressources pour ce service
- sa réponse varie peu dans le temps (ie pas un flux vidéo, pas une donnée météo, etc...). Exemple de service distant : un service IA d'embedding de texte en vu d'une recherche vectorielle.

Notre architecture peut être amenée à évoluer, des techno peuvent changer, des data re-traitées ... Sans pour autant que les données changent fondamentalement. Dans ce cas, il est préférable d'éviter de payer des appels inutiles au service coûteux s'il faut regénérer ses outputs. Le cache intervient ici en stockant les retours des appels au service tiers une fois pour toute. Le coût d'appel est donc remplacé par un coût de stockage.

### Caching pour économiser du temps
Supposons qu'une donnée soit stockée en DB, tel le résultat d'une jointure. Supposons que plusieurs services de notre architecture nécessitent ponctuellement la connaissance de cette information. Exemple : connaître les 10 dernières commandes d'un acheteur sur un site e-commerce => les services ayant simultanément besoin de cette info : le front pour affichage, un service ML pour calcul de la probabilité d'achat du client, un service comptable de vérification que toutes les factures sont honorées ... le tout en l'espace de 5 secondes.

<img src="schemas-MIAGE-no-cache-time.png" width="800" style="display: block; margin: 0 auto">

Chaque appel à la DB a un coût ; diviser la charge de la DB par 2 pourrait permettre de diviser les CPU et la RAM loués par ~2 (estimation grosse maille). Ainsi, la stratégie suivante :
- n'appeler la DB qu'une seule fois lorsque le premier service demande l'info
- stocker sa réponse dans un cache
- économiser les appels DB suivants en distribuant simplement à la réponse cachée aux autres services lorsqu'ils demandent l'info
=> Permet de diviser sensiblement la charge sur la DB.

<img src="schemas-cache-enabled.png" width="800" style="display: block; margin: 0 auto">

## Time to live

Un cache peut programmer l'expiration des clefs enregistrées au bout de `x` secondes. Ce délai s'appelle *time to live* ou TTL. Le TTL permet d'établir un compromis entre 2 types de coûts
- coût de stockage RAM du cache qui augmente sans fin
- coût de rappel ponctuel du service caché

Lorsqu'une clef expire, le cache la supprime. Le prochain appel sur cette clef provoquera une interrogation du serveur et permettra de rafraîchir la clef dans le cache.

Le TTL permet également de faire expirer une information lorsqu'on sait qu'elle peut périmer après un certain temps. Exemple : dans un moteur de recherche web (Qwant, Google), les recherches "facebook", "youtube", "gmail" sont faites des milliers de fois par seconde. Or il inutile de déclencher la cascade de calcul qui permet d'y répondre à chaque fois - les résultats attendus risquent de ne changer qu'en quelques heures. Ainsi, programmer un TTL de 3600 secondes permet :
- d'économiser 3600*1000=3.6M requêtes au moteur
- de maintenir les résultats à jour à intervalle régulier


## Redis
Redis, pour *RE*mote *DI*ctionary *S*erver, est un cache très répandu que nous allons utiliser ici. Voir [la doc](https://redis.io/docs/latest/) pour se rendre compte du nombre d'outils connexes

In [8]:
import redis
import requests
import time

# Redis connection details
REDIS_HOST = "redis"  # Use "localhost" if running Redis locally outside of Docker
REDIS_PORT = 6379
rcache = redis.Redis(host=REDIS_HOST, port=REDIS_PORT)

## Insertion et TTL

In [4]:
ttm_sec = 5
key = "key:my_first_key"
rcache.set(name=key, value=42, ex=ttm_sec)

tic = time.time()
time.sleep(1)
v = rcache.get(key)
toc = time.time() 
print(f"After {int(toc-tic)} seconds:")
if v:
    print(f"Recovered value from cache:", v)
print()
time.sleep(6)
v = rcache.get(key)
toc = time.time() 
print(f"After {int(toc-tic)} seconds:")
if v:
    print(f"Recovered value from cache:", v)
else:
    print(f"No entry in cache for key {key}")

After 1 seconds:
Recovered value from cache: b'42'

After 7 seconds:
Recovered value from cache: b'42'


## Exercice
Réaliser une classe Python pour wrapper un appel à une API externe en essayant prioritairement de trouver l'info sur un cache Redis. Spec :
- le constructeur de la classe doit prendre en argument :
  - une instance de client Redis
  - une instance de client pour l'API externe. On suppose que cette API possède une méthode `get(object_input: str)` qui permet d'appeler le service externe pour l'objet dont l'id est `object_input`
  - un TTL
- la classe doit exposer une méthode `get(object_input: str)` qui orchestre l'appel API ou REDIS comme expliqué plus haut

Squelette:

In [None]:
import mysql.connector
import pandas as pd

# MySQL connection details
mysql_host = 'mysql'
mysql_user = 'root' # blabla 
mysql_password = 'rootpassword'
mysql_database = 'workshop_db'

# Create a connection to the MySQL database
conn = mysql.connector.connect(
    host=mysql_host,
    user=mysql_user,
    password=mysql_password,
    database=mysql_database
)


In [5]:
import pandas as pd

In [6]:
df = pd.read_csv("/datasets/csv/breweries.csv")

In [7]:
df

Unnamed: 0,id,name,address1,address2,city,state,code,country,phone,website,filepath,descript,add_user,last_mod
0,1,(512) Brewing Company,"407 Radam, F200",,Austin,Texas,78745,United States,512.707.2337,http://512brewing.com/,,(512) Brewing Company is a microbrewery locate...,0,2010-07-22 20:00:20
1,2,21st Amendment Brewery Cafe,563 Second Street,,San Francisco,California,94107,United States,1-415-369-0900,http://www.21st-amendment.com/,,The 21st Amendment Brewery offers a variety of...,0,2010-10-24 13:54:07
2,3,3 Fonteinen Brouwerij Ambachtelijke Geuzestekerij,Hoogstraat 2A,,Beersel,Vlaams Brabant,,Belgium,32-02-/-306-71-03,http://www.3fonteinen.be/index.htm,,,0,2010-07-22 20:00:20
3,4,Aass Brewery,Ole Steensgt. 10 Postboks 1530,,Drammen,,,Norway,47-32-26-60-00,http://www.aass.no,,Aass Brewery was established in 1834 and is th...,0,2010-07-22 20:00:20
4,5,Abbaye de Leffe,Dinant,,Dinant,Namur,,Belgium,,,,,0,2010-07-22 20:00:20
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1409,1416,Brewery Vivant,925 Cherry Street SE,,Grand Rapids,MI,49506,United States,616 719 1604,http://breweryvivant.com,bv-logo.png,Brewery Vivant is the realization of years of ...,494,2011-06-22 12:19:30
1410,1417,Oakshire,,,Eugene,Or,,United States,,,,,516,2011-07-07 07:42:42
1411,1418,Oakshire,,,Eugene,Or,,United States,,,,,516,2011-07-07 07:44:13
1412,1422,Abhi Brewery,,,,,,India,,,,,590,2011-09-27 00:35:48


In [9]:
rcache.set()

In [11]:
import requests

def get_embedding(text: str):
    url = "http://vectorizer:8000/embed"
    payload = {"text": text}
    
    response = requests.post(url, json=payload)
    try:
        response.raise_for_status()  # Raise an exception for HTTP errors
        return response.json()["vector"]
    except:
        return []


In [31]:
import json
class CachedVectorizer:
    def __init__(self, redis_client):
        self.redis_client: redis.Redis = redis_client

    def call(self, row: pd.Series):
        _id = str(row.id)
        _descr = row.descript
        if (rr:=self.redis_client.get(_id)):
            return rr
        else:
            rr = get_embedding(_descr)
            self.redis_client.set(_id, rr)
            return rr

In [33]:
cached_vecto = CachedVectorizer(rcache)

In [35]:
for _, row in df.iterrows():
    aa = cached_vecto.call(row)

InvalidJSONError: Out of range float values are not JSON compliant

In [34]:
aa = df.apply(cached_vecto.call, axis=1)

InvalidJSONError: Out of range float values are not JSON compliant