# 02 - Les Acteurs

In [23]:
import logging
import random
import time
from random import randint
from typing import Dict, List

import numpy as np
import ray
from ray import ObjectRef

In [None]:
ray.init(
    ignore_reinit_error=True,
    logging_level=logging.ERROR,
)

Dans ce notebook, on va essayer d'explorer quelques patterns que l'on peut utiliser avec les **Actors**.

## La Remote Class

Pour d√©finir notre premier **Actor**, nous allons d√©finir une classe avec le d√©corateur `@ray.remote`.

Cette classe sera un `ParameterServer`, un exemple courant en machine learning o√π une instance maitresse (**La Remote Class**) peut mettre √† jour les gradients provenant d'autres processus, par exemple des workers qui calculent les gradients individuels sur des batches.

<img src="../images/parameter_server.png" width="40%" height="20%">

In [3]:
@ray.remote
class ParameterSever:
    def __init__(self):
        self.params = np.zeros(10)

    def get_params(self):
        return self.params

    def update_params(self, gradients):
        self.params -= gradients

On va ensuite d√©finir worker, une task qui va mod√©liser un calcul des gradients typique du machine learning, et qui va les envoyer au `ParameterServer`.

In [4]:
@ray.remote
def worker(parameter_server: ParameterSever):
    # Mod√©lise les epoch
    for i in range(100):
        # Mod√©lise le calcul des gradients
        time.sleep(1.5)
        grad = np.ones(10)
        parameter_server.update_params.remote(grad)

On d√©marre notre actor `ParameterServer`. Il va √™tre schedul√© comme un process sur un worker Ray.

In [None]:
parameter_server = ParameterSever.remote()
parameter_server

√áa tourne ! V√©rifions les poids initiaux stock√©s sur notre actor :

In [None]:
print(f"Initial params: {ray.get(parameter_server.get_params.remote())}")

Maintenant, on va cr√©er trois workers distincts repr√©sentant nos t√¢ches de Machine Learning qui calculent des gradients.

In [None]:
[worker.remote(parameter_server) for _ in range(3)]

Maintenant, it√©rons dans une boucle et regardons l'√©volution de nos poids dans le `ParameterServer` pendant que les workers s'ex√©cutent ind√©pendamment et mettent √† jour les gradients.

In [None]:
for _i in range(20):
    print(f"Updated params: {ray.get(parameter_server.get_params.remote())}")
    time.sleep(1)

## L'arbre d'Actors

L'`Arbre des Actors` ou le `Tree of Actors` est un pattern courant utilis√© dans les biblioth√®ques Ray comme `Ray Tune`, `Ray Train` et `RLlib` pour entra√Æner des mod√®les en parall√®le ou effectuer une [optimisation des hyperparam√©tres (HPO)](https://en.wikipedia.org/wiki/Hyperparameter_optimization) distribu√©e.

Dans ce mod√®le, un arbre d'acteurs, les feuilles correspondent √† des actors. Les collections d'actors sont g√©r√©es des `supervisor`. Ce pattern peut √™tre utilis√© lorsqu'on souhaite entra√Æner plusieurs mod√®les simultan√©ment tout en √©tant capable de sauvegarder des checkpoints et d'inspecter les √©tats.

```
                                                                          
                            +---------+                                   
                            |  Driver |                                   
                            +---------+                                   
                                 |                                        
                      +----------------------+                            
                      |                      |                            
             +----------------+     +----------------+                    
             | Supervisor     |     | Supervisor     |                    
             | Actor          |     | Actor          |                    
             +----------------+     +----------------+                    
                      |                      |                            
               +-----------+          +------------+                      
               |           |          |            |                      
           +-------+   +-------+   +-------+   +-------+                  
           | Worker|   | Worker|   | Worker|   | Worker|                  
           | Actor |   | Actor |   | Actor |   | Actor |                  
           +-------+   +-------+   +-------+   +-------+                  
```


Dans un premier temps, on peut creer une classe qui repr√©sente un `Model`, il ne s'agit pas d'un actor car ici on ajoute juste les fonctionnalit√©s sp√©cifiques au mod√®le, comme par exemple sa mani√®re de s'entrainer.

In [9]:
class Model:
    def __init__(self, model: str):
        self._model = model

    def train(self):
        time.sleep(1)  # Mod√©lise les calculs


def model_factory(model: str):
    return Model(model)

Ensuite, on va cr√©er un actor, qui va repr√©senter notre worker, avec ses diff√©rents √©tats, et ses diff√©rentes fonctionnalit√©s.

In [10]:
STATES = ["RUNNING", "DONE"]


@ray.remote
class Worker(object):
    def __init__(self, model: str):
        self._model = model

    def state(self) -> str:
        return random.choice(STATES)

    def work(self) -> None:
        model_factory(self._model).train()

Ces Workers vont √™tre d√©ploy√©s et control√©s par les Supervisors.

In [11]:
@ray.remote
class Supervisor:
    def __init__(self) -> None:
        self.workers = [
            Worker.remote(name)
            for name in ["Logical Regression", "Classification", "Neural Metworks"]
        ]

    def work(self) -> None:
        [w.work.remote() for w in self.workers]

    def terminate(self) -> None:
        [ray.kill(w) for w in self.workers]

    def state(self) -> List[str]:
        return ray.get([w.state.remote() for w in self.workers])

On peut ainsi lancer nos entrainements de la mani√®re suivante :

In [None]:
supervisor = Supervisor.remote()

supervisor.work.remote()

In [None]:
while True:
    states = ray.get(supervisor.state.remote())
    print(states)
    result = all("DONE" == e for e in states)
    if result:
        supervisor.terminate.remote()
        ray.kill(supervisor)
        break

## Les Messages

Maintenant, nous allons voir un nouveau pattern pour les syst√®mes de message. Il s'agit du `MessageActor`.

In [14]:
@ray.remote
class MessageActor(object):
    def __init__(self):
        self.messages = []

    def add_message(self, message):
        self.messages.append(message)

    def get_and_clear_messages(self):
        messages = self.messages
        self.messages = []
        return messages

In [15]:
message_actor = MessageActor.remote()

D√©finissons une task qui boucle et envoie des messages √† `MessageActor`. Elle va lui envoyer un identifiant avec un message associ√©.

In [16]:
@ray.remote
def worker(message_actor, j):
    for i in range(10):
        time.sleep(1)
        message_actor.add_message.remote(f"Message {i} from worker {j}.")

On va d√©marrer en arri√®re plan trois t√¢ches qui doivent communiquer avec le `MessageActor`.

In [None]:
[worker.remote(message_actor, j) for j in range(3)]

Pour les r√©cup√©rer, on va executer une boucle qui p√©riodiquement va appeler la fonction `get_and_clear_messages`.

In [None]:
for _ in range(10):
    new_messages = ray.get(message_actor.get_and_clear_messages.remote())
    print("New messages\n:", new_messages)
    time.sleep(1)

----

### Excercice : Gestion d'une flotte de taxis

√Ä vous de jouer !

Vous √™tes charg√© de mod√©liser un service de taxi utilisant Ray pour g√©rer une flotte.

Vous devez simuler une flotte de taxis o√π chaque taxi gagne de l'argent en fonction des courses qu'il effectue. Son tarif est de 1.25 dollar par seconde, mais il doit reverser une commission de 25 cents par seconde au dispatcher. Le dispatcher doit tenir un compte de l'argent total collect√©, et doit distribuer les missions aux taxis.

Quelques notes techniques avant de d√©marrer.

- Comment passer un actor, √† un autre actor ?
   - Attention, `self` est un mot clef python, et il n'est pas vraiment compatible avec `Ray`... Si vous devez passer la r√©f√©rence de l'actor courant vers un autre actor il faudra utiliser :
   - `ray.get_runtime_context().current_actor`

- Si j'appelle deux fonctions d'un actor... Est-ce que les appels sont parall√©lis√©s ?
   - Non, pourquoi le serait-ils ?

**üëá √Ä COMPLETER**


Vous allez impl√©menter une classe Taxi en tant qu'acteur Ray. Cette classe repr√©sente un taxi individuel dans un syst√®me de gestion de flotte. Elle doit permettre d'attribuer des courses et de suivre les gains du chauffeur.


<br/>

**Attributs de la classe**

Votre classe Taxi doit inclure les attributs suivants :

 - `message_actor` : Une r√©f√©rence √† l'acteur MessageActor, utilis√©e pour enregistrer des messages sur les actions du taxi.
 - `dispatcher` : Une r√©f√©rence √† l'acteur Dispatcher, permettant au taxi de notifier la fin d'une course.
 - `name` : Une cha√Æne de caract√®res repr√©sentant le nom du chauffeur.
 - `cash` : Un float repr√©sentant les gains nets du taxi.
 - `state` : Une cha√Æne de caract√®res indiquant l'√©tat actuel du taxi (`DISPONIBLE` ou `OCCUPE`).

<br/>


**M√©thodes √† impl√©menter**

`__init__(name, message_actor, dispatcher)`

- Initialisez les attributs message_actor, dispatcher, name, cash, et state.
- Le taxi commence avec un cash initial de 0.0 et dans l'√©tat DISPONIBLE.


`take_ride(duration)`

- Changez l'√©tat du taxi √† OCCUPE.
- Simulez la dur√©e de la course en utilisant time.sleep(duration).
- Calculez les gains nets pour la course.
- Appelez la m√©thode ride_complete.remote() du dispatcher pour notifier la fin de la course et envoyer la commission correspondante.
- Revenez √† l'√©tat DISPONIBLE une fois la course termin√©e.


<br/>

**Contraintes**

- Les appels au dispatcher, tels que ride_complete, doivent √™tre effectu√©s avec .remote() pour garantir qu'ils sont asynchrones et ne bloquent pas le taxi.
- La m√©thode `take_ride` doit s'ex√©cuter sans interaction directe avec le syst√®me principal (pas de retour ou ray.get).


In [None]:
DISPONIBLE, OCCUPE = "disponible", "occupe"
PRICE_PER_SECOND = 1.25
COMMISSION_PER_SECOND = 0.25


@ray.remote
class Taxi:
    message_actor: MessageActor
    dispatcher: "Dispatcher"
    name: str
    cash: float
    state: str

    def __init__(
        self, name, message_actor: MessageActor, dispatcher: "Dispatcher"
    ) -> None:
        # SOLUTION
        self.message_actor = message_actor
        self.dispatcher = dispatcher
        self.name = name
        self.cash = 0.0
        self.state = DISPONIBLE

    def take_ride(self, duration: int) -> None:
        # SOLUTION
        self.state = OCCUPE
        time.sleep(duration)
        self.cash += duration * (PRICE_PER_SECOND - COMMISSION_PER_SECOND)
        self.dispatcher.ride_complete.remote(
            self.name, duration * COMMISSION_PER_SECOND
        )
        self.state = DISPONIBLE

**üëá √Ä COMPLETER**

Vous allez impl√©menter une classe Dispatcher en tant qu'acteur Ray. Cette classe aura pour r√¥le de g√©rer une flotte de taxis et leur √©tat.

<br/>

**Attributs de la classe**

Votre classe devra inclure les √©l√©ments suivants :

 - Un acteur pour la gestion des messages (message_actor).
 - Une variable repr√©sentant l'argent total collect√© via les commissions.
 - Une structure pour suivre l'√©tat des chauffeurs (noms et √©tats).
 - Une liste contenant les taxis g√©r√©s par le dispatcher.

La liste des employ√©s est :
 - Daniel
 - Petra
 - Gilbert
 - Emilien


<br/>


**M√©thodes √† impl√©menter**:


`__init__`
- Initialisez les attributs n√©cessaires, cr√©ez la flotte de taxis en passant les informations n√©cessaires (nom du chauffeur, message_actor, etc.), et configurez le syst√®me de gestion des √©tats.

`assign_ride(duration)`
- Attribuez une course √† un chauffeur disponible. Signaler cette attribution au `MessageActor`.
- Si aucun taxi n'est disponible, signalez le √©galement.

`ride_complete(driver, commission)`
- Lorsque la course est termin√©e, mettez √† jour les √©tats des chauffeurs et ajoutez la commission collect√©e au total. Signaler cette fin de course au `MessageActor`.

`get_cash()`
- Retournez l'argent total collect√© par le dispatcher.


<br/>


**Contraintes et Syst√®me d'√âtats**

- La gestion des √©tats des taxis doit √™tre bas√©e uniquement sur une structure interne (pas de ray.get pour v√©rifier l'√©tat d'un taxi en cours de course, car s'il est en train de faire une course, il faudrait qu'il la finisse pour r√©pondre).
- Chaque m√©thode doit respecter l'asynchronisme de Ray, avec l'utilisation appropri√©e de .remote().

In [None]:
@ray.remote
class Dispatcher:
    message_actor: MessageActor
    cash: float
    staff: Dict[str:str]  # {employee: status}
    taxis: List[ObjectRef]

    def __init__(self, message_actor) -> None:
        # SOLUTION
        self.message_actor = message_actor
        self.cash = 0.0
        self.staff = {
            name: DISPONIBLE for name in ["Daniel", "Petra", "Gilbert", "Emilien"]
        }
        self.taxis = [
            Taxi.remote(name, message_actor, ray.get_runtime_context().current_actor)
            for name in self.staff.keys()
        ]

    def assign_ride(self, duration) -> None:
        # SOLUTION
        for (driver, status), taxi in zip(self.staff.items(), self.taxis):
            if status == DISPONIBLE:
                self.message_actor.add_message.remote(
                    f"Course de {duration} secondes envoy√©e √† {driver}"
                )
                self.staff[driver] = OCCUPE
                taxi.take_ride.remote(duration)
                return
        self.message_actor.add_message.remote(f"Tous les taxis sont occup√©s")

    def ride_complete(self, driver, commission: float) -> None:
        # SOLUTION
        self.message_actor.add_message.remote(
            f"Commission de {commission} re√ßu de la part de {driver}"
        )
        self.cash += commission
        self.staff[driver] = DISPONIBLE

    def get_cash(self):
        # SOLUTION
        return self.cash

**üëá √Ä COMPLETER**

Vous allez impl√©menter une classe Simulation en tant qu'acteur Ray. Cette classe sera responsable de simuler une journ√©e de travail pour un dispatcher et sa flotte de taxis.

<br/>

**Attributs de la classe**

Votre classe Simulation doit contenir :
- Une r√©f√©rence √† un acteur Dispatcher qui sera responsable de g√©rer les taxis et leurs √©tats.

<br/>

**M√©thodes √† impl√©menter**

`__init__(dispatcher)`
- Recevez une r√©f√©rence √† l'acteur Dispatcher.
- Stockez cette r√©f√©rence dans un attribut pour pouvoir interagir avec le dispatcher au cours de la simulation.

`run()`
- Simulez une s√©rie d'√©v√©nements sur une dur√©e d√©finie (par exemple, une journ√©e de travail fictive).
- √Ä chaque it√©ration :
    - G√©n√©rez une dur√©e al√©atoire pour une course.
    - Appelez la m√©thode assign_ride de l'acteur Dispatcher avec cette dur√©e.
    - Attendez un temps fixe avant de passer √† la prochaine it√©ration pour simuler l'√©coulement du temps.

`get_dispatcher()`
- Retournez la r√©f√©rence au dispatcher, permettant d'inspecter son √©tat ou d'interagir avec lui en dehors de la simulation.

<br/>

**Contraintes**
- La simulation doit √™tre non bloquante pour d'autres processus Ray. Cela signifie que toutes les interactions avec le Dispatcher doivent se faire via .remote().
- Le d√©roulement de la simulation doit imiter une journ√©e r√©aliste avec des pauses r√©guli√®res entre les courses.

In [28]:
@ray.remote
class Simulation:
    def __init__(self, dispatcher):
        # SOLUTION
        self.dispatcher = dispatcher

    def run(self):
        # SOLUTION
        for _ in range(10):
            self.dispatcher.assign_ride.remote(random.randint(1, 5))
            time.sleep(1)

    def get_dispatcher(self):
        # sOLUTION
        return self.dispatcher

In [None]:
message_actor = MessageActor.remote()
dispatcher = Dispatcher.remote(message_actor)
simulation = Simulation.remote(dispatcher)
simulation.run.remote()

for _ in range(15):
    messages = ray.get(message_actor.get_and_clear_messages.remote())
    print(messages)
    time.sleep(1)

total_commission = ray.get(dispatcher.get_cash.remote())
print(f"Commission totale collect√©e {total_commission}")

In [20]:
# ray.shutdown()