# 01 - Les t√¢ches

In [37]:
import logging
import os
import time
from pathlib import Path
from typing import List

import numpy as np
import ray
from numpy import loadtxt

## 1. Mod√®le de t√¢ches parall√®les

Ray transforme les fonctions d√©cor√©es en t√¢ches sans √©tat **Ray Task**, planifi√©es n'importe o√π sur un worker Ray dans le cluster, simplement en ajoutant le d√©corateur `@ray.remote`.  Toutes ces fonctions seront ex√©cut√©es par un processus worker dans un cluster Ray.

O√π seront-elles ex√©cut√©es ? Par quel worker ? Tout cela est pris en charge par Ray.

Notre travail consiste √† prendre nos fonctions Python existantes et √† les convertissez en tasks : c'est aussi simple que cela‚ÄØ!

### Exemple 1: Execution en s√©rie VS en parall√®le

Examinons les diff√©rentes mani√®res d'executer des t√¢ches.


In [38]:
def regular_function():
    return 1

In [39]:
@ray.remote
def remote_function():
    return 1

Que se passe-t-il quand on appelle ces fonctions ?

In [None]:
try:
    res = regular_function()
    print(res)
except Exception as e:
    print(f"{type(e).__name__}: {e}")

In [None]:
try:
    res = remote_function()
    print(res)
except Exception as e:
    print(f"{type(e).__name__}: {e}")

En effet, il existe quelques diff√©rences cl√©s entre la fonction originale et la fonction d√©cor√©e :

- **Invocation** : La version classique est appel√©e avec `regular_function()`, tandis que la version distante est appel√©e avec `remote_function.remote()`.

- **Valeurs de retour** : `regular_function` s'ex√©cute de mani√®re synchrone et retourne le r√©sultat de la fonction (1), tandis que `remote_function` retourne imm√©diatement un `ObjectID` et ex√©cute ensuite la t√¢che en arri√®re-plan dans un processus worker distinct. On appelle cet `ObjectID` un **future**, car il sera execut√© plus tard en appelant `ray.get`.

D√©monstration :

In [None]:
ray.init(
    ignore_reinit_error=True,
    logging_level=logging.ERROR,
    log_to_driver=False,
)

In [None]:
remote_function.remote()

In [None]:
ray.get(remote_function.remote())

Imaginons que nous voulons executer cette t√¢che 10 fois.

**En s√©rie**: Invocations de `regular_function` dans une boucle

In [45]:
result = 0
for _ in range(10):
    result += regular_function()
assert result == 10

**En parall√®le**: Invocations de `remote_function` avec un seul appel √† `get` :

In [46]:
results = []
for _ in range(10):
    results.append(remote_function.remote())
assert sum(ray.get(results)) == 10

### Exercice 1 : Ajouter deux np.arrays

      +---------------+       +---------------+    
      | read_array    |       | read_array    |    
      +---------------+       +---------------+    
               |                       |           
               +-----------+-----------+           
                           |                       
                    +---------------+              
                    |   add_array   |              
                    +---------------+              
                           |                       
                    +---------------+              
                    |   *result*    |              
                    +---------------+              

**üëá √Ä COMPLETER**

D√©finir la task `read_array`, qui prend en argument un `path` de type `Path` et retourne un `np.array`.

In [47]:
# SOLUTION
@ray.remote
def read_array(path: Path) -> np.array:
    return loadtxt(path, dtype=int)

**üëá √Ä COMPLETER**

D√©finir la task `add_array`, qui prend deux arguments `left` et `right` de type `np.array` et qui retourne leur somme avec `np.add`.

In [48]:
# SOLUTION
@ray.remote
def add_array(left: np.array, right: np.array) -> np.array:
    return np.add(left, right)

On doit alors obtenir des `ObjectRef` en appelant ces t√¢ches :

In [49]:
left_matrix_path, right_matrix_path = (
    Path("../course-data/01-Ray-Tasks/matrix_1.txt"),
    Path("../course-data/01-Ray-Tasks/matrix_2.txt"),
)

In [None]:
obj_ref_left_matrix = read_array.remote(left_matrix_path)
print(f"left matrix: {obj_ref_left_matrix}")

In [None]:
obj_ref_right_matrix = read_array.remote(right_matrix_path)
print(f"right matrix: {obj_ref_right_matrix}")

Ajoutons nos deux tableaux en utilisant Ray. Remarque : Nous envoyons des r√©f√©rences Ray `ObjectRef` comme arguments.

**üëá √Ä COMPLETER**

Executer les tasks en parall√®le en utilisant `function.remote(args)`.

In [52]:
# SOLUTION
result_obj_ref = add_array.remote(obj_ref_left_matrix, obj_ref_right_matrix)

**üëá √Ä COMPLETER**

Obtenir le r√©sultat en utilisant `ray.get(function)`.


In [None]:
# SOLUTION
result = ray.get(result_obj_ref)
print(f"Result: add arr1 + arr2: \n {result}")

**üëá √Ä FAIRE**

Changer une valeur dans un des fichiers qui continnent les matrices. R√©executer la case pr√©c√©dente. Que se passe-t-il ?

In [54]:
# SOLUTION
# ...Rien. En fait les t√¢ches sont execut√©es lors d'un `remote` mais on obtient le r√©sultat avec l'appel √† get.

### Exercice 2 : Suite de Fibonnaci

Dans cet exercice, on va d√©finir une fonction qui g√©n√®re une s√©quence de Fibonnaci allant de 1 √† n.

In [112]:
def generate_fibonacci(sequence_size: int) -> List[int]:
    fibonacci = []
    for i in range(0, sequence_size):
        if i < 2:
            fibonacci.append(i)
            continue
        fibonacci.append(fibonacci[i - 1] + fibonacci[i - 2])
    return fibonacci[-1]

On utilise un wrapper pour l'execution sur un cluster :

In [113]:
@ray.remote
def generate_fibonacci_distributed(sequence_size):
    return generate_fibonacci(sequence_size)

Le but est de voir la diff√©rence entre des executions locales, et des executions sur cluster. On va en lancer autant que le nombre de processeurs sur la machine.

In [None]:
number_of_tasks = os.cpu_count()
number_of_tasks

**üëá √Ä COMPL√âTER**

Compl√©ter la fonction pour qu'elle appelle la fonction `generate_fibonacci` `number_of_tasks` fois avec une sequence_size de `10 000`.

In [115]:
def run_local(sequence_size):
    # SOLUTION
    results = [generate_fibonacci(sequence_size) for _ in range(number_of_tasks)]
    return results

In [None]:
%%time
run_local(10000)

**üëá √Ä COMPL√âTER**

Compl√©ter la fonction pour qu'elle appelle la fonction `generate_fibonacci_distributed` `number_of_tasks` fois avec une sequence_size de `10 000`.

In [117]:
def run_remote(sequence_size):
    # SOLUTION
    results = ray.get(
        [
            generate_fibonacci_distributed.remote(sequence_size)
            for _ in range(number_of_tasks)
        ]
    )
    return results

In [None]:
%%time
run_remote(10000)

### Exercice 3 : La d√©pendances des t√¢ches 

Les d√©pendances entre les t√¢ches peuvent constituer des goulots d'√©tranglement.

Dans cette exercice, nous allons aggr√©ger 8 valeurs ensemble. Nous allons de faire avec une addition na√Øve d'entiers, mais pour simuler une op√©ration lourde, nous allons ajouter une instruction de `sleep`.

In [131]:
@ray.remote
def add(x, y):
    time.sleep(1)
    return x + y

Voici les deux approches que nous allons comparer.

<img src="../images/task_dependencies_graphs.png" height="50%" width="70%">

Les valeurs √† ajouter seront les suivantes :

In [143]:
values = [i for i in range(1, 8)]

**üëá √Ä COMPL√âTER**

√âcrire le code permettant d'aggr√©ger la liste de valeur en mod√©lisant l'execution lente :

In [None]:
%%time

futures = values.copy()
while len(futures) > 1:
    # SOLUTION
    futures = [add.remote(futures[0], futures[1])] + futures[2:]
result = ray.get(futures[0])
print(result)

**üëá √Ä COMPL√âTER**

√âcrire le code permettant d'aggr√©ger la liste de valeur en mod√©lisant l'execution rapide :

In [None]:
%%time

futures = values.copy()
while len(futures) > 1:
    # SOLUTION
    futures = futures[2:] + [add.remote(futures[0], futures[1])]
result = ray.get(futures[0])
print(result)

**üëá √Ä FAIRE**

Quelle est la complexit√© des deux mani√®res ? En augmentant n, on retrouve bien une correlation temporelle ?

In [152]:
# SOLUTION
# 1. Ajout lin√©aire
#
# Pour une liste de n √©l√©ments [x1,x2,‚Ä¶,xn], on effectue les op√©rations s√©quentiellement :
#     √âtape 1 : Addition x1 avec le reste -> il reste n - 1‚Äã op√©rations.
#     √âtape 2 : Addition x2 avec le reste -> il reste n - 2‚Äã op√©rations.
#     Continue jusqu'√† ce qu'il reste 1 √©lement.`
#
# Le processus s'arr√™te lorsque :
#     n - k = 1 -> k = n - 1
#     Complexit√© de profondeur : O(n)
#
# 2. Ajout par paires
#
# Pour une liste de nn √©l√©ments [x1,x2,‚Ä¶,xn][x1‚Äã,x2‚Äã,‚Ä¶,xn‚Äã], les op√©rations se font par paires :
#
#     √âtape 1 : Addition par paires -> il reste n/2‚Äã op√©rations.
#     √âtape 2 : Addition des r√©sultats par paire -> il reste n/4‚Äã op√©rations.
#     Continue jusqu'√† ce qu‚Äôil reste 1 √©l√©ment.
#
# Le processus s'arr√™te lorsque :
# n/2^(k) = 1‚ÄÖ‚Ää->‚ÄÖ‚Ääk=log‚Å°2(n)
# Complexit√© de profondeur en O(log(n))

In [153]:
ray.shutdown()

---

### Exercice pour les braves

**üëá √Ä FAIRE**

Impl√©menter un bubble sort local et un bubble sort sur cluster. Regarder l'√©volution du temps en fonction de la dimension.