# Consommation énergétique du code, utilisation de la plateforme Grid5000

# 1 Déroulement de la séance

Dans les deux prochaines séances de TP nous allons travailler sur la plateforme [grid5000](https://www.grid5000.fr/w/Grid5000:Home) pour regarder de
manière fine quelle est la consommation énergétique d’un code. Dans la première partie, nous allons apprendre
à travailler avec Grid5000. Dans la deuxième partie on se posera la question de savoir quels langages sont les
plus efficaces pour implémenter des algorithmes classiques.

Les questions alternent entre un travail sur votre machine locale/celle de l’université
ou au contraire sur la plateforme Grid5000. Dans ce dernier cas elles seront marquées d'une étoile (*).

Vous répondrez aux questions qui nécessitent une réponse, sous la forme de texte ou de code, dans le notebook
`grid5000_part1.ipynb`. Pour ouvrir ce document, il faut au préalable ouvrir `jupyter-notebook` ce qui se fait
sur les machines de l’université avec la commande  
`/opt/anaconda3/bin/jupyter-notebook`.

# 2. Créer un compte

Vous avez du recevoir un mail de grid5000 vous demandant de créer un compte pour accéder à la plateforme.

### Question 1

Générez une clef ssh. Pour cela vous utiliserez la commande suivante  
`ssh-keygen -t rsa`  
qui crée deux fichiers dans le dossier caché `./ssh`.

`id_rsa` est la clef privée (à garder secrète)
et `id_rsa.pub` la clef publique que vous transmettrez à grid5000.

### Question 2

Ne lisez pas toutes les instructions du mail mais suivez le lien proposé pour créer votre
compte. Vous aurez besoin de transmettre votre clef `id_rsa.pub` au cours du processus.

# 3. Prise en main

## 3.1 Description de l'environnement

Grid5000 est un banc de test ("testbed" en anglais). Il s’agit d’une plateforme informatique qui permet de
réaliser des tests rigoureux sur des outils de calcul numérique haute performance, notamment en calcul parallèle
et distribué.
Grid5000 s’organise de la manière suivante :  
— 8 sites en France  
— 800 noeuds localisés à Grenoble (92), Lille (39), Luxembourg (16), Lyon (132), Nancy (189), Nantes (70),
Rennes (173), Sophia (44)  
— environ 15000 coeurs au total  
Vous pourrez accéder à toutes les catactéristiques techniques du matériel [ici](https://www.grid5000.fr/w/Hardware).

## 3.2 Quelques règles simples

Les règles d’utilisation sont détaillées [ici](https://www.grid5000.fr/w/Grid5000:UsagePolicy). Pour résumer très rapidement, vous ne devez utiliser la plateforme
que pour des usages relatifs au TP proposé. On évitera notamment le minage de bitcoin...

## 3.3 Première connexion

Le schéma représenté sur cette [page](https://www.grid5000.fr/w/Getting_Started#Connecting_for_the_first_time) vous donne un aperçu de l’architecture de grid5000.

### Question 3 (*)

Dans un terminal, connectez vous à une machine d’accès via la commande  
`ssh <login>@access.grid5000.fr`  
puis connectez vous à une des 8 machines frontales (ou frontend ) associées aux différents
sites via la commande  
`ssh <site>`  
où `<site>` est à remplacer par `grenoble`, `lyon`, `nancy` etc (sans les `< >`). Votre enseignant.e vous dira quel site choisir.


### Question 4 (*)

Assurez vous que votre répertoire courant ne contient qu’un dossier public lui-même contenant un README.txt dont vous prendrez connaissance du contenu.

### Question 5

A l’aide de la commande `scp` **utilisée depuis votre machine**, copiez le fichier de votre
choix vers le dossier public de la machine frontale de grid5000 de votre choix. Le répertoire
de destination sera de la forme :  
`<login>@access.grid5000.fr:<site>/public/`  
Vérifiez que l’opération s’est passée sans encombre.

## 3.4 Réservation et utilisation des ressources

L’utilisation des ressources de grid5000 est sujette à certaines contraintes et notamment le fait qu’il faut partager ces ressources avec d’autres utilisateurs. Des outils de visualisation ([vue générale](https://www.grid5000.fr/w/Status)) permettent de connaître
l’utilisation des ressources à un instant donné (avec Monika, voir l’exemple de [Nancy](https://intranet.grid5000.fr/oar/Nancy/monika.cgi)) ou sur une certaine durée
(avec Gantt, voir [ici](https://intranet.grid5000.fr/oar/Nancy/drawgantt-svg/)).  
Dans le cadre de ce TP, il est important d’avoir réservé au préalable un certain nombre de clusters pour
que le TP puisse bien se passer. A ce stade, vos enseignants se seront chargés de cette tâche. Vous allez donc
travailler au sein de ressources réservées appelées container job et repéré par un `JOB_ID` qui vous sera donné au début du TP, ainsi qu’un des 8 sites associé.  
La réservation de ressources passe par [OAR](http://oar.imag.fr/) qui est un utilitaire développé par l’INRIA et très utilisé dans
le calcul haute performance.

### Question 6 (*)

Utilisez la commande `oarstat` et repérez les différents jobs associés à l’utilisateur `jlefevre`.  
En utilisant la visualisation Monika ou Gantt, trouvez le nombre de noeuds utilisés et la
durée d'utilisation.

Réponse: 

JOB ID 3972598: 36 noeuds, durée d'utilisation : 2h:59.    
JOB ID 3972601: 36 noeuds, durée d'utilisation : 3h.    
JOB ID 3972602: 36 noeuds, durée d'utilisation : 3h.   

### Question 7 (*)

Sachant que vous êtes 40 (Aix) ou 100 (Luminy) étudiant.e.s en parallèle pendant ce TP de
3 heures, quelle est la quantité de ressources, exprimée en noeud.heures, à répartir par étudiant.e ?

Réponse: 

100 Luminy, 36 noeud , 3h durée d'utlisations
36x3=108
108/100= 1.08 noeud.heure

**Attention, les deux questions suivantes vont s’enchainer en une minute. Le but n’est évidemment pas d’y répondre en une minute mais d’anticiper les différentes actions que vous allez devoir
faire pendant cette précieuse minute.**

### Question 8 (*)

Réservez chacun.e un seul noeud pour une durée de une minute via la commande :  
`oarsub -I -t inner=<JOB_ID> -l host=1,walltime=00:01:00 --project lab-2023-amu-licinfo-impact`
oarsub -I -t inner=3972601 -l host=1,walltime=00:01:00 --project lab-2023-amu-licinfo-impact


Vous devrez voir s’afficher un texte proche de celui-là  
`[ADMISSION RULE] Filtering out exotic resources (grouille).  
[ADMISSION RULE] Computed global resource filter: -p "maintenance = 'NO'"  
[ADMISSION_RULE] Computed resource request: -l {"((type = 'default') AND production = 'NO')
AND exotic = 'NO'"}/host=1  
OAR_JOB_ID=3270847  
`#` Interactive mode: waiting...`

### Question  9 (*)

Lancer la commande  
`stress -c 1 -t 30`  
qui va faire tourner un cpu au maximum de ses capacités pendant 30 secondes. **Attention
de bien lancer la commande pendant la minute qui vous est allouée !**

# 4. Première mesure de consommation énergétique

Dans la partie précédente vous avez utilisé un stress CPU et nous allons voir dans un premier temps comment
on peut retrouver la trace de cette activité.

### Question  10

Exécutez les deux blocs suivants pour charger les librairies et définir les 3 fonctions. Utilisez pour cela le bouton `Run`.

In [8]:
import requests
import matplotlib.pyplot as plt
from getpass import getpass as getpass
from datetime import datetime
import dateutil.parser as dp


In [15]:
def get_power(g5k_auth,node, site, start, stop, metric="pdu_outlet_power_watt"):
    url = "https://api.grid5000.fr/stable/sites/%s/metrics?nodes=%s&metrics=%s&start_time=%s&end_time=%s" % (site, node, metric, start, stop)
    print(url)
    data = requests.get(url, auth=g5k_auth).json()
    return data

def plot(values):
    plt.figure(figsize=(15,9))
    plt.plot(values)
    plt.xlabel("Axe des x: ?")
    plt.ylabel("Axe des y: ?")
    plt.show()
    
def convert_date_sec(date_string):
    return datetime.timestamp(dp.isoparse(date_string))

### Question  11

Exécutez le bloc suivant. Il vous sera demandé votre login et votre mot de passe pour grid5000 qui permettront ensuite d’adresser des
requêtes à l’API de Grid5000.

In [16]:
# Identification

user = input(f"Grid'5000 username: ")
password = getpass("Grid'5000 password: ")
g5k_auth = (user, password) 

NameError: name 'getpass' is not defined

### Question 12

Regardez ensuite la fonction `get_power` et appelez là dans le bloc prévu à cet effet sans
mentionner de métrique particulière. Verifiez que l’affichage du résultat avec `print` donne
une liste vide.

In [9]:
# Première requete
# node : noeud sur lequel le premier stress cpu a tourné
# site : site de la frontale
# start_time et stop_time sont des dates au format ISO8601, par exemple "2021-12-31T23:59"
node = "gros-80"
site = "nancy"
start_time = "2023-01-16T19:28"
stop_time = "2023-01-16T19:31"
data = get_power(g5k_auth,node, site, start_time, stop_time)
print(data)

NameError: name 'g5k_auth' is not defined

La variable `node` désigne le noeud sur lequel vous avez lancé votre stress cpu précédemment. `start_time` et
`stop_time` correspondent aux instants entre lesquels vous souhaitez mesurer la puissance électrique utilisée par
le noeud. Un instant devra s’exprimer selon la [norme 8601] (https://fr.wikipedia.org/wiki/ISO_8601) , par exemple "2021-12-31T23:59". Si vous voulez
retrouver précisément le moment où votre job a été lancé, vous pourrez consulter [Gantt](https://intranet.grid5000.fr/oar/Nancy/drawgantt-svg/).

### Question  13

En regardant le tableau au bas de la [page](https://www.grid5000.fr/w/Monitoring_Using_Kwollect) dédiée aux métriques disponibles sur grid5000 et le
paramètre par défaut de `get_power` vous devriez comprendre pourquoi il ne s’est rien affiché
précedemment. Modifiez alors l’appel de fonction précédent en utilisant une des métriques
utilisées sur votre noeud de calcul pour monitorer la puissance. Sauf problèmes de dernière
minute la métrique à utiliser sera `pdu_outlet_power_watt`.

Réponse:

In [2]:
#dans la fonction get_power metric:"bmc_fan_power_watt" Le metric nest pas le bon faut le changer pour: metric="pdu_outlet_power_watt"
def get_power(g5k_auth,node, site, start, stop, metric="pdu_outlet_power_watt"):
    url = "https://api.grid5000.fr/stable/sites/%s/metrics?nodes=%s&metrics=%s&start_time=%s&end_time=%s" % (site, node, metric, start, stop)
    print(url)
    data = requests.get(url, auth=g5k_auth).json()
    return data

def plot(values):
    plt.figure(figsize=(15,9))
    plt.plot(values)
    plt.xlabel("Axe des x: ?")
    plt.ylabel("Axe des y: ?")
    plt.show()
    
def convert_date_sec(date_string):
    return datetime.timestamp(dp.isoparse(date_string))

### Question 14

Regardez l’affichage du résultat sur le notebook. Quelle est la structure de données de chaque
élément de la liste `data` ? Trouvez comment récupérer l’information de puissance en Watt. Enfin,
après avoir construit la séquence de toutes les puissances, affichez graphiquement l’évolution
du profil de puissance au cours du temps en utilisant la fonction `plot` fournie. Ajoutez une
légende pour les axes.

Réponse:

In [37]:
##C'est un fichier Json
import matplotlib.pyplot as plt
import json

dictionary = json.load(open('data.json'))
#print(dictionary)

values  = dictionary
plot(values)



AttributeError: 'list' object has no attribute 'get'

### Question 15

Récupérez l’information temporelle dans `data` et la convertir en secondes depuis le temps
de début de l’expérience. Vous utiliserez la fonction `convert_date_sec` qui est fournie dans
le notebook.

Réponse:

### Question 16

Faites ensuite l’affichage de la température du processeur, en reprenant une métrique adaptée. Superposez les courbes de puissance et de température et conclure.

Réponse:

# 5. Autres expériences et mesures

Dans cette partie vous allez faire plusieurs expériences en utilisant toujours la fonction `stress` et en faisant
varier ses paramètres. Un des objectifs est notamment de regarder l’évolution de la puissance et de la température du CPU avec le nombre de coeurs utilisés.

### Question 17 (*)

Dans la fonction `stress` faites varier le nombre de CPU de 1 à 8 avec une pause d’une
minute entre chaque appel de fonction. Attention, vous réserverez un noeud pour 5 minutes
maximum. Il est très recommandé de faire un script python ou bash pour automatiser le
processus.

### Question 18

Affichez le profil de puissance en fonction du temps. Dans une autre figure vous afficherez
la puissance maximale en fonction du nombre de CPU, ainsi que la variation de puissance
par rapport à l’état inactif (idle).

Réponse:

### Question 19

Faites la même analyse avec la température maximale.

Réponse:

### Question 20 (*)

Reprenez une expérimentation avec stress en fixant un nombre de CPU et en variant la
durée, entre 30 secondes et 2 minutes avec une pause d’une minute entre chaque appel. Le
noeud devra être réservé pour 8 minutes maximum.

### Question 21

Faites une synthèse des résultats obtenus et proposez d’autres expérimentations qui permettraient d’aller un peu plus loin dans vos conclusions.

Réponse:

# 6 Evaluation globale de la consommation de grid5000 (bonus)

S’il vous reste du temps, vous pourrez évaluer grossièrement ou plus finement la consommation énergétique
d’une plateforme comme grid5000, en comptabilisant tous les clusters des différents sites et en envisageant
différents taux d’utilisation possible.  
Vous pourrez par exemple consulter les caractéristiques techniques du matériel sur cette [page](https://www.grid5000.fr/w/Hardware). Pour avoir
une estimation plus fine, vous pourrez utiliser l’API de grid5000 et vous inspirer de ce [code](https://www.grid5000.fr/w/Getting_Started#Retrieving_information_from_API_with_python) pour interroger les
différents sites, puis les différents clusters et enfin compter le nombre de CPU sur les différents noeuds. Des
hypothèses seront nécessaires pour extrapoler la consommation sur votre noeud d’expérimentation à tous les
autres noeuds de Grid5000.  
Vous pourrez donner les résultats en kW.h, en émissions de CO2 par an et en euros. On rappelle des
informations sur :  
— La quantité de CO2 par kWh, via le site de [Rte-France](https://www.rte-france.com/eco2mix/les-emissions-de-co2-par-kwh-produit-en-france)  
— Le prix du kWh à environ 15 centimes.

Réponse: