# Importations et Configuration Initiale

In [None]:
import enoslib as en
import logging
import os
from pathlib import Path
import time

# --- Configuration de l'exp√©rience ---

# Configurez le logging pour avoir un retour clair sur les √©tapes
logging.basicConfig(level=logging.INFO)



G5K_SITE = "rennes"  # Site Grid'5000 √† utiliser

# Nom du job pour la r√©servation sur Grid'5000
JOB_NAME = "K8sEnoslibDeploy"

# Cl√© SSH, par d√©faut enoslib cherche ~/.ssh/id_rsa
# Si vous en utilisez une autre, d√©commentez et modifiez la ligne suivante :
# en.set_config(ssh_key="~/.ssh/ma_cle_ssh")

# Cr√©ation du chemin pour les sorties (par exemple, inventaire)
Path("inventory").mkdir(exist_ok=True)
OUTPUT_INVENTORY = "inventory/g5k_inventory.yaml"

print("Configuration initiale charg√©e.")


# D√©finition des Ressources pour le Cluster

In [None]:
# CELLULE 2
# D√©finition de la configuration pour la connexion √† Grid'5000
# en.set_provider(
#     en.G5k(
#         username=G5K_USER,
#         site=G5K_SITE,
#         job_name=JOB_NAME,
#     )
# )

# D√©finition des ressources √† r√©server
# 1 n≈ìud master et 2 n≈ìuds workers
# Tous les n≈ìuds seront d√©ploy√©s avec Ubuntu 22.04
conf = (
en.G5kConf.from_settings(
    job_name=JOB_NAME,
    job_type=["deploy"],
    walltime="02:00:00", # R√©servez pour 5 heures
    env_name="ubuntu2204-min"
).add_machine(
    roles=["master"],
    cluster="paradoxe",
    nodes=1
).add_machine(
    roles=["workers"],
    cluster="paradoxe",
    nodes=2
)
)

print("D√©finition des ressources termin√©e.")

# Ex√©cution de la R√©servation et du D√©ploiement

In [None]:

provider = en.G5k(conf)
# D√©marrage de la r√©servation et du d√©ploiement
# provider.init() bloque jusqu'√† ce que les noeuds soient pr√™ts

roles, networks = provider.init()

# R√©cup√©ration des informations sur les r√¥les pour les cellules suivantes
#roles = reservation.get_roles()
master_node = roles["master"]
worker_nodes = roles["workers"]

print("--- R√©servation et d√©ploiement termin√©s ! ---")
print(f"Master: {[node.address for node in master_node]}")
print(f"Workers: {[node.address for node in worker_nodes]}")
#print(f"Tous les n≈ìuds: roles" + str(roles))

#  Pr√©paration Commune de Tous les N≈ìuds

In [None]:
# Script de configuration commun
COMMON_SETUP_SCRIPT = """
#!/bin/bash -xe
sudo apt-get update -y
sudo apt-get install -y software-properties-common gpg curl apt-transport-https ca-certificates jq
cat <<EOF | sudo tee /etc/modules-load.d/k8s.conf
overlay
br_netfilter
EOF
sudo modprobe overlay
sudo modprobe br_netfilter
cat <<EOF | sudo tee /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-iptables  = 1
net.bridge.bridge-nf-call-ip6tables = 1
net.ipv4.ip_forward                 = 1
EOF
sudo sysctl --system
sudo swapoff -a
curl -fsSL https://pkgs.k8s.io/addons:/cri-o:/prerelease:/main/deb/Release.key | gpg --dearmor | sudo tee /etc/apt/keyrings/cri-o-apt-keyring.gpg >/dev/null
echo "deb [signed-by=/etc/apt/keyrings/cri-o-apt-keyring.gpg] https://pkgs.k8s.io/addons:/cri-o:/prerelease:/main/deb/ /" | sudo tee /etc/apt/sources.list.d/cri-o.list
sudo apt-get update -y
sudo apt-get install -y cri-o
sudo systemctl enable --now crio
KUBERNETES_VERSION="1.30"
sudo mkdir -p /etc/apt/keyrings
curl -fsSL https://pkgs.k8s.io/core:/stable:/v$KUBERNETES_VERSION/deb/Release.key | sudo gpg --dearmor -o /etc/apt/keyrings/kubernetes-apt-keyring.gpg
echo "deb [signed-by=/etc/apt/keyrings/kubernetes-apt-keyring.gpg] https://pkgs.k8s.io/core:/stable:/v$KUBERNETES_VERSION/deb/ /" | sudo tee /etc/apt/sources.list.d/kubernetes.list
sudo apt-get update
sudo apt-get install -y kubelet=1.30.0-1.1 kubectl=1.30.0-1.1 kubeadm=1.30.0-1.1
sudo apt-mark hold kubelet kubeadm kubectl
IFACE=$(ip route | grep default | awk '{print $5}')
local_ip=$(ip --json addr show $IFACE | jq -r '.[0].addr_info[] | select(.family == "inet") | .local')
echo "KUBELET_EXTRA_ARGS=--node-ip=$local_ip" | sudo tee /etc/default/kubelet
"""

# Ex√©cution du script sur tous les n≈ìuds
print("Lancement de la pr√©paration commune...")
with en.actions(roles=roles) as p:
    p.shell(COMMON_SETUP_SCRIPT)
print("Pr√©paration commune termin√©e.")

##  V√©rification de la Pr√©paration des N≈ìuds

In [None]:
# Script de v√©rification (inchang√©)
VERIFY_PREP_SCRIPT = """
#!/bin/bash -e
echo "--- V√©rification de l'√©tat des n≈ìuds ---"
echo "[V√âRIF] Service CRI-O (runtime de conteneurs)..."
sudo systemctl is-active --quiet crio
echo "‚úÖ OK: Le service CRI-O est actif."
echo "[V√âRIF] Binaires Kubernetes..."
kubelet --version
kubeadm version
echo "‚úÖ OK: Les binaires Kubelet et Kubeadm sont install√©s."
echo "[V√âRIF] Modules Kernel..."
lsmod | grep -q br_netfilter && echo "‚úÖ OK: Module 'br_netfilter' est charg√©."
lsmod | grep -q overlay && echo "‚úÖ OK: Module 'overlay' est charg√©."
echo "\nüéâ La pr√©paration de ce n≈ìud est valid√©e."
"""

# 1. On ex√©cute les actions (comme avant)
print("Lancement de la v√©rification sur tous les n≈ìuds...")
with en.actions(roles=roles) as p:
    p.shell(VERIFY_PREP_SCRIPT)

results = p.results
verify = results[0].stdout.strip()
print(verify)
# # 2. ‚úÖ NOUVEAU : On r√©cup√®re et on affiche les r√©sultats APR√àS le bloc
# print("\n--- R√âSULTATS DE LA V√âRIFICATION ---")
# results = p.get_results()

# # On boucle sur les r√©sultats de chaque machine
# for r in results:
#     print(f"\n======== N≈ìud: {r.host} ========")
#     print(r.stdout) # Affiche la sortie standard de la commande
    
#     # Optionnel : Affiche les erreurs s'il y en a
#     if r.stderr:
#         print(f"-------- Erreurs (stderr) pour {r.host} --------")
#         print(r.stderr)

#  Initialisation du Master

In [None]:
# Script d'initialisation du master
MASTER_INIT_SCRIPT = """
#!/bin/bash -xe
IFACE=$(ip route | grep default | awk '{print $5}')
IPADDR=$(ip -4 addr show $IFACE | grep -oP '(?<=inet\s)\d+(\.\d+){3}')
NODENAME=$(hostname -s)
sudo kubeadm init --pod-network-cidr=192.168.0.0/16 --apiserver-advertise-address=$IPADDR --node-name $NODENAME --cri-socket unix:///var/run/crio/crio.sock --ignore-preflight-errors=Swap
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
kubectl apply -f https://docs.projectcalico.org/manifests/calico.yaml
"""

# Ex√©cution du script sur le master
print("Initialisation du master...")
with en.actions(roles=master_node) as p:
    p.shell(MASTER_INIT_SCRIPT)
print("Initialisation du master termin√©e.")

# Jonction des Workers

In [None]:
# 1. R√©cup√©rer la commande de jonction depuis le master
print("R√©cup√©ration de la commande de jonction depuis le master...")
with en.actions(roles=master_node) as p:
    p.shell("sudo kubeadm token create --print-join-command")

# R√©cup√©ration des r√©sultats apr√®s le bloc
results = p.results
join_command = results[0].stdout.strip()
print(f"‚úÖ Commande de jonction r√©cup√©r√©e: {join_command}")

# 2. Ex√©cuter la commande sur les workers
print("Les workers rejoignent le cluster...")
with en.actions(roles=worker_nodes) as p:
    p.shell(f"sudo {join_command}")

print("Workers joints. Attente de 60s pour la stabilisation...")
#time.sleep(60)

# V√©rification du Cluster

In [None]:
# Ex√©cution de kubectl get nodes sur le master pour v√©rifier
with en.actions(roles=master_node) as p:
    p.shell("kubectl get nodes -o wide")

results = p.results
nodes = results[0].stdout.strip()
print("--- √âtat du cluster ---")
print(nodes)

 ## Installation des Add-ons

In [None]:
# Script pour installer les add-ons
ADDONS_SCRIPT = """
#!/bin/bash -e

echo "--- Installation du Metrics Server ---"
kubectl apply -f https://raw.githubusercontent.com/techiescamp/kubeadm-scripts/main/manifests/metrics-server.yaml

echo ""
echo "--- Installation d'Ingress-NGINX ---"
kubectl apply -f https://raw.githubusercontent.com/kubernetes/ingress-nginx/controller-v1.13.0/deploy/static/provider/baremetal/deploy.yaml

echo ""
echo "Installation des add-ons termin√©e."
"""

# Ex√©cution du script sur le master
print("Installation des add-ons sur le n≈ìud master...")
with en.actions(roles=master_node) as p:
    p.shell(ADDONS_SCRIPT)

# R√©cup√©ration de la sortie comme vous l'avez sp√©cifi√©
print("\n--- R√©sultat de l'installation ---")
if p.results:
    output = p.results[0].stdout.strip()
    print(output)
else:
    print("Aucun r√©sultat √† afficher. V√©rifiez les erreurs potentielles.")

# D√©ploiement et Test d'une Application

In [None]:
# Script pour d√©ployer l'application de test et son service
APP_DEPLOY_SCRIPT = """
#!/bin/bash -e

echo "--- Cr√©ation du Deployment et du Service pour l'application echoserver ---"

# On utilise un 'heredoc' pour passer le YAML directement √† kubectl
cat <<EOF | kubectl apply -f -
apiVersion: apps/v1
kind: Deployment
metadata:
  name: echoserver
spec:
  replicas: 2
  selector:
    matchLabels:
      app: echoserver
  template:
    metadata:
      labels:
        app: echoserver
    spec:
      containers:
      - name: echoserver
        image: registry.k8s.io/echoserver:1.10
        ports:
        - containerPort: 8080
---
apiVersion: v1
kind: Service
metadata:
  name: echoserver
spec:
  type: NodePort
  selector:
    app: echoserver
  ports:
  - port: 80
    targetPort: 8080
EOF

echo "\n--- Attente de 15 secondes pour le d√©marrage des pods ---"
sleep 15

echo "\n--- V√©rification du statut du d√©ploiement ---"
kubectl get deployment echoserver

echo "\n--- V√©rification des pods (devrait en afficher 2) ---"
kubectl get pods -l app=echoserver

echo "\n--- V√©rification du service (notez le port apr√®s '80:') ---"
kubectl get service echoserver
"""

# Ex√©cution du script sur le master
print("D√©ploiement de l'application de test...")
with en.actions(roles=master_node) as p:
    p.shell(APP_DEPLOY_SCRIPT)

# Affichage du r√©sultat
print("\n--- R√©sultat du d√©ploiement ---")
if p.results:
    output = p.results[0].stdout.strip()
    print(output)

### Envoyez une Requ√™te

In [None]:
# R√©cup√®re l'adresse IP du master
master_ip = master_node[0].address 

# Remplacez 31192 par le port que vous avez obtenu √† l'√©tape 1
node_port = 32202 # ‚ö†Ô∏è CHANGEZ CE PORT

# Test avec curl depuis le master
with en.actions(roles=master_node) as p:
    p.shell(f"curl http://{master_ip}:{node_port}")

if p.results:
    print("--- R√©ponse du serveur ---")
    print(p.results[0].stdout)

# Installation de la Suite de Monitoring (Prometheus & Grafana)

In [None]:
# Script pour d√©ployer la suite de monitoring
MONITORING_SCRIPT = """
#!/bin/bash -e

echo "--- Installation de la suite Prometheus + Grafana via kube-prometheus ---"

# 1. Cloner le d√©p√¥t qui contient les manifestes
if [ ! -d "kube-prometheus" ]; then
    echo "Clonage du d√©p√¥t kube-prometheus..."
    git clone https://github.com/prometheus-operator/kube-prometheus.git
else
    echo "D√©p√¥t kube-prometheus d√©j√† pr√©sent."
fi
cd kube-prometheus

# 2. Appliquer les d√©finitions de ressources (CRDs) et la configuration de base
echo "√âtape 1/3 : Application des CRDs et de la configuration 'setup'..."
kubectl apply --server-side -f manifests/setup

# Attendre que les CRDs soient bien enregistr√©s dans le cluster avant de continuer
echo "Attente de l'√©tablissement des CRDs..."
kubectl wait --for condition=Established --all CustomResourceDefinition --timeout=300s

# 3. Appliquer le reste de la suite (Prometheus, Grafana, Alertmanager, etc.)
echo "√âtape 2/3 : Application des manifestes de la suite de monitoring..."
kubectl apply -f manifests/

# 4. Attendre que les d√©ploiements cl√©s soient pr√™ts dans le namespace 'monitoring'
echo "√âtape 3/3 : Attente du d√©marrage de Prometheus et Grafana (peut prendre quelques minutes)..."
kubectl wait --for=condition=available deployment/prometheus-k8s -n monitoring --timeout=300s
kubectl wait --for=condition=available deployment/grafana -n monitoring --timeout=300s

echo ""
echo "--- V√©rification des pods dans le namespace 'monitoring' ---"
kubectl get pods -n monitoring

echo "\nüéâ Suite de monitoring Prometheus et Grafana install√©e avec succ√®s !"
"""

# Ex√©cution du script sur le master
print("Lancement de l'installation de la suite de monitoring...")
with en.actions(roles=master_node) as p:
    p.shell(MONITORING_SCRIPT)

# Affichage du r√©sultat
print("\n--- R√©sultat de l'installation ---")
if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## V√©rification des Composants de Monitoring

In [None]:
# Script pour lister les pods et services de monitoring
VERIFY_MONITORING_SCRIPT = """
#!/bin/bash

echo "--- Pods dans le namespace 'monitoring' ---"
kubectl get pods -n monitoring -o wide

echo ""
echo "--- Services dans le namespace 'monitoring' ---"
kubectl get services -n monitoring
echo ""
echo "--- ServiceAccounts dans le namespace 'monitoring' ---"
kubectl get serviceaccounts -n monitoring
"""

# Ex√©cution du script de v√©rification sur le master
print("R√©cup√©ration de l'√©tat des composants de monitoring...")
with en.actions(roles=master_node) as p:
    p.shell(VERIFY_MONITORING_SCRIPT)

# Affichage du r√©sultat
if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## Mise √† Jour des NetworkPolicies pour l'Acc√®s Externe

In [None]:
# Script pour mettre √† jour les NetworkPolicies
UPDATE_NP_SCRIPT = """
#!/bin/bash -e

echo "--- 1. Mise √† jour de la NetworkPolicy de Grafana ---"
cat <<EOF | kubectl apply -f -
apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: grafana
  namespace: monitoring
  labels:
    app.kubernetes.io/component: grafana
    app.kubernetes.io/name: grafana
    app.kubernetes.io/part-of: kube-prometheus
    app.kubernetes.io/version: 12.2.0
spec:
  podSelector:
    matchLabels:
      app.kubernetes.io/component: grafana
      app.kubernetes.io/name: grafana
      app.kubernetes.io/part-of: kube-prometheus
  policyTypes:
  - Ingress
  - Egress
  ingress:
  - from:
    # On autorise le trafic depuis n'importe quelle adresse IP (externe/interne)
    - ipBlock:
        cidr: 0.0.0.0/0
    # On garde la r√®gle existante qui autorise Prometheus
    - podSelector:
        matchLabels:
          app.kubernetes.io/name: prometheus
    ports:
    - port: 3000
      protocol: TCP
  egress:
  - {}
EOF

echo "\n--- 2. Mise √† jour de la NetworkPolicy de Prometheus ---"
cat <<EOF | kubectl apply -f -
apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: prometheus-k8s
  namespace: monitoring
  labels:
    app.kubernetes.io/component: prometheus
    app.kubernetes.io/instance: k8s
    app.kubernetes.io/name: prometheus
    app.kubernetes.io/part-of: kube-prometheus
    app.kubernetes.io/version: 3.6.0
spec:
  podSelector:
    matchLabels:
      app.kubernetes.io/component: prometheus
      app.kubernetes.io/instance: k8s
      app.kubernetes.io/name: prometheus
      app.kubernetes.io/part-of: kube-prometheus
  policyTypes:
  - Ingress
  - Egress
  ingress:
  - from:
    # On autorise le trafic depuis n'importe quelle adresse IP
    - ipBlock:
        cidr: 0.0.0.0/0
    # On garde les r√®gles existantes pour la communication interne
    - namespaceSelector: {}
    - podSelector:
        matchLabels:
          app.kubernetes.io/name: prometheus
    - podSelector:
        matchLabels:
          app.kubernetes.io/name: prometheus-adapter
    - podSelector:
        matchLabels:
          app.kubernetes.io/name: grafana
    ports:
    - port: 9090
      protocol: TCP
    - port: 8080
      protocol: TCP
  egress:
  - {}
EOF

echo "\nNetworkPolicies mises √† jour avec succ√®s pour autoriser l'acc√®s externe."
"""

# Ex√©cution du script sur le master
print("Mise √† jour des NetworkPolicies...")
with en.actions(roles=master_node) as p:
    p.shell(UPDATE_NP_SCRIPT)

# Affichage du r√©sultat
if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## Passage des Services en NodePort

In [None]:
# Script pour patcher les services en NodePort
PATCH_SERVICES_SCRIPT = """
#!/bin/bash -e

echo "--- 1. Modification du service Grafana en type NodePort ---"
kubectl patch service grafana -n monitoring -p '{"spec": {"type": "NodePort"}}'

echo ""
echo "--- 2. Modification du service Prometheus en type NodePort ---"
kubectl patch service prometheus-k8s -n monitoring -p '{"spec": {"type": "NodePort"}}'

echo ""
echo "--- 3. V√©rification du r√©sultat ---"
# Petite pause pour s'assurer que l'API server a bien trait√© les changements
sleep 2
kubectl get services -n monitoring
"""

# Ex√©cution du script sur le master
print("Patch des services Grafana et Prometheus en NodePort...")
with en.actions(roles=master_node) as p:
    p.shell(PATCH_SERVICES_SCRIPT)

# Affichage du r√©sultat
print("\n--- R√©sultat de la commande patch ---")
if p.results:
    output = p.results[0].stdout.strip()
    print(output)

# Installer Kepler depuis les Manifestes Locaux

In [None]:
import os

# --- √âtape 1 : Copier le r√©pertoire local 'kepler' vers le master ---

source_dir = "kepler"
dest_dir = "/tmp/kepler"

if not os.path.isdir(source_dir):
    raise FileNotFoundError(f"Le r√©pertoire local '{source_dir}' est introuvable.")

print(f"--- Copie du r√©pertoire local '{source_dir}' vers '{dest_dir}' sur le master... ---")
with en.actions(roles=master_node) as p:
    p.copy(src=source_dir, dest="/tmp/")

if p.results and p.results[0].status == "OK":
    print("R√©pertoire copi√© avec succ√®s.")
else:
    print("Erreur lors de la copie du r√©pertoire.")
    if p.results:
        print(p.results[0].stderr)


# --- √âtape 2 : Appliquer les manifestes et v√©rifier ---

# Script simplifi√© : la cr√©ation du namespace est g√©r√©e par les manifestes
APPLY_KEPLER_MANIFESTS_SCRIPT = f"""
#!/bin/bash -e

echo "--- Application de tous les manifestes depuis le r√©pertoire {dest_dir} ---"
kubectl apply -f "{dest_dir}"

echo ""
echo "--- Attente de 30 secondes pour le d√©marrage des pods ---"
sleep 30

echo ""
echo "--- V√©rification du statut des pods dans le namespace 'kepler' ---"
kubectl get pods -n kepler

echo "--- V√©rification que le Service a bien √©t√© cr√©√© ---"
kubectl get svc -n kepler -o wide

echo ""
echo "üéâ Kepler a √©t√© d√©ploy√© √† partir des manifestes locaux."
"""

print(f"\n--- Application des manifestes sur le cluster... ---")
with en.actions(roles=master_node) as p:
    p.shell(APPLY_KEPLER_MANIFESTS_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## Diagnostic - Pourquoi Prometheus ne Scrape pas Kepler ?

In [None]:
# Script de diagnostic complet pour identifier pourquoi Prometheus ne scrape pas Kepler
DIAGNOSTIC_KEPLER_PROMETHEUS = """
#!/bin/bash

echo "======================================================================"
echo "üîç DIAGNOSTIC COMPLET: Prometheus ‚Üî Kepler"
echo "======================================================================"

echo ""
echo "--- 1. V√©rification des Pods Kepler ---"
kubectl get pods -n kepler -o wide

echo ""
echo "--- 2. V√©rification du Service Kepler ---"
kubectl get svc -n kepler -o wide

echo ""
echo "--- 3. V√©rification des Labels du Service Kepler ---"
echo "Les labels sont CRITIQUES pour que le ServiceMonitor fonctionne!"
kubectl get svc -n kepler -o yaml | grep -A 10 "labels:"

echo ""
echo "--- 4. V√©rification du ServiceMonitor Kepler ---"
kubectl get servicemonitor -n kepler -o wide

echo ""
echo "--- 5. D√©tails du ServiceMonitor (selector et labels) ---"
kubectl get servicemonitor -n kepler -o yaml | grep -A 20 "selector:"

echo ""
echo "--- 6. V√©rification que Prometheus-Operator voit le ServiceMonitor ---"
echo "Prometheus doit √™tre dans le m√™me namespace ou avec les bonnes r√®gles RBAC"
kubectl get servicemonitor -A

echo ""
echo "--- 7. Configuration de Prometheus pour ServiceMonitor ---"
echo "V√©rification des serviceMonitorSelector dans Prometheus:"
kubectl get prometheus -n monitoring -o yaml | grep -A 5 "serviceMonitorSelector:"

echo ""
echo "--- 8. V√©rification des Endpoints Kepler ---"
echo "Si pas d'endpoints, le service ne pointe vers rien!"
kubectl get endpoints -n kepler

echo ""
echo "--- 9. Test direct du endpoint Kepler ---"
KEPLER_POD=`kubectl get pods -n kepler -l app.kubernetes.io/name=kepler -o jsonpath='{.items[0].metadata.name}'`
if [ -n "$KEPLER_POD" ]; then
    echo "Test de l'endpoint metrics sur le pod $KEPLER_POD:"
    kubectl exec -n kepler $KEPLER_POD -- curl -s localhost:9102/metrics | head -20
else
    echo "‚ùå Aucun pod Kepler trouv√©!"
fi

echo ""
echo "--- 10. V√©rification des Logs Prometheus ---"
echo "Recherche d'erreurs li√©es √† Kepler dans les logs Prometheus:"
PROM_POD=`kubectl get pods -n monitoring -l app.kubernetes.io/name=prometheus -o jsonpath='{.items[0].metadata.name}'`
if [ -n "$PROM_POD" ]; then
    kubectl logs -n monitoring $PROM_POD -c prometheus --tail=50 | grep -i kepler || echo "Aucune mention de Kepler dans les logs r√©cents"
else
    echo "‚ùå Pod Prometheus non trouv√©!"
fi

echo ""
echo "--- 11. Configuration Actuelle des Targets Prometheus ---"
echo "V√©rifiez si Kepler appara√Æt dans les targets de Prometheus"
echo "üí° Acc√©dez √† l'UI Prometheus: Status ‚Üí Targets"
echo "üí° Ou utilisez l'API: curl http://prometheus-ip:port/api/v1/targets"

echo ""
echo "======================================================================"
echo "üéØ CAUSES COMMUNES ET SOLUTIONS:"
echo "======================================================================"
echo ""
echo "‚ùå PROBL√àME 1: Labels incompatibles"
echo "   Le ServiceMonitor cherche des labels sp√©cifiques sur le Service"
echo "   Solution: V√©rifiez que les labels du Service matchent le selector du ServiceMonitor"
echo ""
echo "‚ùå PROBL√àME 2: Namespace incorrect"
echo "   Le ServiceMonitor doit √™tre dans un namespace que Prometheus surveille"
echo "   Solution: Soit mettre le ServiceMonitor dans 'monitoring', soit configurer Prometheus"
echo ""
echo "‚ùå PROBL√àME 3: serviceMonitorSelector vide"
echo "   Prometheus n'est configur√© pour surveiller AUCUN ServiceMonitor"
echo "   Solution: Configurer prometheus.serviceMonitorSelector: {}"
echo ""
echo "‚ùå PROBL√àME 4: Port incorrect"
echo "   Le ServiceMonitor pointe vers un port qui n'existe pas"
echo "   Solution: V√©rifier que le port dans ServiceMonitor = port du Service"
echo ""
echo "======================================================================"
"""

# --- Enregistrer le script dans un fichier local ---
script_path = "diagnostic_kepler.sh"
with open(script_path, "w") as f:
    f.write(DIAGNOSTIC_KEPLER_PROMETHEUS)
os.chmod(script_path, 0o755)

print("üîç Lancement du diagnostic complet Prometheus ‚Üî Kepler...")
with en.actions(roles=master_node) as p:
    p.script(script_path)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## üîß Solution : Donner les Permissions RBAC √† Prometheus pour Kepler

In [None]:
# Script pour corriger les permissions RBAC de Prometheus
FIX_PROMETHEUS_RBAC = """
#!/bin/bash -e

echo "========================================================================"
echo "üîß Correction des Permissions RBAC pour Prometheus ‚Üí Kepler"
echo "========================================================================"

echo ""
echo "--- Cr√©ation d'un ClusterRole avec les permissions n√©cessaires ---"
cat <<EOF | kubectl apply -f -
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: prometheus-kepler-access
rules:
- apiGroups: [""]
  resources:
  - services
  - endpoints
  - pods
  verbs: ["get", "list", "watch"]
- apiGroups: ["discovery.k8s.io"]
  resources:
  - endpointslices
  verbs: ["get", "list", "watch"]
EOF

echo ""
echo "--- Liaison du ClusterRole au ServiceAccount prometheus-k8s ---"
cat <<EOF | kubectl apply -f -
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: prometheus-kepler-access
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: prometheus-kepler-access
subjects:
- kind: ServiceAccount
  name: prometheus-k8s
  namespace: monitoring
EOF

echo ""
echo "--- V√©rification des permissions cr√©√©es ---"
kubectl get clusterrole prometheus-kepler-access
kubectl get clusterrolebinding prometheus-kepler-access

echo ""
echo "--- Red√©marrage des pods Prometheus pour appliquer les changements ---"
kubectl rollout restart statefulset prometheus-k8s -n monitoring

echo ""
echo "--- Attente du red√©marrage de Prometheus (30 secondes) ---"
sleep 30

echo ""
echo "--- V√©rification que Prometheus est pr√™t ---"
kubectl wait --for=condition=ready pod -l app.kubernetes.io/name=prometheus -n monitoring --timeout=120s

echo ""
echo "========================================================================"
echo "‚úÖ Permissions RBAC configur√©es avec succ√®s !"
echo "========================================================================"
echo ""
echo "Prometheus peut maintenant acc√©der aux EndpointSlices du namespace kepler."
echo "Attendez 1-2 minutes puis v√©rifiez les targets dans l'UI Prometheus."
"""

print("üîß Application de la correction RBAC...")
with en.actions(roles=master_node) as p:
    p.shell(FIX_PROMETHEUS_RBAC)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

# D√©ploiement des Ressources PowerCap

In [None]:
import os

# --- Script pour d√©ployer tous les manifestes PowerCap ---

source_dir = "powercap"
dest_dir = "/tmp/powercap"

# V√©rifier que le r√©pertoire local existe
if not os.path.isdir(source_dir):
    print(f"‚ö†Ô∏è  Le r√©pertoire local '{source_dir}' n'existe pas.")
    print(f"üìÅ Veuillez cr√©er le dossier '{source_dir}' avec les fichiers suivants:")
    print("   - daemonset.yaml")
    print("   - rbac.yaml")
    print("   - configmap.yaml")
    print("\nüí° Ou uploadez le dossier complet dans le r√©pertoire de travail.")
    raise FileNotFoundError(f"Le r√©pertoire local '{source_dir}' est introuvable. Cr√©ez-le d'abord avec les manifestes n√©cessaires.")

# --- √âtape 1 : Copier le r√©pertoire local vers le master ---
print(f"--- Copie du r√©pertoire '{source_dir}' vers '{dest_dir}' sur le master... ---")
with en.actions(roles=master_node) as p:
    p.copy(src=source_dir, dest="/tmp/")

if p.results and p.results[0].status == "OK":
    print("‚úÖ R√©pertoire copi√© avec succ√®s.")
else:
    print("‚ùå Erreur lors de la copie du r√©pertoire.")
    if p.results:
        print(p.results[0].stderr)

# --- √âtape 2 : Appliquer tous les manifestes ---
DEPLOY_POWERCAP_SCRIPT = f"""
#!/bin/bash -e

echo "========================================================================"
echo "üöÄ D√©ploiement des Ressources PowerCap dans le namespace 'default'"
echo "========================================================================"

echo ""
echo "--- Application de tous les manifestes depuis {dest_dir} ---"
kubectl apply -f "{dest_dir}"

# echo ""
# echo "--- Attente de 30 secondes pour la cr√©ation des ressources ---"
# sleep 30

echo ""
echo "--- V√©rification du DaemonSet powercap-manager ---"
kubectl get daemonset powercap-manager -n default -o wide

echo ""
echo "--- V√©rification des pods powercap-manager ---"
kubectl get pods -n default -l app=powercap-manager -o wide

echo ""
echo "--- Statut du DaemonSet (nombre de pods pr√™ts) ---"
kubectl rollout status daemonset/powercap-manager -n default --timeout=60s

echo ""
echo "--- V√©rification du ServiceAccount ---"
kubectl get serviceaccount powercap-manager -n default

echo ""
echo "--- V√©rification de la ConfigMap ---"
kubectl get configmap powercap-config -n default

echo ""
echo "--- V√©rification des services (si pr√©sents) ---"
kubectl get services -n default -l app=powercap-manager || echo "Aucun service trouv√©"

echo ""
echo "========================================================================"
echo "‚úÖ D√©ploiement PowerCap termin√© !"
echo "========================================================================"
"""

print("\n--- D√©ploiement des ressources PowerCap... ---")
with en.actions(roles=master_node) as p:
    p.shell(DEPLOY_POWERCAP_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## V√©rification de l'√âtat et des Logs PowerCap

In [None]:
# Script pour v√©rifier l'√©tat d√©taill√© et afficher les logs
CHECK_POWERCAP_STATUS_LOGS = """
#!/bin/bash

echo "========================================================================"
echo "üìä V√âRIFICATION D√âTAILL√âE - √âtat et Logs PowerCap Manager"
echo "========================================================================"

echo ""
echo "--- 1. √âtat du DaemonSet powercap-manager ---"
kubectl get daemonset powercap-manager -n default -o wide

echo ""
echo "--- 2. D√©tails du DaemonSet ---"
kubectl describe daemonset powercap-manager -n default | head -50

echo ""
echo "--- 3. Liste des pods powercap-manager sur tous les n≈ìuds ---"
kubectl get pods -n default -l app=powercap-manager -o wide

echo ""
echo "--- 4. Nombre de pods actifs par rapport au nombre attendu ---"
DESIRED=$(kubectl get daemonset powercap-manager -n default -o jsonpath='{.status.desiredNumberScheduled}')
READY=$(kubectl get daemonset powercap-manager -n default -o jsonpath='{.status.numberReady}')
AVAILABLE=$(kubectl get daemonset powercap-manager -n default -o jsonpath='{.status.numberAvailable}')
echo "Pods d√©sir√©s: $DESIRED"
echo "Pods pr√™ts: $READY"
echo "Pods disponibles: $AVAILABLE"

echo ""
echo "--- 5. Description d√©taill√©e de chaque pod ---"
POWERCAP_PODS=$(kubectl get pods -n default -l app=powercap-manager -o jsonpath='{.items[*].metadata.name}')

if [ -n "$POWERCAP_PODS" ]; then
    for pod in $POWERCAP_PODS; do
        echo ""
        echo "=========================================="
        echo "Pod: $pod"
        echo "=========================================="
        
        echo ""
        echo "--- √âtat g√©n√©ral ---"
        kubectl get pod $pod -n default -o wide
        
        echo ""
        echo "--- N≈ìud d'ex√©cution ---"
        NODE=$(kubectl get pod $pod -n default -o jsonpath='{.spec.nodeName}')
        echo "N≈ìud: $NODE"
        
        echo ""
        echo "--- Statut du conteneur ---"
        kubectl get pod $pod -n default -o jsonpath='{range .status.containerStatuses[*]}Conteneur: {.name}
Ready: {.ready}
Restarts: {.restartCount}
Image: {.image}
{end}'
        
        echo ""
        echo "--- Conditions du pod ---"
        kubectl get pod $pod -n default -o jsonpath='{range .status.conditions[*]}{.type}: {.status} ({.reason})
{end}'
    done
else
    echo "‚ùå Aucun pod powercap-manager trouv√© dans le namespace default"
fi

echo ""
echo "--- 6. Logs de tous les pods powercap-manager ---"
if [ -n "$POWERCAP_PODS" ]; then
    for pod in $POWERCAP_PODS; do
        echo ""
        echo "=========================================="
        echo "üìù LOGS du pod: $pod"
        echo "=========================================="
        kubectl logs $pod -n default --tail=100 2>&1 || echo "Impossible de r√©cup√©rer les logs"
    done
else
    echo "‚ùå Aucun log √† afficher"
fi

echo ""
echo "--- 7. √âv√©nements r√©cents li√©s √† powercap-manager ---"
kubectl get events -n default --sort-by='.lastTimestamp' | grep powercap | tail -30 || echo "Aucun √©v√©nement r√©cent"

echo ""
echo "--- 8. V√©rification de l'acc√®s aux ressources syst√®me ---"
if [ -n "$POWERCAP_PODS" ]; then
    # Test sur le premier pod
    FIRST_POD=$(echo $POWERCAP_PODS | awk '{print $1}')
    echo "Test d'acc√®s RAPL sur le pod: $FIRST_POD"
    kubectl exec $FIRST_POD -n default -- ls -la /sys/devices/virtual/powercap/ 2>&1 || echo "‚ùå Impossible d'acc√©der au r√©pertoire RAPL"
fi

echo ""
echo "--- 9. V√©rification de la ConfigMap ---"
kubectl get configmap powercap-config -n default -o yaml

echo ""
echo "--- 10. V√©rification des erreurs critiques ---"
if [ -n "$POWERCAP_PODS" ]; then
    for pod in $POWERCAP_PODS; do
        STATUS=$(kubectl get pod $pod -n default -o jsonpath='{.status.phase}')
        if [ "$STATUS" != "Running" ]; then
            echo ""
            echo "‚ö†Ô∏è  ATTENTION: Pod $pod est en √©tat: $STATUS"
            echo "Raison:"
            kubectl get pod $pod -n default -o jsonpath='{.status.conditions[?(@.type=="Ready")].message}'
            echo ""
            echo "Logs d'erreur:"
            kubectl logs $pod -n default --tail=20 2>&1
        fi
    done
fi

echo ""
echo "========================================================================"
echo "‚úÖ V√©rification termin√©e"
echo "========================================================================"
"""

print("üîç Lancement de la v√©rification d√©taill√©e de l'√©tat et des logs PowerCap...")
with en.actions(roles=master_node) as p:
    p.shell(CHECK_POWERCAP_STATUS_LOGS)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## V√©rification des Annotations des N≈ìuds par PowerCap

In [None]:
# Script pour v√©rifier les annotations ajout√©es par PowerCap sur les n≈ìuds
CHECK_NODE_ANNOTATIONS_SCRIPT = """
#!/bin/bash

echo "========================================================================"
echo "üè∑Ô∏è  V√âRIFICATION DES ANNOTATIONS DES N≈íUDS"
echo "========================================================================"

echo ""
echo "--- Liste de tous les n≈ìuds du cluster ---"
kubectl get nodes

echo ""
echo "--- Annotations compl√®tes de tous les n≈ìuds ---"
for node in $(kubectl get nodes -o jsonpath='{.items[*].metadata.name}'); do
    echo ""
    echo "=========================================="
    echo "üìç N≈ìud: $node"
    echo "=========================================="
    
    echo ""
    echo "--- Type de n≈ìud ---"
    kubectl get node $node -o jsonpath='{.metadata.labels.node-role\.kubernetes\.io/control-plane}' > /dev/null 2>&1 && echo "Type: Master/Control-Plane" || echo "Type: Worker"
    
    echo ""
    echo "--- Toutes les annotations ---"
    kubectl get node $node -o jsonpath='{.metadata.annotations}' | jq '.' 2>/dev/null || kubectl get node $node -o jsonpath='{.metadata.annotations}'
    
    echo ""
    echo "--- Annotations sp√©cifiques √† PowerCap (filtr√©es) ---"
    kubectl get node $node -o json | jq -r '.metadata.annotations | to_entries[] | select(.key | contains("power") or contains("rapl") or contains("energy") or contains("cap")) | "\(.key): \(.value)"' 2>/dev/null || echo "Aucune annotation PowerCap trouv√©e ou jq non disponible"
done

echo ""
echo "--- R√©capitulatif : Annotations PowerCap par n≈ìud ---"
kubectl get nodes -o custom-columns=NAME:.metadata.name,ANNOTATIONS:.metadata.annotations 2>/dev/null || echo "Format custom-columns non support√©"

echo ""
echo "========================================================================"
echo "‚úÖ V√©rification des annotations termin√©e"
echo "========================================================================"
"""

print("üè∑Ô∏è  V√©rification des annotations des n≈ìuds...")
with en.actions(roles=master_node) as p:
    p.shell(CHECK_NODE_ANNOTATIONS_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## Suppression du DaemonSet PowerCap

In [None]:
import os

# V√©rifier si le dossier local existe, sinon afficher une erreur
source_dir = "powercap"
dest_dir = "/tmp/powercap"

if not os.path.isdir(source_dir):
    print(f"‚ùå Le r√©pertoire local '{source_dir}' n'existe pas.")
    print("üí° Cr√©ez le dossier avec les manifestes avant de supprimer les ressources.")
    raise FileNotFoundError(f"Le r√©pertoire '{source_dir}' est introuvable.")

# --- Copier le r√©pertoire vers le master (au cas o√π il n'existe plus sur le master) ---
print(f"üìÅ V√©rification/copie du r√©pertoire '{source_dir}' vers le master...")
with en.actions(roles=master_node) as p:
    p.copy(src=source_dir, dest="/tmp/")

if p.results and p.results[0].status == "OK":
    print("‚úÖ R√©pertoire copi√©/mis √† jour sur le master.")

# Script pour supprimer compl√®tement le DaemonSet PowerCap en utilisant les manifestes
DELETE_POWERCAP_SCRIPT = f"""
#!/bin/bash

echo "========================================================================"
echo "üóëÔ∏è  SUPPRESSION des Ressources PowerCap"
echo "========================================================================"

echo ""
echo "--- Suppression de toutes les ressources via les manifestes ---"
kubectl delete -f {dest_dir}/ --ignore-not-found=true

echo ""
echo "--- Attente de la suppression des pods (10 secondes) ---"
sleep 10

echo ""
echo "--- Suppression des annotations PowerCap sur les n≈ìuds ---"
for node in $(kubectl get nodes -o jsonpath='{{.items[*].metadata.name}}'); do
    echo "Nettoyage des annotations sur le n≈ìud: $node"
    
    # Suppression de chaque annotation PowerCap (avec 2>&1 pour voir les erreurs)
    kubectl annotate node $node power-manager/initialized- 2>&1 || true
    kubectl annotate node $node rapl/last-update- 2>&1 || true
    kubectl annotate node $node rapl/market-period- 2>&1 || true
    kubectl annotate node $node rapl/market-price- 2>&1 || true
    kubectl annotate node $node rapl/market-volume- 2>&1 || true
    kubectl annotate node $node rapl/max_power_uw- 2>&1 || true
    kubectl annotate node $node rapl/pmax- 2>&1 || true
    kubectl annotate node $node rapl/provider- 2>&1 || true
done
echo "‚úÖ Annotations PowerCap supprim√©es de tous les n≈ìuds"

echo ""
echo "--- V√©rification finale ---"
echo ""
echo "DaemonSets restants avec 'powercap' :"
kubectl get daemonsets -n default | grep powercap || echo "‚úÖ Aucun DaemonSet trouv√©"

echo ""
echo "Pods restants avec 'powercap' :"
kubectl get pods -n default -l app=powercap-manager || echo "‚úÖ Aucun pod trouv√©"

echo ""
echo "ConfigMaps restantes avec 'powercap' :"
kubectl get configmap -n default | grep powercap || echo "‚úÖ Aucune ConfigMap trouv√©e"

echo ""
echo "ServiceAccounts restants avec 'powercap' :"
kubectl get serviceaccount -n default | grep powercap || echo "‚úÖ Aucun ServiceAccount trouv√©"

echo ""
echo "ClusterRoles restants avec 'powercap' :"
kubectl get clusterrole | grep powercap || echo "‚úÖ Aucun ClusterRole trouv√©"

echo ""
echo "ClusterRoleBindings restants avec 'powercap' :"
kubectl get clusterrolebinding | grep powercap || echo "‚úÖ Aucun ClusterRoleBinding trouv√©"

echo ""
echo "--- V√©rification des annotations restantes ---"
echo "Annotations PowerCap/RAPL restantes sur les n≈ìuds:"
for node in $(kubectl get nodes -o jsonpath='{{.items[*].metadata.name}}'); do
    echo ""
    echo "N≈ìud: $node"
    kubectl get node $node -o json | jq -r '.metadata.annotations | to_entries[] | select(.key | contains("power") or contains("rapl")) | "  \\(.key): \\(.value)"' 2>/dev/null || echo "  Aucune annotation PowerCap/RAPL trouv√©e"
done

echo ""
echo "========================================================================"
echo "‚úÖ Suppression de PowerCap termin√©e !"
echo "========================================================================"
"""

print("üóëÔ∏è  Lancement de la suppression de PowerCap...")
with en.actions(roles=master_node) as p:
    p.shell(DELETE_POWERCAP_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

# --- Nettoyage des donn√©es sur les workers ---
print("\n--- Nettoyage des donn√©es sur les n≈ìuds workers ---")
CLEANUP_WORKERS_SCRIPT = """
#!/bin/bash
echo "Suppression des donn√©es PowerCap dans /var/lib/powercap..."
sudo rm -rf /var/lib/powercap/*.csv 2>/dev/null || true
echo "‚úÖ Nettoyage termin√© sur ce n≈ìud"
"""

with en.actions(roles=worker_nodes) as p:
    p.shell(CLEANUP_WORKERS_SCRIPT)

print("‚úÖ Toutes les ressources PowerCap ont √©t√© supprim√©es du cluster !")

# D√©ploiement de Volta

In [None]:
import os

# --- Script pour d√©ployer Volta ---

source_dir = "volta"
config_file = "volta-config.yaml"
manifest_file = "volta.yaml"

# V√©rifier que le r√©pertoire local existe
if not os.path.isdir(source_dir):
    print(f"‚ùå Le r√©pertoire local '{source_dir}' n'existe pas.")
    print(f"üìÅ Veuillez cr√©er le dossier '{source_dir}' avec les fichiers suivants:")
    print(f"   - {config_file}")
    print(f"   - {manifest_file}")
    print("\nüí° Ou uploadez le dossier complet dans le r√©pertoire de travail.")
    raise FileNotFoundError(f"Le r√©pertoire local '{source_dir}' est introuvable. Cr√©ez-le d'abord avec les manifestes n√©cessaires.")

# V√©rifier que les fichiers n√©cessaires existent
config_path = os.path.join(source_dir, config_file)
manifest_path = os.path.join(source_dir, manifest_file)

if not os.path.isfile(config_path):
    raise FileNotFoundError(f"Le fichier de configuration '{config_path}' est introuvable.")

if not os.path.isfile(manifest_path):
    raise FileNotFoundError(f"Le fichier manifest '{manifest_path}' est introuvable.")

print(f"‚úÖ Fichiers Volta trouv√©s:")
print(f"   - Configuration: {config_path}")
print(f"   - Manifest: {manifest_path}")

# --- √âtape 1 : Copier le fichier de configuration vers /etc/kubernetes/ sur le master ---
print(f"\n--- Copie du fichier de configuration vers /etc/kubernetes/ sur le master... ---")
with en.actions(roles=master_node) as p:
    p.copy(src=config_path, dest="/etc/kubernetes/volta-config.yaml")

if p.results and p.results[0].status == "OK":
    print("‚úÖ Fichier de configuration copi√© avec succ√®s.")
else:
    print("‚ùå Erreur lors de la copie du fichier de configuration.")
    if p.results:
        print(p.results[0].stderr)

# --- √âtape 2 : Copier le manifest vers le master ---
print(f"\n--- Copie du manifest Volta vers le master... ---")
with en.actions(roles=master_node) as p:
    p.copy(src=manifest_path, dest="/tmp/volta.yaml")

if p.results and p.results[0].status == "OK":
    print("‚úÖ Manifest Volta copi√© avec succ√®s.")
else:
    print("‚ùå Erreur lors de la copie du manifest.")
    if p.results:
        print(p.results[0].stderr)

# --- √âtape 3 : D√©ployer Volta ---
DEPLOY_VOLTA_SCRIPT = """
#!/bin/bash -e

echo "========================================================================"
echo "‚ö° D√©ploiement de Volta Scheduler"
echo "========================================================================"

echo ""
echo "--- V√©rification du fichier de configuration ---"
if [ -f "/etc/kubernetes/volta-config.yaml" ]; then
    echo "‚úÖ Fichier de configuration trouv√©: /etc/kubernetes/volta-config.yaml"
    ls -la /etc/kubernetes/volta-config.yaml
    echo ""
    echo "Contenu du fichier de configuration:"
    head -20 /etc/kubernetes/volta-config.yaml
else
    echo "‚ùå Fichier de configuration non trouv√©!"
    exit 1
fi

echo ""
echo "--- Application du manifest Volta ---"
kubectl apply -f /tmp/volta.yaml

echo ""
echo "--- Attente de 30 secondes pour le d√©marrage ---"
sleep 30

echo ""
echo "--- V√©rification du d√©ploiement volta-scheduler ---"
kubectl get deployment volta-scheduler -n kube-system -o wide

echo ""
echo "--- V√©rification des pods Volta (component=scheduler) ---"
kubectl get pods -n kube-system -l component=scheduler,tier=control-plane -o wide

echo ""
echo "--- Statut du d√©ploiement Volta ---"
kubectl rollout status deployment/volta-scheduler -n kube-system --timeout=120s

echo ""
echo "--- V√©rification de toutes les ressources li√©es √† Volta ---"
kubectl get all -n kube-system | grep volta || echo "Aucune ressource Volta trouv√©e"

echo ""
echo "--- √âv√©nements r√©cents li√©s √† volta-scheduler ---"
kubectl get events -n kube-system --sort-by='.lastTimestamp' | grep volta | tail -20 || echo "Aucun √©v√©nement Volta r√©cent"

echo ""
echo "--- Logs des pods volta-scheduler ---"
kubectl logs -l component=scheduler,tier=control-plane -n kube-system --tail=30 2>&1 || echo "Aucun log disponible"

echo ""
echo "========================================================================"
echo "‚úÖ D√©ploiement de Volta Scheduler termin√© !"
echo "========================================================================"
"""

print("\n--- D√©ploiement de Volta... ---")
with en.actions(roles=master_node) as p:
    p.shell(DEPLOY_VOLTA_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## R√©cup√©ration de Tous les Logs Volta

In [None]:
# Script pour r√©cup√©rer tous les logs de Volta Scheduler
GET_ALL_VOLTA_LOGS_SCRIPT = """
#!/bin/bash

echo "========================================================================"
echo "üìã R√âCUP√âRATION COMPL√àTE DES LOGS VOLTA SCHEDULER"
echo "========================================================================"

echo ""
echo "--- 1. Recherche de tous les pods volta-scheduler ---"
VOLTA_PODS=$(kubectl get pods -n kube-system -l component=scheduler,tier=control-plane -o jsonpath='{.items[*].metadata.name}' | grep volta)

if [ -z "$VOLTA_PODS" ]; then
    echo "‚ùå Aucun pod volta-scheduler trouv√©"
    exit 1
fi

echo "Pods Volta trouv√©s: $VOLTA_PODS"

echo ""
echo "--- 2. Informations d√©taill√©es sur les pods Volta ---"
for pod in $VOLTA_PODS; do
    echo ""
    echo "=========================================="
    echo "Pod: $pod"
    echo "=========================================="
    
    echo "--- √âtat du pod ---"
    kubectl get pod $pod -n kube-system -o wide
    
    echo ""
    echo "--- N≈ìud d'ex√©cution ---"
    kubectl get pod $pod -n kube-system -o jsonpath='{.spec.nodeName}'
    echo ""
    
    echo ""
    echo "--- Statut des conteneurs ---"
    kubectl get pod $pod -n kube-system -o jsonpath='{range .status.containerStatuses[*]}Conteneur: {.name}, Ready: {.ready}, Restarts: {.restartCount}{"\n"}{end}'
done

echo ""
echo "--- 3. LOGS COMPLETS DE TOUS LES PODS VOLTA ---"
for pod in $VOLTA_PODS; do
    echo ""
    echo "=========================================="
    echo "üìù LOGS COMPLETS du pod: $pod"
    echo "=========================================="
    
    # Logs depuis le d√©but (pas de --tail)
    kubectl logs $pod -n kube-system --timestamps 2>&1 || echo "‚ùå Impossible de r√©cup√©rer les logs"
    
    echo ""
    echo "--- Logs du conteneur pr√©c√©dent (si red√©marrage) ---"
    kubectl logs $pod -n kube-system --previous --timestamps 2>/dev/null || echo "Aucun log de conteneur pr√©c√©dent"
done

echo ""
echo "--- 4. LOGS EN TEMPS R√âEL (suivre les logs) ---"
echo "üí° Pour suivre les logs en temps r√©el, utilisez:"
echo "kubectl logs -f -l component=scheduler,tier=control-plane -n kube-system | grep volta"

echo ""
echo "--- 5. √âV√âNEMENTS LI√âS √Ä VOLTA ---"
kubectl get events -n kube-system --sort-by='.lastTimestamp' | grep -i volta | tail -50 || echo "Aucun √©v√©nement Volta trouv√©"

echo ""
echo "--- 6. DESCRIPTION D√âTAILL√âE DES PODS VOLTA ---"
for pod in $VOLTA_PODS; do
    echo ""
    echo "=========================================="
    echo "üìã DESCRIPTION du pod: $pod"
    echo "=========================================="
    kubectl describe pod $pod -n kube-system
done

echo ""
echo "--- 7. CONFIGURATION DU D√âPLOIEMENT VOLTA ---"
kubectl get deployment volta-scheduler -n kube-system -o yaml 2>&1 || echo "D√©ploiement Volta non trouv√©"

echo ""
echo "--- 8. LOGS DE D√âBOGAGE - D√âCISIONS DE SCHEDULING ---"
echo "Recherche des logs de scheduling dans tous les pods volta:"
for pod in $VOLTA_PODS; do
    echo ""
    echo "--- D√©cisions de scheduling dans $pod ---"
    kubectl logs $pod -n kube-system | grep -i "schedule\|bind\|filter\|score" | tail -20 || echo "Aucun log de scheduling trouv√©"
done

echo ""
echo "========================================================================"
echo "‚úÖ R√©cup√©ration compl√®te des logs Volta termin√©e"
echo "========================================================================"
"""

print("üìã R√©cup√©ration de tous les logs Volta...")
with en.actions(roles=master_node) as p:
    p.shell(GET_ALL_VOLTA_LOGS_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## D√©ploiement d'Application Demo avec Volta Scheduler

In [None]:
import os

# --- Script pour d√©ployer l'application demo avec Volta Scheduler ---

demo_dir = "demo"
demo_file = "rancher-demo.yaml"

# V√©rifier que le r√©pertoire et le fichier existent
if not os.path.isdir(demo_dir):
    print(f"‚ùå Le r√©pertoire local '{demo_dir}' n'existe pas.")
    raise FileNotFoundError(f"Le r√©pertoire '{demo_dir}' est introuvable.")

demo_path = os.path.join(demo_dir, demo_file)
if not os.path.isfile(demo_path):
    print(f"‚ùå Le fichier '{demo_path}' n'existe pas.")
    raise FileNotFoundError(f"Le fichier '{demo_path}' est introuvable.")

print(f"‚úÖ Fichier demo trouv√©: {demo_path}")


# --- Copier le fichier demo vers le master ---
print(f"\n--- Copie du fichier demo vers le master... ---")
with en.actions(roles=master_node) as p:
    p.copy(src=demo_path, dest="/tmp/rancher-demo.yaml")

if p.results and p.results[0].status == "OK":
    print("‚úÖ Fichier demo copi√© avec succ√®s.")
else:
    print("‚ùå Erreur lors de la copie du fichier demo.")
    if p.results:
        print(p.results[0].stderr)

# --- Appliquer le manifest demo avec Volta Scheduler ---
DEPLOY_DEMO_WITH_VOLTA_SCRIPT = """
#!/bin/bash -e

echo "========================================================================"
echo "üöÄ D√©ploiement de l'Application Demo avec Volta Scheduler"
echo "========================================================================"

echo ""
echo "--- Application du manifest rancher-demo.yaml ---"
kubectl apply -f /tmp/rancher-demo.yaml

echo ""
echo "--- Attente de 30 secondes pour le d√©marrage ---"
sleep 30

echo ""
echo "--- V√©rification du d√©ploiement hello-world ---"
kubectl get deployment hello-world -o wide

echo ""
echo "--- V√©rification des pods hello-world ---"
kubectl get pods -l app=hello-world -o wide

echo ""
echo "--- V√©rification du scheduler utilis√© ---"
kubectl get pods -l app=hello-world -o jsonpath='{range .items[*]}{.metadata.name}{"\t"}{.spec.schedulerName}{"\t"}{.spec.nodeName}{"\n"}{end}' | column -t

echo ""
echo "--- Statut du d√©ploiement ---"
kubectl rollout status deployment/hello-world --timeout=120s

echo ""
echo "--- √âv√©nements r√©cents li√©s √† hello-world ---"
kubectl get events --sort-by='.lastTimestamp' | grep hello-world | tail -10 || echo "Aucun √©v√©nement r√©cent"

echo ""
echo "--- Logs du scheduler Volta (pour voir les d√©cisions de placement) ---"
kubectl logs -l component=scheduler,tier=control-plane -n kube-system --tail=20 | grep -i "hello-world\|volta\|schedule" || echo "Aucun log de scheduling trouv√©"

echo ""
echo "========================================================================"
echo "‚úÖ D√©ploiement de l'application demo avec Volta termin√© !"
echo "========================================================================"
"""

print("\n--- D√©ploiement de l'application demo avec Volta Scheduler... ---")
with en.actions(roles=master_node) as p:
    p.shell(DEPLOY_DEMO_WITH_VOLTA_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

In [None]:
DEPLOY_DEMO_WITH_VOLTA_SCRIPT = """
#!/bin/bash -e
echo "========================================================================"
echo ""
echo "--- V√©rification du d√©ploiement hello-world ---"
kubectl get deployment hello-world -o wide

echo ""
echo "--- V√©rification des pods hello-world ---"
kubectl get pods -l app=hello-world -o wide

echo ""
echo "--- V√©rification du scheduler utilis√© ---"
kubectl get pods -l app=hello-world -o jsonpath='{range .items[*]}{.metadata.name}{"\t"}{.spec.schedulerName}{"\t"}{.spec.nodeName}{"\n"}{end}' | column -t

echo ""
echo "--- Statut du d√©ploiement ---"
kubectl rollout status deployment/hello-world --timeout=120s

echo ""
echo "--- √âv√©nements r√©cents li√©s √† hello-world ---"
kubectl get events --sort-by='.lastTimestamp' | grep hello-world | tail -10 || echo "Aucun √©v√©nement r√©cent"

echo ""
echo "--- Logs du scheduler Volta (pour voir les d√©cisions de placement) ---"
kubectl logs -l component=scheduler,tier=control-plane -n kube-system --tail=20 | grep -i "hello-world\|volta\|schedule" || echo "Aucun log de scheduling trouv√©"

echo ""
echo "========================================================================"
echo "‚úÖ D√©ploiement de l'application demo avec Volta termin√© !"
echo "========================================================================"
"""

print("\n--- D√©ploiement de l'application demo avec Volta Scheduler... ---")
with en.actions(roles=master_node) as p:
    p.shell(DEPLOY_DEMO_WITH_VOLTA_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

## Suppression de l'Application Demo

In [None]:
# Script pour supprimer l'application demo
DELETE_DEMO_SCRIPT = """
#!/bin/bash

echo "========================================================================"
echo "üóëÔ∏è  SUPPRESSION de l'Application Demo"
echo "========================================================================"

echo ""
echo "--- Suppression du d√©ploiement hello-world ---"
kubectl delete deployment hello-world --ignore-not-found=true

echo ""
echo "--- Attente de la suppression des pods (10 secondes) ---"
sleep 10

echo ""
echo "--- Suppression des fichiers temporaires ---"
rm -f /tmp/rancher-demo.yaml /tmp/rancher-demo-volta.yaml 2>&1 || echo "Fichiers temporaires d√©j√† supprim√©s"

echo ""
echo "--- V√©rification finale ---"
echo ""
echo "D√©ploiements restants avec 'hello-world' :"
kubectl get deployments | grep hello-world || echo "‚úÖ Aucun d√©ploiement trouv√©"

echo ""
echo "Pods restants avec 'hello-world' :"
kubectl get pods -l app=hello-world || echo "‚úÖ Aucun pod trouv√©"

echo ""
echo "========================================================================"
echo "‚úÖ Suppression de l'application demo termin√©e !"
echo "========================================================================"
"""

print("üóëÔ∏è  Lancement de la suppression de l'application demo...")
with en.actions(roles=master_node) as p:
    p.shell(DELETE_DEMO_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

print("‚úÖ L'application demo a √©t√© compl√®tement supprim√©e du cluster !")

## Suppression de Volta Scheduler

In [None]:
# Script pour supprimer compl√®tement Volta Scheduler
DELETE_VOLTA_SCRIPT = """
#!/bin/bash

echo "========================================================================"
echo "üóëÔ∏è  SUPPRESSION de Volta Scheduler"
echo "========================================================================"

echo ""
echo "--- Suppression du d√©ploiement volta-scheduler ---"
kubectl delete deployment volta-scheduler -n kube-system --ignore-not-found=true

echo ""
echo "--- Attente de la suppression des pods (10 secondes) ---"
sleep 10

echo ""
echo "--- Suppression du fichier de configuration ---"
sudo rm -f /etc/kubernetes/volta-config.yaml 2>&1 || echo "Fichier de configuration d√©j√† supprim√©"

echo ""
echo "--- Suppression du manifest temporaire ---"
rm -f /tmp/volta.yaml 2>&1 || echo "Manifest temporaire d√©j√† supprim√©"

echo ""
echo "--- V√©rification finale ---"
echo ""
echo "D√©ploiements restants avec 'volta' :"
kubectl get deployments -n kube-system | grep volta || echo "‚úÖ Aucun d√©ploiement trouv√©"

echo ""
echo "Pods restants avec 'volta' :"
kubectl get pods -n kube-system | grep volta || echo "‚úÖ Aucun pod trouv√©"

echo ""
echo "Services restants avec 'volta' :"
kubectl get services -n kube-system | grep volta || echo "‚úÖ Aucun service trouv√©"

echo ""
echo "--- V√©rification des fichiers de configuration ---"
ls -la /etc/kubernetes/volta-config.yaml 2>/dev/null || echo "‚úÖ Fichier de configuration supprim√©"

echo ""
echo "========================================================================"
echo "‚úÖ Suppression de Volta Scheduler termin√©e !"
echo "========================================================================"
"""

print("üóëÔ∏è  Lancement de la suppression de Volta Scheduler...")
with en.actions(roles=master_node) as p:
    p.shell(DELETE_VOLTA_SCRIPT)

if p.results:
    output = p.results[0].stdout.strip()
    print(output)

print("‚úÖ Volta Scheduler a √©t√© compl√®tement supprim√© du cluster !")

# Lib√©ration des Ressources

In [52]:
# Destruction de la r√©servation
print("Lib√©ration des ressources sur Grid'5000...")
provider.destroy()
print("Ressources lib√©r√©es. ‚úÖ")

Lib√©ration des ressources sur Grid'5000...


INFO:enoslib.log:[G5k] Reloading 3297806 from rennes
INFO:enoslib.log:[G5k] Killing the job (rennes, 3297806)
INFO:enoslib.log:[G5k] Killing the job (rennes, 3297806)
INFO:enoslib.log:[G5k] Job killed (rennes, 3297806)
INFO:enoslib.log:[G5k] Job killed (rennes, 3297806)


Ressources lib√©r√©es. ‚úÖ


## üîç Examen des Limites de Puissance RAPL

In [None]:
# Script pour examiner les limites de puissance RAPL
RAPL_LIMITS_SCRIPT = """#!/bin/bash

echo "========================================================================"
echo "üîç EXAMEN DES LIMITES DE PUISSANCE RAPL"
echo "========================================================================"
echo "Hostname: $(hostname)"
echo "Date: $(date)"
echo ""

# V√©rification de l'existence du r√©pertoire RAPL
RAPL_DIR="/sys/devices/virtual/powercap/intel-rapl"

if [ ! -d "$RAPL_DIR" ]; then
    echo "‚ùå R√©pertoire RAPL non trouv√©: $RAPL_DIR"
    echo "Intel RAPL non disponible sur ce syst√®me"
    exit 1
fi

echo "‚úÖ R√©pertoire RAPL trouv√©: $RAPL_DIR"
echo ""

echo "--- Structure du r√©pertoire RAPL ---"
ls -la $RAPL_DIR/
echo ""

echo "--- Recherche des fichiers *_power_limit_uw ---"
POWER_LIMIT_FILES=$(find $RAPL_DIR -name "*_power_limit_uw" 2>/dev/null)

if [ -z "$POWER_LIMIT_FILES" ]; then
    echo "‚ùå Aucun fichier *_power_limit_uw trouv√©"
else
    echo "üìä Fichiers de limites de puissance trouv√©s:"
    echo "$POWER_LIMIT_FILES"
    echo ""
    
    echo "========================================================================"
    echo "üìà VALEURS DES LIMITES DE PUISSANCE"
    echo "========================================================================"
    
    for file in $POWER_LIMIT_FILES; do
        echo ""
        echo "--- Fichier: $file ---"
        
        if [ -r "$file" ]; then
            VALUE_UW=$(cat "$file" 2>/dev/null)
            if [ -n "$VALUE_UW" ] && [ "$VALUE_UW" -ne 0 ] 2>/dev/null; then
                # Conversion en Watts
                VALUE_W=$(echo "scale=2; $VALUE_UW / 1000000" | bc 2>/dev/null || echo "N/A")
                echo "  Valeur brute (microWatts): $VALUE_UW"
                echo "  Valeur en Watts: $VALUE_W W"
                
                # D√©terminer le type de domaine
                DOMAIN_NAME=$(basename $(dirname "$file"))
                echo "  Domaine: $DOMAIN_NAME"
                
                # Afficher le nom du domaine si disponible
                NAME_FILE="$(dirname "$file")/name"
                if [ -r "$NAME_FILE" ]; then
                    DOMAIN_FRIENDLY_NAME=$(cat "$NAME_FILE" 2>/dev/null)
                    echo "  Nom du domaine: $DOMAIN_FRIENDLY_NAME"
                fi
                
            else
                echo "  ‚ö†Ô∏è  Valeur non disponible ou nulle"
            fi
        else
            echo "  ‚ùå Fichier non accessible en lecture"
        fi
    done
fi

echo ""
echo "--- Informations additionnelles RAPL ---"
echo ""

# Afficher tous les domaines RAPL
echo "üìã Tous les domaines RAPL disponibles:"
for domain_dir in $RAPL_DIR/intel-rapl:*; do
    if [ -d "$domain_dir" ]; then
        DOMAIN_NAME=$(basename "$domain_dir")
        NAME_FILE="$domain_dir/name"
        if [ -r "$NAME_FILE" ]; then
            FRIENDLY_NAME=$(cat "$NAME_FILE" 2>/dev/null)
            echo "  $DOMAIN_NAME: $FRIENDLY_NAME"
            
            # Afficher la limite maximale si disponible
            MAX_LIMIT_FILE="$domain_dir/max_power_range_uw"
            if [ -r "$MAX_LIMIT_FILE" ]; then
                MAX_VALUE_UW=$(cat "$MAX_LIMIT_FILE" 2>/dev/null)
                if [ -n "$MAX_VALUE_UW" ]; then
                    MAX_VALUE_W=$(echo "scale=2; $MAX_VALUE_UW / 1000000" | bc 2>/dev/null || echo "N/A")
                    echo "    Limite maximale: $MAX_VALUE_W W"
                fi
            fi
        fi
    fi
done

echo ""
echo "--- V√©rification des permissions ---"
echo "Permissions sur le r√©pertoire RAPL:"
ls -ld $RAPL_DIR
echo ""
echo "Permissions sur les fichiers de limites:"
for file in $POWER_LIMIT_FILES; do
    echo "$(ls -l "$file")"
done

echo ""
echo "========================================================================"
echo "‚úÖ Examen des limites RAPL termin√©"
echo "========================================================================"
"""

print("üîç Examen des limites de puissance RAPL sur les n≈ìuds WORKERS uniquement...")
print("üìä Recherche des fichiers *_power_limit_uw dans /sys/devices/virtual/powercap/intel-rapl")
print("")

# Cr√©er le script sur les workers uniquement et l'ex√©cuter
with en.actions(roles=worker_nodes) as p:
    # Cr√©er le fichier script
    p.copy(content=RAPL_LIMITS_SCRIPT, dest="/tmp/check_rapl_limits.sh", mode="0755")

with en.actions(roles=worker_nodes) as p:
    # Ex√©cuter le script
    p.shell("bash /tmp/check_rapl_limits.sh")

if p.results:
    for i, result in enumerate(p.results):
        print(f"\n{'='*60}")
        print(f"üìç WORKER {i+1}: {result.host}")
        print('='*60)
        
        if result.status == "OK":
            # Extraire les informations importantes
            lines = result.stdout.split('\n')
            
            # Afficher les limites de puissance trouv√©es
            in_power_section = False
            for line in lines:
                if "VALEURS DES LIMITES DE PUISSANCE" in line:
                    in_power_section = True
                    print("üìà LIMITES DE PUISSANCE:")
                elif "Examen des limites RAPL termin√©" in line:
                    in_power_section = False
                elif in_power_section and ("Valeur en Watts:" in line or "Domaine:" in line or "Nom du domaine:" in line):
                    print(f"  {line.strip()}")
                elif "Aucun fichier *_power_limit_uw trouv√©" in line:
                    print("‚ùå Aucune limite de puissance RAPL trouv√©e")
                elif "R√©pertoire RAPL non trouv√©" in line:
                    print("‚ùå Intel RAPL non disponible")
            
            # Afficher les domaines disponibles
            print("\nüìã Domaines RAPL:")
            for line in lines:
                if ": " in line and ("package" in line.lower() or "core" in line.lower() or "dram" in line.lower()):
                    print(f"  {line.strip()}")
                    
        else:
            print(f"‚ùå Erreur: {result.stderr}")

print(f"\n{'='*60}")
print("üí° INFO: Les limites RAPL permettent de contr√¥ler la consommation maximale")
print("üìä Ces valeurs sont utilis√©es par Kepler pour le monitoring √©nerg√©tique")
print("üñ•Ô∏è  Analyse effectu√©e uniquement sur les n≈ìuds workers")
print('='*60)

## üîß Installation de powercap-utils sur les Workers

In [None]:
print("üì¶ Installation de powercap-utils sur les n≈ìuds WORKERS...")
print("‚è≥ Cette op√©ration peut prendre quelques instants...")
print("")

# Installation de powercap-utils sur les workers
with en.actions(roles=worker_nodes) as p:
    p.apt(
        name="powercap-utils",
        state="present",
        update_cache=True
    )

if p.results:
    for i, result in enumerate(p.results):
        print(f"üìç WORKER {i+1}: {result.host}")
        if result.status == "OK":
            # V√©rifier si le paquet a √©t√© modifi√© via payload
            changed = result.payload.get('changed', False)
            if changed:
                print("  ‚úÖ powercap-utils install√© avec succ√®s")
            else:
                print("  ‚ÑπÔ∏è  powercap-utils √©tait d√©j√† install√©")
        else:
            stderr = result.payload.get('stderr', 'Erreur inconnue')
            print(f"  ‚ùå Erreur lors de l'installation: {stderr}")
        print("")

print("‚úÖ Installation termin√©e sur tous les workers")

## üî¨ Commandes powercap-utils - Analyse RAPL

In [None]:
print("üî¨ Ex√©cution de commandes powercap-utils...")
print("")

# Commande simple pour voir les infos RAPL
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-info intel-rapl")

if p.results:
    for i, result in enumerate(p.results):
        print(f"\n{'='*80}")
        print(f"üìç WORKER {i+1}: {result.host}")
        print('='*80)
        
        if result.status == "OK":
            print(result.stdout)
        else:
            print(f"‚ùå Erreur: {result.payload.get('stderr', 'Erreur inconnue')}")

print("\n‚úÖ Termin√©")

## üìñ Aide powercap-set

In [None]:
print("üìñ Affichage de l'aide powercap-set sur le premier worker...")
print("="*80)
print("")

# Ex√©cuter powercap-set --help sur le premier worker
with en.actions(roles=worker_nodes[0]) as p:
    p.shell("powercap-set --help")

if p.results:
    for result in p.results:
        print(f"Worker: {result.host}")
        print("-"*80)
        if result.status == "OK":
            print(result.stdout)
        else:
            print(f"Erreur: {result.payload.get('stderr', 'Erreur inconnue')}")

## ‚ö° Configuration Power Capping Recommand√©e

In [None]:
print("‚ö° Configuration du Power Capping sur les Workers")
print("="*80)
print("")

# Package 0 - Constraint 0 (long_term) √† 200W
print("üìù Configuration Package 0 - long_term √† 200W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 0 -l 200000000")

# Package 0 - Constraint 1 (short_term) √† 250W  
print("üìù Configuration Package 0 - short_term √† 250W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 1 -l 250000000")

# Package 1 - Constraint 0 (long_term) √† 200W
print("üìù Configuration Package 1 - long_term √† 200W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 0 -l 200000000")

# Package 1 - Constraint 1 (short_term) √† 250W
print("üìù Configuration Package 1 - short_term √† 250W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 1 -l 250000000")

# Activer DRAM Package 0
print("üìù Activation contr√¥le DRAM Package 0...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -e 1")

# Activer DRAM Package 1
print("üìù Activation contr√¥le DRAM Package 1...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1:0 -e 1")

# DRAM Package 0 √† 40W
print("üìù Configuration DRAM Package 0 √† 40W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -c 0 -l 40000000")

# DRAM Package 1 √† 40W
print("üìù Configuration DRAM Package 1 √† 40W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1:0 -c 0 -l 40000000")

print("")
print("‚úÖ Configuration termin√©e !")
print("")
print("üí° Limites configur√©es par worker :")
print("  ‚Ä¢ Package 0 : 200W (long) / 250W (short)")
print("  ‚Ä¢ Package 1 : 200W (long) / 250W (short)")
print("  ‚Ä¢ DRAM 0 : 40W")
print("  ‚Ä¢ DRAM 1 : 40W")
print("  ‚Ä¢ Total : ~480W (long_term)")
print("")
print("üîÑ R√©ex√©cutez la cellule powercap-info pour v√©rifier")

## üîã Configuration Alternative : √âconomie d'√ânergie Maximale

In [None]:
print("üîã Configuration √âCONOMIE D'√âNERGIE MAXIMALE")
print("="*80)
print("")
print("üìã Profil : R√©duction consommation ~40%")
print("  ‚Ä¢ CPU Package : 150W (long_term) - TDP r√©duit")
print("  ‚Ä¢ CPU Package : 180W (short_term) - Turbo limit√©")
print("  ‚Ä¢ DRAM : Activation + 30W par socket")
print("")

# Package 0 - Constraint 0 (long_term) √† 150W
print("üìù CPU Package 0 - long_term √† 150W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 0 -l 150000000")

# Package 0 - Constraint 1 (short_term) √† 180W  
print("üìù CPU Package 0 - short_term √† 180W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 1 -l 180000000")

# Package 1 - Constraint 0 (long_term) √† 150W
print("üìù CPU Package 1 - long_term √† 150W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 0 -l 150000000")

# Package 1 - Constraint 1 (short_term) √† 180W
print("üìù CPU Package 1 - short_term √† 180W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 1 -l 180000000")

# Activer DRAM Package 0
print("üìù Activation DRAM Package 0...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -e 1")

# Activer DRAM Package 1
print("üìù Activation DRAM Package 1...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1:0 -e 1")

# DRAM Package 0 √† 30W
print("üìù DRAM Package 0 √† 30W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -c 0 -l 30000000")

# DRAM Package 1 √† 30W
print("üìù DRAM Package 1 √† 30W...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1:0 -c 0 -l 30000000")

print("")
print("‚úÖ Configuration √âCONOMIE appliqu√©e !")
print("")
print("üí° Bilan par worker :")
print("  ‚Ä¢ CPU total : 300W (long) / 360W (short)")
print("  ‚Ä¢ DRAM total : 60W")
print("  ‚Ä¢ Total syst√®me : ~360W max")
print("  ‚Ä¢ √âconomie : ~40% vs valeurs par d√©faut (500W)")
print("")
print("‚ö†Ô∏è  Impact : R√©duction des performances ~15-20%")
print("‚úÖ Avantage : R√©duction consommation et temp√©rature")

## üìö Explication : Time Window (Fen√™tre de Temps) dans RAPL

### üéØ Qu'est-ce qu'une Time Window ?

La **time window** (fen√™tre de temps) est la p√©riode sur laquelle Intel RAPL **calcule la moyenne** de la consommation √©nerg√©tique pour v√©rifier si elle respecte les limites de puissance configur√©es.

---

### üîß Comment √ßa fonctionne ?

#### **Principe de base :**
```
Puissance moyenne (sur time_window) ‚â§ Power Limit
```

**Exemple concret :**
- **Power limit** : 200W
- **Time window** : 1 seconde

‚û°Ô∏è Le processeur peut consommer **plus de 200W pendant de courtes p√©riodes**, tant que la **moyenne sur 1 seconde** reste ‚â§ 200W

---

### ‚öôÔ∏è Les 2 Contraintes RAPL

Sur votre syst√®me, vous avez observ√© **2 contraintes** par package :

#### **1Ô∏è‚É£ Constraint 0 : long_term (PL1)**
- **R√¥le** : Limite de puissance **soutenue** (TDP nominal)
- **Time window typique** : 1 seconde (999,424 ¬µs par d√©faut)
- **Objectif** : Garantir que la consommation moyenne reste sous contr√¥le
- **Exemple sur votre syst√®me** : 250W sur ~1s
- **Impact** : Contr√¥le la puissance continue, √©vite la surchauffe

**Analogie** : C'est comme une limite de vitesse moyenne sur autoroute (130 km/h en moyenne)

#### **2Ô∏è‚É£ Constraint 1 : short_term (PL2)**
- **R√¥le** : Limite de puissance pour les **pics courts** (Turbo Boost)
- **Time window typique** : Tr√®s court (<10ms g√©n√©ralement)
- **Objectif** : Permettre des pics de performance temporaires
- **Exemple sur votre syst√®me** : 300W sur quelques millisecondes
- **Impact** : Permet les acc√©l√©rations CPU (turbo) sans violer les limites thermiques

**Analogie** : C'est comme une vitesse de pointe autoris√©e pour d√©passer (150 km/h pendant quelques secondes)

---

### üìä Illustration du Comportement

```
Puissance (W)
    ‚îÇ
350 ‚îÇ        ‚ï±‚ï≤                    PL2 = 300W (short_term)
    ‚îÇ       ‚ï±  ‚ï≤
300 ‚îÇ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ï±‚îÄ‚îÄ‚îÄ‚îÄ‚ï≤‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ        
    ‚îÇ     ‚ï±      ‚ï≤     ‚ï±‚ï≤
250 ‚îÇ‚îÄ‚îÄ‚îÄ‚îÄ‚ï±‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ï≤‚îÄ‚îÄ‚îÄ‚ï±‚îÄ‚îÄ‚ï≤‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ   PL1 = 250W (long_term)
    ‚îÇ   ‚ï±          ‚ï≤ ‚ï±    ‚ï≤
200 ‚îÇ‚îÄ‚îÄ‚ï±‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ï≤‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ï≤‚îÄ‚îÄ‚îÄ‚îÄ
    ‚îÇ ‚ï±              ‚ï≤      ‚ï≤
    ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñ∫ Temps
      ‚Üë               ‚Üë
      Pic autoris√©    Moyenne sur time_window
      (PL2)           respecte PL1
```

---

### ‚è±Ô∏è Impact de la Time Window

#### **Time Window COURTE (100-250ms) :**
```
‚úÖ Avantages :
  ‚Ä¢ Respect strict des limites
  ‚Ä¢ Consommation tr√®s stable
  ‚Ä¢ R√©duction rapide de fr√©quence en cas de pic
  
‚ö†Ô∏è Inconv√©nients :
  ‚Ä¢ Throttling fr√©quent
  ‚Ä¢ Performances r√©duites (~10-15%)
  ‚Ä¢ Moins de tol√©rance aux pics
```

#### **Time Window MOYENNE (1s) - D√©faut :**
```
‚öñÔ∏è √âquilibre :
  ‚Ä¢ Bon compromis performance/√©nergie
  ‚Ä¢ Tol√®re les pics courts (~500ms)
  ‚Ä¢ Throttling occasionnel
  ‚Ä¢ Impact minimal sur les performances
```

#### **Time Window LONGUE (5s) :**
```
‚úÖ Avantages :
  ‚Ä¢ Performances maximales
  ‚Ä¢ Tol√©rance √©lev√©e aux pics
  ‚Ä¢ Peu de throttling
  
‚ö†Ô∏è Inconv√©nients :
  ‚Ä¢ D√©passements possibles sur courtes p√©riodes
  ‚Ä¢ Contr√¥le moins strict
  ‚Ä¢ Pics de temp√©rature possibles
```

---

### üßÆ Exemple Math√©matique

**Sc√©nario :** Power limit = 200W, Time window = 1s

```
Temps   | Puissance instantan√©e | Moyenne glissante (1s) | Action CPU
--------|----------------------|------------------------|-------------
0.0s    | 150W                 | 150W                   | Normal
0.2s    | 280W (pic)           | 176W                   | Turbo autoris√©
0.4s    | 250W                 | 193W                   | Turbo autoris√©
0.6s    | 220W                 | 200W                   | Limite atteinte
0.8s    | 230W                 | 206W                   | ‚ö†Ô∏è Throttling!
1.0s    | 180W                 | 198W                   | Normal r√©tabli
```

‚û°Ô∏è Le CPU **r√©duit automatiquement** sa fr√©quence quand la moyenne d√©passe 200W

---

### üéì Pourquoi c'est Important pour Kepler ?

1. **Pr√©dictibilit√© √©nerg√©tique** : Time window court = consommation plus pr√©visible
2. **Validation des limites** : Permet de v√©rifier que Kepler mesure correctement le capping
3. **Optimisation** : Trouver le meilleur compromis performance/√©nergie pour vos workloads
4. **Budget √©nerg√©tique** : Calculer pr√©cis√©ment la consommation maximale d'un cluster

---

### üí° Recommandations par Cas d'Usage

| Cas d'usage | Time Window | Raison |
|-------------|-------------|---------|
| **Data Center avec SLA strict** | 100-250ms | Garanties √©nerg√©tiques maximales |
| **Applications web/services** | 500ms-1s | Bon √©quilibre r√©activit√©/performance |
| **Calcul scientifique/HPC** | 2-5s | Tol√©rance aux pics de calcul |
| **Validation Kepler** | 1s | Standard, bonnes m√©triques |
| **Exp√©riences contr√¥l√©es** | 250ms | Pr√©cision maximale |

---

### üî¨ Pour Votre Th√®se

Les time windows sont **cruciaux** pour :
- √âtudier le **trade-off performance/√©nergie**
- Valider la **pr√©cision de Kepler** dans diff√©rents r√©gimes
- Comparer les **strat√©gies de power capping**
- Mod√©liser la **consommation pr√©visible** des applications

## ‚è±Ô∏è Exp√©riences : Impact des Fen√™tres de Temps (Time Window)

In [None]:
print("‚è±Ô∏è CONFIG 1 : Time Window COURTE (250ms) - R√©activit√© Maximale")
print("="*80)
print("")
print("üìã Caract√©ristiques :")
print("  ‚Ä¢ Time Window : 250ms (250,000 ¬µs)")
print("  ‚Ä¢ R√©action tr√®s rapide aux pics de consommation")
print("  ‚Ä¢ Power capping strict et agressif")
print("  ‚Ä¢ CPU : 200W (long_term)")
print("")

# Configuration des limites CPU avec time window court
print("üìù Configuration Package 0...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 0 -c 0 -s 250000")  # 250ms

print("üìù Configuration Package 1...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 1 -c 0 -s 250000")  # 250ms

# DRAM
print("üìù Configuration DRAM...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -e 1")
    p.shell("powercap-set intel-rapl -z 1:0 -e 1")
    p.shell("powercap-set intel-rapl -z 0:0 -c 0 -l 40000000")
    p.shell("powercap-set intel-rapl -z 1:0 -c 0 -l 40000000")

print("")
print("‚úÖ Time Window 250ms configur√© !")
print("")
print("üî¨ Effets attendus :")
print("  ‚úÖ Respect tr√®s strict des limites de puissance")
print("  ‚úÖ R√©duction rapide de la fr√©quence CPU en cas de pic")
print("  ‚ö†Ô∏è  Peut causer des throttling fr√©quents")
print("  ‚ö†Ô∏è  Performances l√©g√®rement r√©duites sur workloads variables")
print("")
print("üí° Id√©al pour : Garantir les limites √©nerg√©tiques, exp√©riences contr√¥l√©es")

In [None]:
print("‚è±Ô∏è CONFIG 2 : Time Window MOYENNE (1s) - √âquilibre")
print("="*80)
print("")
print("üìã Caract√©ristiques :")
print("  ‚Ä¢ Time Window : 1 seconde (1,000,000 ¬µs)")
print("  ‚Ä¢ R√©action √©quilibr√©e aux pics de consommation")
print("  ‚Ä¢ Power capping mod√©r√©")
print("  ‚Ä¢ CPU : 200W (long_term)")
print("")

# Configuration des limites CPU avec time window standard
print("üìù Configuration Package 0...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 0 -c 0 -s 1000000")  # 1s

print("üìù Configuration Package 1...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 1 -c 0 -s 1000000")  # 1s

# DRAM
print("üìù Configuration DRAM...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -e 1")
    p.shell("powercap-set intel-rapl -z 1:0 -e 1")
    p.shell("powercap-set intel-rapl -z 0:0 -c 0 -l 40000000")
    p.shell("powercap-set intel-rapl -z 1:0 -c 0 -l 40000000")

print("")
print("‚úÖ Time Window 1s configur√© !")
print("")
print("üî¨ Effets attendus :")
print("  ‚úÖ Bon compromis entre respect des limites et performance")
print("  ‚úÖ Tol√©rance aux pics courts (~500ms)")
print("  ‚öôÔ∏è  Throttling mod√©r√©")
print("  ‚öôÔ∏è  Performances correctes sur la plupart des workloads")
print("")
print("üí° Id√©al pour : Usage g√©n√©ral, applications r√©actives")

In [None]:
print("‚è±Ô∏è CONFIG 3 : Time Window LONGUE (5s) - Tol√©rance aux Pics")
print("="*80)
print("")
print("üìã Caract√©ristiques :")
print("  ‚Ä¢ Time Window : 5 secondes (5,000,000 ¬µs)")
print("  ‚Ä¢ R√©action lente aux pics de consommation")
print("  ‚Ä¢ Power capping permissif")
print("  ‚Ä¢ CPU : 200W (long_term)")
print("")

# Configuration des limites CPU avec time window long
print("üìù Configuration Package 0...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 0 -c 0 -s 5000000")  # 5s

print("üìù Configuration Package 1...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 1 -c 0 -s 5000000")  # 5s

# DRAM
print("üìù Configuration DRAM...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -e 1")
    p.shell("powercap-set intel-rapl -z 1:0 -e 1")
    p.shell("powercap-set intel-rapl -z 0:0 -c 0 -l 40000000")
    p.shell("powercap-set intel-rapl -z 1:0 -c 0 -l 40000000")

print("")
print("‚úÖ Time Window 5s configur√© !")
print("")
print("üî¨ Effets attendus :")
print("  ‚úÖ Tol√©rance √©lev√©e aux pics de charge")
print("  ‚úÖ D√©passements possibles sur courtes p√©riodes")
print("  ‚ö†Ô∏è  Respect moins strict des limites de puissance")
print("  ‚úÖ Performances maximales sur workloads avec pics")
print("")
print("üí° Id√©al pour : Calculs par batch, workloads avec pics courts")

In [None]:
print("‚è±Ô∏è CONFIG 4 : Time Window TR√àS COURTE (100ms) - Ultra-R√©actif")
print("="*80)
print("")
print("üìã Caract√©ristiques :")
print("  ‚Ä¢ Time Window : 100ms (100,000 ¬µs)")
print("  ‚Ä¢ R√©action ultra-rapide, presque instantan√©e")
print("  ‚Ä¢ Power capping tr√®s strict")
print("  ‚Ä¢ CPU : 200W (long_term)")
print("")

# Configuration des limites CPU avec time window tr√®s court
print("üìù Configuration Package 0...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 0 -c 0 -s 100000")  # 100ms

print("üìù Configuration Package 1...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 1 -c 0 -l 200000000")
    p.shell("powercap-set intel-rapl -z 1 -c 0 -s 100000")  # 100ms

# DRAM
print("üìù Configuration DRAM...")
with en.actions(roles=worker_nodes) as p:
    p.shell("powercap-set intel-rapl -z 0:0 -e 1")
    p.shell("powercap-set intel-rapl -z 1:0 -e 1")
    p.shell("powercap-set intel-rapl -z 0:0 -c 0 -l 40000000")
    p.shell("powercap-set intel-rapl -z 1:0 -c 0 -l 40000000")

print("")
print("‚úÖ Time Window 100ms configur√© !")
print("")
print("üî¨ Effets attendus :")
print("  ‚úÖ Respect maximal des limites (presque aucun d√©passement)")
print("  ‚úÖ Contr√¥le √©nerg√©tique tr√®s pr√©cis")
print("  ‚ö†Ô∏è  Throttling tr√®s fr√©quent et agressif")
print("  ‚ö†Ô∏è  Impact significatif sur les performances (~10-15%)")
print("")
print("üí° Id√©al pour : Garanties √©nerg√©tiques strictes, data centers contraints")

## üìä Tableau Comparatif des Fen√™tres de Temps

In [None]:
print("üìä COMPARAISON DES TIME WINDOWS")
print("="*90)
print("")
print("| Time Window | R√©activit√© | Respect Limites | Throttling | Performance | Usage       |")
print("|-------------|------------|-----------------|------------|-------------|-------------|")
print("| 100ms       | ‚ö°‚ö°‚ö°‚ö°‚ö°    | ‚úÖ‚úÖ‚úÖ‚úÖ‚úÖ         | ‚ö†Ô∏è‚ö†Ô∏è‚ö†Ô∏è‚ö†Ô∏è‚ö†Ô∏è    | ‚≠ê‚≠ê          | Data Center |")
print("| 250ms       | ‚ö°‚ö°‚ö°‚ö°      | ‚úÖ‚úÖ‚úÖ‚úÖ          | ‚ö†Ô∏è‚ö†Ô∏è‚ö†Ô∏è       | ‚≠ê‚≠ê‚≠ê         | Contr√¥l√©    |")
print("| 1s (d√©faut) | ‚ö°‚ö°‚ö°        | ‚úÖ‚úÖ‚úÖ           | ‚ö†Ô∏è‚ö†Ô∏è         | ‚≠ê‚≠ê‚≠ê‚≠ê        | G√©n√©ral     |")
print("| 5s          | ‚ö°‚ö°         | ‚úÖ‚úÖ             | ‚ö†Ô∏è           | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê       | HPC/Batch   |")
print("")
print("="*90)
print("")
print("üî¨ M√âTHODOLOGIE DE TEST RECOMMAND√âE :")
print("")
print("1Ô∏è‚É£  Appliquer une configuration de time window")
print("2Ô∏è‚É£  Lancer un stress test (cellule stress pr√©c√©dente)")
print("3Ô∏è‚É£  Observer les m√©triques Kepler dans Grafana pendant 5 minutes")
print("4Ô∏è‚É£  Noter les observations :")
print("    ‚Ä¢ Consommation moyenne")
print("    ‚Ä¢ Pics de consommation")
print("    ‚Ä¢ Fr√©quence de throttling")
print("    ‚Ä¢ Performance des workloads")
print("5Ô∏è‚É£  Changer de configuration et r√©p√©ter")
print("")
print("üìà M√âTRIQUES KEPLER √Ä SURVEILLER :")
print("  ‚Ä¢ kepler_container_joules_total (√©nergie consomm√©e)")
print("  ‚Ä¢ kepler_node_core_joules_total (√©nergie CPU)")
print("  ‚Ä¢ kepler_node_dram_joules_total (√©nergie DRAM)")
print("  ‚Ä¢ Puissance instantan√©e (d√©riv√©e de l'√©nergie)")
print("")
print("üí° INSIGHTS ATTENDUS :")
print("  ‚Ä¢ Time window court = √©nergie plus stable mais performances r√©duites")
print("  ‚Ä¢ Time window long = pics d'√©nergie mais meilleures performances")
print("  ‚Ä¢ Optimal = compromis bas√© sur vos contraintes (SLA, budget √©nergie)")

## üîÑ Nouveau Cluster : Paradoxe (Rennes) - Analyse RAPL

In [None]:
print("üîÑ ANALYSE DU NOUVEAU CLUSTER : PARADOXE (RENNES)")
print("="*80)
print("")
print("üìã CARACT√âRISTIQUES D√âTECT√âES :")
print("")
print("üñ•Ô∏è  CPU Packages (2 par worker) :")
print("  ‚Ä¢ TDP (long_term)  : 185W par package")
print("  ‚Ä¢ Turbo (short_term): 222W par package")
print("  ‚Ä¢ Max Turbo possible: 652W (!)")
print("  ‚Ä¢ Time Window      : ~1 seconde (999,424 ¬µs)")
print("")
print("üíæ DRAM (2 modules par worker) :")
print("  ‚Ä¢ √âtat actuel      : D√âSACTIV√â (enabled: 0)")
print("  ‚Ä¢ Limite actuelle  : 0W")
print("  ‚Ä¢ Limite maximale  : 41.25W par module")
print("")
print("üìä COMPARAISON AVEC CLUSTER PR√âC√âDENT (Chirop/Lille) :")
print("")
print("| Param√®tre          | Chirop (Lille)  | Paradoxe (Rennes) | Diff√©rence |")
print("|--------------------|-----------------|-------------------|------------|")
print("| CPU long_term      | 250W            | 185W              | -26%       |")
print("| CPU short_term     | 300W            | 222W              | -26%       |")
print("| CPU turbo max      | 794W            | 652W              | -18%       |")
print("| DRAM max           | 80W             | 41.25W            | -48%       |")
print("| Total par worker   | ~500W           | ~370W             | -26%       |")
print("")
print("üí° OBSERVATIONS IMPORTANTES :")
print("")
print("‚úÖ Processeurs plus √©conomes en √©nergie")
print("   ‚Üí TDP r√©duit de 26% (185W vs 250W)")
print("   ‚Üí Meilleur pour les exp√©riences d'efficacit√© √©nerg√©tique")
print("")
print("‚úÖ Turbo Boost tr√®s puissant")
print("   ‚Üí Ratio turbo/TDP : 3.5x (652W/185W)")
print("   ‚Üí Permet des pics de performance importants")
print("")
print("‚ö†Ô∏è  DRAM d√©sactiv√©e par d√©faut")
print("   ‚Üí Limite DRAM √† 0W actuellement")
print("   ‚Üí N√©cessite activation pour power capping complet")
print("")
print("‚ö†Ô∏è  DRAM moins puissante")
print("   ‚Üí Max 41.25W vs 80W (environ moiti√©)")
print("   ‚Üí Architecture m√©moire diff√©rente")
print("")
print("üéØ RECOMMANDATIONS POUR CE CLUSTER :")
print("")
print("1Ô∏è‚É£  Activer le contr√¥le DRAM (priorit√© haute)")
print("2Ô∏è‚É£  Adapter les limites aux nouvelles valeurs de base")
print("3Ô∏è‚É£  Profiter du TDP r√©duit pour des exp√©riences √©conomes")
print("4Ô∏è‚É£  Tester l'impact du turbo boost √©lev√© (3.5x)")
print("")
print("üîß CONFIGURATIONS ADAPT√âES CR√â√âES CI-DESSOUS")

### üîß Configurations Adapt√©es au Cluster Paradoxe

Voici les configurations de power capping **ajust√©es** pour les caract√©ristiques du cluster Paradoxe (TDP 185W au lieu de 250W).

#### ‚öôÔ∏è Configuration 1 : **Balanced** (√âquilibr√©e)
```bash
# Package 0 (CPU socket 0) - Time windows par d√©faut
powercap-set intel-rapl -z 0 -c 0 -l 150000000  # 150W long_term (d√©faut: ~1s)
powercap-set intel-rapl -z 0 -c 1 -l 180000000  # 180W short_term (d√©faut: ~2.44ms)

# Package 1 (CPU socket 1) - Time windows par d√©faut
powercap-set intel-rapl -z 1 -c 0 -l 150000000  # 150W long_term (d√©faut: ~1s)
powercap-set intel-rapl -z 1 -c 1 -l 180000000  # 180W short_term (d√©faut: ~2.44ms)

# DRAM 0 (M√©moire socket 0) - ACTIVATION N√âCESSAIRE
powercap-set intel-rapl -z 0:0 -c 0 -l 30000000 -e 1  # 30W DRAM + enable

# DRAM 1 (M√©moire socket 1) - ACTIVATION N√âCESSAIRE
powercap-set intel-rapl -z 1:0 -c 0 -l 30000000 -e 1  # 30W DRAM + enable
```

**Caract√©ristiques :**
- **81% du TDP** par package (150W/185W)
- **81% du turbo** maximum (180W/222W)
- **73% de la limite DRAM** (30W/41.25W)
- **Time windows par d√©faut** ‚Üí utilise les valeurs syst√®me (999.424¬µs pour long_term)
- Excellent compromis performance/√©conomies

---

#### ‚ö° Configuration 2 : **Economy** (√âconomique)
```bash
# Package 0 - Time windows par d√©faut
powercap-set intel-rapl -z 0 -c 0 -l 120000000  # 120W long_term (d√©faut: ~1s)
powercap-set intel-rapl -z 0 -c 1 -l 140000000  # 140W short_term (d√©faut: ~2.44ms)

# Package 1 - Time windows par d√©faut
powercap-set intel-rapl -z 1 -c 0 -l 120000000  # 120W long_term (d√©faut: ~1s)
powercap-set intel-rapl -z 1 -c 1 -l 140000000  # 140W short_term (d√©faut: ~2.44ms)

# DRAM 0
powercap-set intel-rapl -z 0:0 -c 0 -l 20000000 -e 1  # 20W DRAM + enable

# DRAM 1
powercap-set intel-rapl -z 1:0 -c 0 -l 20000000 -e 1  # 20W DRAM + enable
```

**Caract√©ristiques :**
- **65% du TDP** (120W/185W) ‚Üí **-35% de consommation**
- **63% du turbo** (140W/222W)
- **48% de la limite DRAM** (20W/41.25W)
- **Time windows par d√©faut** ‚Üí utilise les valeurs syst√®me
- Id√©al pour **√©conomies d'√©nergie maximales**

---

#### üöÄ Configuration 3 : **Performance** (Performante)
```bash
# Package 0
powercap-set intel-rapl -z 0 -c 0 -l 170000000 -s 1000000  # 170W long_term (1s)
powercap-set intel-rapl -z 0 -c 1 -l 210000000 -s 2440     # 210W short_term (2.44ms)

# Package 1
powercap-set intel-rapl -z 1 -c 0 -l 170000000 -s 1000000  # 170W long_term (1s)
powercap-set intel-rapl -z 1 -c 1 -l 210000000 -s 2440     # 210W short_term (2.44ms)

# DRAM 0
powercap-set intel-rapl -z 0:0 -c 0 -l 40000000 -e 1       # 40W DRAM + enable

# DRAM 1
powercap-set intel-rapl -z 1:0 -c 0 -l 40000000 -e 1       # 40W DRAM + enable
```

**Caract√©ristiques :**
- **92% du TDP** (170W/185W) ‚Üí Proche du maximum
- **95% du turbo** (210W/222W)
- **97% de la limite DRAM** (40W/41.25W)
- Performance maximale avec l√©ger capping

---

### üìå Diff√©rences par rapport au cluster Chirop (Lille)

| Configuration | Chirop (Lille)  | Paradoxe (Rennes) | Ajustement |
|---------------|-----------------|-------------------|------------|
| **Balanced**  | 200W ‚Üí 250W     | 150W ‚Üí 180W       | -25% /-28% |
| **Economy**   | 150W ‚Üí 180W     | 120W ‚Üí 140W       | -20% /-22% |
| **Performance**| 230W ‚Üí 280W    | 170W ‚Üí 210W       | -26% /-25% |
| **DRAM Balanced**| 40W          | 30W               | -25%       |
| **DRAM Economy** | 30W          | 20W               | -33%       |
| **DRAM Performance**| 60W       | 40W               | -33%       |

**Conclusion :** Toutes les configurations ont √©t√© **r√©duites d'environ 25-30%** pour s'adapter au TDP plus faible du cluster Paradoxe.

### üß™ Exp√©riences Time Windows (Paradoxe)

Les configurations de **fen√™tres de temps** peuvent rester identiques car elles testent l'**impact du d√©lai de r√©action** du power capping, ind√©pendamment du TDP.

Cependant, nous adaptons les **limites de puissance** pour le cluster Paradoxe :

#### ‚ö° Configuration 1 : Ultra-R√©actif (100ms)
```bash
# Packages - 150W avec r√©action rapide
powercap-set intel-rapl -z 0 -c 0 -l 150000000 -s 100000   # 150W @ 100ms
powercap-set intel-rapl -z 1 -c 0 -l 150000000 -s 100000

# DRAM - 30W avec r√©action rapide
powercap-set intel-rapl -z 0:0 -c 0 -l 30000000 -s 100000 -e 1
powercap-set intel-rapl -z 1:0 -c 0 -l 30000000 -s 100000 -e 1
```
**Impact attendu :** Contr√¥le tr√®s strict, throttling fr√©quent, -10-15% performance

---

#### ‚è±Ô∏è Configuration 2 : R√©actif (250ms)
```bash
# Packages - 150W avec r√©action mod√©r√©e
powercap-set intel-rapl -z 0 -c 0 -l 150000000 -s 250000   # 150W @ 250ms
powercap-set intel-rapl -z 1 -c 0 -l 150000000 -s 250000

# DRAM - 30W avec r√©action mod√©r√©e
powercap-set intel-rapl -z 0:0 -c 0 -l 30000000 -s 250000 -e 1
powercap-set intel-rapl -z 1:0 -c 0 -l 30000000 -s 250000 -e 1
```
**Impact attendu :** Contr√¥le √©quilibr√©, throttling mod√©r√©, -5-8% performance

---

#### üéØ Configuration 3 : √âquilibr√© (1s - d√©faut)
```bash
# Packages - 150W avec r√©action standard
powercap-set intel-rapl -z 0 -c 0 -l 150000000 -s 1000000  # 150W @ 1s
powercap-set intel-rapl -z 1 -c 0 -l 150000000 -s 1000000

# DRAM - 30W avec r√©action standard
powercap-set intel-rapl -z 0:0 -c 0 -l 30000000 -s 1000000 -e 1
powercap-set intel-rapl -z 1:0 -c 0 -l 30000000 -s 1000000 -e 1
```
**Impact attendu :** √âquilibre optimal, impact minimal, -1-3% performance

---

#### üïê Configuration 4 : Tol√©rant (5s)
```bash
# Packages - 150W avec r√©action lente
powercap-set intel-rapl -z 0 -c 0 -l 150000000 -s 5000000  # 150W @ 5s
powercap-set intel-rapl -z 1 -c 0 -l 150000000 -s 5000000

# DRAM - 30W avec r√©action lente
powercap-set intel-rapl -z 0:0 -c 0 -l 30000000 -s 5000000 -e 1
powercap-set intel-rapl -z 1:0 -c 0 -l 30000000 -s 5000000 -e 1
```
**Impact attendu :** Tol√©rance maximale aux pics, throttling rare, impact n√©gligeable

---

### üìä Tableau Comparatif Complet (Paradoxe)

| Config             | TDP/Package | Turbo | DRAM  | Time Window | Throttling | Perf    | √âconomies |
|--------------------|-------------|-------|-------|-------------|------------|---------|-----------|
| **Baseline**       | 185W        | 222W  | 0W    | 1s          | Aucun      | 100%    | 0%        |
| **Balanced**       | 150W        | 180W  | 30W   | 1s          | Mod√©r√©     | ~98%    | ~20%      |
| **Economy**        | 120W        | 140W  | 20W   | 1s          | √âlev√©      | ~85%    | ~35%      |
| **Performance**    | 170W        | 210W  | 40W   | 1s          | Faible     | ~99%    | ~10%      |
| **Ultra-R√©actif**  | 150W        | -     | 30W   | 100ms       | Tr√®s √©lev√© | ~85-90% | ~20%      |
| **R√©actif**        | 150W        | -     | 30W   | 250ms       | √âlev√©      | ~92-95% | ~20%      |
| **Tol√©rant**       | 150W        | -     | 30W   | 5s          | Tr√®s faible| ~99%    | ~20%      |

**Notes importantes :**
- üìâ Les √©conomies sont calcul√©es par rapport au TDP de 185W
- ‚ö° Le turbo (short_term) n'est pas utilis√© dans les configs time window
- üíæ DRAM activ√©e dans toutes les configurations (vs d√©sactiv√©e par d√©faut)
- üî¨ Les pourcentages de performance sont des estimations √† valider exp√©rimentalement

In [None]:
# üîß APPLIQUER LES CONFIGURATIONS SUR LE CLUSTER PARADOXE

# Choisir la configuration √† d√©ployer :
# - "balanced" : √âquilibre performance/√©conomie (150W, 30W DRAM)
# - "economy"  : √âconomies maximales (120W, 20W DRAM)  
# - "performance" : Performance maximale (170W, 40W DRAM)
# - "ultrafast" : Time window 100ms
# - "reactive" : Time window 250ms
# - "tolerant" : Time window 5s

CONFIG_CHOICE = "tolerant"  # ‚Üê MODIFIER ICI

# Dictionnaire des configurations pour Paradoxe (185W TDP)
CONFIGS_PARADOXE = {
    "balanced": {
        "name": "‚öñÔ∏è Balanced (√âquilibr√©e)",
        "cpu_long": 150000000,   # 150W
        "cpu_short": 180000000,  # 180W
        "dram": 30000000,        # 30W
        "time_window_long": None,  # Valeur par d√©faut du syst√®me
        "time_window_short": None, # Valeur par d√©faut du syst√®me
    },
    "economy": {
        "name": "‚ö° Economy (√âconomique)",
        "cpu_long": 120000000,   # 120W
        "cpu_short": 140000000,  # 140W
        "dram": 20000000,        # 20W
        "time_window_long": None,  # Valeur par d√©faut du syst√®me
        "time_window_short": None, # Valeur par d√©faut du syst√®me
    },
    "performance": {
        "name": "üöÄ Performance (Performante)",
        "cpu_long": 170000000,   # 170W
        "cpu_short": 210000000,  # 210W
        "dram": 40000000,        # 40W
        "time_window_long": 1000000,
        "time_window_short": 2440,
    },
    "ultrafast": {
        "name": "‚ö° Ultra-R√©actif (100ms)",
        "cpu_long": 150000000,
        "cpu_short": 180000000,
        "dram": 30000000,
        "time_window_long": 100000,   # 100ms
        "time_window_short": 2440,
    },
    "reactive": {
        "name": "‚è±Ô∏è R√©actif (250ms)",
        "cpu_long": 150000000,
        "cpu_short": 180000000,
        "dram": 30000000,
        "time_window_long": 250000,   # 250ms
        "time_window_short": 2440,
    },
    "tolerant": {
        "name": "üïê Tol√©rant (5s)",
        "cpu_long": 150000000,
        "cpu_short": 180000000,
        "dram": 30000000,
        "time_window_long": 5000000,  # 5s
        "time_window_short": 2440,
    },
}

# R√©cup√©rer la configuration choisie
config = CONFIGS_PARADOXE[CONFIG_CHOICE]

print(f"üìå Configuration s√©lectionn√©e : {config['name']}")
print(f"   CPU long_term  : {config['cpu_long']/1e6:.0f}W", end="")
if config['time_window_long']:
    print(f" @ {config['time_window_long']/1000:.0f}ms")
else:
    print(" @ d√©faut syst√®me (~1s)")
print(f"   CPU short_term : {config['cpu_short']/1e6:.0f}W", end="")
if config['time_window_short']:
    print(f" @ {config['time_window_short']/1000:.2f}ms")
else:
    print(" @ d√©faut syst√®me (~2.44ms)")
print(f"   DRAM           : {config['dram']/1e6:.0f}W (activation incluse)")
print("")

# G√©n√©rer les commandes powercap-set
commands = []

# Package 0 - CPU long_term
if config['time_window_long']:
    commands.append(f"powercap-set intel-rapl -z 0 -c 0 -l {config['cpu_long']} -s {config['time_window_long']}")
else:
    commands.append(f"powercap-set intel-rapl -z 0 -c 0 -l {config['cpu_long']}")

# Package 0 - CPU short_term
if config['time_window_short']:
    commands.append(f"powercap-set intel-rapl -z 0 -c 1 -l {config['cpu_short']} -s {config['time_window_short']}")
else:
    commands.append(f"powercap-set intel-rapl -z 0 -c 1 -l {config['cpu_short']}")

# Package 1 - CPU long_term
if config['time_window_long']:
    commands.append(f"powercap-set intel-rapl -z 1 -c 0 -l {config['cpu_long']} -s {config['time_window_long']}")
else:
    commands.append(f"powercap-set intel-rapl -z 1 -c 0 -l {config['cpu_long']}")

# Package 1 - CPU short_term
if config['time_window_short']:
    commands.append(f"powercap-set intel-rapl -z 1 -c 1 -l {config['cpu_short']} -s {config['time_window_short']}")
else:
    commands.append(f"powercap-set intel-rapl -z 1 -c 1 -l {config['cpu_short']}")

# DRAM 0 - M√©moire socket 0 (activation avec -e 1)
commands.append(f"powercap-set intel-rapl -z 0:0 -c 0 -l {config['dram']} -e 1")

# DRAM 1 - M√©moire socket 1 (activation avec -e 1)
commands.append(f"powercap-set intel-rapl -z 1:0 -c 0 -l {config['dram']} -e 1")

print("üîß Commandes √† ex√©cuter sur chaque worker :")
print("-" * 80)
for cmd in commands:
    print(cmd)

# Cr√©er le script shell pour d√©ploiement
script_content = "#!/bin/bash\n\n"
script_content += f"# Configuration : {config['name']}\n"
script_content += f"# G√©n√©r√© pour cluster Paradoxe (TDP 185W)\n\n"
script_content += "echo 'üîß Application du power capping...'\n\n"

for cmd in commands:
    script_content += f"{cmd}\n"

script_content += "\necho ''\n"
script_content += "echo '‚úÖ Configuration appliqu√©e avec succ√®s !'\n"
script_content += "echo ''\n"
script_content += "echo 'üìä V√©rification des limites :'\n"
script_content += "powercap-info intel-rapl\n"

# Sauvegarder le script
with open(f"apply_power_capping_{CONFIG_CHOICE}.sh", "w") as f:
    f.write(script_content)

print("")
print(f"‚úÖ Script g√©n√©r√© : apply_power_capping_{CONFIG_CHOICE}.sh")
print("")
print("üìã Pour appliquer cette configuration sur les workers :")

In [None]:
# üì§ D√âPLOYER LA CONFIGURATION SUR LES WORKERS

# D√©ployer sur tous les workers
print(f"D√©ploiement de la configuration '{config['name']}' sur les workers...")
print("")

with en.actions(roles=worker_nodes) as p:
    # Copier le script sur les workers
    p.copy(
        src=f"apply_power_capping_{CONFIG_CHOICE}.sh",
        dest=f"/tmp/apply_power_capping_{CONFIG_CHOICE}.sh",
        mode="0755"
    )
    
    # Ex√©cuter le script avec sudo
    p.shell(
        cmd=f"sudo /tmp/apply_power_capping_{CONFIG_CHOICE}.sh"
    )

print(f"‚úÖ Configuration '{config['name']}' d√©ploy√©e sur les workers")
print("")

# Afficher les r√©sultats
if p.results:
    for result in p.results:
        print(f"üìç Worker : {result.host}")
        if 'stdout' in result.payload:
            print(result.payload['stdout'])
        print("-" * 80)