# TP 7 : Kubernetes pour les Pipelines de Données Évolutifs

## Objectifs

Ce TP introduit Kubernetes (K8s), la plateforme d'orchestration de conteneurs de référence dans l'industrie. Vous apprendrez à déployer, mettre à l'échelle et gérer des applications de traitement de données conteneurisées dans un environnement proche de la production.

### Objectifs d'apprentissage
* Comprendre l'architecture Kubernetes et ses concepts fondamentaux
* Déployer des applications avec des Pods, Deployments et Services
* Gérer la configuration avec des ConfigMaps et des Secrets
* Mettre en œuvre le stockage persistant avec des PersistentVolumes
* Exécuter des tâches par lots et planifiées avec des Jobs et CronJobs
* Mettre à l'échelle automatiquement les applications avec le Horizontal Pod Autoscaler
* Déployer des applications Spark sur Kubernetes
* Surveiller et dépanner les charges de travail Kubernetes

### Prérequis
* Achèvement du TP 6 (Docker)
* Docker Desktop avec Kubernetes activé, OU
* Minikube installé ([Guide d'installation](https://minikube.sigs.k8s.io/docs/start/))
* CLI kubectl installé ([Guide d'installation](https://kubernetes.io/docs/tasks/tools/))

### Vérification de l'installation

```bash
# Vérifier la version de kubectl
kubectl version --client

# Vérifier l'état du cluster
kubectl cluster-info

# Lister les nœuds
kubectl get nodes
```

### Aperçu des exercices

| Exercice | Sujet | Difficulté |
|----------|-------|------------|
| 1 | Architecture Kubernetes et bases de kubectl | ★ |
| 2 | Pods et Deployments | ★ |
| 3 | Services et mise en réseau | ★★ |
| 4 | ConfigMaps et Secrets | ★★ |
| 5 | Stockage persistant | ★★ |
| 6 | Jobs et CronJobs pour le traitement par lots | ★★ |
| 7 | Mise à l'échelle automatique horizontale des Pods | ★★★ |
| 8 | Déploiement de pipelines de traitement de données | ★★★ |

---

## Exercice 1 : Architecture Kubernetes et bases de kubectl [★]

### Architecture Kubernetes

```
┌────────────────────────────────────────────────────────────────────┐
│                        Plan de contrôle                            │
│  ┌──────────────┐  ┌──────────────┐  ┌──────────────┐             │
│  │  API Server  │  │  Scheduler   │  │  Controller  │             │
│  │              │  │              │  │   Manager    │             │
│  └──────────────┘  └──────────────┘  └──────────────┘             │
│                           │                                        │
│                    ┌──────┴──────┐                                │
│                    │    etcd     │                                │
│                    │  (Stockage) │                                │
│                    └─────────────┘                                │
└────────────────────────────────────────────────────────────────────┘
                              │
         ┌────────────────────┼────────────────────┐
         │                    │                    │
         ▼                    ▼                    ▼
┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐
│  Nœud Worker    │  │  Nœud Worker    │  │  Nœud Worker    │
│  ┌───────────┐  │  │  ┌───────────┐  │  │  ┌───────────┐  │
│  │  kubelet  │  │  │  │  kubelet  │  │  │  │  kubelet  │  │
│  └───────────┘  │  │  └───────────┘  │  │  └───────────┘  │
│  ┌───────────┐  │  │  ┌───────────┐  │  │  ┌───────────┐  │
│  │kube-proxy │  │  │  │kube-proxy │  │  │  │kube-proxy │  │
│  └───────────┘  │  │  └───────────┘  │  │  └───────────┘  │
│  ┌───┐ ┌───┐    │  │  ┌───┐ ┌───┐    │  │  ┌───┐ ┌───┐    │
│  │Pod│ │Pod│    │  │  │Pod│ │Pod│    │  │  │Pod│ │Pod│    │
│  └───┘ └───┘    │  │  └───┘ └───┘    │  │  └───┘ └───┘    │
└─────────────────┘  └─────────────────┘  └─────────────────┘
```

### Composants clés

**Plan de contrôle :**
- **API Server** : Point d'entrée pour toutes les commandes REST
- **etcd** : Stockage clé-valeur distribué pour l'état du cluster
- **Scheduler** : Assigne les Pods aux nœuds
- **Controller Manager** : Exécute les boucles de contrôle (ReplicaSet, Deployment, etc.)

**Nœuds Worker :**
- **kubelet** : Agent qui s'exécute sur chaque nœud
- **kube-proxy** : Proxy réseau pour la mise en réseau des services
- **Container Runtime** : Docker, containerd ou CRI-O

### Commandes kubectl de base

```bash
# Obtenir les informations du cluster
kubectl cluster-info

# Lister tous les nœuds
kubectl get nodes

# Lister tous les namespaces
kubectl get namespaces

# Lister toutes les ressources dans le namespace courant
kubectl get all

# Lister les pods avec plus de détails
kubectl get pods -o wide

# Décrire une ressource
kubectl describe pod <nom-du-pod>

# Afficher les logs
kubectl logs <nom-du-pod>

# Exécuter une commande dans un pod
kubectl exec -it <nom-du-pod> -- /bin/bash

# Appliquer une configuration
kubectl apply -f <fichier.yaml>

# Supprimer une ressource
kubectl delete -f <fichier.yaml>
```

### Travailler avec les Namespaces

Les namespaces fournissent une isolation et une organisation pour les ressources.

```bash
# Créer un namespace
kubectl create namespace data-processing

# Lister les pods dans un namespace spécifique
kubectl get pods -n data-processing

# Définir le namespace par défaut pour le contexte courant
kubectl config set-context --current --namespace=data-processing

# Lister toutes les ressources dans tous les namespaces
kubectl get pods --all-namespaces
```

### Manifestes YAML

Kubernetes utilise des fichiers YAML pour définir les ressources. Structure de base :

```yaml
apiVersion: v1              # Version de l'API
kind: Pod                   # Type de ressource
metadata:
  name: my-pod              # Nom de la ressource
  namespace: default        # Namespace
  labels:                   # Labels clé-valeur
    app: myapp
spec:                       # Spécification de la ressource
  # ... champs spécifiques à la ressource
```

### Questions - Exercice 1

**Q1.1** Explorez votre cluster Kubernetes :
- Listez tous les nœuds et leur état
- Décrivez un nœud pour voir sa capacité et ses ressources allouables
- Listez tous les namespaces et pods du cluster

**Q1.2** Créez un namespace appelé `tdm-practicals` et définissez-le comme votre namespace par défaut.

**Q1.3** Utilisez `kubectl explain` pour explorer la ressource Pod :
- Quels champs sont disponibles dans `spec.containers` ?
- Quelle est la différence entre `resources.limits` et `resources.requests` ?

---

## Exercice 2 : Pods et Deployments [★]

### Pods

Un Pod est la plus petite unité déployable dans Kubernetes. Il peut contenir un ou plusieurs conteneurs qui partagent le stockage et le réseau.

**Pod simple (pod.yaml) :**

```yaml
apiVersion: v1
kind: Pod
metadata:
  name: python-pod
  labels:
    app: python-demo
spec:
  containers:
  - name: python
    image: python:3.10-slim
    command: ["python", "-c"]
    args:
    - |
      import time
      while True:
          print(f"Bonjour depuis Kubernetes à {time.ctime()}")
          time.sleep(5)
    resources:
      requests:
        memory: "64Mi"
        cpu: "100m"
      limits:
        memory: "128Mi"
        cpu: "200m"
```

```bash
# Créer le pod
kubectl apply -f pod.yaml

# Afficher les logs
kubectl logs python-pod -f

# Supprimer le pod
kubectl delete pod python-pod
```

### Deployments

Les Deployments gèrent les ReplicaSets et fournissent des mises à jour déclaratives pour les Pods.

**Deployment (deployment.yaml) :**

```yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: data-processor
  labels:
    app: data-processor
spec:
  replicas: 3
  selector:
    matchLabels:
      app: data-processor
  template:
    metadata:
      labels:
        app: data-processor
    spec:
      containers:
      - name: processor
        image: python:3.10-slim
        command: ["python", "-c"]
        args:
        - |
          import socket
          import time
          hostname = socket.gethostname()
          while True:
              print(f"Traitement sur {hostname}")
              time.sleep(10)
        resources:
          requests:
            memory: "64Mi"
            cpu: "100m"
          limits:
            memory: "128Mi"
            cpu: "200m"
```

```bash
# Créer le deployment
kubectl apply -f deployment.yaml

# Afficher l'état du deployment
kubectl get deployments
kubectl get pods

# Mettre à l'échelle le deployment
kubectl scale deployment data-processor --replicas=5

# Afficher l'historique du deployment
kubectl rollout history deployment/data-processor

# Mettre à jour le deployment (changer l'image, etc.)
kubectl set image deployment/data-processor processor=python:3.11-slim

# Revenir à la version précédente
kubectl rollout undo deployment/data-processor
```

### Cycle de vie des Pods et vérifications de santé

```yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: web-app
spec:
  replicas: 2
  selector:
    matchLabels:
      app: web-app
  template:
    metadata:
      labels:
        app: web-app
    spec:
      containers:
      - name: web
        image: python:3.10-slim
        command: ["python", "-c"]
        args:
        - |
          from http.server import HTTPServer, SimpleHTTPRequestHandler
          print('Démarrage du serveur sur le port 8080')
          HTTPServer(('0.0.0.0', 8080), SimpleHTTPRequestHandler).serve_forever()
        ports:
        - containerPort: 8080
        livenessProbe:
          httpGet:
            path: /
            port: 8080
          initialDelaySeconds: 10
          periodSeconds: 5
        readinessProbe:
          httpGet:
            path: /
            port: 8080
          initialDelaySeconds: 5
          periodSeconds: 3
```

### Questions - Exercice 2

**Q2.1** Créez un Deployment pour une application de traitement de données qui :
- Exécute 3 réplicas
- Utilise l'image Python
- Traite des données en boucle
- Possède des limites de ressources appropriées
- Inclut des sondes de vivacité et de disponibilité (liveness et readiness probes)

**Q2.2** Expérimentez avec la mise à l'échelle :
- Mettez à l'échelle le deployment à 5 réplicas
- Observez comment Kubernetes distribue les pods sur les nœuds
- Réduisez à 2 réplicas et observez la terminaison des pods

**Q2.3** Effectuez une mise à jour progressive (rolling update) :
- Mettez à jour la version de l'image
- Observez la progression du déploiement
- Simulez un déploiement échoué et effectuez un rollback

---

## Exercice 3 : Services et mise en réseau [★★]

### Types de Services

Les Services exposent les pods et fournissent une mise en réseau stable.

```
┌────────────────────────────────────────────────────────────┐
│                      Types de Services                     │
├────────────────┬───────────────────────────────────────────┤
│ ClusterIP      │ IP interne au cluster (par défaut)        │
│ NodePort       │ Expose sur l'IP de chaque nœud à un port  │
│                │ statique                                  │
│ LoadBalancer   │ Répartiteur de charge externe (cloud)     │
│ ExternalName   │ Mappe vers un nom DNS externe             │
└────────────────┴───────────────────────────────────────────┘
```

### Service ClusterIP

**service-clusterip.yaml :**

```yaml
apiVersion: v1
kind: Service
metadata:
  name: data-processor-service
spec:
  type: ClusterIP
  selector:
    app: data-processor
  ports:
  - port: 80          # Port du service
    targetPort: 8080  # Port du conteneur
    protocol: TCP
```

### Service NodePort

**service-nodeport.yaml :**

```yaml
apiVersion: v1
kind: Service
metadata:
  name: web-app-nodeport
spec:
  type: NodePort
  selector:
    app: web-app
  ports:
  - port: 80
    targetPort: 8080
    nodePort: 30080   # Optionnel : 30000-32767
```

```bash
# Accéder au service
# http://<ip-du-noeud>:30080

# Avec minikube
minikube service web-app-nodeport --url
```

### Exemple complet d'application web

**webapp.yaml :**

```yaml
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: flask-app
spec:
  replicas: 3
  selector:
    matchLabels:
      app: flask-app
  template:
    metadata:
      labels:
        app: flask-app
    spec:
      containers:
      - name: flask
        image: python:3.10-slim
        command: ["/bin/bash", "-c"]
        args:
        - |
          pip install flask && python -c "
          from flask import Flask
          import socket
          app = Flask(__name__)
          @app.route('/')
          def hello():
              return f'Bonjour depuis {socket.gethostname()}'
          app.run(host='0.0.0.0', port=5000)
          "
        ports:
        - containerPort: 5000
        resources:
          requests:
            memory: "128Mi"
            cpu: "100m"
          limits:
            memory: "256Mi"
            cpu: "200m"
---
apiVersion: v1
kind: Service
metadata:
  name: flask-app-service
spec:
  type: NodePort
  selector:
    app: flask-app
  ports:
  - port: 80
    targetPort: 5000
    nodePort: 30500
```

```bash
# Appliquer les deux ressources
kubectl apply -f webapp.yaml

# Tester la répartition de charge (plusieurs requêtes montrent différents noms d'hôte)
for i in {1..10}; do curl http://localhost:30500; done
```

### DNS et découverte de services

Kubernetes fournit une découverte de services basée sur DNS. Les services peuvent être accédés par :
- `<nom-du-service>` (même namespace)
- `<nom-du-service>.<namespace>` (entre namespaces)
- `<nom-du-service>.<namespace>.svc.cluster.local` (FQDN)

```bash
# Tester le DNS depuis un pod
kubectl run -it --rm debug --image=busybox -- nslookup flask-app-service
```

### Questions - Exercice 3

**Q3.1** Créez une application multi-niveaux :
- Deployment et Service Frontend (NodePort)
- Deployment et Service Backend (ClusterIP)
- Le frontend communique avec le backend via le nom du service

**Q3.2** Testez la découverte de services :
- Créez un pod de débogage
- Utilisez `nslookup` et `curl` pour vérifier la connectivité des services
- Documentez le processus de résolution DNS

**Q3.3** Implémentez la répartition de charge :
- Déployez 5 réplicas d'une application web
- Faites plusieurs requêtes et identifiez quel pod traite chacune
- Analysez la distribution de la charge

---

## Exercice 4 : ConfigMaps et Secrets [★★]

### ConfigMaps

Les ConfigMaps stockent des données de configuration non sensibles.

**configmap.yaml :**

```yaml
apiVersion: v1
kind: ConfigMap
metadata:
  name: app-config
data:
  # Paires clé-valeur
  DATABASE_HOST: "postgres-service"
  DATABASE_PORT: "5432"
  LOG_LEVEL: "INFO"
  
  # Clés de type fichier
  config.json: |
    {
      "processing": {
        "batch_size": 100,
        "timeout": 30
      }
    }
```

**Utilisation des ConfigMaps dans les Pods :**

```yaml
apiVersion: v1
kind: Pod
metadata:
  name: config-demo
spec:
  containers:
  - name: demo
    image: python:3.10-slim
    
    # Méthode 1 : Variables d'environnement à partir de clés spécifiques
    env:
    - name: DB_HOST
      valueFrom:
        configMapKeyRef:
          name: app-config
          key: DATABASE_HOST
    
    # Méthode 2 : Toutes les clés comme variables d'environnement
    envFrom:
    - configMapRef:
        name: app-config
    
    # Méthode 3 : Montage comme volume
    volumeMounts:
    - name: config-volume
      mountPath: /etc/config
      
  volumes:
  - name: config-volume
    configMap:
      name: app-config
```

### Secrets

Les Secrets stockent des données sensibles comme les mots de passe et les clés API.

```bash
# Créer un secret à partir de valeurs littérales
kubectl create secret generic db-credentials \
  --from-literal=username=admin \
  --from-literal=password=secretpass123

# Créer un secret à partir d'un fichier
kubectl create secret generic tls-certs \
  --from-file=cert.pem \
  --from-file=key.pem

# Afficher le secret (encodé en base64)
kubectl get secret db-credentials -o yaml
```

**secret.yaml :**

```yaml
apiVersion: v1
kind: Secret
metadata:
  name: db-credentials
type: Opaque
data:
  # Les valeurs doivent être encodées en base64
  # echo -n 'admin' | base64
  username: YWRtaW4=
  password: c2VjcmV0cGFzczEyMw==
```

**Utilisation des Secrets dans les Pods :**

```yaml
apiVersion: v1
kind: Pod
metadata:
  name: secret-demo
spec:
  containers:
  - name: demo
    image: python:3.10-slim
    env:
    - name: DB_USERNAME
      valueFrom:
        secretKeyRef:
          name: db-credentials
          key: username
    - name: DB_PASSWORD
      valueFrom:
        secretKeyRef:
          name: db-credentials
          key: password
```

### Exemple complet : Application avec configuration

**data-processor-config.yaml :**

```yaml
---
apiVersion: v1
kind: ConfigMap
metadata:
  name: processor-config
data:
  BATCH_SIZE: "100"
  PROCESSING_MODE: "parallel"
  LOG_LEVEL: "DEBUG"
---
apiVersion: v1
kind: Secret
metadata:
  name: processor-secrets
type: Opaque
stringData:  # Utilisez stringData pour les valeurs non encodées
  API_KEY: "your-secret-api-key"
  DATABASE_URL: "postgresql://user:pass@host:5432/db"
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: data-processor
spec:
  replicas: 2
  selector:
    matchLabels:
      app: data-processor
  template:
    metadata:
      labels:
        app: data-processor
    spec:
      containers:
      - name: processor
        image: python:3.10-slim
        command: ["python", "-c"]
        args:
        - |
          import os
          import time
          print(f"Taille du lot : {os.environ.get('BATCH_SIZE')}")
          print(f"Mode : {os.environ.get('PROCESSING_MODE')}")
          print(f"Clé API : {os.environ.get('API_KEY')[:5]}...")
          while True:
              print("Traitement en cours...")
              time.sleep(10)
        envFrom:
        - configMapRef:
            name: processor-config
        - secretRef:
            name: processor-secrets
```

### Questions - Exercice 4

**Q4.1** Créez une configuration pour une application de traitement de données :
- ConfigMap avec les paramètres de traitement (taille du lot, timeout, chemins d'entrée/sortie)
- Secret avec les identifiants de base de données
- Deployment qui utilise les deux

**Q4.2** Implémentez le rechargement à chaud de la configuration :
- Montez le ConfigMap comme volume
- Écrivez un script Python qui surveille les changements du fichier de configuration
- Mettez à jour le ConfigMap et vérifiez que l'application détecte les changements

**Q4.3** Créez une configuration prête pour la production :
- Configurations séparées pour les environnements dev/staging/prod
- Utilisez Kustomize pour gérer les surcharges spécifiques à chaque environnement
- Documentez la stratégie de gestion de configuration

---

## Exercice 5 : Stockage persistant [★★]

### Concepts de stockage

```
┌─────────────────────────────────────────────────────────────┐
│                   Architecture de stockage                   │
│                                                              │
│  ┌──────────────────┐                                       │
│  │       Pod        │                                       │
│  │  ┌────────────┐  │                                       │
│  │  │  Montage   │  │◄──── PersistentVolumeClaim (PVC)     │
│  │  │  de volume │  │            │                          │
│  │  └────────────┘  │            │ liaison                  │
│  └──────────────────┘            ▼                          │
│                         ┌──────────────────┐                │
│                         │ PersistentVolume │                │
│                         │      (PV)        │                │
│                         └────────┬─────────┘                │
│                                  │                          │
│                                  ▼                          │
│                         ┌──────────────────┐                │
│                         │Backend de stockage│               │
│                         │ (NFS, EBS, etc.)  │               │
│                         └──────────────────┘                │
└─────────────────────────────────────────────────────────────┘
```

### PersistentVolume et PersistentVolumeClaim

**pv-pvc.yaml :**

```yaml
---
# PersistentVolume (généralement créé par l'administrateur)
apiVersion: v1
kind: PersistentVolume
metadata:
  name: data-pv
spec:
  capacity:
    storage: 5Gi
  accessModes:
    - ReadWriteOnce      # RWO : nœud unique
    # - ReadWriteMany    # RWX : plusieurs nœuds
    # - ReadOnlyMany     # ROX : lecture seule sur plusieurs nœuds
  persistentVolumeReclaimPolicy: Retain  # ou Delete
  storageClassName: manual
  hostPath:
    path: /data/pv-data
---
# PersistentVolumeClaim (créé par l'utilisateur)
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: data-pvc
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 2Gi
  storageClassName: manual
```

### Utilisation d'un PVC dans les Pods

**pod-with-storage.yaml :**

```yaml
apiVersion: v1
kind: Pod
metadata:
  name: data-writer
spec:
  containers:
  - name: writer
    image: python:3.10-slim
    command: ["python", "-c"]
    args:
    - |
      import time
      from datetime import datetime
      
      counter = 0
      while True:
          with open('/data/output.txt', 'a') as f:
              f.write(f"{datetime.now()}: Enregistrement {counter}\n")
          print(f"Enregistrement {counter} écrit")
          counter += 1
          time.sleep(5)
    volumeMounts:
    - name: data-volume
      mountPath: /data
  volumes:
  - name: data-volume
    persistentVolumeClaim:
      claimName: data-pvc
```

### StorageClass pour le provisionnement dynamique

**storageclass.yaml :**

```yaml
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: fast-storage
provisioner: kubernetes.io/gce-pd  # ou aws-ebs, azure-disk
parameters:
  type: pd-ssd
reclaimPolicy: Delete
volumeBindingMode: Immediate
```

**PVC dynamique :**

```yaml
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: dynamic-pvc
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 10Gi
  storageClassName: fast-storage  # Utilise la StorageClass
```

### Questions - Exercice 5

**Q5.1** Créez une configuration de stockage persistant pour un pipeline de données :
- PersistentVolume pour les données d'entrée
- PersistentVolume pour les données de sortie
- Pod qui lit depuis l'entrée, traite, et écrit vers la sortie

**Q5.2** Implémentez le partage de données entre pods :
- Créez un PVC avec le mode d'accès ReadWriteMany
- Déployez un pod écrivain et plusieurs pods lecteurs
- Vérifiez que tous les pods peuvent accéder aux données partagées

**Q5.3** Testez la persistance des données :
- Déployez une base de données (PostgreSQL) avec stockage persistant
- Insérez des données, supprimez le pod, vérifiez que les données persistent
- Documentez le processus de sauvegarde et de restauration

---

## Exercice 6 : Jobs et CronJobs pour le traitement par lots [★★]

### Jobs

Les Jobs exécutent un ou plusieurs pods jusqu'à leur achèvement.

**job.yaml :**

```yaml
apiVersion: batch/v1
kind: Job
metadata:
  name: data-processing-job
spec:
  completions: 5       # Nombre d'achèvements réussis requis
  parallelism: 2       # Pods s'exécutant en parallèle
  backoffLimit: 3      # Tentatives avant de marquer comme échec
  activeDeadlineSeconds: 600  # Timeout
  template:
    spec:
      restartPolicy: Never  # ou OnFailure
      containers:
      - name: processor
        image: python:3.10-slim
        command: ["python", "-c"]
        args:
        - |
          import random
          import time
          import socket
          
          hostname = socket.gethostname()
          work_time = random.randint(5, 15)
          
          print(f"Job {hostname} démarré, s'exécutera pendant {work_time} secondes")
          time.sleep(work_time)
          print(f"Job {hostname} terminé avec succès")
```

```bash
# Créer le job
kubectl apply -f job.yaml

# Surveiller la progression du job
kubectl get jobs -w

# Afficher les logs des pods
kubectl logs job/data-processing-job

# Supprimer le job et ses pods
kubectl delete job data-processing-job
```

### CronJobs

Les CronJobs exécutent des jobs selon un calendrier.

**cronjob.yaml :**

```yaml
apiVersion: batch/v1
kind: CronJob
metadata:
  name: data-aggregator
spec:
  schedule: "*/5 * * * *"  # Toutes les 5 minutes
  # Format cron : minute heure jour-du-mois mois jour-de-la-semaine
  # "0 * * * *"     - Toutes les heures
  # "0 0 * * *"     - Tous les jours à minuit
  # "0 0 * * 0"     - Tous les dimanches à minuit
  
  concurrencyPolicy: Forbid  # Allow, Forbid, Replace
  successfulJobsHistoryLimit: 3
  failedJobsHistoryLimit: 1
  startingDeadlineSeconds: 200
  
  jobTemplate:
    spec:
      template:
        spec:
          restartPolicy: OnFailure
          containers:
          - name: aggregator
            image: python:3.10-slim
            command: ["python", "-c"]
            args:
            - |
              from datetime import datetime
              print(f"Exécution de l'agrégation à {datetime.now()}")
              # Simuler le travail d'agrégation
              import time
              time.sleep(30)
              print("Agrégation terminée")
```

```bash
# Créer le cronjob
kubectl apply -f cronjob.yaml

# Lister les cronjobs
kubectl get cronjobs

# Afficher les jobs créés par le cronjob
kubectl get jobs

# Déclencher manuellement un job depuis le cronjob
kubectl create job --from=cronjob/data-aggregator manual-run

# Suspendre un cronjob
kubectl patch cronjob data-aggregator -p '{"spec": {"suspend": true}}'
```

### Pipeline de traitement de données avec Jobs

**etl-pipeline.yaml :**

```yaml
---
apiVersion: v1
kind: ConfigMap
metadata:
  name: etl-config
data:
  INPUT_PATH: "/data/input"
  OUTPUT_PATH: "/data/output"
---
apiVersion: batch/v1
kind: Job
metadata:
  name: etl-extract
spec:
  template:
    spec:
      restartPolicy: OnFailure
      containers:
      - name: extract
        image: python:3.10-slim
        command: ["python", "-c"]
        args:
        - |
          import os
          import json
          
          output_path = os.environ.get('OUTPUT_PATH', '/data/output')
          os.makedirs(output_path, exist_ok=True)
          
          # Simuler l'extraction
          data = [{'id': i, 'value': i * 10} for i in range(100)]
          
          with open(f'{output_path}/extracted.json', 'w') as f:
              json.dump(data, f)
          
          print(f"{len(data)} enregistrements extraits")
        envFrom:
        - configMapRef:
            name: etl-config
        volumeMounts:
        - name: data-volume
          mountPath: /data
      volumes:
      - name: data-volume
        persistentVolumeClaim:
          claimName: etl-data-pvc
```

### Questions - Exercice 6

**Q6.1** Créez un job de traitement par lots qui :
- Lit des données depuis un ConfigMap
- Traite les données en parallèle (3 pods)
- Écrit les résultats sur un PersistentVolume
- Gère les échecs avec des tentatives de reprise

**Q6.2** Implémentez un pipeline de données planifié :
- CronJob qui s'exécute toutes les heures
- Récupère des données depuis une API externe (simulée)
- Traite et stocke les résultats
- Envoie une notification à la fin (simulée)

**Q6.3** Créez un pipeline ETL avec plusieurs jobs :
- Job d'extraction qui récupère les données brutes
- Job de transformation qui nettoie et enrichit les données
- Job de chargement qui écrit vers la destination finale
- Utilisez des initContainers pour assurer le bon séquencement

---

## Exercice 7 : Mise à l'échelle automatique horizontale des Pods [★★★]

### Bases du HPA

Le Horizontal Pod Autoscaler met automatiquement à l'échelle le nombre de pods en fonction de l'utilisation observée du CPU/mémoire ou de métriques personnalisées.

```bash
# Activer metrics-server (requis pour le HPA)
# Pour minikube :
minikube addons enable metrics-server

# Vérifier que les métriques sont disponibles
kubectl top nodes
kubectl top pods
```

### Configuration du HPA

**deployment-for-hpa.yaml :**

```yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: cpu-intensive-app
spec:
  replicas: 1
  selector:
    matchLabels:
      app: cpu-intensive
  template:
    metadata:
      labels:
        app: cpu-intensive
    spec:
      containers:
      - name: app
        image: python:3.10-slim
        command: ["/bin/bash", "-c"]
        args:
        - |
          pip install flask && python -c "
          from flask import Flask
          import math
          app = Flask(__name__)
          @app.route('/')
          def compute():
              x = 0
              for i in range(1000000):
                  x += math.sqrt(i)
              return f'Calcul terminé : {x}'
          app.run(host='0.0.0.0', port=5000)
          "
        ports:
        - containerPort: 5000
        resources:
          requests:
            cpu: "100m"
            memory: "128Mi"
          limits:
            cpu: "500m"
            memory: "256Mi"
---
apiVersion: v1
kind: Service
metadata:
  name: cpu-intensive-service
spec:
  type: NodePort
  selector:
    app: cpu-intensive
  ports:
  - port: 80
    targetPort: 5000
    nodePort: 30600
```

**hpa.yaml :**

```yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: cpu-intensive-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: cpu-intensive-app
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 50
  behavior:
    scaleDown:
      stabilizationWindowSeconds: 300
      policies:
      - type: Percent
        value: 100
        periodSeconds: 15
    scaleUp:
      stabilizationWindowSeconds: 0
      policies:
      - type: Percent
        value: 100
        periodSeconds: 15
      - type: Pods
        value: 4
        periodSeconds: 15
      selectPolicy: Max
```

```bash
# Appliquer les configurations
kubectl apply -f deployment-for-hpa.yaml
kubectl apply -f hpa.yaml

# Ou créer le HPA via la ligne de commande
kubectl autoscale deployment cpu-intensive-app --cpu-percent=50 --min=1 --max=10

# Surveiller l'état du HPA
kubectl get hpa -w

# Générer de la charge
# Dans un autre terminal :
kubectl run -it load-generator --rm --image=busybox -- /bin/sh -c \
  "while true; do wget -q -O- http://cpu-intensive-service; done"
```

### HPA basé sur la mémoire

```yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: memory-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: memory-intensive-app
  minReplicas: 2
  maxReplicas: 8
  metrics:
  - type: Resource
    resource:
      name: memory
      target:
        type: AverageValue
        averageValue: 500Mi
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 70
```

### Questions - Exercice 7

**Q7.1** Configurez la mise à l'échelle automatique pour un service de traitement de données :
- Déployez une application de traitement intensive en CPU
- Configurez le HPA avec min=2, max=10 réplicas
- Ciblez une utilisation CPU à 60%
- Testez avec différents niveaux de charge

**Q7.2** Implémentez la mise à l'échelle multi-métriques :
- Mise à l'échelle basée sur le CPU et la mémoire
- Ajoutez des métriques personnalisées (si vous utilisez Prometheus)
- Documentez le comportement de mise à l'échelle sous différentes conditions

**Q7.3** Créez une démonstration complète de mise à l'échelle automatique :
- Déployez une application avec HPA
- Créez un générateur de charge
- Visualisez les événements de mise à l'échelle
- Mesurez les temps de réponse pendant la mise à l'échelle

---

## Exercice 8 : Déploiement de pipelines de traitement de données [★★★]

### Architecture complète du pipeline de données

```
┌─────────────────────────────────────────────────────────────────┐
│                    Cluster Kubernetes                           │
│                                                                 │
│  ┌─────────────┐     ┌─────────────┐     ┌─────────────┐       │
│  │  Ingestion  │     │   File de   │     │    Pods     │       │
│  │  de données │────►│  messages   │────►│   Worker    │       │
│  │  (Deploy)   │     │ (RabbitMQ)  │     │  (Deploy)   │       │
│  └─────────────┘     └─────────────┘     └──────┬──────┘       │
│                                                  │              │
│                                                  ▼              │
│                                           ┌─────────────┐       │
│                                           │ Base de     │       │
│                                           │ données     │       │
│                                           │ (PostgreSQL)│       │
│                                           └─────────────┘       │
│                                                  │              │
│                                                  ▼              │
│                                           ┌─────────────┐       │
│                                           │    API      │       │
│                                           │  (Deploy)   │       │
│                                           └─────────────┘       │
└─────────────────────────────────────────────────────────────────┘
```

### Déploiement RabbitMQ

**rabbitmq.yaml :**

```yaml
---
apiVersion: v1
kind: ConfigMap
metadata:
  name: rabbitmq-config
data:
  RABBITMQ_DEFAULT_USER: "admin"
  RABBITMQ_DEFAULT_PASS: "rabbitmq123"
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: rabbitmq
spec:
  replicas: 1
  selector:
    matchLabels:
      app: rabbitmq
  template:
    metadata:
      labels:
        app: rabbitmq
    spec:
      containers:
      - name: rabbitmq
        image: rabbitmq:3-management
        ports:
        - containerPort: 5672
        - containerPort: 15672
        envFrom:
        - configMapRef:
            name: rabbitmq-config
        resources:
          requests:
            memory: "256Mi"
            cpu: "200m"
          limits:
            memory: "512Mi"
            cpu: "500m"
---
apiVersion: v1
kind: Service
metadata:
  name: rabbitmq
spec:
  selector:
    app: rabbitmq
  ports:
  - name: amqp
    port: 5672
  - name: management
    port: 15672
```

### Déploiement PostgreSQL

**postgres.yaml :**

```yaml
---
apiVersion: v1
kind: Secret
metadata:
  name: postgres-secret
type: Opaque
stringData:
  POSTGRES_USER: "datauser"
  POSTGRES_PASSWORD: "datapass123"
  POSTGRES_DB: "dataprocessing"
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: postgres-pvc
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 5Gi
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: postgres
spec:
  replicas: 1
  selector:
    matchLabels:
      app: postgres
  template:
    metadata:
      labels:
        app: postgres
    spec:
      containers:
      - name: postgres
        image: postgres:15
        ports:
        - containerPort: 5432
        envFrom:
        - secretRef:
            name: postgres-secret
        volumeMounts:
        - name: postgres-storage
          mountPath: /var/lib/postgresql/data
        resources:
          requests:
            memory: "256Mi"
            cpu: "200m"
          limits:
            memory: "512Mi"
            cpu: "500m"
      volumes:
      - name: postgres-storage
        persistentVolumeClaim:
          claimName: postgres-pvc
---
apiVersion: v1
kind: Service
metadata:
  name: postgres
spec:
  selector:
    app: postgres
  ports:
  - port: 5432
```

### Déploiement des Workers avec HPA

**worker.yaml :**

```yaml
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: data-worker
spec:
  replicas: 2
  selector:
    matchLabels:
      app: data-worker
  template:
    metadata:
      labels:
        app: data-worker
    spec:
      containers:
      - name: worker
        image: python:3.10-slim
        command: ["/bin/bash", "-c"]
        args:
        - |
          pip install pika psycopg2-binary && python -c "
          import pika
          import psycopg2
          import time
          import os
          import json
          
          # Connexion à RabbitMQ
          for i in range(10):
              try:
                  connection = pika.BlockingConnection(
                      pika.ConnectionParameters('rabbitmq', credentials=pika.PlainCredentials('admin', 'rabbitmq123'))
                  )
                  break
              except:
                  print('Attente de RabbitMQ...')
                  time.sleep(5)
          
          channel = connection.channel()
          channel.queue_declare(queue='data_queue', durable=True)
          
          def callback(ch, method, props, body):
              data = json.loads(body)
              print(f'Traitement : {data}')
              # Traiter les données et sauvegarder en base de données
              time.sleep(1)
              ch.basic_ack(delivery_tag=method.delivery_tag)
          
          channel.basic_qos(prefetch_count=1)
          channel.basic_consume(queue='data_queue', on_message_callback=callback)
          print('Worker démarré, en attente de messages...')
          channel.start_consuming()
          "
        resources:
          requests:
            memory: "128Mi"
            cpu: "100m"
          limits:
            memory: "256Mi"
            cpu: "300m"
---
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: data-worker-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: data-worker
  minReplicas: 2
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        type: Utilization
        averageUtilization: 60
```

### Déploiement du pipeline complet

```bash
# Créer le namespace
kubectl create namespace data-pipeline

# Déployer les composants
kubectl apply -f rabbitmq.yaml -n data-pipeline
kubectl apply -f postgres.yaml -n data-pipeline
kubectl apply -f worker.yaml -n data-pipeline

# Vérifier les déploiements
kubectl get all -n data-pipeline

# Afficher les logs
kubectl logs -f deployment/data-worker -n data-pipeline

# Redirection de port pour le débogage
kubectl port-forward svc/rabbitmq 15672:15672 -n data-pipeline
# Accéder à l'interface RabbitMQ : http://localhost:15672
```

### Questions - Exercice 8

**Q8.1** Déployez un pipeline complet de traitement de données :
- RabbitMQ pour la mise en file d'attente des messages
- PostgreSQL pour le stockage des données
- Service producteur qui génère des données
- Service worker avec mise à l'échelle automatique
- Service API pour interroger les résultats

**Q8.2** Ajoutez la surveillance et l'observabilité :
- Déployez Prometheus pour la collecte de métriques
- Configurez le scraping pour tous les services
- Créez des tableaux de bord Grafana
- Configurez des alertes pour les métriques clés

**Q8.3** Implémentez un déploiement Spark sur Kubernetes :
- Déployez l'opérateur Spark (ou utilisez spark-submit avec Kubernetes)
- Soumettez un job Spark pour traiter des données depuis PostgreSQL
- Configurez la mise à l'échelle des executors
- Surveillez la progression du job et l'utilisation des ressources

---

## Résumé

Dans ce TP, vous avez appris :

1. **Architecture Kubernetes** : Plan de contrôle, nœuds worker et composants principaux
2. **Pods et Deployments** : Création et gestion d'applications conteneurisées
3. **Services** : Exposition des applications et découverte de services
4. **ConfigMaps et Secrets** : Gestion de la configuration des applications
5. **Stockage persistant** : Implémentation de la persistance des données avec PVs et PVCs
6. **Jobs et CronJobs** : Exécution de charges de travail par lots et planifiées
7. **Mise à l'échelle automatique horizontale des Pods** : Mise à l'échelle automatique basée sur les métriques
8. **Pipelines complets** : Déploiement de systèmes de traitement de données prêts pour la production

### Points clés à retenir

- Utilisez les Deployments pour les applications sans état, les StatefulSets pour celles avec état
- Définissez toujours les demandes et limites de ressources
- Utilisez les ConfigMaps pour la configuration, les Secrets pour les données sensibles
- Implémentez des vérifications de santé (sondes liveness et readiness)
- Concevez pour la mise à l'échelle horizontale dès le départ
- Utilisez les namespaces pour l'isolation et l'organisation des ressources

### Considérations pour la production

- **Sécurité** : Utilisez RBAC, les Network Policies, les Pod Security Policies
- **Surveillance** : Implémentez une observabilité complète
- **Haute disponibilité** : Déployez sur plusieurs zones de disponibilité
- **Reprise après sinistre** : Sauvegardes régulières et procédures de récupération testées
- **GitOps** : Utilisez des outils comme ArgoCD ou Flux pour les déploiements déclaratifs

### Lectures complémentaires

- [Documentation Kubernetes](https://kubernetes.io/docs/home/)
- [Kubernetes Patterns](https://www.oreilly.com/library/view/kubernetes-patterns/9781492050278/)
- [The Kubernetes Book](https://nigelpoulton.com/books/)
- [Spark sur Kubernetes](https://spark.apache.org/docs/latest/running-on-kubernetes.html)