# MLOps : Quand le Machine Learning rencontre l‚Äôesprit du DevOps

## Introduction

Les projets de Machine Learning (ML) sont souvent compar√©s √† des exp√©riences scientifiques : on explore, on teste, on ajuste. Une sorte de laboratoire o√π chaque id√©e est mise √† l‚Äô√©preuve. Mais cette approche, bien qu‚Äôefficace pour apprendre, montre vite ses limites quand il s‚Äôagit de passer √† la production.

Avec des mod√®les plus complexes, plus de donn√©es, et des besoins de monitoring, il ne suffit plus que ¬´‚ÄØ√ßa marche dans le notebook‚ÄØ¬ª. C‚Äôest ici que le MLOps, inspir√© du DevOps, entre en jeu‚ÄØ: il structure, automatise et industrialise chaque √©tape d‚Äôun projet ML. Pour le d√©montrer, prenons un exemple concret‚ÄØavec un **projet d‚Äôanalyse de sentiments**. Il s'agit de cr√©er un prototype d'IA pour pr√©dire le sentiment des tweets √† partir de donn√©es open source et d√©ploy√© le model via une API Cloud.

## 1) Premier pas

L'une des premi√®res √©tapes est le choix du mod√®le, c'est une √©tape essentielle mais souvent complexe. Cela d√©pend des sp√©cificit√©s des donn√©es, des contraintes du projet et des objectifs vis√©s. Une approche pragmatique consiste √† commencer par un mod√®le simple, puis √† explorer des mod√®les de plus en plus avanc√©s.

Pour notre projet d'analyse de sentiment, nous commen√ßons par **une r√©gression logistique**. Pourquoi‚ÄØ? Parce qu‚Äôelle est rapide, facile √† impl√©menter et souvent suffisante pour valider une id√©e. Avec cette m√©thode, nous avons utilis√© des caract√©ristiques textuelles de base, comme la fr√©quence des mots (bag of words). Cette **baseline** joue un double r√¥le‚ÄØ: elle permet de valider rapidement la faisabilit√© de l'approche et sert de r√©f√©rence pour √©valuer les am√©liorations apport√©es par des mod√®les plus complexes.

Une fois que notre r√©gression logistique est en place et que nous avons une baseline, il devient crucial de structurer notre approche pour garantir la reproductibilit√© des r√©sultats, faciliter la comparaison des exp√©rimentations, et pr√©parer le mod√®le au d√©ploiement en production, ce que permettent les principes du MLOps et des outils comme **MLflow**. **MLflow** stocke les m√©tadonn√©es de run et les mod√®les, tout en assurant le suivi des exp√©rimentations.



En ce qui concerne MLops, nous allons utiliser conjointement plusieurs outils :
- **MLflow**: stocke les m√©tadonn√©es de run et les mod√®les.
- **DVC**: stocke et versionne les datasets, sans multiplier l‚Äôespace √† chaque run. DVC est con√ßu pour g√©rer efficacement les changements et √©viter de t√©l√©charger ou de pousser inutilement des donn√©es si elles n'ont pas √©t√© modifi√©es.
- **Git**: stocke les scripts, configurations et fichiers .dvc n√©cessaires pour synchroniser code et donn√©es, assurant une tra√ßabilit√© compl√®te du projet.
- **Docker/Conda**: Garantie d'avoir un environnement reproductible. 
    - ex : conda pack -n mlops-env -o mlops-env.tar.gz && docker build -f Dockerfile.mlops-env -t mlops-env:v1 .

Ensemble, ces outils cr√©ent un √©cosyst√®me int√©gr√© qui garantit la reproductibilit√© des r√©sultats en synchronisant chaque version du code, des donn√©es et des mod√®les. Ils facilitent √©galement la collaboration entre √©quipes en offrant un suivi clair des exp√©rimentations et des changements, tout en structurant des pipelines de Machine Learning robustes et facilement d√©ployables √† l'√©chelle.



### Points cl√©s :
- Utilisation de Docker
- L'utilisation de DVC et git permet de faire en sorte que le script 
- l'utilisation d'Hydra permet de changer de passer d'une exp√©rience √† autre simplement.

### R√©sultats :
Voici les performances obtenues sur notre dataset‚ÄØ:
- Pr√©cision : 76,5%
- F1-score : 74,2%

## Cr√©ation du pipeline avec DVC (Data Version Control)

Dans un pipeline DevOps classique, vous codez, vous poussez sur Git, et boum, tout se construit et se d√©ploie automatiquement. En MLOps, on va un cran plus loin, les √©tapes classiques sont : 
- Pr√©parer les donn√©es (nettoyage, enrichissement).
- Entra√Æner les mod√®les (et tester plusieurs configurations).
- Valider les r√©sultats (cross-validation, ensembles de test).
- Et ensuite‚ÄØ? Surveiller en continu. Parce qu‚Äôun mod√®le, contrairement √† du code, peut se d√©grader avec le temps !(drift)

En machine learning, les pipelines impliquent non seulement du code, mais aussi des donn√©es, des mod√®les, et des √©tapes de transformation interconnect√©es. C'est l√† que DVC devient un outil indispensable. Inspir√© de Git, DVC d√©tecte automatiquement les changements dans votre pipeline, ne r√©ex√©cutant que les √©tapes n√©cessaires pour garantir une gestion efficace et reproductible des workflows ML.


## Monter en puissance avec des mod√®les avanc√©s

Bien que ce soit un bon point de d√©part, le mod√®le manque de finesse pour capturer des relations contextuelles. Pour am√©liorer les r√©sultats, nous avons besoin de tester des mod√®les plus avanc√©s, comme des word embeddings combin√©s √† des r√©seaux neuronaux (CNN ou RNN). Ces approches permettent de mieux comprendre le contexte des mots en tenant compte des s√©quences.

Avec Hydra, il devient facile d'ajouter des configurations sans trop toucher aux scripts python.

Capture d‚Äô√©cran des r√©sultats et du graphe des erreurs communes.

R√©sultat avec un CNN :
- Pr√©cision : 82,7%
- F1-score : 81,4%

Cette am√©lioration montre que le mod√®le capture d√©sormais des nuances plus subtiles dans les sentiments. Cependant, la complexit√© augmente : le mod√®le prend plus de temps √† entra√Æner, et le suivi des hyperparam√®tres devient critique.

Capture d‚Äô√©cran des r√©sultats compar√©s aux erreurs de la r√©gression logistique.

## √âtape 3 : L‚Äô√âtat de l‚Äôart avec BERT

Enfin, nous avons utilis√© BERT, un mod√®le pr√©entra√Æn√© d‚Äô√âtat de l‚Äôart, capable de comprendre les subtilit√©s linguistiques et les relations complexes dans les phrases. Avec BERT, les r√©sultats ont √©t√© impressionnants :

R√©sultat avec BERT :
- Pr√©cision : 89,5%
- F1-score : 88,9%

Cependant, l‚Äôutilisation de BERT a introduit de nouveaux d√©fis‚ÄØ:
- Temps d‚Äôentra√Ænement prolong√© : Il a fallu 10 fois plus de temps que pour la r√©gression logistique.
- Infrastructure n√©cessaire : L‚Äôentra√Ænement a n√©cessit√© un GPU, et le suivi des versions de donn√©es et de mod√®les est devenu encore plus crucial.

Capture d‚Äô√©cran des r√©sultats, avec une visualisation des pr√©dictions BERT sur des exemples complexes.

## Passage en production avec MLOps

√Ä chaque √©tape, les mod√®les deviennent plus performants, mais aussi plus complexes √† g√©rer. C‚Äôest ici que le MLOps prend tout son sens. Voici comment il a structur√© notre projet‚ÄØ:

### 1. Suivi des exp√©rimentations

Gr√¢ce √† des outils comme MLflow, nous avons enregistr√© chaque exp√©rimentation‚ÄØ:
- Version des donn√©es utilis√©es.
- Hyperparam√®tres et configurations des mod√®les.
- Performances obtenues (pr√©cision, F1-score, etc.).

Cela nous a permis de comparer les r√©sultats facilement et de justifier nos choix √† chaque √©tape.

### 2. Automatisation des pipelines

Nous avons automatis√© les √©tapes cl√©s‚ÄØ:
- Pr√©paration des donn√©es (nettoyage, transformation).
- Entra√Ænement des mod√®les avec diff√©rentes configurations.
- Validation sur des ensembles ind√©pendants.

Un outil comme Kubeflow nous a aid√©s √† orchestrer ces t√¢ches et √† les rendre reproductibles.

### 3. Monitoring en production

Une fois BERT d√©ploy√©, un syst√®me de monitoring a √©t√© mis en place pour surveiller les performances en temps r√©el. Par exemple‚ÄØ:
- D√©tection des drifts de donn√©es‚ÄØ: Si les avis clients √©voluent (argot, emojis, etc.).
- Suivi des m√©triques‚ÄØ: Si le mod√®le perd en pr√©cision ou en rappel.

Conclusion : Apprendre, structurer, et industrialiser

L‚Äôhistoire de ce projet d‚Äôanalyse de sentiments montre bien la double nature des projets ML. D‚Äôun c√¥t√©, il y a l‚Äôaspect exploratoire‚ÄØ: tester diff√©rents mod√®les et approches pour trouver ce qui fonctionne. De l‚Äôautre, il y a le besoin d‚Äôindustrialisation, o√π la reproductibilit√© et la fiabilit√© deviennent essentielles.

Le MLOps, en s‚Äôappuyant sur les principes du DevOps, nous a permis de structurer cette transition. Il a transform√© une s√©rie d‚Äôexp√©rimentations en une solution robuste, pr√™te pour la production. Et √† chaque √©tape, il nous a offert des outils pour g√©rer la complexit√© croissante du Machine Learning.

# MLOps : Construire des mod√®les qui tiennent la distance

D√©velopper un projet de machine learning suit g√©n√©ralement un parcours bien d√©fini : collecte et pr√©paration des donn√©es, exp√©rimentation et entra√Ænement des mod√®les, √©valuation des performances, puis mise en production. Chaque √©tape apporte son lot de d√©fis techniques et m√©thodologiques, mais avec une bonne organisation, il est possible d‚Äôobtenir un mod√®le performant et exploitable.

Cependant, √† mesure que le projet √©volue et prend de l‚Äôampleur, de nouvelles contraintes apparaissent. Comment garantir que le mod√®le reste performant dans le temps ? Comment assurer la reproductibilit√© des r√©sultats ? Comment maintenir un cadre structur√© malgr√© l‚Äô√©volution des donn√©es, des infrastructures ou des √©quipes ?

C‚Äôest ici que MLOps intervient. Son r√¥le est de structurer et fiabiliser le cycle de vie des mod√®les en anticipant ces d√©fis avant qu‚Äôils ne deviennent des freins majeurs. Il permet d‚Äôassurer la tra√ßabilit√©, la reproductibilit√© et l‚Äô√©volutivit√© des mod√®les, ind√©pendamment des changements qui surviennent au fil du temps. Plut√¥t que de simplement optimiser la vitesse de mise en production, MLOps vise √† garantir une progression stable et ma√Ætris√©e, en r√©duisant les risques li√©s aux infrastructures, aux donn√©es et √† la gouvernance.

L√† o√π un projet ML peut devenir difficile √† maintenir sur le long terme, MLflow et DVC apportent des solutions concr√®tes :

- MLflow centralise le suivi des exp√©rimentations et la gestion des mod√®les, facilitant leur versioning et leur √©valuation.
- DVC assure une gestion efficace des donn√©es et des pipelines, garantissant la reproductibilit√© des entra√Ænements et des r√©sultats.

Ces outils permettent non seulement de structurer le travail, mais aussi d‚Äô√©viter la d√©pendance aux individus, en garantissant que chaque avanc√©e est document√©e et exploitable par toute l‚Äô√©quipe, m√™me apr√®s plusieurs mois d‚Äôinactivit√© sur le projet.

üí° Pour illustrer ces b√©n√©fices concrets, nous prendrons l‚Äôexemple d‚Äôune analyse de sentiments bas√©e sur des tweets. Ce projet nous servira de fil conducteur pour montrer comment MLflow, DVC et Docker/Kubernetes r√©pondent aux d√©fis techniques et organisationnels tout au long du cycle de vie d‚Äôun mod√®le. De la gestion des donn√©es √† la mise en production, chaque √©tape sera explor√©e sous l‚Äôangle du MLOps, afin de d√©montrer comment cette approche s‚Äôimpose aujourd‚Äôhui comme un levier strat√©gique pour garantir la p√©rennit√© et la scalabilit√© des solutions d‚Äôintelligence artificielle.

## Analyse exploratoire des donn√©es (AED)


| **Composant MLOps** | **Solution sans MLOps** | **Probl√®me potentiel √† long terme** | **Solution MLOps** | **Outil** |
|----------------------|----------------------|----------------------|----------------------|----------------------|
| **Analyse exploratoire des donn√©es (AED)** | Analyse et visualisation ponctuelle des donn√©es via des notebooks | Pas de tra√ßabilit√© des transformations appliqu√©es, difficult√© √† reproduire l‚Äôanalyse | Versionner les transformations et standardiser le pr√©processing | **DVC** (versionning des donn√©es), **MLflow** (tracking des exp√©riences) |
| **Pr√©paration des donn√©es et extraction de caract√©ristiques** | Nettoyage et transformation des donn√©es manuellement, stockage en local ou sur un drive | Incoh√©rence des datasets entre √©quipes, difficult√© √† reproduire les jeux de donn√©es | Versionnement des donn√©es et pipelines reproductibles | **DVC** (gestion des datasets), **MLflow** (enregistrement des transformations) |
| **Entra√Ænement et r√©glage du mod√®le** | Exp√©rimentations non structur√©es dans des notebooks, hyperparam√®tres ajust√©s manuellement | Perte des versions interm√©diaires des mod√®les, pas de reproductibilit√© des exp√©riences | Tracking des entra√Ænements, gestion des hyperparam√®tres, reproductibilit√© | **MLflow** (Tracking, Model Registry), **DVC** (pipelines de traitement) |
| **Revue et gouvernance du mod√®le** | Validation et revue manuelle des mod√®les, crit√®res de qualit√© non formalis√©s | Risque de biais non d√©tect√©s, mod√®les non conformes aux normes r√©glementaires | Automatisation des tests de validation, auditabilit√© des mod√®les | **MLflow** (validation et audit des mod√®les), **DVC** (tra√ßabilit√© des donn√©es) |
| **Inf√©rence et d√©ploiement du mod√®le** | D√©ploiement manuel via scripts, mod√®le stock√© sans versioning | Risque d‚Äôerreurs de configuration, difficult√© √† restaurer une version stable | Automatisation du packaging et du d√©ploiement, versionnement des mod√®les | **MLflow** (Model Registry, Serving), **Docker/Kubernetes** (d√©ploiement scalable) |
| **Surveillance des mod√®les** | Pas de monitoring, ou v√©rification manuelle des pr√©dictions | D√©gradation des performances non d√©tect√©e, mod√®le obsol√®te face √† de nouvelles donn√©es | Monitoring automatique des performances et d√©tection du drift | **MLflow** (Model Monitoring), **Prometheus/Grafana** (visualisation des m√©triques) |
| **R√©entra√Ænement automatis√© du mod√®le** | R√©entra√Ænement manuel, sans d√©clenchement bas√© sur des crit√®res pr√©cis | Mod√®le vieillissant, performance en baisse, absence de mise √† jour proactive | D√©clenchement du r√©entra√Ænement automatique bas√© sur des m√©triques pr√©d√©finies | **MLflow** (gestion des mod√®les), **DVC** (pipelines automatis√©s) |


## Cycle de vie

## MLflow : Le carnet de bord des exp√©rimentations ML

(# Ici, vous pouvez ins√©rer une capture d'√©cran MLflow ou un court code montrant l'utilisation de mlflow.start_run(), mlflow.log_param(), mlflow.log_metric()...)

L'une des premi√®res √©tapes dans un projet ML est le choix du mod√®le. Cette √©tape essentielle est souvent complexe et d√©pend autant des sp√©cificit√©s des donn√©es que des contraintes du projet et des objectifs vis√©s. Pour d√©marrer, il est judicieux de commencer par un mod√®le simple, puis d‚Äôexplorer des mod√®les plus avanc√©s. Dans notre cas, nous avons opt√© pour une r√©gression logistique. Pourquoi‚ÄØ? Parce qu‚Äôelle est rapide, facile √† impl√©menter et dsouvent suffisante pour valider la faisabilit√© de l‚Äôapproche. Ce mod√®le, que l‚Äôon nomme baseline, joue un double r√¥le :
- Confirmer rapidement la validit√© de la d√©marche.
- Servir de r√©f√©rence pour √©valuer les gains apport√©s par des mod√®les plus sophistiqu√©s.

### Capturer les m√©triques

Dans le cadre de ce projet d‚Äôanalyse de sentiments, la baseline (r√©gression logistique) est enregistr√©e dans le Model Registry de MLflow, ce qui offre un suivi centralis√© de ses performances.
Comparaison de la baseline avec un mod√®le plus avanc√©

Lorsque de nouveaux mod√®les sont test√©s (par exemple un r√©seau de neurones), MLflow facilite la comparaison avec la baseline, tant au niveau des m√©triques que des hyperparam√®tres utilis√©s. Un simple coup d‚Äô≈ìil √† l‚Äôinterface permet de voir si le nouveau mod√®le surpasse ou non la baseline initiale.

##  Un pipeline unique ou plusieurs ?

(# Rajouter √©ventuellement un bref aper√ßu YAML/Hydra montrant comment vous param√©trez le vectoriseur et le mod√®le.)

Cependant, la baseline n‚Äôest qu‚Äôun point de d√©part : √† mesure que l‚Äôon it√®re, que l‚Äôon ajuste les hyperparam√®tres et que l‚Äôon √©value diff√©rents mod√®les, il devient primordial de garder une tra√ßabilit√© pr√©cise de chaque exp√©rimentation. Dans notre projet, nous souhaitions par exemple tester plusieurs vectoriseurs (TF-IDF, GloVe, BERT‚Ä¶), diff√©rents mod√®les (r√©gression logistique, LSTM, Random Forest, etc.) ou encore des configurations vari√©es (batch_size, lr, seuils de d√©coupage des donn√©es, etc.).

Pour √©viter de multiplier les scripts et de rendre la maintenance laborieuse, on s‚Äôappuie sur un pipeline modulaire et param√©trable. Na√Øvement, deux approches sont possibles :
- Dupliquer le pipeline pour chaque variante,
- Cr√©er un pipeline modulaire et param√©trable, o√π la vectorisation, le mod√®le ou les hyperparam√®tres sont g√©r√©s via un syst√®me de configuration (ex. Hydra, YAML, etc.).

La premi√®re approche peut para√Ætre simple mais devient vite co√ªteuse en maintenance et en risques de divergence de code (copies multiples). Le guide Google ‚ÄúContinuous delivery and automation pipelines in machine learning‚Äù (souvent cit√© comme une r√©f√©rence MLOps) pr√©conise ainsi :

    ‚ÄúTo reduce complexity and promote reuse, we recommend building modular and parametric pipelines. Each stage (data processing, training, evaluation) is defined once and can be reused by multiple variants or parameter sets. This avoids duplication of code and simplifies maintenance.‚Äù

En d‚Äôautres termes, un pipeline modulaire et param√©trable reste plus souple, plus facile √† tester et √† maintenir, tout en assurant la tra√ßabilit√© au sein d‚Äôune m√™me structure de code. Gr√¢ce √† une configuration centralis√©e, vous n‚Äôavez qu‚Äô√† adapter quelques param√®tres pour changer de vectoriseur ou de mod√®le, ce qui acc√©l√®re consid√©rablement l‚Äôexp√©rimentation et limite les erreurs.

### CI/CD Github
(# Rajoutez une courte phrase expliquant ce qu‚Äôon voit dans la capture d‚Äô√©cran, par ex. ‚ÄúCi-dessous un exemple de workflow GitHub Actions d√©clench√© √† chaque push, qui ex√©cute nos tests et notre pipeline MLOps.‚Äù)
Capture d'√©cran

## Passage en production

(# Ici, vous pouvez mentionner comment vous packagez le mod√®le, par exemple via Docker. Ou comment vous utilisez un orchestrateur type Kubernetes, ou un service. Expliquer tr√®s bri√®vement la d√©marche.)

Apr√®s avoir valid√© un mod√®le satisfaisant, il faut le d√©ployer pour qu‚Äôil soit accessible en production. Cette √©tape peut impliquer :
- La containerisation (via Docker) pour embarquer le mod√®le et son environnement d‚Äôex√©cution,
- Le d√©ploiement sur un cluster Kubernetes ou un service d‚Äôh√©bergement (AWS, GCP, Azure‚Ä¶),
- La mise en place d‚Äôune API (REST, gRPC) permettant de recevoir des donn√©es et de retourner des pr√©dictions,
- Des scripts ou workflows CI/CD (GitHub Actions, GitLab CI, Jenkins‚Ä¶) assurant que chaque nouvelle version du mod√®le est correctement test√©e et livr√©e.

(# Ajouter un exemple rapide : ‚ÄúNous avons cr√©√© un Dockerfile d√©crivant l‚Äôenvironnement, qui inclut Python 3.X, scikit-learn, MLflow, etc. Ensuite, un script de d√©ploiement‚Ä¶‚Äù)
DVC et MLflow : Un duo pour une gestion coh√©rente des mod√®les et des donn√©es

Apr√®s avoir d√©fini une baseline et explor√© des mod√®les plus avanc√©s, la gestion des donn√©es et des versions devient essentielle. Il ne suffit pas de versionner les mod√®les avec MLflow ou les donn√©es avec DVC, mais de garantir un lien explicite entre les deux. Cette association assure que chaque modification repose sur un environnement tra√ßable et reproductible, une pierre angulaire du MLOps.

Prenons un exemple concret : reprendre un mod√®le tagu√© en pr√©production dans MLflow, restaurer son environnement exact, et cr√©er une nouvelle branche Git pour pr√©parer une mise √† jour.
```bash
# R√©cup√©rer le hash Git depuis MLflow
mlflow models describe -m "models:/sentiment-analysis-baseline/Production" > model_metadata.txt
GIT_COMMIT=$(grep "git_commit" model_metadata.txt | awk -F': ' '{print $2}')

# Restaurer l'environnement
git checkout $GIT_COMMIT
dvc checkout
dvc pull
```

(# Expliquer en quelques mots ce qui se passe dans le script. ‚Äúmlflow models describe...‚Äù r√©cup√®re le commit Git associ√© au mod√®le, on fait ensuite git checkout pour retrouver le code, dvc checkout et dvc pull pour synchroniser les donn√©es.‚Äù)

## Conclusion

(# Vous pouvez illustrer comment le monitoring ou la d√©rive de donn√©es peut √™tre d√©tect√©, ou simplement raccourcir √† votre convenance.)

En d√©finitive, l‚Äôapproche MLOps va bien au-del√† du simple ¬´‚ÄØ√ßa marche dans le notebook‚ÄØ¬ª. En outillant chaque √©tape (tracking des exp√©riences, versioning des donn√©es, CI/CD et d√©ploiement), elle garantit tra√ßabilit√©, collaboration et industrialisation. Dans l‚Äôexemple de l‚Äôanalyse de sentiments, l‚Äôapproche modulaire et param√©trable permet d‚Äôit√©rer rapidement sur diff√©rents mod√®les ou configurations sans perdre le fil. R√©sultat‚ÄØ: on allie la vitesse d‚Äôexploration scientifique √† la fiabilit√© d‚Äôun environnement de production, assurant la p√©rennit√© et l‚Äôimpact des projets ML.

(# Pensez √† ajouter √©ventuellement un glossaire de termes techniques ou un court paragraphe ‚ÄúAller plus loin‚Äù listant des liens officiels : MLflow, DVC, Hydra, Docker, etc. Cela peut aussi am√©liorer la lisibilit√© et l‚Äôenrichissement pour le lecteur.)
