Jusqu'√† maintenant, nous avons vu avec MLflow la puissance du composant Tracking, qui permettait de fournir un historique des exp√©rimentations r√©alis√©es en gardant une tracabilit√© des hyper-param√®tres utilis√©s, des m√©triques obtenus mais √©galement des artifacts g√©n√©r√©s (mod√®le, graphique).

Il y a √©galement un autre composant particuli√®rement utile en tant que ML Engineer : c'est le **registre de mod√®le**. √Ä l'instar d'un d√©p√¥t Git, le registre de mod√®le MLflow permettra de g√©rer plusieurs versions de mod√®les en leur attribuant √©galement des tags, qui correspondent √† des environnement de pr√©-production (*staging*) et de production.

<blockquote><p>üôã <b>Ce que nous allons faire</b></p>
<ul>
    <li>Int√©grer le tracking MLflow dans Kedro</li>
    <li>Cr√©er un mod√®le packag√© sous MLflow</li>
    <li>Versioner les mod√®les dans Kedro</li>
</ul>
</blockquote>

## Tracking MLflow sous Kedro

Dans le Notebook MLflow, nous avions entra√Æn√© un LightGBM manuellement et l'avons envoy√© directement sur MLflow et Cloud Storage. L'objectif ici est de modifier le pipeline `training` sous Kedro pour y ajouter l'int√©gration avec MLflow.

Commen√ßons par ajouter une variable d'environnement. Sous Python, le package `python-dotenv` est utile pour r√©cup√©rer les variables d'environnement ou pour en configurer automatiquement lors du d√©veloppement du projet.

√Ä la racine du projet, cr√©ons le fichier `.env`.

Le r√¥le de ce fichier est identique √† un `export` qui serait r√©alis√© sur chaque variable. Le principal int√©r√™t, en plus de pouvoir centraliser toutes les variables d'environnement, est que `python-dotenv` supporte aussi les variables d'environnement : il peut donc √™tre utilis√© √† la fois lors du d√©veloppement ou une fois le code en production.

√Ä noter que nous aurions pu utiliser le fichier `parameters.yml` de Kedro. Dans la pratique, ce fichier est plut√¥t r√©serv√© aux param√®tres des pipelines (ratio pour l'ensemble de test, hyper-param√®tres par d√©faut, etc), et il est pr√©f√©rable, comme c'est le cas en d√©veloppement logiciel, d'inscrire des param√®tres plus g√©n√©raux (comme les r√©f√©rences aux servers, l'environnement de pr√©-production ou de production) dans des fichiers de configuration ou des variables d'environnement.

Cr√©ons le fichier `__init__.py` dans le dossier `training` des pipelines.

Pour rappel, ce fichier sera ex√©cut√© initialement par l'interpr√©teur Python, permettant ainsi de d√©finir des configurations qui seront partag√©es par tous les fichiers du module/dossier. Par la suite, nous allons pouvoir appeler `os.getenv("MLFLOW_SERVER")` pour r√©cup√©rer cette variable d'environnement dans n'importe quel fichier du dossier contenant ce `__init__.py`.

Nous allons ajouter deux param√®tres dans `parameters.yml`.

Cela permet de d√©cider √† tout moment si l'on souhaite envoyer les logs et artifacts vers MLflow, ainsi que l'identifiant de l'exp√©rience MLflow.

Dans `nodes.py` de `training`, modifiant la fonction `auto_ml` pour accepter ces deux nouveaux param√®tres.

Par d√©faut, si aucune information n'est sp√©cifi√©e concernant MLflow, on pr√©f√®re ne pas envoyer de logs ou d'artifacts. Importons `os` ainsi que `mlflow`.

Au tout d√©but de la fonction, apr√®s avoir r√©cup√©r√© la base d'apprentissage $(X, y)$, nous d√©marrons un run.

Si l'on souhaite tracker avec MLflow (`log_to_mlflow` √† `True`), alors on sp√©cifie l'URL de tracking, puis on lance un run avec `start_run` en indiquant l'identifiant de l'exp√©rience associ√© au run.

√Ä la fin de la fonction, nous envoyons les logs et artifacts vers MLflow. Elle retournera √©galement le champ `mlflow_run_id`.

La derni√®re modification √† apporter est de mettre √† jour la d√©finition du pipeline.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry3.png" />

Avant d'ex√©cuter le pipeline, il faut penser √† donner les droits d'√©criture sur Cloud Storage au compte de service de Kedro. Rappelons-nous, nous avions cr√©e un compte de service pour pouvoir r√©cup√©rer les fichiers CSV sur le bucket. Pas besoin d'en cr√©er un nouveau : nous pouvons utiliser celui existant en lui rajoutant de nouvelles autorisations.

Dirigeons-nous dans <a href="https://console.cloud.google.com/iam-admin/iam" target="_blank">IAM</a> et √©ditons le membre `purchase-predict@...`.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry1.png" />

Ajoutons le r√¥le Cr√©ateur des objets de l'espace de stockage. Apr√®s modification des r√¥les, il faut ret√©l√©charger une cl√© pour <a href="https://console.cloud.google.com/iam-admin/serviceaccounts" target="_blank">le compte de service</a>. Une fois le contenu de la cl√© modifi√© dans `conf/local/service-account.json`, nous devons mettre √† jour la variable d'environnement `GOOGLE_APPLICATION_CREDENTIALS`.

√Ä noter que pour aller plus vite, nous pouvons d√©finir cette variable dans le fichier `.env`.

Temporairement, pour v√©rifier que notre code fonctionne, nous allons modifier le param√®tre `automl_max_evals` √† $1$. Dans le m√™me temps, mettons en place le pipeline `global` qui va ex√©cuter de mani√®re s√©quentielle les trois pipelines `loading`, `processing` et `traning`.

Ex√©cutons le pipeline `global`.

Apr√®s quelques dizaines de secondes, le run devrait √™tre visible sous MLflow.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry2.png" />

N'oublions pas, puisque le test est concluant, de remettre `automl_max_evals` √† sa valeur d'origine.

## Pipeline de d√©ploiement vers MLflow

Pour l'instant, nous avons uniquement effectu√© du tracking. Bien que cela soit pratique pour historiser et garder une trace des diff√©rentes ex√©cutions des pipelines d'entra√Ænement, cela ne permet pas directement de g√©rer efficacement des **versions de mod√®les**.

### Registre de mod√®les

Le **Model Registry** (registre de mod√®les) est un composant de MLflow qui permet de g√©rer des versions de mod√®les de Machine Learning, en proposant √©galement des **stages** (√©tats).

- Le tag **staging** correspond √† un mod√®le consid√©r√© comme pr√©-production.
- Le tag **production** correspond √† un mod√®le qui serait en environnement de production.
- Le tag **archived** pour les anciens mod√®les staging ou production archiv√©s.

C'est un composant particuli√®rement utile pour g√©rer le cycle de vie des mod√®les, car le cycle staging, production et archive est couramment appliqu√© lorsque des mod√®les sont mis √† jour r√©guli√®rement. Sous MLflow, l'onglet Models permet d'afficher tous les mod√®les enregistr√©s.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry4.png" />

Retournons dans les exp√©riences et choisissons le dernier run que nous avons lanc√©. En cliquant sur `model` dans les artifacts, un bouton *Register Model* appara√Æt √† droite.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry5.png" />

En cliquant dessus, nous allons pouvoir ajouter manuellement le mod√®le au registre. Pour cela, nous devons cr√©er un nouveau mod√®le que l'on nommera `purchase_predict`.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry6.png" />

En retournant dans Models, nous voyons que la version 1 (le mod√®le que nous venons d'ajouter est bien pr√©sent).

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry7.png" />

En cliquant dessus, nous avons acc√®s √† plus de d√©tails sur les diff√©rentes versions pr√©sentes.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry8.png" />

Pour une version sp√©cifique, nous pouvons manuellement transitionner vers un √©tat de pr√©-production ou de production. L'objectif sera d'automatiser cette t√¢che pour automatiquement changer l'√©tat d'un mod√®le que l'on aura entra√Æn√©.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry9.png" />

### Pipeline de d√©ploiement

Une fois l'entra√Ænement r√©alis√©, nous allons √©galement impl√©menter dans Kedro un pipeline qui va permettre de transitionner l'√©tat d'un mod√®le en staging ou production. Pour cela, nous allons cr√©er un pipepline `deployment` avec les trois fichiers `__init__.py`, `nodes.py` et `pipeline.py`. Le fichier `__init__.py` contiendra les m√™mes instructions.

Nous allons cr√©er deux fonctions dans le fichier `nodes.py`.

- La fonction `push_to_model_registry` va envoyer un mod√®le enregistr√© dans tracking vers le registre de mod√®le associ√©. Notons que pour cela, le mod√®le doit d√©j√† √™tre dans le tracking.
- La fonction `stage_model` qui permet de transitionner un mod√®le du registre vers un √©tat staging ou production.

Nous avons besoin de configurations suppl√©mentaires, `registry_name`, pour r√©f√©rencer le nom du mod√®le dans le registre, que l'on ajoute au fichier `parameters.yml`, ainsi que la variable d'environnement `ENV` pour sp√©cifier si le projet Kedro est ex√©cut√© dans un environnement de pr√©-production ou de production. Modifions le fichier `.env`.

De m√™me pour le fichier `parameters.yml`.

Le param√®tre `run_id` sera lui fourni par le catalogue de donn√©es. √âcrivons le code du pipeline, qui ne pr√©sente aucune difficult√©.

Il ne reste plus qu'√† renseigner ce pipeline dans `hooks.py`.

Nous obtenons le pipeline suivant.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry10.png" />

Lan√ßons une ex√©cution globale (en sp√©cifiant l√†-aussi le param√®tre `automl_max_evals` √† 1 pour acc√©lerer les calculs.

Puisque nous sommes en environnement staging, sur MLflow, le mod√®le enregistr√© doit avoir l'√©tat correspondant.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry12.png" />

Nous avons donc √† la fois la *Latest Version* √† 2, et c'est elle qui est actuellement en staging.

L'int√©gralit√© des pipelines ont √©t√© r√©alis√©es, ce qui donne pour le pipeline `global` un ensemble assez important d'√©tapes.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/model_registry11.png" />

> ‚ùì En quoi envoyer le mod√®le vers le registre peut nous √™tre utile ?

Ce qui va √™tre puissant, c'est que l'on sera capable de r√©cup√©rer, dans un projet diff√©rent que Kedro, le mod√®le le plus √† jour. Ainsi, on **d√©couple fortement** la phase d'exp√©rimentation/d'entra√Ænement du mod√®le et la phase de d√©ploiement, qui est une bonne pratique du Cloud.

Comme toujours, il ne faut pas h√©siter √† r√©guli√®rement pousser son code vers le d√©p√¥t Git.

Nous allons cr√©er une **nouvelle branche** appel√©e staging. Cela va nous permettre de produire un code en environnement de pr√©-production.

On n'oubliera pas d'ajouter la cl√© SSH √† l'agent avec de pousser vers le d√©p√¥t.

Sur <a href="https://source.cloud.google.com/" target="_blank">Cloud Source</a>, la branche `staging` est d√©sormais visible.

## ‚úîÔ∏è Conclusion

Dor√©navant, le projet Kedro peut ex√©cuter le pipeline ML de A √† Z avec MLflow pour centraliser les diff√©rents mod√®les qui seront entra√Æn√©s.

- Nous avons int√©gr√© le tracking MLflow sous Kedro.
- Nous avons cr√©er un mod√®le packag√© sous MLflow.
- Nous sommes capable de changer les √©tats des mod√®les de pr√©-production et de production automatiquement.

> ‚û°Ô∏è Nous avons un mod√®le pr√™t √† √™tre utilis√©. Mais pour √™tre utilis√©, il faut le rendre accessible ... et la meilleure mani√®re de le faire, c'est de <b>construire une API</b>.