Le pipeline de pr√©-production correspond aux diff√©rents √©tapes permettant de d√©ployer l'API contenant le mod√®le entra√Æn√©. Il s'agit d'ex√©cuter, dans son int√©gralit√©, les processus d'entra√Ænement, de logging et de conteneurisation de l'API pour servir et exposer directement le mod√®le lorsque l'on modifie le code source.

Cette pratique est pleinement au coeur de l'approche MLOps : en automatisant le d√©ploiement par des processus reli√©s entre-eux, on augmente significativement l'efficacit√© op√©rationnelle en rendant disponible le mod√®le le plus *√† jour*.

<blockquote><p>üôã <b>Ce que nous allons faire</b></p>
<ul>
    <li>Cr√©er le pipeline CI/CD de l'API</li>
    <li>Construire l'int√©gralit√© du pipeline de pr√©-production</li>
</ul>
</blockquote>

<img src="https://media.giphy.com/media/DQcqDjL0vcxz7lEhNT/giphy.gif" />

Le pipeline de pr√©-production est la succession du pipeline CI/CD construit pour entra√Æner le mod√®le et l'envoyer vers MLflow, avec le pipeline qui va automatiquement d√©ployer une image Docker de l'API sur Cloud Run.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod.png" />

Concernant l'entra√Ænement du mod√®le, nous avons seulement un d√©clencheur : lorsque de nouvelles r√©f√©rences sont envoy√©es vers le d√©p√¥t `purchase_predict`. En revanche, pour la construction de l'API, il y a deux d√©clencheurs.

- Lorsque de nouvelles r√©f√©rences sont envoy√©es vers l'API `purchase_predict_api`.
- Lorsque l'entra√Ænement du mod√®le par Cloud Build a termin√© son ex√©cution.

## D√©ploiement de l'API

Dans un premier temps, cr√©ons la partie qui va construire l'API √† partir du d√©p√¥t `purchase_predict_api`.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod_api.png" />

Rappelons-nous que pour construire l'API, nous avons besoin de trois √©tapes.

- Il faut construire l'image Docker de l'API.
- Cette image Docker doit √™tre envoy√©e au Container Registry de notre projet Google.
- L'image envoy√©e vers le Container Registry doit remplacer celle en cours d'ex√©cution sur Cloud Run.

Reprenons le `Dockerfile` que nous avions construit pour l'API.

La seule diff√©rence r√©side dans l'exposition du port o√π nous r√©cup√©rons la variable d'environnement plut√¥t que d'√©crire en clair un port sp√©cifique.

Ensuite, tout comme nous l'avions fait pour le projet `purchase-predict`, nous allons ajouter un fichier `cloudbuild.yaml` qui contient les diff√©rentes √©tapes √† ex√©cuter sur Cloud Build.

Dans les deux premi√®res √©tapes, nous utilisons l'image `gcr.io/cloud-builders/docker` pour construire l'image Docker de l'API et l'envoyer sur le registre de conteneurs de notre projet Google Cloud.

La derni√®re √©tape utilise l'image `gcr.io/google.com/cloudsdktool/cloud-sdk` pour avoir acc√®s √† la commande `gcloud`. Cette derni√®re va nous permettre d'envoyer l'image Docker construire comme nouvelle r√©vision sur notre application Cloud Run.

Cr√©ons un nouveau d√©clencheur Cloud Build nomm√© `build-purchase-predict-api-staging`.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod_api2.png" />

√Ä la troisi√®me √©tape, notre service aura besoin de d√©ployer le conteneur sur Cloud Run. Or, par d√©faut, Cloud Build ne dispose pas des droits d'acc√®s sur les autres services. Il faut donc autoriser Cloud Build √† interagir avec Cloud Run dans les param√®tres.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod_api3.png" />

Envoyons les nouvelles r√©f√©rences vers Git.

Nous voyons le nouveau build appara√Ætre avec les trois √©tapes telles que mentionn√©es dans le fichier de configuration.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod_api4.png" />

Si nous retournons dans <a href="https://console.cloud.google.com/run/" target="_blank">Cloud Run</a>, nous voyons que l'image Docker a bien √©t√© d√©ploy√©e.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod_api5.png" />

Par ailleurs, dans <a href="https://console.cloud.google.com/gcr" target="_blank">Container Registry</a>, nous voyons bien appara√Ætre le tag du commit Git.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod_api6.png" />

## Pipeline entier

Revenons maintenant sur l'int√©gralit√© du pipeline.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/pipeline_preprod.png" />

Nous venons de cr√©er les deux parties (gauche et droite) de mani√®re ind√©pendantes. Pour obtenir l'int√©gralit√© du pipeline, il suffit simplement de modifier le pipeline CI/CD (√† gauche) du projet `purchase-predict` pour ex√©cuter automatiquement la construction de l'image Docker de l'API et son d√©ploiement vers Cloud Run.

Modifions le fichier `cloudbuild.yaml` du projet `purchase-predict`.

Nous ajoutons ici une derni√®re √©tape qui va r√©cup√©rer l'image `gcr.io/google.com/cloudsdktool/cloud-sdk` pour l√†-aussi interagir avec le SDK `gcloud`. L'ex√©cution est ensuite assez dense et peut se d√©composer en plusieurs √©tapes.

- On commence par r√©cup√©rer le d√©p√¥t distant avec `gcloud source repos` de notre API que l'on enregistre dans `/tmp/purchase_predict_api`.
- Ensuite, nous nous positionnons sur la branche adapt√©e (`master` ou `staging`) avec un `checkout` en sp√©cifiant par l'interm√©diaire des arguments `--git-dir` et `--work-tree` le chemin d'acc√®s du code de l'API.
- Enfin, avec `gcloud builds submit`, nous envoyons manuellement un nouveau build en sp√©cifiant le fichier `cloudbuild.yaml` de l'API et en indiquant le dossier des codes sources situ√© dans `/tmp/purchase_predict_api`.

<div class="alert alert-block alert-info">
    Pour acc√©l√©rer les temps de calcul, le param√®tre Kedro <code>automl_max_evals</code> a √©t√© fix√© √† $1$.
</div>

Pour des raisons de temps de calcul, nous rajoutons un `timeout` √† 1200s √† la fin. En effet, la derni√®re √©tape va g√©n√©rer un second build qui sera d√©pendant de celui-ci. Ainsi, la derni√®re √©tape sera termin√©e uniquement lorsque le build lanc√© sera lui-aussi termin√© : il faut donc prendre en compte le temps n√©cessaire √† la fois pour entra√Æner le mod√®le, mais aussi pour construire l'image Docker et l'envoyer sur Cloud Run.

En effectuant un nouveau commit et un push, l'ex√©cution sur Cloud Build devrait prendre au total 7 √† 8 minutes. √Ä la fin, la nouvelle version sera d√©ploy√©e sur Cloud Run.

## ‚úîÔ∏è Conclusion

Le pipeline de pr√©-production est enfin pr√™t ! Il est 100% automatis√©, et en tant que ML Engineer ou Data Scientist, nous pouvons √† tout moment modifier le code ou le mod√®le et un simple `push` fera le travail de d√©ploiement √† notre place (du moins dans l'environnement staging).

- Nous avons cr√©e le pipeline CI/CD pour l'API.
- Nous avons construit le pipeline de pr√©-production dont l'ex√©cution est enti√®rement automatis√©e.

> ‚û°Ô∏è Apr√®s le pipeline de pr√©-production, au tour du **pipeline de production** ! Mais cette fois-ci, la production va devoir supporter de grandes charges de travail (milliers/millions de requ√™tes) : c'est donc **Kubernetes** qui va h√©berger l'API.