Avec Docker, il est tr√®s facile de conteneuriser une application pour packager le code source et ses d√©pendances. Nous allons donc pouvoir conteneuriser l'API contenant le mod√®le.

<blockquote><p>üôã <b>Ce que nous allons faire</b></p>
<ul>
    <li>Cr√©er l'image Docker contenant l'API.</li>
    <li>Configurer le syst√®me pour ex√©cuter automatiquement le conteneur sur l'instance Docker.</li>
</ul>
</blockquote>

<img src="https://media.giphy.com/media/XeAE4MvXVwOLZsZJWO/giphy.gif" />

## Cr√©ation de l'image Docker

Nous allons construire l'image Docker qui va contenir l'API du mod√®le. Pour cela, nous devrions a priori ajouter une cl√© SSH au d√©p√¥t Cloud Source pour que l'instance `docker` puisse cloner le projet. Mais profitons de l'interaction entre les services de Google Cloud : il est possible de donner des droits d'acc√®s automatiquement √† certaines VMs pour, par exemple, authentifier les actions de clonage Git.

Cr√©ons une VM `docker`. En modifiant les informations de l'instance, nous pouvons d√©finir le **Niveau d'acc√®s** √† *D√©finir l'acc√®s pour chaque API*. Sous Cloud Source Repositoires, s√©lectionnons *Lecture seule*.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/docker_api1.png" />

Enregistrons les param√®tres et d√©marrons l'instance. En s'y connectant en SSH, nous pouvons cloner le d√©p√¥t `purchase_predict_api` depuis <a href="https://source.cloud.google.com/" target="_blank">Cloud Source</a>. En cliquant sur le bouton pour cloner, copions la commande via **SDK Google Cloud**. La commande de clonage via SSH ne fonctionnera pas puisque nous n'avons pas configur√© de cl√©s.

 Sur le d√©p√¥t, il faut se positionner sur la branche `staging`, puisqu'il n'y a aucun fichier par d√©faut.

Retournons dans le r√©pertoire local et ajoutons le fichier `Dockerfile`.

Ce fichier est d√©compos√© en plusieurs √©tapes.

- L'installation des paquets n√©cessaires (comme `libgomp1` pour LightGBM) et du gestionnaire `pip`.
- L'ajout des fichiers sources dans le dossier `/app` sur l'image Docker.
- L'ex√©cution en parall√®le des 4 processus Flask avec `gunicorn`.

Une fois le fichier enregistr√©, nous pouvons construire l'image.

Nous pouvons ensuite ex√©cuter un conteneur avec l'image construire.

Malheureusement, au bout de quelques secondes ... plusieurs erreurs apparaissent !

En effet, nous n'avons pas d√©fini les **variables d'environnement** ! Il faut donc sp√©cifier au conteneur Docker les variables telles que nous les avions d√©finies dans le fichier `.env` par exemple. Pour cela, il est plus commode de cr√©er un fichier `env.list` par exemple.

Pour passer l'ensembles des variables en param√®tre au conteneur Docker, nous pouvons utiliser l'argument `--env-file`.

Les 4 ex√©cutions de l'API doivent maintenant √™tre op√©rationnelles dans le conteneur.

> ‚ùì Comment avons-nous pu r√©cup√©rer le mod√®le depuis Cloud Storage alors qu'il n'y a pas de compte de service ?

En effet, nous n'avons pas sp√©cifi√© de compte de service ici. C'est justement parce que nous sommes sur **une VM situ√©e dans le m√™me projet que le bucket** que l'authentification s'effectue par d√©faut. Les instances de VM de Google Cloud ont d√©j√† des comptes de service par d√©faut avec notamment un acc√®s en lecture et √©criture vers Cloud Storage. Ainsi, cela est automatiquement transmis au conteneur Docker. Par contre, si nous √©tions sur un serveur d'un autre projet Google Cloud ou d'un autre fournisseur Cloud, alors il aurait fallu mettre la cl√© d'un compte de service sur l'instance h√¥te, renseigner le chemin √† cette cl√© dans la variable `GOOGLE_APPLICATION_CREDENTIALS` et transmettre cette variable d'environnement au conteneur Docker.

Testons notre API pour voir que tout s'est bien d√©roul√©.

In [2]:
import os
import requests
import pandas as pd

dataset = pd.read_csv(os.path.expanduser("~/data/primary.csv"))
dataset = dataset.drop(["user_session", "user_id", "purchased"], axis=1)

In [None]:
requests.post(
    "http://xx.xx.xx.xx/predict",  # Remplacer par l'adresse IP de l'instance Docker
    json=dataset.sample(n=10).to_json()
).json()

## Configuration du syst√®me

Nous sommes capable d'ex√©cuter notre API √† partir d'un conteneur Docker. Seulement, nous devons r√©aliser toutes ces √©tapes manuellement si l'on souhaite par exemple cr√©er une autre VM pour l'API ou si l'on red√©marre l'actuelle VM. Pour optimiser la configuration du syst√®me, nous allons mettre en place plusieurs composantes.

- L'image Docker va √™tre h√©berg√© vers un <a href="https://console.cloud.google.com/gcr/images" target="_blank">Container Registry</a> qui ne sera accessible que dans notre projet GCP (et non public).
- Nous allons utiliser le nom d'h√¥te de l'instance MLflow plut√¥t que son adresse IP : en effet, en cas de red√©marrage de cette instance, l'adresse IP publique, √©tant √©ph√©m√®re par d√©faut, sera modifi√©e. Ainsi, il faut modifier **toutes les r√©f√©rences** de cette adresse IP dans les applications qui l'utilisent. Le nom d'h√¥te, quant √† lui, permettra de faire r√©f√©rence √† cette VM m√™me en cas de red√©marrage.
- Un service syst√®me sera cr√©e pour ex√©cuter automatiquement le conteneur contenant l'API.

### Registre de conteneurs Google Cloud

Dirigeons-nous vers le <a href="https://console.cloud.google.com/gcr/images" target="_blank">Container Registry</a> et cr√©ons un nouveau registre comme nous l'avions fait avec DockerHub.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/docker_api2.png" />

Comme nous pouvons le voir, il n'y a aucun registre pour l'instant. Mais contrairement √† DockerHub, il n'est pas possible d'en cr√©er un directement via l'interface : les registres sont automatiquement cr√©es lorsqu'une image est envoy√©e via l'API Google Cloud.

Arr√™tons la VM Docker et attribuons lui un nouvel acc√®s API au stockage.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/docker_api3.png" />

Maintenant, nous disposons des droits d'acc√®s pour envoyer une image vers un conteneur de notre projet. Toujours en SSH, apr√®s red√©marrage et connexion √† l'instance Docker, ex√©cutons les commandes `gcloud` pour s'authentifier.

L'utilisation de `sudo` est importante, car cela va cr√©er les fichiers de configuration dans `/root`, car Docker est utilis√© avec `sudo`. Avant d'envoyer l'image vers le registre, attribuons-lui un tag permettant de faire r√©f√©rence √† notre projet Google Cloud.

Il ne reste plus qu'√† envoyer l'image vers le registre.

Le registre est bien cr√©e avec l'image.

<img src="https://blent-learning-user-ressources.s3.eu-west-3.amazonaws.com/training/ml_engineer_facebook/img/docker_api4.png" />

### Nom de domaine du serveur MLflow

Avant de configurer les fichiers `systemd` pour ex√©cuter automatiquement le conteneur sur la machine, r√©cup√©rons le nom de domaine de l'instance MLflow. Apr√®s connexion SSH, nous pouvons simplement utiliser la commande suivante.

Si l'on retourne sur l'instance Docker, en SSH, nous pouvons faire un `ping` pour v√©rifier que le nom de domaine correspond bien √† l'instance MLflow.

√Ä noter que ce nom de domaine n'est accessible **qu'√† l'int√©rieur du projet Google Cloud** : la VM ne sera pas joignable depuis son propre ordinateur.

### Configuration du `systemd`

La derni√®re √©tape consiste √† cr√©er un service `systemd` qui permettra d'ex√©cuter automatiquement le conteneur en arri√®re-plan tout en garantissant le red√©marrage. Mais avant, rappelons-nous que les variables d'environnements doivent √™tre configur√©s, et avec un `systemd`, il n'est pas possible faire des `export`.

Pour pouvoir configurer les variables d'environnements pour un service, il faut les centraliser dans un fichier de configuration, que nous allons cr√©er avec `sudo nano /etc/default/purchase_predict_api`.

Il ne reste plus qu'√† cr√©er le fichier `systemd`. Ce fichier concentre trois blocs que nous allons expliciter.

- **Unit** fait r√©f√©rence aux unit√©s qui doivent √™tre au pr√©alable en cours d'ex√©cution pour que ce service puisse √™tre lanc√©. En l'occurence, les services r√©seaux et de gestion de fichier doivent √™tre lanc√©s pour Zookeeper.
- **Service** contient les informations du service.
- **Install** sp√©cifie la m√©thode d'installation du service.

On pourra trouver <a href="https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/system_administrators_guide/chap-managing_services_with_systemd" target="_blank">plus d'informations ici</a> pour les fichiers `systemd`.

Apr√®s avoir enregistr√© le fichier, nous activons le service et l'ajoutons au services syst√®mes √† d√©marrer automatiquement.

Puis d√©marrons le service.

Pour v√©rifier si le conteneur est bien ex√©cut√©, nous pouvons v√©rifier que le port $80$ est bien utilis√©.

Si le port $80$ n'est pas utilis√©, il se peut que le conteneur ne soit pas en cours d'ex√©cution. Pour cela, il est possible d'inspecter les sorties du syst√®me en affichant par exemple les 100 derni√®res lignes.

Testons une nouvelle fois l'API.

In [9]:
requests.post(
    "http://xx.xx.xx.xx/predict",  # Remplacer par l'adresse IP de l'instance Docker
    json=dataset.sample(n=10).to_json()
).json()

Red√©marrons l'instance. A priori, si nous avons correctement configur√© le `systemd`, le conteneur devra s'ex√©cuter automatiquement au d√©marrage de l'instance. Apr√®s quelques secondes, le temps que l'instance red√©marre, nous pouvons ex√©cuter √† nouveau la cellule ci-dessus.

<div class="alert alert-block alert-warning">
    Puisque l'instance poss√®de une adresse IP √©ph√©m√®re, il faudra probablement changer l'IP dans le cellule.
</div>

Une fois termin√©, nous pouvons stopper l'instance puisque nous n'allons plus l'utiliser par la suite.

## ‚úîÔ∏è Conclusion

Notre API est maintenant pleinement d√©ploy√©e.

- Nous avons cr√©er une image Docker pour l'API.
- Nous avons configur√© le syst√®me pour automatiser l'ex√©cution de l'API.

> ‚û°Ô∏è Malgr√© tout, jusqu'ici, le travail √©tait principalement manuel. √Ä partir de maintenant, nous allons pleinement int√©grer l'approche MLOps en <b>automatisant le d√©ploiement</b> des diff√©rents projets.