# Déployer sur un point de terminaison en ligne

Pour consommer un modèle à partir d’une application, vous pouvez déployer le modèle sur un point de terminaison en ligne. Vous allez créer un modèle MLflow à partir de fichiers locaux et tester le point de terminaison.

## Avant de commencer

Vous devez avoir la dernière version du package **azureml-ai-ml** pour exécuter le code dans ce notebook. Exécutez la cellule ci-dessous pour vérifier qu’il est installé.

> **Remarque** :
> Si le package **azure-ai-ml** n’est pas installé, exécutez `pip install azure-ai-ml` pour l’installer.

In [None]:
## Se connecter à un espace de travail

Une fois les packages requis du Kit de développement logiciel (SDK) installés, vous êtes prêt à vous connecter à votre espace de travail.

Pour vous connecter à un espace de travail, vous avez besoin de paramètres d’identificateur : un ID d’abonnement, un nom de groupe de ressources et un nom d’espace de travail. Le nom du groupe de ressources et le nom de l’espace de travail sont déjà renseignés pour vous. Vous avez seulement besoin de l’ID d’abonnement pour exécuter la commande.

Pour trouver les paramètres nécessaires, cliquez sur l’abonnement et le nom de l’espace de travail en haut à droite du studio. Un volet s’ouvre à droite.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> Copiez l’ID d’abonnement et remplacez **YOUR-SUBSCRIPTION-ID** par la valeur que vous avez copiée. </p>

## Définir et créer un point de terminaison

L’objectif est de déployer un modèle sur un point de terminaison. C’est pourquoi vous devez d’abord créer un point de terminaison. Le point de terminaison est un point de terminaison HTTPS qu’une application peut appeler pour recevoir les prédictions du modèle. Une application peut consommer un point de terminaison en utilisant son URI et en s’authentifiant avec une clé ou un jeton.

Exécutez la cellule suivante pour définir le point de terminaison. Notez que le nom du point de terminaison doit être unique. Vous allez utiliser la fonction `datetime` pour générer un nom unique.

In [None]:
Ensuite, vous allez créer le point de terminaison en exécutant la cellule suivante. Cette opération peut prendre quelques minutes. Pendant la création de votre point de terminaison, vous pouvez découvrir [ce que sont les points de terminaison Azure Machine Learning](https://learn.microsoft.com/azure/machine-learning/concept-endpoints).

In [None]:
<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT ! Attendez que le point de terminaison soit créé avant de continuer ! Une notification verte devrait apparaître dans le studio. </p>

## Configurer le déploiement

Vous pouvez déployer plusieurs modèles sur un point de terminaison. C’est principalement utile lorsque vous souhaitez mettre à jour le modèle déployé tout en conservant le modèle actuel en production. Vous devez configurer le déploiement pour spécifier le modèle à déployer sur un point de terminaison. Dans la cellule suivante, vous allez référencer le modèle entraîné et stocké dans le dossier local `model` (stocké dans le même dossier que ce notebook). Notez que puisque vous utilisez un modèle MLflow, vous n’avez pas besoin de spécifier l’environnement ou le script de scoring.

Vous allez aussi spécifier l’infrastructure nécessaire au déploiement du modèle.

## Créer le déploiement

Enfin, vous pouvez déployer le modèle sur le point de terminaison en exécutant la cellule suivante :

In [None]:
Le déploiement du modèle peut prendre 10 à 15 minutes. En attendant que le modèle soit déployé, vous pouvez en savoir plus sur les [points de terminaison managés dans cette vidéo](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper).

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT ! Attendez que le déploiement soit terminé avant de poursuivre ! Une notification verte devrait apparaître dans le studio.</p>

Étant donné que vous n’avez qu’un seul modèle déployé sur le point de terminaison, vous souhaitez que ce déploiement prenne 100 % du trafic. Si vous déployez plusieurs modèles sur le point de terminaison, vous pouvez utiliser la même approche pour distribuer le trafic entre les modèles déployés.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT ! Attendez que le déploiement bleu soit configuré avant de poursuivre ! Une notification verte devrait apparaître dans le studio. </p> 

## test du déploiement

Testons le modèle déployé en appelant le point de terminaison. Un fichier JSON avec un échantillon de données est utilisé comme entrée. Le modèle entraîné prédit si un patient est diabétique ou non, sur la base de données médicales comme l’âge, l’IMC et le nombre de grossesses. `[0]` indique qu’un patient n’a pas de diabète. `[1]` indique qu’un patient a du diabète.

In [None]:
Si vous le souhaitez, vous pouvez modifier les valeurs du fichier `sample-data.json` pour essayer d’obtenir une autre prédiction.

## Lister les points de terminaison

Vous pouvez voir tous les points de terminaison dans le studio, mais vous pouvez également les lister en utilisant le SDK :

In [None]:
## Obtenir les détails du point de terminaison

Si vous souhaitez plus d’informations sur un point de terminaison spécifique, vous pouvez explorer les détails en utilisant également le SDK.

## Supprimer le point de terminaison et le déploiement

Comme un point de terminaison est toujours disponible, il ne peut pas être mis en pause pour réduire les coûts. Pour éviter des coûts superflus, supprimez le point de terminaison.

In [None]:
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

The deployment of the model may take 10-15 minutes. While waiting for the model to be deployed, you can learn more about [managed endpoints in this video](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper).

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the deployment is completed before continuing! A green notification should appear in the studio.</p>

Since you only have one model deployed to the endpoint, you want this deployment to take 100% of the traffic. If you deploy multiple models to the endpoint, you could use the same approach to distribute traffic across the deployed models.

In [None]:
# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.begin_create_or_update(endpoint).result()

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the blue deployment is configured before continuing! A green notification should appear in the studio. </p> 

## Test the deployment

Let's test the deployed model by invoking the endpoint. A JSON file with sample data is used as input. The trained model predicts whether a patient has diabetes or not, based on medical data like age, BMI, and the number of pregnancies. A `[0]` indicates a patient doesn't have diabetes. A `[1]` means a patient does have diabetes.

In [None]:
# test the blue deployment with some sample data
response = ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="sample-data.json",
)

if response[1]=='1':
    print("Diabetic")
else:
    print ("Not diabetic")

Optionally, you can change the values in the `sample-data.json` file to try and get a different prediction.

## List endpoints

Although you can view all endpoints in the Studio, you can also list all endpoints using the SDK:

In [None]:
endpoints = ml_client.online_endpoints.list()
for endp in endpoints:
    print(endp.name)

## Get endpoint details

If you want more information about a specific endpoint, you can explore the details using the SDK too.

In [None]:
# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

## Delete the endpoint and deployment

As an endpoint is always available, it can't be paused to save costs. To avoid unnecessary costs, delete the endpoint.

In [None]:
ml_client.online_endpoints.begin_delete(name=online_endpoint_name)