# Créer un service d’inférence par lots

Imaginez qu’un stage de santé prend des mesures de patients à longueur de journée, en enregistrant les détails de chaque patient dans un fichier séparé. Ensuite, pendant la nuit, le modèle de prédiction du diabète peut être utilisé pour traiter toutes les données patient de la journée en tant que lot, en générant des prédictions qui attendront le lendemain matin afin que la clinique puisse suivre les patients qui sont prédits comme étant à risque de diabète. Avec Azure Machine Learning, vous pouvez faire cela en créant un *pipeline d’inférence de lot*; et c’est ce que vous allez implémenter dans cet exercice.

## Se connecter à votre espace de travail

Pour commencer, connectez-vous à votre espace de travail.

> **Remarque** : si vous n’avez pas encore établi de session authentifiée avec votre abonnement Azure, vous serez invité à vous authentifier en cliquant sur un lien, en saisissant un code d’authentification et en vous connectant à Azure.

In [None]:
import azureml.core
from azureml.core import Workspace

# Load the workspace from the saved config file
ws = Workspace.from_config()
print('Ready to use Azure ML {} to work with {}'.format(azureml.core.VERSION, ws.name))

## Effectuer l’apprentissage un modèle et l’inscrire

Nous allons à présent effectuer l’apprentissage d’un modèle et l’inscrire pour déploiement dans un pipeline d’inférence de lot.

In [None]:
from azureml.core import Experiment
from azureml.core import Model
import pandas as pd
import numpy as np
import joblib
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import roc_auc_score
from sklearn.metrics import roc_curve

# Create an Azure ML experiment in your workspace
experiment = Experiment(workspace=ws, name='mslearn-train-diabetes')
run = experiment.start_logging()
print("Starting experiment:", experiment.name)

# load the diabetes dataset
print("Loading Data...")
diabetes = pd.read_csv('data/diabetes.csv')

# Separate features and labels
X, y = diabetes[['Pregnancies','PlasmaGlucose','DiastolicBloodPressure','TricepsThickness','SerumInsulin','BMI','DiabetesPedigree','Age']].values, diabetes['Diabetic'].values

# Split data into training set and test set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=0)

# Train a decision tree model
print('Training a decision tree model')
model = DecisionTreeClassifier().fit(X_train, y_train)

# calculate accuracy
y_hat = model.predict(X_test)
acc = np.average(y_hat == y_test)
print('Accuracy:', acc)
run.log('Accuracy', np.float(acc))

# calculate AUC
y_scores = model.predict_proba(X_test)
auc = roc_auc_score(y_test,y_scores[:,1])
print('AUC: ' + str(auc))
run.log('AUC', np.float(auc))

# Save the trained model
model_file = 'diabetes_model.pkl'
joblib.dump(value=model, filename=model_file)
run.upload_file(name = 'outputs/' + model_file, path_or_stream = './' + model_file)

# Complete the run
run.complete()

# Register the model
run.register_model(model_path='outputs/diabetes_model.pkl', model_name='diabetes_model',
                   tags={'Training context':'Inline Training'},
                   properties={'AUC': run.get_metrics()['AUC'], 'Accuracy': run.get_metrics()['Accuracy']})

print('Model trained and registered.')

## Générer et charger des données par lot

Étant donné que nous ne disposons pas d’une clinique pleinement dotée en personnel avec des patients auprès desquels recueillir de nouvelles données pour cet exercice, vous allez générer un échantillon aléatoire à partir de notre fichier CSV de données sur le diabète, charger ces données vers un magasin de données dans l’espace de travail Azure Machine Learning, et inscrire un jeu de données pour celui-ci.

In [None]:
from azureml.core import Datastore, Dataset
import pandas as pd
import os

# Set default data store
ws.set_default_datastore('workspaceblobstore')
default_ds = ws.get_default_datastore()

# Enumerate all datastores, indicating which is the default
for ds_name in ws.datastores:
    print(ds_name, "- Default =", ds_name == default_ds.name)

# Load the diabetes data
diabetes = pd.read_csv('data/diabetes2.csv')
# Get a 100-item sample of the feature columns (not the diabetic label)
sample = diabetes[['Pregnancies','PlasmaGlucose','DiastolicBloodPressure','TricepsThickness','SerumInsulin','BMI','DiabetesPedigree','Age']].sample(n=100).values

# Create a folder
batch_folder = './batch-data'
os.makedirs(batch_folder, exist_ok=True)
print("Folder created!")

# Save each sample as a separate file
print("Saving files...")
for i in range(100):
    fname = str(i+1) + '.csv'
    sample[i].tofile(os.path.join(batch_folder, fname), sep=",")
print("files saved!")

# Upload the files to the default datastore
print("Uploading files to datastore...")
default_ds = ws.get_default_datastore()
default_ds.upload(src_dir="batch-data", target_path="batch-data", overwrite=True, show_progress=True)

# Register a dataset for the input data
batch_data_set = Dataset.File.from_files(path=(default_ds, 'batch-data/'), validate=False)
try:
    batch_data_set = batch_data_set.register(workspace=ws, 
                                             name='batch-data',
                                             description='batch data',
                                             create_new_version=True)
except Exception as ex:
    print(ex)

print("Done!")

## Créer une capacité de calcul

Nous allons avoir besoin d’un contexte de calcul pour le pipeline. Nous allons donc utiliser le code suivant pour spécifier un cluster de calcul Azure Machine Learning (il sera créé s’il n’existe pas).

> **Important** : remplacez *your-compute-cluster* par le nom de votre cluster de calcul dans le code ci-dessous avant de l’exécuter. Les noms de cluster doivent être des noms globalement uniques d’une longueur comprise entre 2 et 16 caractères. Les caractères valides sont les lettres, les chiffres et le tiret (-).

In [None]:
from azureml.core.compute import ComputeTarget, AmlCompute
from azureml.core.compute_target import ComputeTargetException

cluster_name = "your-compute-cluster"

try:
    # Check for existing compute target
    inference_cluster = ComputeTarget(workspace=ws, name=cluster_name)
    print('Found existing cluster, use it.')
except ComputeTargetException:
    # If it doesn't already exist, create it
    try:
        compute_config = AmlCompute.provisioning_configuration(vm_size='STANDARD_DS11_V2', max_nodes=2)
        inference_cluster = ComputeTarget.create(ws, cluster_name, compute_config)
        inference_cluster.wait_for_completion(show_output=True)
    except Exception as ex:
        print(ex)
    

> **Remarque** : les clusters et instances de calcul sont basés sur des images de machines virtuelles Azure standard. Pour cet exercice, l’image *Standard_DS11_v2* est recommandée pour obtenir l’équilibre optimal entre coûts et performances. Si votre abonnement comprend un n’incluant cette image, choisissez-en une autre. Gardez cependant à l’esprit qu’une image plus grande peut entraîner des coûts plus élevés, tandis qu’une plus petite risque de ne pas suffire pour accomplir les tâches. Vous pouvez également demander à votre administrateur Azure d’étendre votre quota.

## Créer un pipeline pour l’inférence par lot

Nous sommes maintenant prêts à définir le pipeline que nous allons utiliser pour l’inférence par lot. Notre pipeline aura besoin d’un code Python pour effectuer l’inférence par lot. Nous allons donc créer un dossier où nous conserver tous les fichiers utilisés par le pipeline :

In [None]:
import os
# Create a folder for the experiment files
experiment_folder = 'batch_pipeline'
os.makedirs(experiment_folder, exist_ok=True)

print(experiment_folder)

Nous allons maintenant créer un script Python pour effectuer le travail réel et l’enregistrer dans le dossier de pipeline :

In [None]:
%%writefile $experiment_folder/batch_diabetes.py
import os
import numpy as np
from azureml.core import Model
import joblib


def init():
    # Runs when the pipeline step is initialized
    global model

    # load the model
    model_path = Model.get_model_path('diabetes_model')
    model = joblib.load(model_path)


def run(mini_batch):
    # This runs for each batch
    resultList = []

    # process each file in the batch
    for f in mini_batch:
        # Read the comma-delimited data into an array
        data = np.genfromtxt(f, delimiter=',')
        # Reshape into a 2-dimensional array for prediction (model expects multiple items)
        prediction = model.predict(data.reshape(1, -1))
        # Append prediction to results
        resultList.append("{}: {}".format(os.path.basename(f), prediction[0]))
    return resultList

Le pipeline aura besoin d’un environnement dans lequel s’exécuter. Nous allons donc créer une spécification Conda incluant les packages que le code utilise.

In [None]:
%%writefile $experiment_folder/batch_environment.yml
name: batch_environment
dependencies:
- python=3.6.2
- scikit-learn
- pip
- pip:
  - azureml-defaults

Nous allons ensuite définir un contexte d’exécution incluant l’environnement Conda.

In [None]:
from azureml.core import Environment
from azureml.core.runconfig import DEFAULT_CPU_IMAGE

# Create an Environment for the experiment
batch_env = Environment.from_conda_specification("experiment_env", experiment_folder + "/batch_environment.yml")
batch_env.docker.base_image = DEFAULT_CPU_IMAGE
print('Configuration ready.')

Vous allez utiliser un pipeline pour exécuter le script de prédiction par lot, générer des prédictions à partir des données d’entrée et enregistrer les résultats sous la forme d’un fichier texte dans le dossier de sortie. Pour ce faire, vous pouvez utiliser une **ParallelRunStep**, qui permet de traiter les données du lot en parallèle et de rassembler les résultats dans un seul fichier de sortie nommé *parallel_run_step.txt*.

In [None]:
from azureml.pipeline.steps import ParallelRunConfig, ParallelRunStep
from azureml.data import OutputFileDatasetConfig

output_dir = OutputFileDatasetConfig(name='inferences')

parallel_run_config = ParallelRunConfig(
    source_directory=experiment_folder,
    entry_script="batch_diabetes.py",
    mini_batch_size="5",
    error_threshold=10,
    output_action="append_row",
    environment=batch_env,
    compute_target=inference_cluster,
    node_count=2)

parallelrun_step = ParallelRunStep(
    name='batch-score-diabetes',
    parallel_run_config=parallel_run_config,
    inputs=[batch_data_set.as_named_input('diabetes_batch')],
    output=output_dir,
    arguments=[],
    allow_reuse=True
)

print('Steps defined')

Il est maintenant temps de placer l’étape dans un pipeline et de l’exécuter.

> **Remarque** : cette opération peut prendre un certain temps.

In [None]:
from azureml.core import Experiment
from azureml.pipeline.core import Pipeline

pipeline = Pipeline(workspace=ws, steps=[parallelrun_step])
pipeline_run = Experiment(ws, 'mslearn-diabetes-batch').submit(pipeline)
pipeline_run.wait_for_completion(show_output=True)

Une fois l’exécution du pipeline terminée, les prédictions obtenues sont enregistrées dans les sorties de l’expérience associée à la première (et seule) étape dans le pipeline. Vous pouvez les récupérer comme suit :

In [None]:
import pandas as pd
import shutil

# Remove the local results folder if left over from a previous run
shutil.rmtree('diabetes-results', ignore_errors=True)

# Get the run for the first step and download its output
prediction_run = next(pipeline_run.get_children())
prediction_output = prediction_run.get_output_data('inferences')
prediction_output.download(local_path='diabetes-results')

# Traverse the folder hierarchy and find the results file
for root, dirs, files in os.walk('diabetes-results'):
    for file in files:
        if file.endswith('parallel_run_step.txt'):
            result_file = os.path.join(root,file)

# cleanup output format
df = pd.read_csv(result_file, delimiter=":", header=None)
df.columns = ["File", "Prediction"]

# Display the first 20 results
df.head(20)

## Publier le pipeline et utiliser son interface REST

Maintenant que vous disposez d’un pipeline de travail pour l’inférence par lot, vous pouvez le publier et utiliser un point de terminaison REST pour l’exécuter à partir d’une application.

In [None]:
published_pipeline = pipeline_run.publish_pipeline(
    name='diabetes-batch-pipeline', description='Batch scoring of diabetes data', version='1.0')

published_pipeline

Notez que le pipeline publié a un point de terminaison, que vous pouvez voir dans le portail Azure. Vous pouvez également le trouver en tant que propriété de l’objet de pipeline publié :

In [None]:
rest_endpoint = published_pipeline.endpoint
print(rest_endpoint)

Pour utiliser le point de terminaison, les applications clientes doivent effectuer un appel REST sur HTTP. Cette requête devant être authentifiée, un en-tête d’autorisation est requis. Pour tester cela, nous allons utiliser l’en-tête d’autorisation de votre connexion actuelle auprès de votre espace de travail Azure, que vous pouvez obtenir à l’aide du code suivant :

> **Remarque** : une application réelle nécessiterait un principal de service avec lequel s’authentifier.

In [None]:
from azureml.core.authentication import InteractiveLoginAuthentication

interactive_auth = InteractiveLoginAuthentication()
auth_header = interactive_auth.get_authentication_header()
print('Authentication header ready.')

Nous sommes maintenant prêts à appeler l’interface REST. Le pipeline s’exécutant de façon asynchrone, nous allons obtenir un identificateur utilisable pour suivre l’expérience de pipeline au fur et à mesure de son exécution :

In [None]:
import requests

rest_endpoint = published_pipeline.endpoint
response = requests.post(rest_endpoint, 
                         headers=auth_header, 
                         json={"ExperimentName": "mslearn-diabetes-batch"})
run_id = response.json()["Id"]
run_id

Étant donné que nous disposons de l’ID d’exécution, nous pouvons utiliser le widget **RunDetails** pour afficher l’expérience au fur et à mesure de son exécution :

In [None]:
from azureml.pipeline.core.run import PipelineRun
from azureml.widgets import RunDetails

published_pipeline_run = PipelineRun(ws.experiments['mslearn-diabetes-batch'], run_id)

# Block until the run completes
published_pipeline_run.wait_for_completion(show_output=True)

Attendez la fin de l’exécution du pipeline, puis exécutez la cellule suivante pour afficher les résultats.

Comme précédemment, les résultats figurent dans la sortie de la première étape du pipeline :

In [None]:
import pandas as pd
import shutil

# Remove the local results folder if left over from a previous run
shutil.rmtree('diabetes-results', ignore_errors=True)

# Get the run for the first step and download its output
prediction_run = next(pipeline_run.get_children())
prediction_output = prediction_run.get_output_data('inferences')
prediction_output.download(local_path='diabetes-results')

# Traverse the folder hierarchy and find the results file
for root, dirs, files in os.walk('diabetes-results'):
    for file in files:
        if file.endswith('parallel_run_step.txt'):
            result_file = os.path.join(root,file)

# cleanup output format
df = pd.read_csv(result_file, delimiter=":", header=None)
df.columns = ["File", "Prediction"]

# Display the first 20 results
df.head(20)

Vous disposez maintenant d’un pipeline utilisable pour traiter par lots des données patient quotidiennes.

** Informations supplémentaires** : pour plus d’informations sur l’utilisation des pipelines pour l’inférence par lot, consultez la rubrique [Exécuter des prédictions par lots](https://docs.microsoft.com/azure/machine-learning/how-to-run-batch-predictions) dans la documentation Azure Machine Learning.