# Effectuer l’apprentissage et le suivi des modèles dans des notebooks

En tant que scientifique des données, vous utilisez des notebooks pour effectuer des expériences et l’apprentissage des modèles. Pour regrouper les résultats de l’apprentissage du modèle, vous allez utiliser des expériences. Pour suivre les métriques du modèle avec MLflow lors de l’apprentissage d’un modèle dans un notebook, vous pouvez utiliser les fonctionnalités de journalisation de MLflow.



In [4]:
#!pip install mlflow
#!pip install azureml-mlflow

In [6]:
import mlflow
mlflow.set_tracking_uri = "azureml://westus.api.azureml.ms/mlflow/v1.0/subscriptions/721e8e8b-4456-49f5-a29c-c7c5a9b2e71e/resourceGroups/rg-azure-ml/providers/Microsoft.MachineLearningServices/workspaces/azure-ml-lab" 

### Créer une expérience MLflow
Vous pouvez créer une expérience MLflow, ce qui permet de regrouper des exécutions. Si vous ne créez pas d’expérience, MLflow se rapporte à l’expérience par défaut avec le nom Default.

Pour créer une expérience, exécutez la commande suivante dans un notebook :

In [10]:
import mlflow

mlflow.set_experiment(experiment_name="heart-condition-classifier")

<Experiment: artifact_location='file:///Users/awf/Projects/azure/azure-data-scientist-associate/mlflow/mlruns/347582798210917144', creation_time=1685953031660, experiment_id='347582798210917144', last_update_time=1685953031660, lifecycle_stage='active', name='heart-condition-classifier', tags={}>

In [11]:
mlflow.set_experiment(experiment_name)

NameError: name 'experiment_name' is not defined

### Résultats des journaux avec MLflow
Vous êtes maintenant prêt à effectuer l’apprentissage de votre modèle. Pour démarrer une exécution suivie par MLflow, vous allez utiliser start_run(). Pour suivre le modèle, vous pouvez ensuite :

#### Activer la journalisation automatique.
Utiliser la journalisation personnalisée.
Activer la journalisation automatique
MLflow prend en charge la journalisation automatique pour les bibliothèques de Machine Learning populaires. Si vous utilisez une bibliothèque prise en charge par la journalisation automatique, MLflow indique à l’infrastructure que vous utilisez de consigner l’ensemble des métriques, paramètres, artefacts et modèles qu’elle considère comme pertinents.

Vous pouvez activer la journalisation automatique à l’aide de la méthode autolog de l’infrastructure que vous utilisez. Pour activer la journalisation automatique par exemple pour les modèles XGBoost, vous pouvez utiliser mlflow.xgboost.autolog().

`Une cellule de notebook qui effectue l’apprentissage et le suivi d’un modèle de classification à l’aide de la journalisation automatique peut ressembler à l’exemple de code suivant`

In [None]:
from xgboost import XGBClassifier

with mlflow.start_run():
    mlflow.xgboost.autolog()

    model = XGBClassifier(use_label_encoder=False, eval_metric="logloss")
    model.fit(X_train, y_train, eval_set=[(X_test, y_test)], verbose=False)

### Utiliser la journalisation personnalisée

En outre, vous pouvez enregistrer votre modèle manuellement avec MLflow. La journalisation manuelle des modèles est utile quand vous souhaitez consigner des informations supplémentaires ou personnalisées qui ne le sont pas via la journalisation automatique.

Voici les fonctions courantes utilisées avec la journalisation personnalisée :

- `mlflow.log_param()` : consigne un paramètre clé-valeur unique. Utilisez cette fonction pour un paramètre d’entrée que vous souhaitez consigner.
- `mlflow.log_metric()` : consigne une métrique clé-valeur unique. La valeur doit être un nombre. Utilisez cette fonction pour toute sortie que vous souhaitez stocker avec l’exécution.
- `mlflow.log_artifact()` : journalise un fichier. Utilisez cette fonction pour tout tracé que vous souhaitez consigner et enregistrer en tant que fichier image avant.
- `mlflow.log_model()` : journalise un modèle. Utilisez cette fonction pour créer un modèle MLflow, qui peut inclure une signature personnalisée, un environnement et des exemples d’entrée.


In [None]:
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score

with mlflow.start_run():
    model = XGBClassifier(use_label_encoder=False, eval_metric="logloss")
    model.fit(X_train, y_train, eval_set=[(X_test, y_test)], verbose=False)
    y_pred = model.predict(X_test)

    accuracy = accuracy_score(y_test, y_pred)
    mlflow.log_metric("accuracy", accuracy)