# Automatiser la sélection de modèles Machine Learning avec Azure Machine Learning

Machine Learning Automatisé

### Introduction

permet de trouver le modèle le plus performant pour vos données en vous évitant de procéder manuellement à de nombreux essais et traitements d’erreur.

- pour les espaces de travail de l’édition Entreprise uniquement

### Tâche et algorithmes du ML automatisé

Utilisable pour 3 types de tâche :
- Classification
- Régression
- Time Series Forecasting (prédiction de série chronologique)

Restriction de la selection d'algo: Par défaut, le Machine Learning automatisé effectue une sélection aléatoire parmi la plage complète des algorithmes pour la tâche spécifiée. Mais on peut choisir une stratégie qui limite le type d’algorithmes de machine learning que vous pouvez utiliser dans votre organisation.

### Prétraitement et caractérisation

le Machine Learning automatisé peut appliquer des transformations de prétraitement à vos données, améliorant les performances du modèle.

- Mise à l'échelle et normalisation

- caractérisation facultative: encodage, imputation de données, etc etc

### Execution d'expériences de ML automatisé

- <font color='red'>Configuration d’une expérience de Machine Learning automatisé:</font>


classe --> AutoMLConfig


In [None]:
from azureml.train.automl import AutoMLConfig

automl_run_config = RunConfiguration(framework='python')
automl_config = AutoMLConfig(name='Automated ML Experiment',
                             task='classification',
                             primary_metric = 'AUC_weighted',
                             compute_target=aml_compute,
                             training_data = train_dataset,
                             validation_data = test_dataset,
                             label_column_name='Label',
                             featurization='auto',
                             iterations=12,
                             max_concurrent_iterations=4)

- <font color='red'>Spécification des données pour l’entraînement</font>


Quand vous utilisez le SDK pour exécuter une expérience de Machine Learning automatisé, vous pouvez envoyer les données des manières suivantes :

- Spécifiez un jeu de données ou un dataframe de données d’entraînement qui comprend des caractéristiques et l’étiquette à prédire.
- Si vous le souhaitez, spécifiez un deuxième jeu de données de données de validation ou dataframe à utiliser pour valider le modèle entraîné. Si vous ne le faites pas, Azure Machine Learning applique la validation croisée à l’aide des données d’entraînement.



Sinon 

- Spécifiez un jeu de données, dataframe ou tableau numpy de valeurs X contenant les caractéristiques d’entraînement, avec un tableau y de valeurs d’étiquette correspondant.
- Si vous le souhaitez, spécifiez des dataframes, des jeux de données X_valid et y_valid ou des tableaux numpy de valeurs X_valid à utiliser pour la validation.

- <font color='red'> Spécification de la métrique principale </font>


**primary_metric** = la métrique de performance cible pour laquelle le modèle optimal est déterminé
- --> fonction get_primary_metric



In [None]:
from azureml.train.automl.utilities import get_primary_metrics

get_primary_metrics('classification')

### Envoi d’une expérience de Machine Learning automatisé


In [None]:
from azureml.core.experiment import Experiment

automl_experiment = Experiment(ws, 'automl_experiment')
automl_run = automl_experiment.submit(automl_config)

### Récupération de la meilleure exécution et de son modèle


In [None]:
best_run, fitted_model = automl_run.get_output()
best_run_metrics = best_run.get_metrics()
for metric_name in best_run_metrics:
    metric = best_run_metrics[metric_name]
    print(metric_name, metric)

### Exploration des étapes de prétraitement


Le Machine Learning automatisé utilise des pipelines scikit-learn pour encapsuler les étapes de prétraitement avec le modèle.

In [None]:
for step_ in fitted_model.named_steps:
    print(step)