# AutoML
Durant l'exercice précédent, nous avons regardé comment créer un modèle avec KNN. Nous avons pu voir qu'il fallait faire plusieurs expérimentations, faire de la recherche pour trouver les bons hyperparamètres. Ça peut être assez long et fastidieux. Il existe plusieurs techniques pour trouver les bons hyperparamètres, dont la recherche en grille (on boucle sur une liste de paramètres pour chaque hyperparamètre). La recherche en grille est une des techniques, ce n'est pas la meilleure, mais elle est un bon début.

Imaginez, vous n'avez fait qu'un seul algorithme et ceci vous a pris un certain temps. Imaginez de le faire en boucle pour chaque hyperparamètre qui chacun a une liste de paramètres, de choix. Le nombre de boucles explose assez rapidement...

Il y a encore mieux : les AutoML: Automatic Machine Learning. Cette technique est en émergence depuis quelques années et démontre ses capacités assez rapidement. Ceux que je connais sont 
- [Neuraxle](https://www.neuraxle.org/stable/intro.html)
- [Hyperopt (qui est en délaissement)](https://hyperopt.github.io/hyperopt/)
- [AutoKeras (pour l'apprentissage profond)](https://autokeras.com/)
- [Pycaret](https://pycaret.gitbook.io/docs/)

Dans ce notebook, nous utiliserons Pycaret car il est un de ceux que j'apprécie le plus pour sa simplicité, ses options et son développement rapide.

Je tiens à mentionner Neuraxle car c'est une jeune entreprise québécoise à Québec qui développe très rapidement ce produit en source libre (open source).

## Installation
Pour cette partie, comme Pycaret n'est pas compatible avec python 3.9, il nous faut installer un nouvel environnement avec anaconda. 

N'oubliez pas de désactiver votre environnement si vous n'êtes pas dans l'environnement de base en tapant la commande : `conda deactivate`.

Voici les commandes à exécuter pour créer le nouvel environnement et pour installer les paquets pour Pycaret :
- `conda create --name demo_pycaret python=3.8`
- `conda activate demo_pycaret`
- `pip install ipykernel`
- `pip install pycaret[full]`

In [None]:
from pycaret.datasets import get_data
data = get_data('diabetes')

In [None]:
from pycaret.classification import *
s = setup(data, target = 'Class variable', silent=True)

In [None]:
best = compare_models()

In [None]:
print(best)

In [None]:
evaluate_model(best)

In [None]:
plot_model(best, plot = 'auc')

In [None]:
plot_model(best, plot = 'confusion_matrix')

In [None]:
predict_model(best)

In [None]:
predictions = predict_model(best, data=data)
predictions.head()

In [None]:
predictions = predict_model(best, data=data, raw_score=True)
predictions.head()

# Exercice

Comme vous avez pu le voir, Pycaret simplifie énormément les choses, maintenant, testons le avec le même jeu de données que lors de l'exercice précédent. Est-ce que vos résultats sont meilleurs que ce Pycaret trouve pour l'algorithme KNN?

In [None]:

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.colors import ListedColormap
from sklearn import neighbors, datasets

In [None]:

iris = datasets.load_iris()

In [None]:
iris

In [None]:
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df.head()

In [None]:
df = pd.concat([df, pd.DataFrame(iris.target, columns=['target'])], axis=1)
df.head()

In [None]:
from pycaret.classification import *
s = setup(df, target = 'target', silent=True)

In [None]:
best = compare_models()