<a href='http://moncoachdata.com'><img src= 'https://moncoachdata.com/wp-content/uploads/MonCoachData-cours/MonCoachData.jpg' width=400/></a>


---


<center><em>Copyright MonCoachData (tous droits réservés)</em></center>
<center><em>Pour plus d'informations, visitez notre site <a href='http://moncoachdata.com'>moncoachdata.com</a></em></center>



---

# Grid Search 

Nous pouvons rechercher une variété de combinaisons d'hyperparamètres avec un Grid Search (Grille de recherche). Alors que de nombreux modèles linéaires sont assez simples et sont même fournis avec leurs propres versions spécialisées qui effectuent une recherche pour vous, cette méthode de Grid Search peut être appliquée à *n'importe quel* modèle de sklearn, et nous devrons l'utiliser plus tard pour des modèles plus complexes, tels que les Machines à Vecteur de Support (SVM).

## Importations

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

## Données

In [None]:
df = pd.read_csv("Advertising.csv")

In [None]:
df.head()

Unnamed: 0,TV,radio,newspaper,sales
0,230.1,37.8,69.2,22.1
1,44.5,39.3,45.1,10.4
2,17.2,45.9,69.3,9.3
3,151.5,41.3,58.5,18.5
4,180.8,10.8,58.4,12.9


## Formatage des Données

In [None]:
## CRÉER X et y
X = df.drop('sales',axis=1)
y = df['sales']

# TRAIN TEST SPLIT / Fractionnement Entraînement Test
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=101)

# SCALE DATA / Mise à l'échelle des données
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

## Modèle

In [None]:
from sklearn.linear_model import ElasticNet

In [None]:
help(ElasticNet)

Help on class ElasticNet in module sklearn.linear_model._coordinate_descent:

class ElasticNet(sklearn.base.MultiOutputMixin, sklearn.base.RegressorMixin, sklearn.linear_model._base.LinearModel)
 |  ElasticNet(alpha=1.0, *, l1_ratio=0.5, fit_intercept=True, normalize='deprecated', precompute=False, max_iter=1000, copy_X=True, tol=0.0001, warm_start=False, positive=False, random_state=None, selection='cyclic')
 |  
 |  Linear regression with combined L1 and L2 priors as regularizer.
 |  
 |  Minimizes the objective function::
 |  
 |          1 / (2 * n_samples) * ||y - Xw||^2_2
 |          + alpha * l1_ratio * ||w||_1
 |          + 0.5 * alpha * (1 - l1_ratio) * ||w||^2_2
 |  
 |  If you are interested in controlling the L1 and L2 penalty
 |  separately, keep in mind that this is equivalent to::
 |  
 |          a * ||w||_1 + 0.5 * b * ||w||_2^2
 |  
 |  where::
 |  
 |          alpha = a + b and l1_ratio = a / (a + b)
 |  
 |  The parameter l1_ratio corresponds to alpha in the glmnet 

In [None]:
base_elastic_model = ElasticNet()

## Grid Search

Une recherche consiste en :

* un estimateur (régresseur ou classificateur tel que sklearn.svm.SVC()) (estimator)
* un paramètre de l'espace ou grille à tester (param_grid)
* une méthode de recherche ou d'échantillonnage des candidats (par défaut, aléatoire stratifié)
* un schéma de validation croisée (cv)
* une fonction de score (scoring)

In [None]:
param_grid = {'alpha':[0.1,1,5,10,50,100],
              'l1_ratio':[.1, .5, .7, .9, .95, .99, 1]}

In [None]:
from sklearn.model_selection import GridSearchCV

In [None]:
# verbose (int) : Contrôle la verbosité, plus elle est élevée, plus il y a de messages
grid_model = GridSearchCV(estimator=base_elastic_model,
                          param_grid=param_grid,
                          scoring='neg_mean_squared_error',
                          cv=5,
                          verbose=2)

In [None]:
grid_model.fit(X_train,y_train)

Fitting 5 folds for each of 42 candidates, totalling 210 fits
[CV] END ............................alpha=0.1, l1_ratio=0.1; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.1; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.1; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.1; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.1; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.5; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.5; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.5; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.5; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.5; total time=   0.0s
[CV] END ............................alpha=0.1, l1_ratio=0.7; total time=   0.0s
[CV] END ............................alpha=0.1,

GridSearchCV(cv=5, estimator=ElasticNet(),
             param_grid={'alpha': [0.1, 1, 5, 10, 50, 100],
                         'l1_ratio': [0.1, 0.5, 0.7, 0.9, 0.95, 0.99, 1]},
             scoring='neg_mean_squared_error', verbose=2)

In [None]:
grid_model.best_estimator_

ElasticNet(alpha=0.1, l1_ratio=1)

In [None]:
grid_model.best_params_

{'alpha': 0.1, 'l1_ratio': 1}

In [None]:
# pd.DataFrame(grid_model.cv_results_)

## Utilisation du meilleur modèle à partir de Grid Search

In [None]:
y_pred = grid_model.predict(X_test)

In [None]:
from sklearn.metrics import mean_squared_error

In [None]:
mean_squared_error(y_test,y_pred)

2.387342642087474