# Ejemplo de rejilla de optimización en árbol de decisión.
Ejemplo de aplicación de rejilla de búsqueda de parámetros óptimos aplicados a dos clasificadores, el primero basado en un árbol de decisión y el segundo en un SVC no lineal buscando el kernel óptimo y el parámetro de regularización.

In [1]:
from sklearn.datasets import make_moons
X, y = make_moons(n_samples=10000, noise=0.4, random_state=42)

In [2]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Se va a usar la búsqueda en cuadrícula con validación cruzada (con la ayuda de la clase GridSearchCV) para encontrar buenos valores de hiperparámetros para un DecisionTreeClassifier probando varios valores para max_leaf_nodes y min_samples_split

In [3]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.model_selection import GridSearchCV

params = {'max_leaf_nodes': list(range(2, 100)), 'min_samples_split': [2, 3, 4]}
#max_leaf_nodes: int, default=None. Define el número máximo de nodos hoja.Si no se pone nada es ilimitado
#min_samples_split: int or float, default=2. El número mínimo de muestras requeridas para dividir un nodo interno:
    # Si es int, considere min_samples_split como el número mínimo.
    # Si es float, entonces min_samples_split es una fracción y ceil(min_samples_split * n_samples) es el número mínimo de muestras para cada división
    
grid_search_cv = GridSearchCV(DecisionTreeClassifier(random_state=42), params, verbose=1, cv=3)
#verbose: Controla los mensajes: cuanto más alta, más mensajes. 
  #1 : se muestra el tiempo de cálculo para cada pliegue y parámetro candidato;
  #2 : también se muestra la puntuación;
  #3 : los índices de parámetros de pliegue y candidato también se muestran junto con la hora de inicio del cálculo.
#cv: Determina la estrategia de división de validación cruzada. Las entradas posibles para cv son:
  #Ninguno, para usar la validación cruzada de 5 veces predeterminada,
  # entero, para especificar el número de pliegues en un KFold (estratificado),
  # Para entradas de entero/Ninguno, si el estimador es un clasificador y y es binario o multiclase, 
  # se utiliza StratifiedKFold. En todos los demás casos, se utiliza KFold. Estos divisores se instancian 
  #con shuffle=False, por lo que las divisiones serán las mismas en todas las llamadas.

grid_search_cv.fit(X_train, y_train)

Fitting 3 folds for each of 294 candidates, totalling 882 fits


In [4]:
grid_search_cv.best_estimator_ #Para ver las características del mejor estimador

In [5]:
grid_search_cv.best_params_ #Para ver el resulvalor de los parámetros que optimizan el clasificador

{'max_leaf_nodes': 17, 'min_samples_split': 2}

In [6]:
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score, f1_score
from sklearn.metrics import ConfusionMatrixDisplay


In [7]:
y_pred = grid_search_cv.predict(X_test)
accuracy_score(y_test, y_pred), precision_score(y_test, y_pred), recall_score(y_test, y_pred), f1_score(y_test, y_pred)

(0.8695, 0.8757763975155279, 0.8571428571428571, 0.8663594470046083)

# Ahora vamos a usar la rejilla con SVC

In [8]:
params = {'C':[0.2, 0.5, 1], 'kernel': ["linear", "poly", "rbf", "sigmoid"]} #Variamos el parámetro de regularización y el kernel
grid_search_cv2 = GridSearchCV(SVC(random_state=42), params, verbose=2, cv=3)


In [9]:
grid_search_cv2.fit(X_train, y_train)

Fitting 3 folds for each of 12 candidates, totalling 36 fits
[CV] END ...............................C=0.2, kernel=linear; total time=   0.2s
[CV] END ...............................C=0.2, kernel=linear; total time=   0.2s
[CV] END ...............................C=0.2, kernel=linear; total time=   0.2s
[CV] END .................................C=0.2, kernel=poly; total time=   0.3s
[CV] END .................................C=0.2, kernel=poly; total time=   0.3s
[CV] END .................................C=0.2, kernel=poly; total time=   0.3s
[CV] END ..................................C=0.2, kernel=rbf; total time=   0.3s
[CV] END ..................................C=0.2, kernel=rbf; total time=   0.3s
[CV] END ..................................C=0.2, kernel=rbf; total time=   0.3s
[CV] END ..............................C=0.2, kernel=sigmoid; total time=   0.5s
[CV] END ..............................C=0.2, kernel=sigmoid; total time=   0.5s
[CV] END ..............................C=0.2, ke

In [10]:
grid_search_cv2.best_estimator_

In [11]:
y_pred = grid_search_cv2.predict(X_test)
accuracy_score(y_test, y_pred), precision_score(y_test, y_pred), recall_score(y_test, y_pred), f1_score(y_test, y_pred)

(0.872, 0.8658658658658659, 0.8763931104356636, 0.8710976837865055)

In [12]:
grid_search_cv2.best_score_

0.8622500113217281

In [13]:
grid_search_cv2.best_params_

{'C': 0.2, 'kernel': 'rbf'}