# B칰squeda de hiperpar치metros

Sabes que para entrenar un modelo de machine learning es necesario establecer algunos valores y configuraciones para modificar el comportamiento del entrenamiento, estos son conocidos como hiperpar치metros. Por poner un ejemplo de estos hiperpar치metros, toma la clase <code>RandomForestRegressor</code> (m치s adelante veremos los algoritmos de machine learning que sklear nos ofrece, por el momento no te preocupes):

In [None]:
from sklearn.ensemble import RandomForestRegressor

models = RandomForestRegressor(
    n_estimators = 10,
    criterion = "gini",
    max_depth = 10,
    max_leaf_nodes = 100
)

En donde los hiperar치metros son: el n칰mero de 치rboles, el criterio de divisi칩n, la profundidad m치xima y la cantidad m칤nima de muestras por hoja.

Estos valores tienen un impacto significativo en el desempe침o del modelo, y pueden ser la diferencia entre un mal modelo y uno que funciona a la perfecci칩n.

A pesar de que los hiperpar치metros por default que las clases de scikit-learn tienen son valores razonables, no son necesariamente 칩ptimos para todos los conjuntos de datos o para todos los problemas de aprendizaje autom치tico. Por lo tanto, es importante hacer una b칰squeda de hiperpar치metros para encontrar los valores 칩ptimos que maximicen el desempe침o del modelo en todos nuestros conjuntos de datos.

Realizar esta b칰squeda lleva tiempo y esfuerzo, pero es una inversi칩n que vale la pena hacer por la mejora que representan en nuestro modelo estos par치metros.

Scikit-learn nos ofrece varias opciones para cuando se trata de hacer la b칰squeda de estos hiperpar치metros de forma sistem치tica en lugar de manual.

Las t칠cnicas son: <i>grid search</i> o b칰squeda en cuadr칤cula y b칰squeda aleatoria o <i>random search</i> en ingl칠s. Cada una tiene sus ventajas y desventajas, en esta lecci칩n yo te hablar칠 de la b칰squeda aleatoria:

Solo una peque침a nota, en scikit-learn las b칰squedas de hiperpar치metros est치n siempre conectadas con al validaci칩n cruzada, para garantizar que los valores elegidos sean una elecci칩n correcta para el conjunto de datos.

## Random search

Ahora si, vamos a ver un ejemplo en un problema de regresi칩n.

Primero, carguemos el dataset y divid치moslo en los conjuntos de entrenamiento y prueba:

In [None]:
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split

housing_dataset = fetch_california_housing()

X_train, X_test, y_train, y_test = train_test_split(
	housing_dataset.data,
	housing_dataset.target,
	random_state=42
)

Luego vamos a crear un modelo de regresi칩n:

In [None]:
from sklearn.ensemble import RandomForestRegressor

model = RandomForestRegressor()

Debemos definir el espacio de par치metros en el que vamos a buscar - este espacio de b칰squeda ser치 utilizado por Random Search para generar combinaciones de hiperpar치metros de forma aleatoria, estas combinaciones ser치n utilizadas para crear nuevas instancias de nuestro RandomForestRegressor y ejecutar validaci칩n cruzada sobre ellos, evaluando as칤 qu칠 tan buenos son para encontrar la mejor combinaci칩n.

In [None]:
param_distributions = {
    # 'n_estimators': [100, 1000, 2000],
    # 'criterion': ["squared_error", "absolute_error", "friedman_mse"],
    # 'max_depth': [None, 10, 100],
    'max_features': ["sqrt", "log2"],
    'max_leaf_nodes': [None, 10, 100, 1000]
}

Y finalmente, importamos la clase <code>RandomizedSearchCV</code>:

In [None]:
from sklearn.model_selection import RandomizedSearchCV

Creamos una instancia, pas치ndole el modelo, el conjunto de par치metros. Despu칠s especificamos el n칰mero de iteraciones, recuerda que la b칰squeda is aleatoria, el n칰mero de iteraciones especifica cu치ntos intentos haremos para encontrar los mejores hiperpar치metros. Con <code>cv</code> especificamos el n칰mero de subconjuntos para la validaci칩n cruzada y por 칰ltimo, fijamos el estado aleatorio en 42 para que el resultado sea reproducible.

In [None]:
search = RandomizedSearchCV(model, param_distributions, n_iter=50, cv=5, random_state=42)

Por 칰ltimo llamamos a <code>fit</code> para comenzar la b칰squeda, este recibe los datos de entrenamiento:

In [None]:
search.fit(X_train, y_train)

Este se va a tardar un poco, pero al terminar vamos a poder acceder a los mejores par치metros utilizando el atributo <code>best_params_</code> y podemos evaluar el mejor modelo conseguido a trav칠s del m칠todo <code>score</code>:

In [None]:
print("Mejores hiperpar치metros: ", search.best_params_)
print("Puntuaci칩n de prueba: ", search.score(X_test, y_test))

## Entrenando un modelo con los mejores par치metros

Para entrenar el modelo final, podemos tomar los mejores hiperpar치metros y pasarlos al constructor, esto crea un modelo fresco con la configuraci칩n ideal que acabamos de conseguir y lo entrena con la totalidad de nuestros datos de entrenamiento:

In [None]:
best_model = RandomForestRegressor(**search.best_params_)

best_model.fit(X_train, y_train)

 > 游닄 De tarea, practica usando una b칰squeda en cuadr칤cula, utilizando <code>GridSearchCV</code>. Cuidado con utilizar muchos par치metros porque <i>grid search</i> toma tiempo para ejecutarse.

## No garantiza la mejor soluci칩n

Es importante tener en cuenta que la b칰squeda de hiperpar치metros no garantiza encontrar el conjunto 칩ptimo de hiperpar치metros para un modelo dado. Es posible que la combinaci칩n 칩ptima de hiperpar치metros no se encuentre en el espacio de b칰squeda especificado manualmente. Por lo tanto, es importante considerar la b칰squeda de hiperpar치metros como un proceso iterativo que puede requerir varias iteraciones para alcanzar un conjunto 칩ptimo de hiperpar치metros para un modelo dado.

## En conclusi칩n

La b칰squeda de hiperpar치metros es un paso crucial cuando quieres sacarle el m치ximo provecho a los datos. En scikit-learn esta b칰squeda est치 fuertemente ligada con la validaci칩n cruzada aunque en la teor칤a son dos conceptos independientes el uno del otro.

scikit-learn ofrece dos m칠todos de b칰squeda de hiperpar치metros: GridSearchCV y RandomizedSearchCV. El primero realiza una b칰squeda exhaustiva sobre todas las combinaciones posibles de valores de hiperpar치metros especificados, mientras que el segundo realiza una b칰squeda aleatoria de un subconjunto de combinaciones. En general, RandomizedSearchCV puede ser m치s eficiente que GridSearchCV cuando el espacio de b칰squeda de hiperpar치metros es grande.

Tambi칠n recuerda que no es una soluci칩n m치gica, y que a veces debes iterar en la elecci칩n del mejor espacio de b칰squeda.