# Ajuste de Hiperprámetros

Bienvenido a otra lección más en este interesante día donde estamos conociendo a **Scikit-Learn** hasta el hueso.

Y ahora hablemos de un concepto especial: el **ajuste de hiperparámetros**. ¿qué es esto? Es un paso crítico para optimizar un modelo de **Machine Learning**.


### Concepto

Primero permíteme explicarte qué es el concepto de **ajuste de hiperparámetros**. Imagínate que estás preparando una comida que nunca habías cocinado antes, y que por la primera vez lo haces siguiendo al pie de la letra una receta que has encontrado en internet. En este caso los hiperparámetros de la receta serían los **ingredientes** y sus cantidades o proporciones.

Es probable que la primera vez que cocines este plato, uses los ingredientes *exactamente* como dice la receta. Pero es posible que luego de comer este riquísimo plato, la segunda vez que lo cocines, comiences a **ajustar las proporciones de los ingredientes** para que se adapte a tus preferencias: más pimienta, menos orégano, más tiempo de cocción, y así.

En el contexto de la inteligencia artificial, los **hiperparámetros** son las **configuraciones que podemos ajustar** antes de entrenar un modelo para que prediga cosas. Estos hiperparámetros podrían ser cuánto tiempo debe entrenarse un modelo o cuán complejo debería ser.

El ajuste de los hiperparámetros busca **encontrar la combinación perfecta** de estos ajustes para que el modelo funcione de la mejor manera posible, es decir, para que haga las mejores predicciones con los datos nuevos que no ha visto antes.


### El problema de encontrar la mejor combinación de hiperparámetros

Como habrás notado en las lecciones de **Machine Learning**, muchas veces al **configurar un modelo**, cualquiera de ellos, yo lo hacía estableciendo sus parámetros de un modo muy específico. Por ejemplo:

```
kmeans = KMeans(n_clusters=5,
                n_init='warn',
                max_iter=300,
                verbose=0,
                random_state=42)
```

Puede que tu hayas pensado "*Cuando yo tenga que configurar mis propios modelos ¿cuántas veces los tengo que poner a prueba antes de encontrar los mejores parámetros?*". Bueno, eso es lo que vamos a aprender a hacer ahora.


### Automatizar la búsqueda de los mejores hiperparámetros

Para hacer un ajuste con los mejores hiperparámetros posibles, **Scikit-Learn** nos ofrece una herramienta que se llama `GridSearchCV`, que lo que hace es **probar una serie de configuraciones de hiperparámetros**, de manera automatizada, para encontrar la combinación que produce **el mejor rendimiento**.

Lo veamos en un ejemplo. Nuevamente tenemos a nuestro dataset `iris` ya preparado, y hemos instanciado el modelo `RandomForestClassifier` en la variable `modelo`.

A los fines prácticos, ya he importado el componente `GridSearchCV` a este ejemplo.

In [1]:
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV

data = load_iris()
X = data.data
y = data.target

modelo = RandomForestClassifier(random_state=42)

Ahora yo quiero descubrir **cómo configurar mi modelo** de la mejor manera posible para estos datos.

Si busco la ayuda para mi modelo `RandomForestClassifier`, me encuentro con que tiene tantos parámetros, que si me pongo a probar en todas sus combinaciones, me tomaría mucho tiempo descubrir cuáles son los mejores valores para cada parámetro. 

Entonces aquí es donde entra en acción `GridSearchCV`, para resolver este problema.

### Implementación de `GridSearchCV`

Comenzaré definiendo una variable llamada `parametros`, que va a contener un **diccionario** con todas las alternativas que quiero probar para los parámetros de `RandomForestClassifier`:

In [2]:
parametros = {
    'n_estimators': [50, 100, 200],
    'max_features': ['sqrt', 'log2'],
    'max_depth': [4, 5, 6, 7, 8],
    'criterion': ['gini', 'entropy']
}

Entonces ahora voy a crear una instancia del objeto `GridSearchCV`, y le voy a pasar estos parámetros:

In [3]:
mi_grid_search = GridSearchCV(estimator=modelo,
                             param_grid=parametros,
                             cv=5,
                             scoring="accuracy")

Y finalmente voy a ejecutar la búsqueda de hiperparámetros.

**Advertencia**: La ejecución de la siguiente celda puede tomar un tiempo más prolongado de lo habitual.

In [4]:
mi_grid_search.fit(X, y)

Ahora nuestro objeto `mi_grid_search` dispone de toda la información de rendimiento de todas las combinaciones de hiperparámetros posibles, por lo que ha llegado la hora de mostrar los **mejores parámetros** y la **mejor puntuación** encontrada.

In [5]:
print("Mejores parámetros:", mi_grid_search.best_params_)
print("Mejor exactitud:", mi_grid_search.best_score_)

Mejores parámetros: {'criterion': 'gini', 'max_depth': 4, 'max_features': 'sqrt', 'n_estimators': 50}
Mejor exactitud: 0.9666666666666668


Cabe aclarar que `GridSearchCV` puede ser computacionalmente intensivo, especialmente si lo aplicamos en datasets muy grandes, o si le cargamos un gran número de combinaciones de hiperparámetros. Por eso es importante balancear la amplitud del espacio de búsqueda según los recursos computacionales que tengamos disponibles.

Dicho esto, sin duda alguna `GridSearchCV` es un gran aliado que nos brinda una información importantísima para poder configurar nuestros modelos con precisión, por lo que deberíamos tener este recurso siempre a mano a la hora de preparar modelos de **Machine Learning**.

El día no se acaba, así que te veo en la siguiente lección.