| **Inicio** | **atr√°s 15** | **Siguiente 17** |
|----------- |-------------- |---------------|
| [üè†](../../README.md) | [‚è™](./15.DBSCAN_Clustering.ipynb)| [‚è©](./17.Bagging%20_Machine_learning.ipynb)|

# **16. Ajuste de Hiperpar√°metros de Modelos de Machine Learning**

## **Introducci√≥n**

El ajuste de hiperpar√°metros en el contexto de modelos de Machine Learning se refiere al proceso de encontrar la combinaci√≥n √≥ptima de valores para los par√°metros que no se aprenden directamente del conjunto de datos durante el entrenamiento del modelo.

Los hiperpar√°metros son valores que se definen antes del entrenamiento del modelo y que afectan su capacidad para ajustarse al conjunto de datos. Algunos ejemplos comunes de hiperpar√°metros son la tasa de aprendizaje, el n√∫mero de capas en una red neuronal, la cantidad de √°rboles en un bosque aleatorio, entre otros.

El ajuste de hiperpar√°metros implica probar diferentes combinaciones de valores de los hiperpar√°metros y evaluar el desempe√±o del modelo en un conjunto de validaci√≥n. El objetivo es encontrar la combinaci√≥n √≥ptima que maximice la precisi√≥n del modelo en el conjunto de datos de prueba.

Este proceso puede ser muy laborioso y a menudo se utilizan t√©cnicas como la b√∫squeda de cuadr√≠cula, la b√∫squeda aleatoria y la optimizaci√≥n bayesiana para encontrar la combinaci√≥n √≥ptima de hiperpar√°metros. Una vez que se ha encontrado la combinaci√≥n √≥ptima, se puede utilizar para entrenar el modelo final que se utilizar√° en la producci√≥n.

## **Datos y t√©cnica a utilizar**

Aqu√≠ te presento algunos ejemplos de datos y t√©cnicas que se pueden utilizar para el ajuste de hiperpar√°metros en modelos de Machine Learning:

**1. Datos:**

Conjunto de datos de reconocimiento de im√°genes de d√≠gitos escritos a mano `(MNIST)`.

**T√©cnica:** B√∫squeda de cuadr√≠cula para ajustar los hiperpar√°metros de un modelo de red neuronal convolucional, como el n√∫mero de capas ocultas, el n√∫mero de filtros en cada capa, el tama√±o del kernel, etc.

**2. Datos:**

 Conjunto de datos de precios de viviendas.

**T√©cnica:** B√∫squeda aleatoria para ajustar los hiperpar√°metros de un modelo de regresi√≥n, como el tama√±o del conjunto de entrenamiento, el n√∫mero de variables de entrada, el tipo de modelo (regresi√≥n lineal, regresi√≥n de bosque aleatorio, etc.), y otros hiperpar√°metros espec√≠ficos del modelo.

**3. Datos:**

 Conjunto de datos de detecci√≥n de fraude de tarjetas de cr√©dito.

**T√©cnica:** Optimizaci√≥n bayesiana para ajustar los hiperpar√°metros de un modelo de clasificaci√≥n, como el n√∫mero de √°rboles en un bosque aleatorio, el n√∫mero m√°ximo de profundidad, la tasa de aprendizaje, la regularizaci√≥n y otros hiperpar√°metros espec√≠ficos del modelo.

Estos son solo algunos ejemplos de datos y t√©cnicas que se pueden utilizar para el ajuste de hiperpar√°metros en modelos de Machine Learning. La elecci√≥n de la t√©cnica y los hiperpar√°metros espec√≠ficos depender√° del problema y los datos que se est√©n utilizando.

## **Explicaci√≥n de bosques aleatorios**

Los bosques aleatorios son un tipo de modelo de Machine Learning que se utilizan para problemas de clasificaci√≥n y regresi√≥n. Son una combinaci√≥n de m√∫ltiples √°rboles de decisi√≥n, en los cuales cada √°rbol es entrenado con una muestra aleatoria de datos y una selecci√≥n aleatoria de caracter√≠sticas.

La idea principal detr√°s de los bosques aleatorios es que la combinaci√≥n de m√∫ltiples modelos d√©biles y altamente correlacionados puede producir un modelo fuerte y robusto. Cada √°rbol en el bosque se entrena en una muestra aleatoria de los datos, lo que significa que cada √°rbol ver√° una parte diferente del conjunto de datos y ser√° entrenado con una perspectiva diferente. Adem√°s, cada √°rbol se entrena con una selecci√≥n aleatoria de caracter√≠sticas, lo que significa que cada √°rbol se enfoca en diferentes aspectos de los datos.

A continuaci√≥n se muestra un ejemplo de c√≥digo en Python para implementar un modelo de bosque aleatorio utilizando el conjunto de datos de `Iris`:

In [1]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=42)

# crear un modelo de bosque aleatorio con 100 √°rboles
rfc = RandomForestClassifier(n_estimators=100, random_state=42)

# ajustar el modelo a los datos de entrenamiento
rfc.fit(X_train, y_train)

# evaluar la precisi√≥n del modelo en los datos de prueba
print('Precisi√≥n del modelo:', rfc.score(X_test, y_test))


Precisi√≥n del modelo: 1.0


En este ejemplo, se utiliza la biblioteca `Scikit-Learn` para cargar el conjunto de datos de `Iris` y dividirlo en un conjunto de datos de entrenamiento y prueba. Luego se crea un modelo de bosque aleatorio con `100` √°rboles utilizando la clase ```RandomForestClassifier```. Se ajusta el modelo a los datos de entrenamiento y se eval√∫a la precisi√≥n del modelo en los datos de prueba. La precisi√≥n del modelo se imprime en la consola.

## **Hiperpar√°metros de los bosques**

Los hiperpar√°metros son valores que se establecen antes del entrenamiento de un modelo de Machine Learning y que influyen en su rendimiento. Para los bosques aleatorios, algunos ejemplos de hiperpar√°metros incluyen el n√∫mero de √°rboles en el bosque, la profundidad m√°xima de los √°rboles, el n√∫mero m√≠nimo de muestras requeridas para dividir un nodo, la fracci√≥n de caracter√≠sticas que se seleccionan al azar para cada √°rbol, entre otros.

A continuaci√≥n, se muestra un ejemplo de c√≥digo en Python que utiliza la biblioteca `Scikit-Learn` para entrenar un modelo de bosque aleatorio en el conjunto de datos de `Iris`, ajustando algunos de sus hiperpar√°metros:

In [2]:
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV, train_test_split

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=42)

# crear un modelo de bosque aleatorio
rfc = RandomForestClassifier(random_state=42)

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'n_estimators': [50, 100, 200],
              'max_depth': [3, 5, None],
              'min_samples_split': [2, 5, 10],
              'max_features': ['sqrt', 'log2']}

# realizar la b√∫squeda de cuadr√≠cula para encontrar los mejores hiperpar√°metros
grid_search = GridSearchCV(rfc, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# imprimir los mejores hiperpar√°metros y la precisi√≥n del modelo en los datos de prueba
print('Mejores hiperpar√°metros:', grid_search.best_params_)
print('Precisi√≥n del modelo:', grid_search.score(X_test, y_test))


Mejores hiperpar√°metros: {'max_depth': 3, 'max_features': 'sqrt', 'min_samples_split': 10, 'n_estimators': 100}
Precisi√≥n del modelo: 1.0


En este ejemplo, se crea un modelo de bosque aleatorio sin establecer valores para algunos de sus hiperpar√°metros, para que puedan ser ajustados m√°s tarde mediante la b√∫squeda de cuadr√≠cula. Se define una cuadr√≠cula de hiperpar√°metros utilizando la clase ```GridSearchCV``` de Scikit-Learn, que realiza una b√∫squeda exhaustiva de combinaciones de hiperpar√°metros para encontrar los valores que producen el mejor rendimiento. En este caso, se ajustan los hiperpar√°metros ```n_estimators```, ```max_depth```, ```min_samples_split``` y ```max_features```. Luego, se ajusta el modelo a los datos de entrenamiento utilizando la funci√≥n ```fit``` de la clase ```GridSearchCV``` y se eval√∫a la precisi√≥n del modelo en los datos de prueba. Finalmente, se imprimen los mejores hiperpar√°metros encontrados y la precisi√≥n del modelo en los datos de prueba.

## **B√∫squeda en Rejilla (GridSearch)**

La b√∫squeda en rejilla, o `GridSearch`, es una t√©cnica de ajuste de hiperpar√°metros que implica la evaluaci√≥n exhaustiva de todas las combinaciones posibles de valores de hiperpar√°metros en un rango predefinido. A continuaci√≥n, se presenta un ejemplo de c√≥digo en Python que utiliza la biblioteca `Scikit-Learn` para realizar una b√∫squeda en rejilla en un modelo de regresi√≥n log√≠stica:

In [4]:
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import GridSearchCV, train_test_split

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=42)

# crear un modelo de regresi√≥n log√≠stica
logreg = LogisticRegression(random_state=42, max_iter=1000)

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'C': [0.1, 1, 10],
              'penalty': ['l1', 'l2'],
              'solver': ['liblinear', 'saga']}

# realizar la b√∫squeda de cuadr√≠cula para encontrar los mejores hiperpar√°metros
grid_search = GridSearchCV(logreg, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# imprimir los mejores hiperpar√°metros y la precisi√≥n del modelo en los datos de prueba
print('Mejores hiperpar√°metros:', grid_search.best_params_)
print('Precisi√≥n del modelo:', grid_search.score(X_test, y_test))




Mejores hiperpar√°metros: {'C': 10, 'penalty': 'l1', 'solver': 'saga'}
Precisi√≥n del modelo: 1.0




En este ejemplo, se define una cuadr√≠cula de hiperpar√°metros utilizando la clase ```GridSearchCV``` de Scikit-Learn. La cuadr√≠cula contiene diferentes valores para los hiperpar√°metros ```C```, ```penalty``` y ```solver``` del modelo de regresi√≥n log√≠stica. Luego, se realiza una b√∫squeda de cuadr√≠cula para evaluar todas las posibles combinaciones de hiperpar√°metros y encontrar los que producen el mejor rendimiento en t√©rminos de precisi√≥n en los datos de entrenamiento. La funci√≥n ```fit``` de la clase ```GridSearchCV``` ajusta el modelo a los datos de entrenamiento utilizando cada combinaci√≥n de valores de hiperpar√°metros y eval√∫a el rendimiento utilizando una validaci√≥n cruzada con 5 divisiones. Finalmente, se imprimen los mejores hiperpar√°metros encontrados y la precisi√≥n del modelo en los datos de prueba.

## **Informaci√≥n de la Rejilla**

La Informaci√≥n de la Rejilla `(GridSearchCV)` es una t√©cnica de ajuste de hiperpar√°metros que utiliza una b√∫squeda exhaustiva sobre una grilla de valores posibles de hiperpar√°metros para encontrar la mejor combinaci√≥n de hiperpar√°metros para un modelo de machine learning. En lugar de ajustar manualmente los hiperpar√°metros, `GridSearchCV` prueba todas las posibles combinaciones de hiperpar√°metros y devuelve la mejor combinaci√≥n.

Aqu√≠ hay un ejemplo de c√≥digo que muestra c√≥mo utilizar `GridSearchCV` con `SVM` para encontrar la mejor combinaci√≥n de valores de hiperpar√°metros:

In [5]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=0)

# crear un modelo SVM
svm = SVC()

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf'], 'gamma': ['scale', 'auto']}

# realizar la b√∫squeda de cuadr√≠cula para encontrar los mejores hiperpar√°metros
grid_search = GridSearchCV(svm, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# imprimir los mejores hiperpar√°metros y la precisi√≥n del modelo en los datos de prueba
print('Mejores hiperpar√°metros:', grid_search.best_params_)
print('Precisi√≥n del modelo:', grid_search.score(X_test, y_test))


Mejores hiperpar√°metros: {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Precisi√≥n del modelo: 0.9736842105263158


En este ejemplo, se utiliza ```GridSearchCV``` para buscar la mejor combinaci√≥n de valores de hiperpar√°metros para el modelo `SVM`. La cuadr√≠cula de hiperpar√°metros a probar se define en el diccionario ```param_grid```. ```GridSearchCV``` ajusta el modelo `SVM` a cada combinaci√≥n posible de valores de hiperpar√°metros y eval√∫a su rendimiento utilizando la validaci√≥n cruzada de 5 pliegues. Finalmente, imprime los mejores hiperpar√°metros encontrados y la precisi√≥n del modelo en los datos de prueba.

## **Validaci√≥n cruzada y Rejilla**

La Validaci√≥n Cruzada `(Cross Validation)` es una t√©cnica utilizada para evaluar el rendimiento de un modelo de Machine Learning. La idea principal es dividir el conjunto de datos en subconjuntos de entrenamiento y prueba, entrenar el modelo en el subconjunto de entrenamiento y evaluar su rendimiento en el subconjunto de prueba. Esta t√©cnica es √∫til para evitar el sobreajuste y para obtener una mejor estimaci√≥n del rendimiento del modelo.

La B√∫squeda en Rejilla `(GridSearchCV)` es una t√©cnica de ajuste de hiperpar√°metros que utiliza una b√∫squeda exhaustiva sobre una grilla de valores posibles de hiperpar√°metros para encontrar la mejor combinaci√≥n de hiperpar√°metros para un modelo de Machine Learning.

Aqu√≠ hay un ejemplo de c√≥digo que muestra c√≥mo utilizar la Validaci√≥n Cruzada y la B√∫squeda en Rejilla con `SVM` para encontrar la mejor combinaci√≥n de valores de hiperpar√°metros:

In [6]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV, cross_val_score
from sklearn.svm import SVC

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=0)

# crear un modelo SVM
svm = SVC()

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf'], 'gamma': ['scale', 'auto']}

# realizar la b√∫squeda de cuadr√≠cula con validaci√≥n cruzada para encontrar los mejores hiperpar√°metros
grid_search = GridSearchCV(svm, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# imprimir los mejores hiperpar√°metros y la precisi√≥n del modelo en los datos de prueba
print('Mejores hiperpar√°metros:', grid_search.best_params_)
print('Precisi√≥n del modelo en los datos de prueba:', grid_search.score(X_test, y_test))

# realizar la validaci√≥n cruzada para evaluar el rendimiento del modelo
scores = cross_val_score(grid_search, iris.data, iris.target, cv=5)
print('Precisi√≥n media de la validaci√≥n cruzada:', scores.mean())


Mejores hiperpar√°metros: {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}
Precisi√≥n del modelo en los datos de prueba: 0.9736842105263158
Precisi√≥n media de la validaci√≥n cruzada: 0.9666666666666668


En este ejemplo, se utiliza la Validaci√≥n Cruzada con B√∫squeda en Rejilla para encontrar la mejor combinaci√≥n de valores de hiperpar√°metros para el modelo `SVM`. La cuadr√≠cula de hiperpar√°metros a probar se define en el diccionario ```param_grid```. `GridSearchCV` ajusta el modelo `SVM` a cada combinaci√≥n posible de valores de hiperpar√°metros y eval√∫a su rendimiento utilizando la validaci√≥n cruzada de `5` pliegues. Finalmente, imprime los mejores hiperpar√°metros encontrados y la precisi√≥n del modelo en los datos de prueba, as√≠ como la precisi√≥n media de la validaci√≥n cruzada.

## **Conjuntos de hiperpar√°metros explorados**

En el contexto de la B√∫squeda en Rejilla `(GridSearchCV)`, los conjuntos de hiperpar√°metros explorados son todas las combinaciones de valores de hiperpar√°metros que se prueban para encontrar la mejor combinaci√≥n que produce el mejor rendimiento del modelo. Estos conjuntos pueden ser bastante grandes y pueden ser un desaf√≠o para la optimizaci√≥n del modelo.

Aqu√≠ hay un ejemplo de c√≥digo que muestra c√≥mo utilizar la B√∫squeda en Rejilla con `SVM` para explorar conjuntos de hiperpar√°metros:

In [7]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import SVC

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=0)

# crear un modelo SVM
svm = SVC()

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf'], 'gamma': ['scale', 'auto']}

# realizar la b√∫squeda de cuadr√≠cula para encontrar los mejores hiperpar√°metros
grid_search = GridSearchCV(svm, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# imprimir los conjuntos de hiperpar√°metros explorados y su rendimiento
print('Conjuntos de hiperpar√°metros explorados:', grid_search.cv_results_['params'])
print('Rendimiento de cada conjunto de hiperpar√°metros:', grid_search.cv_results_['mean_test_score'])


Conjuntos de hiperpar√°metros explorados: [{'C': 0.1, 'gamma': 'scale', 'kernel': 'linear'}, {'C': 0.1, 'gamma': 'scale', 'kernel': 'rbf'}, {'C': 0.1, 'gamma': 'auto', 'kernel': 'linear'}, {'C': 0.1, 'gamma': 'auto', 'kernel': 'rbf'}, {'C': 1, 'gamma': 'scale', 'kernel': 'linear'}, {'C': 1, 'gamma': 'scale', 'kernel': 'rbf'}, {'C': 1, 'gamma': 'auto', 'kernel': 'linear'}, {'C': 1, 'gamma': 'auto', 'kernel': 'rbf'}, {'C': 10, 'gamma': 'scale', 'kernel': 'linear'}, {'C': 10, 'gamma': 'scale', 'kernel': 'rbf'}, {'C': 10, 'gamma': 'auto', 'kernel': 'linear'}, {'C': 10, 'gamma': 'auto', 'kernel': 'rbf'}]
Rendimiento de cada conjunto de hiperpar√°metros: [0.95533597 0.82094862 0.95533597 0.94703557 0.97312253 0.96403162
 0.97312253 0.96403162 0.97272727 0.97312253 0.97272727 0.97272727]


En este ejemplo, se utiliza la B√∫squeda en Rejilla con `SVM` para explorar conjuntos de hiperpar√°metros definidos en el diccionario ```param_grid```. `GridSearchCV` ajusta el modelo `SVM` a cada combinaci√≥n posible de valores de hiperpar√°metros y eval√∫a su rendimiento utilizando la validaci√≥n cruzada de `5` pliegues. Luego, imprime los conjuntos de hiperpar√°metros explorados y su rendimiento.

## **Ranking de los mejores modelos**

El ranking de los mejores modelos es una lista ordenada de los modelos entrenados seg√∫n su rendimiento. Esta lista puede ser √∫til para seleccionar el modelo final para su uso en la producci√≥n. Los modelos se ordenan seg√∫n alguna m√©trica de rendimiento, como la precisi√≥n, la puntuaci√≥n `F1`, el `AUC`, etc.

Aqu√≠ hay un ejemplo de c√≥digo que muestra c√≥mo utilizar `GridSearchCV` para entrenar varios modelos y ordenarlos seg√∫n su precisi√≥n:

In [8]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=0)

# definir una lista de modelos para entrenar
models = [
    ('Logistic Regression', LogisticRegression()),
    ('Decision Tree', DecisionTreeClassifier())
]

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {
    'Logistic Regression': {'C': [0.1, 1, 10], 'penalty': ['l1', 'l2']},
    'Decision Tree': {'max_depth': [3, 5, 7]}
}

# entrenar los modelos utilizando la b√∫squeda de cuadr√≠cula y la validaci√≥n cruzada de 5 pliegues
results = {}
for name, model in models:
    grid_search = GridSearchCV(model, param_grid[name], cv=5)
    grid_search.fit(X_train, y_train)
    results[name] = {'best_params': grid_search.best_params_, 'score': grid_search.score(X_test, y_test)}

# ordenar los modelos seg√∫n su precisi√≥n
ranked_models = sorted(results.items(), key=lambda x: x[1]['score'], reverse=True)

# imprimir el ranking de los modelos
for i, (name, result) in enumerate(ranked_models):
    print(f'{i+1}. Modelo: {name}, Precisi√≥n: {result["score"]}, Mejores Hiperpar√°metros: {result["best_params"]}')


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

1. Modelo: Logistic Regression, Precisi√≥n: 0.9736842105263158, Mejores Hiperpar√°metros: {'C': 10, 'penalty': 'l2'}
2. Modelo: Decision Tree, Precisi√≥n: 0.9736842105263158, Mejores Hiperpar√°metros: {'max_depth': 3}


En este ejemplo, se definen dos modelos diferentes para entrenar (regresi√≥n log√≠stica y √°rbol de decisi√≥n) y se define una cuadr√≠cula de hiperpar√°metros diferente para cada modelo. `GridSearchCV` se utiliza para entrenar los modelos utilizando la b√∫squeda de cuadr√≠cula y la validaci√≥n cruzada de 5 pliegues. Luego, los modelos se ordenan seg√∫n su precisi√≥n y se imprimen en orden de mejor a peor rendimiento.

## **Los mejores hiperpar√°metros**

Los mejores hiperpar√°metros son aquellos que producen el mejor rendimiento en el modelo de machine learning. En la b√∫squeda de hiperpar√°metros, se exploran diferentes combinaciones de hiperpar√°metros para encontrar los que producen el mejor resultado. El mejor conjunto de hiperpar√°metros se selecciona seg√∫n una m√©trica de evaluaci√≥n espec√≠fica, como la precisi√≥n, el `AUC`, la `F1-score`, entre otros.

Aqu√≠ hay un ejemplo de c√≥mo obtener los mejores hiperpar√°metros utilizando la b√∫squeda en rejilla y la validaci√≥n cruzada en `Scikit-learn`:

In [9]:
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV, train_test_split

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=42)

# crear un modelo de bosque aleatorio
rfc = RandomForestClassifier(random_state=42)

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'n_estimators': [50, 100, 200],
              'max_depth': [None, 5, 10],
              'max_features': ['auto', 'sqrt', 'log2']}

# realizar la b√∫squeda de cuadr√≠cula para encontrar los mejores hiperpar√°metros
grid_search = GridSearchCV(rfc, param_grid, cv=5)
grid_search.fit(X_train, y_train)

# imprimir los mejores hiperpar√°metros y la precisi√≥n del modelo en los datos de prueba
print('Mejores hiperpar√°metros:', grid_search.best_params_)
print('Precisi√≥n del modelo:', grid_search.score(X_test, y_test))


  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(
  warn(


Mejores hiperpar√°metros: {'max_depth': None, 'max_features': 'auto', 'n_estimators': 100}
Precisi√≥n del modelo: 1.0


En este ejemplo, estamos buscando los mejores hiperpar√°metros para un modelo de bosque aleatorio. Hacemos uso de la b√∫squeda en rejilla para explorar diferentes combinaciones de hiperpar√°metros y usamos la validaci√≥n cruzada con 5 pliegues para evaluar el rendimiento de cada combinaci√≥n de hiperpar√°metros. Finalmente, imprimimos los mejores hiperpar√°metros encontrados y la precisi√≥n del modelo en los datos de prueba.

## **Usando el mejor modelo**

Una vez que hemos obtenido los mejores hiperpar√°metros y hemos ajustado nuestro modelo usando la validaci√≥n cruzada, podemos utilizar el modelo resultante para hacer predicciones en nuevos datos. Aqu√≠ hay un ejemplo de c√≥mo hacer esto usando un modelo de regresi√≥n log√≠stica ajustado a trav√©s de la validaci√≥n cruzada:

In [10]:
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import GridSearchCV, train_test_split

# cargar el conjunto de datos de iris
iris = load_iris()

# dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=42)

# definir una cuadr√≠cula de hiperpar√°metros para buscar
param_grid = {'C': [0.1, 1, 10],
              'penalty': ['l1', 'l2'],
              'solver': ['liblinear', 'saga']}

# crear un modelo de regresi√≥n log√≠stica con los mejores hiperpar√°metros
best_logreg = LogisticRegression(C=1, penalty='l1', solver='saga', random_state=42)

# ajustar el modelo a los datos de entrenamiento
best_logreg.fit(X_train, y_train)

# hacer predicciones en los datos de prueba
y_pred = best_logreg.predict(X_test)

# evaluar la precisi√≥n del modelo en los datos de prueba
accuracy = best_logreg.score(X_test, y_test)
print('Precisi√≥n del modelo en los datos de prueba:', accuracy)


Precisi√≥n del modelo en los datos de prueba: 1.0




En este ejemplo, despu√©s de ajustar el modelo con los mejores hiperpar√°metros encontrados mediante la validaci√≥n cruzada, utilizamos el m√©todo ```predict``` para hacer predicciones en los datos de prueba. Luego, evaluamos la precisi√≥n del modelo en los datos de prueba utilizando el m√©todo ```score```.

## **B√∫squeda aleatoria (RandomizedSearch)**

La b√∫squeda aleatoria `(RandomizedSearch)` es una t√©cnica de optimizaci√≥n de hiperpar√°metros que consiste en buscar los valores √≥ptimos de los par√°metros de un modelo de forma aleatoria en un rango de valores especificado. En lugar de probar todas las combinaciones posibles de par√°metros, lo que puede ser computacionalmente costoso, se seleccionan valores aleatorios dentro de un rango predefinido para cada par√°metro y se eval√∫a su desempe√±o en el modelo.

Un ejemplo de c√≥mo se puede implementar `RandomizedSearch` utilizando la biblioteca de aprendizaje autom√°tico `Scikit-learn` en Python es el siguiente:

In [16]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import randint

# Define el modelo
model = RandomForestClassifier()

# Define el espacio de b√∫squeda de los hiperpar√°metros
param_dist = {'n_estimators': randint(10, 100),
              'max_depth': randint(1, 10),
              'min_samples_split': randint(2, 20),
              'min_samples_leaf': randint(1, 20)}

# Ejecuta la b√∫squeda aleatoria
random_search = RandomizedSearchCV(model, param_distributions=param_dist,
                                   n_iter=10, cv=5, n_jobs=-1)

# Ajusta el modelo utilizando los mejores par√°metros encontrados
random_search.fit(X_train, y_train)

# Muestra los mejores par√°metros encontrados
print(random_search.best_params_)


{'max_depth': 5, 'min_samples_leaf': 13, 'min_samples_split': 12, 'n_estimators': 16}


En este ejemplo, se define un modelo `RandomForestClassifier` y se define un espacio de b√∫squeda de los hiperpar√°metros a trav√©s del diccionario `param_dist`. Los valores de los hiperpar√°metros se seleccionan de forma aleatoria dentro de los rangos especificados usando la funci√≥n `randint` de `scipy.stats`.

Se ejecuta la b√∫squeda aleatoria utilizando `RandomizedSearchCV` de `Scikit-learn`, que realiza una validaci√≥n cruzada de `5` veces y prueba `10` combinaciones aleatorias de valores de hiperpar√°metros.

Finalmente, se ajusta el modelo utilizando los mejores par√°metros encontrados y se imprimen los valores de los mejores par√°metros encontrados.

## **Hiperpar√°metros explorados aleatoriamente**

Los hiperpar√°metros explorados aleatoriamente se refieren a los valores de los hiperpar√°metros que son seleccionados de forma aleatoria dentro de un rango predefinido durante el proceso de b√∫squeda aleatoria. Estos hiperpar√°metros son los que se eval√∫an para determinar cu√°l combinaci√≥n de valores da lugar al mejor desempe√±o del modelo.

A continuaci√≥n, se presenta un ejemplo de c√≥digo que muestra c√≥mo se pueden definir los hiperpar√°metros a ser explorados aleatoriamente en la b√∫squeda de un modelo `RandomForestClassifier` utilizando la biblioteca de aprendizaje autom√°tico `Scikit-learn` en Python:

In [17]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import randint

# Define el modelo
model = RandomForestClassifier()

# Define el espacio de b√∫squeda de los hiperpar√°metros
param_dist = {'n_estimators': randint(10, 100),
              'max_depth': randint(1, 10),
              'min_samples_split': randint(2, 20),
              'min_samples_leaf': randint(1, 20)}

# Ejecuta la b√∫squeda aleatoria
random_search = RandomizedSearchCV(model, param_distributions=param_dist,
                                   n_iter=10, cv=5, n_jobs=-1)

# Ajusta el modelo utilizando los mejores par√°metros encontrados
random_search.fit(X_train, y_train)

# Muestra los mejores par√°metros encontrados
print(random_search.best_params_)




{'max_depth': 3, 'min_samples_leaf': 2, 'min_samples_split': 7, 'n_estimators': 46}


En este ejemplo, los hiperpar√°metros explorados aleatoriamente son:

* **n_estimators:** n√∫mero de √°rboles en el modelo `RandomForestClassifier`, seleccionado aleatoriamente entre 10 y 100.
* **max_depth:** profundidad m√°xima de los √°rboles en el modelo `RandomForestClassifier`, seleccionado aleatoriamente entre 1 y 10.
* **min_samples_split:** n√∫mero m√≠nimo de muestras requeridas para dividir un nodo interno en el modelo `RandomForestClassifier`, seleccionado aleatoriamente entre 2 y 20.
* **min_samples_leaf:** n√∫mero m√≠nimo de muestras requeridas para ser una hoja en el modelo `RandomForestClassifier`, seleccionado aleatoriamente entre 1 y 20.

Estos hiperpar√°metros son definidos en el diccionario ```param_dist```, que es pasado como par√°metro a la funci√≥n `RandomizedSearchCV`. Durante la b√∫squeda aleatoria, se seleccionan aleatoriamente 10 combinaciones de valores de los hiperpar√°metros definidos en ```param_dist```, y se eval√∫a el desempe√±o del modelo para cada combinaci√≥n. Al final, el mejor conjunto de valores de hiperpar√°metros se selecciona y se utiliza para ajustar el modelo.

| **Inicio** | **atr√°s 15** | **Siguiente 17** |
|----------- |-------------- |---------------|
| [üè†](../../README.md) | [‚è™](./15.DBSCAN_Clustering.ipynb)| [‚è©](./17.Bagging%20_Machine_learning.ipynb)|