In [1]:
# Importar las librerías necesarias
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

In [3]:
# Cargar los datos de Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [5]:
# Crear el modelo de Random Forest
rf = RandomForestClassifier()

# Definir el espacio de búsqueda de hiperparámetros
param_grid = {
    'n_estimators': [10, 50, 100],  # Número de árboles en el bosque
    'max_depth': [None, 10, 20],    # Profundidad máxima de los árboles
    'min_samples_split': [2, 5, 10] # Mínimo número de muestras para dividir un nodo
}

In [7]:
# Configurar GridSearchCV
grid_search = GridSearchCV(estimator=rf, param_grid=param_grid, cv=5, n_jobs=-1, verbose=2)

# Ajustar el modelo a los datos de entrenamiento
grid_search.fit(X_train, y_train)

Fitting 5 folds for each of 27 candidates, totalling 135 fits


In [8]:
# Imprimir los mejores hiperparámetros encontrados por GridSearchCV
print("Mejores hiperparámetros:", grid_search.best_params_)

# Evaluar el rendimiento en el conjunto de prueba
accuracy = grid_search.score(X_test, y_test)
print("Precisión en el conjunto de prueba:", accuracy)

Mejores hiperparámetros: {'max_depth': None, 'min_samples_split': 10, 'n_estimators': 50}
Precisión en el conjunto de prueba: 1.0


In [13]:
grid_search.best_estimator_

In [15]:
grid_search.best_score_

0.9523809523809523

In [None]:
# Una vez hemos encontrado los mejores hiperparámetros como los utilizamos?

In [11]:
# Obtener los mejores hiperparámetros
best_params = grid_search.best_params_

# Crear un nuevo modelo con los mejores hiperparámetros
new_rf_model = RandomForestClassifier(**best_params)

# Entrenar el nuevo modelo
new_rf_model.fit(X_train, y_train)

# Realizar predicciones con el nuevo modelo
y_pred_new = new_rf_model.predict(X_test)

# Evaluar el nuevo modelo
accuracy_new = new_rf_model.score(X_test, y_test)
print("Precisión con el nuevo modelo:", accuracy_new)


Precisión con el nuevo modelo: 1.0
