## Búsqueda de meta-parámetros

Sigue las instrucciones y añade tu código en las celdas en las que se indique.

Entrega este cuaderno modificado y ejecutado.

### Búsqueda en rejilla

Carga el dataset de Wine disponible en Scikit-learn y aplica sobre él un modelo de tipo Random Forest. Debes hacer una búsqueda de meta-parámetros de tipo rejilla con 3 posibles valores para el número de árboles del modelo y 3 posibles valores para la profundidad máxima de cada árbol. Indica la accuracy obtenida mediante validación cruzada.

In [1]:
from sklearn.model_selection import cross_val_score, train_test_split
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_wine
import pandas as pd

data = load_wine()
X = pd.DataFrame(data.data, columns= data.feature_names)
y = data.target
X_train, X_test,y_train, y_test = train_test_split(X,y)
rfs = RandomForestClassifier()
rfs.fit(X_train, y_train)

param_grid = {'n_estimators':[50, 100, 150],
              'max_depth': [5, 10, 15]}
grid_search =GridSearchCV(estimator=rfs, param_grid=param_grid, cv=5)
grid_search.fit(X_train, y_train)
best_params = grid_search.best_params_
best_score = grid_search.best_score_
best_rf_model = grid_search.best_estimator_
accuracy_scores = cross_val_score(best_rf_model, X, y, cv=5)
mean_accuracy = accuracy_scores.mean()
print("Mejores parámetros encontrados:", best_params)
print("Precisión mediante validación cruzada:", mean_accuracy)




Mejores parámetros encontrados: {'max_depth': 5, 'n_estimators': 50}
Precisión mediante validación cruzada: 0.972063492063492


### Búsqueda aleatoria

Carga el dataset de Diabetes y aplica sobre él un modelo de tipo Perceptrón Multicapa. Debes hacer una búsqueda de meta-parámetros de tipo aleatorio con 3 posibles valores para la arquitectura de capas del modelo, 3 posibles valores para el parámetro de regularización L2 y 3 posibles valores para la learning rate inicial. Indica el coeficiente R^2 obtenido mediante validación cruzada.

In [12]:
import numpy as np
from sklearn.datasets import load_diabetes
from sklearn.model_selection import cross_val_score, RandomizedSearchCV
from sklearn.neural_network import MLPRegressor
from scipy.stats import uniform, randint

X,y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.30, random_state=42 )

model = MLPRegressor()
model.fit(X_train,y_train)

param_dist = {
    'hidden_layer_sizes': [(randint.rvs(1, 100),) for _ in range(3)],
    'alpha': uniform(0.0001, 0.1),
    'learning_rate_init': uniform(0.001, 0.1)
}

# Realizar la búsqueda aleatoria de meta-parámetros
random_search = RandomizedSearchCV(model, param_distributions=param_dist, n_iter=10, scoring='r2', cv=5)
random_search.fit(X_train, y_train)

print("Mejores parámetros encontrados:")
print(random_search.best_params_)

print("Coeficiente R^2 promedio mediante validación cruzada:", random_search.best_score_)




Mejores parámetros encontrados:
{'alpha': 0.057247489065798234, 'hidden_layer_sizes': (94,), 'learning_rate_init': 0.022939453181816807}
Coeficiente R^2 promedio mediante validación cruzada: 0.4526501372736485


