# Laboratorio: Métodos de búsqueda

En las clases anteriores creaste códigos para realizar búsquedas aleatorias (Simulated Annealing) y búsquedas dirigidas (Optimización Bayesiana). Estos métodos de búsqueda se utilizan para facilitar el proceso de optimización de funciones objetivos compleja y costosas de computar.

En este laboratorio usaremos el dataset de los diferentes tipos de iris, y sus longitudes y anchos de pétalos y sépalos. Utilizaremos un RandomForest para crear un modelo de clasificación y el métrico F1 para decidir cuál es el mejor modelo de acuerdo a lo que tenemos disponible.

1. Carga el dataset de Iris

In [1]:
from sklearn import datasets
X, y = datasets.load_iris(return_X_y=True)

2. Importa el archivo `Bosque.py`.

Este archivo contiene la función `RegresionBosque`, que recibe:
- X: las características independientes
- y: la variable de respuesta
- árboles: cantidad total de árboles
- profundidad de bosque: niveles de profundidad del bosque

Su salida es:
- modelo: El objeto con el modelo ajustado
- f1: El métrico que califica qué tan bueno es el modelo que se ajustó.


In [37]:
import Bosque
import numpy as np
modelo, f1 = Bosque.RegresionBosque(X, y, 10, 3)
f1

0.9444444444444444

### Actividad 1:

Inicializa un espacio con 5 muestras en nuestro dominio de variables independientes:
- árboles: números enteros entre 5 y 50.
- profundidad: números enteros entre 2 y 10

Utiliza optimización Bayesiana para encontrar la combinación de árboles y profundidad que **maximice** el métrico F1.

In [139]:
import numpy as np
from sklearn import datasets
import Bosque  
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF

arboles = np.random.randint(5, 51, 5)
profundidad = np.random.randint(2, 11, 5)

X.reshape([-1,1])
y.reshape([-1,1])

for i in range(5):
    modelo, f1 = Bosque.RegresionBosque(X, y, arboles[i], profundidad[i])
    print("Modelo", i+1, "Árboles :", arboles[i] , "Profundidad = ", profundidad[i], "F1 :", f1)



Modelo 1 Árboles : 34 Profundidad =  4 F1 : 0.9555555555555556
Modelo 2 Árboles : 13 Profundidad =  3 F1 : 0.9666666666666667
Modelo 3 Árboles : 32 Profundidad =  5 F1 : 0.9555555555555556
Modelo 4 Árboles : 38 Profundidad =  9 F1 : 0.9555555555555556
Modelo 5 Árboles : 28 Profundidad =  3 F1 : 0.9444444444444444


In [144]:
kernel = 1.0*RBF(length_scale=1)
gp = GaussianProcessRegressor(kernel=kernel, n_restarts_optimizer=10).fit(X,RegresionBosque(X,y,arboles,profundidad))
x = np.linspace(4, 51, 1000).reshape([-1,1])
y_pred,y_std = gp.predict(x, return_std=True)
plt.figure()
plt.scatter(X1,f(X1), s=50, c="r", zorder=3)
plt.plot(x, y_pred)
y_pred_low = y_pred - 1.96*y_std
y_pred_high = y_pred + 1.96*y_std
plt.fill_between(x[:,0], y_pred_low, y_pred_high, alpha=0.2)

InvalidParameterError: The 'max_depth' parameter of RandomForestClassifier must be an int in the range [1, inf) or None. Got array([4, 3, 5, 9, 3]) instead.

### Actividad 2:

Inicializa 2 vectores con posibles valores para las variables independientes:
- árboles: números enteros entre 5 y 50
- profundidad: números enteros entre 2 y 10

Utiliza el algoritmo de Simulated Annealing que siga el siguiente orden:
- Elige un punto de partida para las variables.
- Selecciona al azar una de las dos para modificarlas.
- Selecciona un elemento al azar de la lista que contiene los posibles valores de esa variable.
- Sigue el algoritmo ($p$ y $q$) para decidir si usas esa combinación nueva o si mantienes la anterior.