# Ensemble Learning:

## Ensemble para Problemas de Regresión

Así como hemos visto cómo aplicar votaciones para problemas de Clasificación, también es posible aplicarlo a problemas de Regresión:

### VotingRegressor: Implementación en Scikit-Learn



https://scikit-learn.org/stable/modules/ensemble.html#voting-regressor

In [None]:
import numpy as np
import pandas as pd

#### Los Datos

In [None]:
# No es necesario que vea este código es sólo para generar los valores de X e y.

m = 200   # cantidad de observaciones
np.random.seed(seed=123)  # para generar siempre los mismos valores de X e y

# Generamos los valores de X e y con un poco de ruido

X = 6 * np.random.rand(m, 1) - 3
y = X**3+5 * X**2 + X + 2 + 2*np.random.randn(m, 1)

In [None]:
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y[:,0],test_size=0.20,random_state=123)

#### Los modelos

In [None]:

from sklearn.linear_model import Ridge
from sklearn.neighbors import KNeighborsRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.svm import SVR
from sklearn.ensemble import VotingRegressor

In [None]:
ridge=Ridge(max_iter= 20000,fit_intercept=True, random_state=123)
knn=KNeighborsRegressor()
tree=DecisionTreeRegressor(random_state=123)
svm=SVR()

#### Evaluaciones individuales

 vamos a medir el RMSE, como por defecto para Regresión .score devuelve el $R^2$ vamos a importar el RMSE:

In [None]:
from sklearn.metrics import mean_squared_error

In [None]:
modelos_lista=(ridge, knn, tree, svm)

for modelo in modelos_lista:
    modelo.fit(X_train,y_train)
    y_pred=modelo.predict(X_test)
    RMSE=mean_squared_error(y_test,y_pred,squared=False)
    #R2=modelo.score(X_test,y_test)
    print("RMSE: ",RMSE)

RMSE:  12.085310348449486
RMSE:  2.0746560830117913
RMSE:  2.846657242096183
RMSE:  7.7835385132283434


#### VotingRegressor: La votación

In [None]:
from sklearn.ensemble import VotingRegressor

In [None]:
modelos=[('ridge',ridge),('knn',knn),('arbol',tree),('svm',svm)]
votacion=VotingRegressor(estimators=modelos,n_jobs=-1, weights=[1,5,5,1])
votacion.fit(X_train, y_train)
y_pred=votacion.predict(X_test)
RMSE=mean_squared_error(y_test,y_pred,squared=False)
print("RMSE_votacion: ",RMSE)

RMSE_votacion:  2.4599659956106317


### Conclusión: 

esta vez el Ensemble no mejoró el resultado, podríamos probar agregando weights=[1,10,5,1] por ejemplo, para ver si mejora al resultado del mejor esimador (en este caso parece que no) parece que knn es imbatible!