# Scikit Learn - Ensemble

- - -

## Árboles de decisión II - Ensemble
- - -

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import roc_auc_score
from sklearn.model_selection import cross_val_score
import warnings
warnings.filterwarnings(action="ignore")

In [None]:
#Pre-procesamos igual que en el notebook de decision tree
nba = pd.read_csv("https://raw.githubusercontent.com/4data-lab/datasets/master/nba_logreg.csv")
nba = nba.dropna()

In [None]:
X = nba.drop(["name", "target_5yrs"], axis=1)
y = nba["target_5yrs"]

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, test_size=0.30, random_state=1)

In [None]:
DTC = DecisionTreeClassifier(random_state=1)

In [None]:
DTC.fit(X_train, y_train)

In [None]:
print("AUC - Datos de validation")
cross_val_score(DTC, X_train, y_train, cv=5, scoring="roc_auc").mean()

- - -

## Bagging

Una forma de mejorar un modelo predictivo es usando la técnica creada por Leo Breiman que denominó Bagging (aka Bootstrap Aggregating).

Esta técnica consiste en crear diferentes modelos usando muestras aleatorias y luego obtener un modelo único como salida.

Para realizar la predicción todos los modelos que forman el agregado participan aportando su predicción.
Como valor de salida, se toma la media de todas las predicciones para las variables continuas o la clase más frecuente para las variables categóricas.

<img src=https://i.ibb.co/Ws0vgLQ/01.png width="600">

In [None]:
from sklearn.ensemble import BaggingClassifier

In [None]:
BAGG = BaggingClassifier(base_estimator=DTC, random_state=1)

In [None]:
BAGG.fit(X_train, y_train)

In [None]:
print("AUC - Datos de validation")
cross_val_score(BAGG, X_train, y_train, cv=5, scoring="roc_auc").mean()

- - -

## Boosting

Crea una secuencia de modelos que intentan corregir los errores de los modelos anteriores, llamados weak learners.

Genera un dataset en secuencia donde la predicción no fue correcta, de forma que cada modelo aprende de los errores del anterior. 

Los resultados se combinan para crear una predicción de salida final, al igual que en bagging.

<img src=https://i.ibb.co/HP0jWqh/02.png width="700">

In [None]:
from sklearn.ensemble import AdaBoostClassifier

In [None]:
#Por defecto, ya usa un Decision Tree
BOOS = AdaBoostClassifier(random_state=1)

In [None]:
BOOS.fit(X_train, y_train)

In [None]:
print("AUC - Datos de validation")
cross_val_score(BOOS, X_train, y_train, cv=5, scoring="roc_auc").mean()

- - -

## Voting

<img src=https://i.ibb.co/C2jLscf/03.png width="400">

In [None]:
from sklearn.ensemble import VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier

In [None]:
KNN = KNeighborsClassifier(n_neighbors=5)

In [None]:
LR = LogisticRegression(random_state=1)

In [None]:
VOTI = VotingClassifier(estimators=[("DTC", DTC), ("LR", LR), ("KNN", KNN)], voting="soft")

In [None]:
VOTI.fit(X_train, y_train)

In [None]:
print("AUC - Datos de validation")
cross_val_score(VOTI, X_train, y_train, cv=5, scoring="roc_auc").mean()

- - -

#### Tipo de votación:



- - -
Imagina que disponemos de las siguientes probabilidades:

**0.45 0.45 0.90**

Hard Vote daría unvotación de 2 votos en contra y 1 voto a favor, por lo que se clasificaría como "negativo".

Soft Vote obtendría el promedio de las probabilidades, que es 0.6 y clasificaría como "positivo".
- - -
</p>
</details>