# Modelo: Bagging(DecisionTreeClassifier)

---

## Resultados dashboard

- Prueba N° 4: 
    - Recall: 0.787
    - Acurracy: 0.751
<br>
<br>
- Prueba N° 5: 
    - Recall: 0.787
    - Acurracy: 0.742

In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from models.utils import transform_df, save_results

#### Se cargan los datos y se realizan las transformaciones

In [None]:
df_train = transform_df("datasets/hospitalizaciones_train.csv")
df_test = transform_df("datasets/hospitalizaciones_test.csv", test=True)

#### Se extraen los valores de train y test

In [None]:
x_train = df_train.drop(columns=["stay_labed"]).values
y_train = df_train["stay_labed"].values.reshape(-1, 1)
x_test = df_test.values

#### Se definen los parametros a optimizar

In [None]:
test_params = {
    "estimator": [
        DecisionTreeClassifier(max_depth=10),
        DecisionTreeClassifier(max_depth=20),
    ],
    "n_estimators": np.arange(101, 151, 10),
    "max_features": np.arange(0.6, 0.9, 0.1),
    "max_samples": np.arange(0.6, 0.9, 0.1),
}

#### Se realiza la busqueda de los parametros optimos

In [None]:
grid_serch_bagging_classifier = GridSearchCV(
    estimator=BaggingClassifier(),
    cv=5,
    n_jobs=2,
    param_grid=test_params,
    scoring=["recall", "accuracy"],
    refit="recall",
    verbose=4,
)
grid_serch_bagging_classifier.fit(x_train, y_train)

#### Se asignan los mejores parametros

In [None]:
best_params = grid_serch_bagging_classifier.best_params_

#### Se instancia el modelo con los parametros encontrados y se realiza la predicción

In [None]:
bagging_classifier = BaggingClassifier(**best_params)
y_pred = bagging_classifier.predict(x_test)

#### Se guardan los resultados obtenidos en la predicción

In [None]:
y_pred = pd.DataFrame(y_pred)
save_results(series=y_pred, model=(bagging_classifier,"model_"))