<h1 style="text-align: center; font-weight: bolder">
    Métodos de Ensamble
</h1>

Consiste en combinar diferentes métodos de ML con diferentes configuraciones y aplicar un método para lograr un consenso.

La diversidad es una muy buena opción.

## **Estrategías**

### **Bagging (Bootstrap Aggregation)**

Consiste en ejecutar varios modelos en paralelo para que cada uno decida cual es el criterio de la respuesta. Finalmente, mediante algún metodo de consenso se decide la respuesta final.

#### **Procedimiento**

- Creamos particiones aleatorias (uniforme y con remplazo) del conjunto de datos original.
- Se construyen modelos de aprendizaje para cada uno de los subconjuntos por aparte.
- La respuesta final es la combinación (Por ejemplo, por votación) entre las respuestas individuales.

### **Boosting (Impulsar/Propulsar)**

Consiste en encadenar una serie de modelos. Busca fortalecer gradualmente un modelo de aprendizaje usando siempre el error residual de las etapas anteriores.

El resultado final tambien se obtiene por consenso entre todos los modelos.

## **Librerias**

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.ensemble import BaggingClassifier, GradientBoostingClassifier

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix

## **Datos**

In [None]:
# Cargamos los datos
df = pd.read_csv('data/heart.csv')

In [None]:
# Prepamos nuestro dataset
features = df.drop('target', axis=1).copy()
target = df['target'].copy()

In [None]:
# Dividimos el dataset en base de entrenamiento y testeo
X_train, X_test, y_train, y_test = train_test_split(features, target, test_size=0.35, random_state=13)

## **Modelos**

### **1. Modelo Base**

In [None]:
# Inicializamos el modelo 
knn_class = KNeighborsClassifier()

In [None]:
# Entrenamos el modelo
knn_class.fit(X_train, y_train)

In [None]:
# Usamos nuestro modelo para predecir
y_pred_knn = knn_class.predict(X_test)

In [None]:
# Evaluamos el modelo
accuracy_score(y_pred_knn, y_test)

In [None]:
cf_matrix = confusion_matrix(y_test, y_pred_knn)

In [None]:
sns.heatmap(cf_matrix/np.sum(cf_matrix), annot=True, fmt='.2%')

### **2. Metodo Bagging**

In [None]:
# Inicializamos el metodo
bag_class = BaggingClassifier(
    base_estimator=KNeighborsClassifier(),
    n_estimators=50
)

In [None]:
# Entrenamos el modelo
bag_class.fit(X_train, y_train)

In [None]:
# Usamos nuestro modelo para predecir
y_pred_bag = bag_class.predict(X_test)

In [None]:
# Evaluamos el modelo
accuracy_score(y_pred_bag, y_test)

In [None]:
cf_matrix = confusion_matrix(y_test, y_pred_bag)

In [None]:
sns.heatmap(cf_matrix/np.sum(cf_matrix), annot=True, fmt='.2%')

### **3. Metodo Boosting**

In [None]:
# Inicializamos el metodo
boost_class = GradientBoostingClassifier(
    n_estimators=50
)

In [None]:
# Entrenamos el modelo
boost_class.fit(X_train, y_train)

In [None]:
# Usamos nuestro modelo para predecir
y_pred_boost = boost_class.predict(X_test)

In [None]:
# Evaluamos el modelo
accuracy_score(y_pred_boost, y_test)

In [None]:
cf_matrix = confusion_matrix(y_test, y_pred_boost)

In [None]:
sns.heatmap(cf_matrix/np.sum(cf_matrix), annot=True, fmt='.2%')

In [None]:
A = [3, 6, 4, 5, 2, 1]

In [None]:
def prueba(x):
    i = 1
    while i in x:
        i = i + 1
    return i

In [None]:
def solution(A):
    if max(A) < 0:
        return 1
    else: 
        i = 1
        while i in A:
            i = i + 1
        return i

In [None]:
solution([-1, -3])

In [None]:
minpositive(A)

In [None]:
A = 'babaaba'
B = 'ababa'

In [None]:
lista

In [None]:
def separar(x):
    separaciones = x.count('a')
    # return x.split('a')
    
    for i in range(separaciones):
        lista = []
        for i in x:
            lista.append(i)
            print(i)
            if i == 'a':
                break
        print('*'*10)
        print(lista)
        
separar(A)