**Ejercicio 3:** Utilizando las funciones provistas por Scikit-learn, implememente los métodos de ensambles de clasificadores Bagging y AdaBoost. Compare el desempeño de estos modelos empleando 5 particiones con el conjunto de datos Wine.

#### **Librerías**

In [32]:
import numpy as np
from tabulate import tabulate                   # Para generar tablas

from sklearn import datasets                    # Módulo para levantar los datos
from sklearn.metrics import accuracy_score      # Medida de precisión
from sklearn.model_selection import KFold       # Modelo de partición

# Clasificadores:
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import BaggingClassifier
from sklearn.ensemble import AdaBoostClassifier

#### **Inicialización**
Levanto los datos del conjunto Wine con el módulo datasets y, además, genero una función para el KFold de 5 particiones, al cual le voy a pasar los datos de entrada y el clasificador. 

In [33]:
X_digits,y_digits = datasets.load_wine(return_X_y=True)  
datos_tabla = []

def generar_kfold(X_digits,y_digits,clf,n_particiones=5):
    kf = KFold(n_splits=n_particiones)
    ACC = []

    for train_index, test_index in kf.split(X_digits):
        X_train, X_test = X_digits[train_index], X_digits[test_index]
        y_train, y_test = y_digits[train_index], y_digits[test_index]

        clf.fit(X_train, y_train)       # Entreno perceptrón con el conjunto de datos obtenido.
        y_pred = clf.predict(X_test)    # Obtengo salida con datos de prueba
        ACC_aux = accuracy_score(y_test,y_pred)
        ACC.append(ACC_aux)

    return ACC

def medidas(ACC):
    # Medidas globales
    print('Exactitud media:',np.mean(ACC))
    print('Varianza de la exactitud:',np.var(ACC))
    # Medidas tabla
    table_data = [[x,y] for x, y in zip(range(len(ACC)), ACC)]
    headers = ['N° Partición','Precisión']
    table = tabulate(table_data, headers, tablefmt='simple_grid',stralign='center',numalign='center')
    print(table)

#### **Ensambles de clasificadores**
Para ambos casos hago ensambles de árboles de decisión.

- **Bagging**

In [34]:
base_clf = DecisionTreeClassifier()
clf = BaggingClassifier(base_clf,n_estimators=100)
ACC = generar_kfold(X_digits,y_digits,clf)
medidas(ACC)

Exactitud media: 0.9442857142857143
Varianza de la exactitud: 0.0015344923154446976
┌────────────────┬─────────────┐
│  N° Partición  │  Precisión  │
├────────────────┼─────────────┤
│       0        │  0.944444   │
├────────────────┼─────────────┤
│       1        │  0.916667   │
├────────────────┼─────────────┤
│       2        │  0.888889   │
├────────────────┼─────────────┤
│       3        │      1      │
├────────────────┼─────────────┤
│       4        │  0.971429   │
└────────────────┴─────────────┘


- **AdaBoost**

In [35]:
base_clf = DecisionTreeClassifier()
clf = AdaBoostClassifier(base_clf,n_estimators=100)
ACC = generar_kfold(X_digits,y_digits,clf)
medidas(ACC)

Exactitud media: 0.836984126984127
Varianza de la exactitud: 0.004632048374905514
┌────────────────┬─────────────┐
│  N° Partición  │  Precisión  │
├────────────────┼─────────────┤
│       0        │  0.916667   │
├────────────────┼─────────────┤
│       1        │  0.805556   │
├────────────────┼─────────────┤
│       2        │  0.805556   │
├────────────────┼─────────────┤
│       3        │  0.742857   │
├────────────────┼─────────────┤
│       4        │  0.914286   │
└────────────────┴─────────────┘
