
### Laboratorio 1: Ensamble - Bagging

#### Objetivos:
- Entender y aplicar el método de Bagging utilizando Random Forest.
- Evaluar el rendimiento del modelo en un conjunto de datos real.

#### Instroducción:

El Bagging, o Bootstrap Aggregating, es una técnica de ensamble diseñada para mejorar la estabilidad y precisión de los algoritmos de aprendizaje máquina, reduciendo la varianza y ayudando a evitar el sobreajuste. Utiliza el muestreo con reemplazo para crear múltiples subconjuntos del conjunto de datos de entrenamiento, sobre los cuales se entrena un modelo base (como un árbol de decisión) de forma independiente. La decisión final se toma por mayoría de votos o promedio de las predicciones de todos los modelos. Random Forest es una extensión del Bagging donde se utilizan múltiples árboles de decisión para lograr una mayor precisión.

In [1]:
# Importar librerías necesarias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler


In [2]:
# Cargar datos
data = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv', sep=';')
data['quality'] = data['quality'].apply(lambda x: 1 if x >= 7 else 0)

# Preparar datos
X = data.drop('quality', axis=1)
y = data['quality']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [3]:
# Escalar características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)


## Configurar y entrenar modelo de Bagging (Random Forest)


In [4]:
random_forest = RandomForestClassifier(n_estimators=100, random_state=42)
random_forest.fit(X_train_scaled, y_train)

In [5]:
# Evaluar el modelo
predictions = random_forest.predict(X_test_scaled)
accuracy = accuracy_score(y_test, predictions)
print(f"Accuracy de Random Forest: {accuracy:.2f}")

Accuracy de Random Forest: 0.90


## Laboratorio 2: Ensamble - Stacking


#### Objetivos:
- Implementar un modelo de Stacking combinando varios clasificadores base.
- Utilizar un modelo final (meta-modelo) para mejorar la predicción.

#### Instroducción:
El Stacking es una técnica avanzada de ensamble que combina las predicciones de varios modelos de aprendizaje máquina para hacer una predicción final mediante un meta-modelo. Diferente de otras técnicas de ensamble, Stacking no solo combina resultados sino que también aprende de los errores de los modelos base para mejorar las predicciones. Se caracteriza por utilizar modelos base diversos y un meta-modelo que puede ser entrenado para optimizar efectivamente la combinación de las predicciones base, resultando en un rendimiento superior en comparación con cualquiera de los modelos individuales.

In [6]:
# Importar librerías necesarias
from sklearn.ensemble import StackingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier



In [7]:
# Configurar modelo de Stacking
estimators = [
    ('svm', SVC(probability=True)),
    ('dt', DecisionTreeClassifier()),
    ('lr', LogisticRegression())
]
stacking_classifier = StackingClassifier(estimators=estimators, final_estimator=LogisticRegression())


In [8]:
# Entrenar el modelo
stacking_classifier.fit(X_train_scaled, y_train)


In [9]:

# Evaluar el modelo
stacking_predictions = stacking_classifier.predict(X_test_scaled)
stacking_accuracy = accuracy_score(y_test, stacking_predictions)
print(f"Accuracy de Stacking Classifier: {stacking_accuracy:.2f}")

Accuracy de Stacking Classifier: 0.87


### Laboratorio 3: Técnicas de Ensamble - Boosting

#### Objetivos:
- Comprender y aplicar Boosting usando AdaBoost.
- Evaluar cómo Boosting puede mejorar la precisión del modelo en comparación con modelos individuales.

#### Introducción :
Boosting es una familia de algoritmos que convierte aprendices débiles en fuertes. A diferencia del Bagging, Boosting intenta reducir el sesgo así como la varianza de los modelos. En este método, los modelos se entrenan secuencialmente y cada modelo subsiguiente intenta corregir los errores del modelo anterior. AdaBoost, uno de los algoritmos de Boosting más conocidos, ajusta los pesos de las instancias de entrenamiento que son incorrectamente predichas por el modelo anterior, enfocándose así más en los casos difíciles en los entrenamientos subsiguientes. Esto hace que Boosting sea muy eficaz para los conjuntos de datos donde la clasificación es desafiante.



In [10]:
# Configurar y entrenar modelo de Boosting (AdaBoost)
from sklearn.ensemble import AdaBoostClassifier

In [11]:
adaboost = AdaBoostClassifier(n_estimators=100, random_state=42)
adaboost.fit(X_train_scaled, y_train)



In [12]:
# Evaluar el modelo
ada_predictions = adaboost.predict(X_test_scaled)
ada_accuracy = accuracy_score(y_test, ada_predictions)
print(f"Accuracy de AdaBoost: {ada_accuracy:.2f}")

Accuracy de AdaBoost: 0.85
