**Método de Filtrado**:

El método de filtrado utiliza medidas estadísticas para asignar un puntaje a cada característica. Las características con puntajes más altos se consideran más relevantes y se seleccionan para el modelo. SelectKBest de sklearn.feature_selection es un ejemplo de un método de filtrado.

In [1]:
from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest, f_classif

# Cargar el conjunto de datos Iris
iris = load_iris()
X, y = iris.data, iris.target

# Seleccionar las 2 mejores características usando ANOVA-F como métrica de evaluación
selector_filtro = SelectKBest(score_func=f_classif, k=2)
X_filtrado = selector_filtro.fit_transform(X, y)

print("Características seleccionadas usando método de Filtro:")
print(X_filtrado)

Características seleccionadas usando método de Filtro:
[[1.4 0.2]
 [1.4 0.2]
 [1.3 0.2]
 [1.5 0.2]
 [1.4 0.2]
 [1.7 0.4]
 [1.4 0.3]
 [1.5 0.2]
 [1.4 0.2]
 [1.5 0.1]
 [1.5 0.2]
 [1.6 0.2]
 [1.4 0.1]
 [1.1 0.1]
 [1.2 0.2]
 [1.5 0.4]
 [1.3 0.4]
 [1.4 0.3]
 [1.7 0.3]
 [1.5 0.3]
 [1.7 0.2]
 [1.5 0.4]
 [1.  0.2]
 [1.7 0.5]
 [1.9 0.2]
 [1.6 0.2]
 [1.6 0.4]
 [1.5 0.2]
 [1.4 0.2]
 [1.6 0.2]
 [1.6 0.2]
 [1.5 0.4]
 [1.5 0.1]
 [1.4 0.2]
 [1.5 0.2]
 [1.2 0.2]
 [1.3 0.2]
 [1.4 0.1]
 [1.3 0.2]
 [1.5 0.2]
 [1.3 0.3]
 [1.3 0.3]
 [1.3 0.2]
 [1.6 0.6]
 [1.9 0.4]
 [1.4 0.3]
 [1.6 0.2]
 [1.4 0.2]
 [1.5 0.2]
 [1.4 0.2]
 [4.7 1.4]
 [4.5 1.5]
 [4.9 1.5]
 [4.  1.3]
 [4.6 1.5]
 [4.5 1.3]
 [4.7 1.6]
 [3.3 1. ]
 [4.6 1.3]
 [3.9 1.4]
 [3.5 1. ]
 [4.2 1.5]
 [4.  1. ]
 [4.7 1.4]
 [3.6 1.3]
 [4.4 1.4]
 [4.5 1.5]
 [4.1 1. ]
 [4.5 1.5]
 [3.9 1.1]
 [4.8 1.8]
 [4.  1.3]
 [4.9 1.5]
 [4.7 1.2]
 [4.3 1.3]
 [4.4 1.4]
 [4.8 1.4]
 [5.  1.7]
 [4.5 1.5]
 [3.5 1. ]
 [3.8 1.1]
 [3.7 1. ]
 [3.9 1.2]
 [5.1 1.6]
 [4.5 1.5]
 [4.5 1.6]

En este ejemplo, SelectKBest utiliza el método de ANOVA-F para seleccionar las 2 mejores características del conjunto de datos Iris.

**Método "Wrapper":**
    
Los métodos "wrapper" envuelven el modelo de aprendizaje automático y evalúan diferentes combinaciones de características para determinar cuál conjunto proporciona el mejor rendimiento del modelo. RFE (Recursive Feature Elimination) de sklearn.feature_selection es un ejemplo de un método "wrapper".

In [2]:
from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression

# Cargar el conjunto de datos Iris
iris = load_iris()
X, y = iris.data, iris.target

# Crear un modelo de clasificación
modelo = LogisticRegression()

# Seleccionar las 2 mejores características usando RFE (Recursive Feature Elimination)
selector_wrapper = RFE(estimator=modelo, n_features_to_select=2)
X_wrapper = selector_wrapper.fit_transform(X, y)

print("Características seleccionadas usando método Wrapper (RFE):")
print(X_wrapper)

Características seleccionadas usando método Wrapper (RFE):
[[1.4 0.2]
 [1.4 0.2]
 [1.3 0.2]
 [1.5 0.2]
 [1.4 0.2]
 [1.7 0.4]
 [1.4 0.3]
 [1.5 0.2]
 [1.4 0.2]
 [1.5 0.1]
 [1.5 0.2]
 [1.6 0.2]
 [1.4 0.1]
 [1.1 0.1]
 [1.2 0.2]
 [1.5 0.4]
 [1.3 0.4]
 [1.4 0.3]
 [1.7 0.3]
 [1.5 0.3]
 [1.7 0.2]
 [1.5 0.4]
 [1.  0.2]
 [1.7 0.5]
 [1.9 0.2]
 [1.6 0.2]
 [1.6 0.4]
 [1.5 0.2]
 [1.4 0.2]
 [1.6 0.2]
 [1.6 0.2]
 [1.5 0.4]
 [1.5 0.1]
 [1.4 0.2]
 [1.5 0.2]
 [1.2 0.2]
 [1.3 0.2]
 [1.4 0.1]
 [1.3 0.2]
 [1.5 0.2]
 [1.3 0.3]
 [1.3 0.3]
 [1.3 0.2]
 [1.6 0.6]
 [1.9 0.4]
 [1.4 0.3]
 [1.6 0.2]
 [1.4 0.2]
 [1.5 0.2]
 [1.4 0.2]
 [4.7 1.4]
 [4.5 1.5]
 [4.9 1.5]
 [4.  1.3]
 [4.6 1.5]
 [4.5 1.3]
 [4.7 1.6]
 [3.3 1. ]
 [4.6 1.3]
 [3.9 1.4]
 [3.5 1. ]
 [4.2 1.5]
 [4.  1. ]
 [4.7 1.4]
 [3.6 1.3]
 [4.4 1.4]
 [4.5 1.5]
 [4.1 1. ]
 [4.5 1.5]
 [3.9 1.1]
 [4.8 1.8]
 [4.  1.3]
 [4.9 1.5]
 [4.7 1.2]
 [4.3 1.3]
 [4.4 1.4]
 [4.8 1.4]
 [5.  1.7]
 [4.5 1.5]
 [3.5 1. ]
 [3.8 1.1]
 [3.7 1. ]
 [3.9 1.2]
 [5.1 1.6]
 [4.5 1.5]
 [4.5 

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


En este ejemplo, RFE utiliza regresión logística como estimador para seleccionar las 2 mejores características del conjunto de datos Iris.

**Método Embebido:** 

El método embebido implica que el proceso de selección de características está incorporado en el propio proceso de entrenamiento del modelo. Veamos un ejemplo utilizando RF.

In [3]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris

# Cargar el conjunto de datos Iris
iris = load_iris()
X, y = iris.data, iris.target

# Crear un modelo de clasificación con Random Forest (que realiza selección de características automáticamente)
modelo_embebido = RandomForestClassifier(n_estimators=100, random_state=42)
modelo_embebido.fit(X, y)

# Obtener importancias de características
importancias_caracteristicas = modelo_embebido.feature_importances_

print("Importancias de características usando método Embebido:")
print(importancias_caracteristicas)

Importancias de características usando método Embebido:
[0.10612762 0.02167809 0.43612951 0.43606478]


En resumen, estos son ejemplos básicos para ilustrar cómo funcionan estos métodos. En la práctica, es importante considerar las características específicas del conjunto de datos y el problema que estás abordando para elegir el método de selección de características más adecuado. Además, siempre es crucial evaluar el rendimiento del modelo después de aplicar la selección de características para asegurarse de que mejore la calidad del modelo.