<a href="https://colab.research.google.com/github/FelipeAfana/Apuntes-2-Inteligencia-Artificial/blob/main/cuaderno_6_selecci_n_de_caracter_sticas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# <font color="red">Cuaderno 6: Selección de Características
La selección de características es una técnica fundamental en el preprocesamiento de datos que busca identificar las características más relevantes para un modelo de machine learning. Este proceso tiene como objetivo reducir la complejidad del modelo, mejorar su interpretabilidad, evitar el sobreajuste y reducir los tiempos de entrenamiento. En este Sesion, exploraremos diversos métodos de selección de características, desde enfoques estadísticos hasta técnicas automáticas y basadas en regularización.


---
## <font color="red">6.1 ¿Qué es la Selección de Características?
La selección de características es el proceso de elegir un subconjunto de las variables originales del dataset que sea más relevante para el problema que se quiere resolver. Al reducir el número de características, se mejora la eficiencia del modelo y se facilita su interpretación. Además, se puede evitar el sobreajuste, donde el modelo se ajusta demasiado a los datos de entrenamiento y no generaliza bien a nuevos datos.
### Importancia de la selección de características:
* Mejora la precisión y la generalización del modelo.
* Reduce la complejidad computacional.
* Elimina la redundancia en los datos.
* Facilita la interpretación del modelo.


---
## <font color="red">6.2 Métodos de Selección Basados en Estadística
Existen varios métodos estadísticos que ayudan a seleccionar las características más relevantes. Algunos de los más comunes son:
### <font color="blue">6.2.1 Selección de Baja Varianza
Las características con muy baja varianza aportan poca información al modelo, ya que no varían significativamente entre las observaciones. Por lo tanto, estas características pueden ser eliminadas.



In [None]:
from sklearn.feature_selection import VarianceThreshold

# Datos de ejemplo
X = [[1, 2, 3], [4, 7, 2], [4, 2, 1], [5, 6, 1], [1, 1, 2]]
# Eliminar características con baja varianza (por defecto, umbral de 0)
selector = VarianceThreshold(threshold=2)
X_new = selector.fit_transform(X)

print("Características seleccionadas:\n", X_new)


Características seleccionadas:
 [[1 2]
 [4 7]
 [4 2]
 [5 6]
 [1 1]]


Se usa la que tenga mayor variansa, con un limite que uno le pone

### <font color="blue">6.2.2 Selección mediante Chi-cuadrado (Chi-Squared Test)
El test de Chi-cuadrado se utiliza para evaluar la independencia de una variable categórica respecto a las demás. Este test mide la diferencia entre la frecuencia observada y la esperada de las variables.


In [None]:
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
from sklearn.datasets import load_digits

# Cargar datos de ejemplo
X, y = load_digits(return_X_y=True)

print(len(X))
print(len(y))

# Seleccionar las 10 mejores características basadas en Chi-cuadrado
selector = SelectKBest(chi2, k=10)
X_new = selector.fit_transform(X, y)


print("Características seleccionadas:", selector.get_support())


1797
1797
Características seleccionadas: [False False False False False False False False False False False False
 False False False False False False False False  True  True False False
 False False  True False False False  True False False  True  True False
 False False False False False False  True  True False False False False
 False False False False False False  True False False False False False
 False False  True False]


### <font color="blue">6.2.3 Pruebas Estadísticas (ANOVA, T-Tests, etc.)
Pruebas estadísticas como el test ANOVA o el T-test pueden ser utilizadas para comparar las medias entre diferentes grupos y determinar si una característica tiene un impacto significativo sobre la variable objetivo.


---

## <font color="red">6.3 Métodos Automáticos de Selección de Características
### <font color="blue">6.3.1 Selección Hacia Adelante (Forward Selection)
Este es un enfoque progresivo en el que comenzamos con un conjunto vacío de características y, en cada paso, añadimos la característica que mejora más el rendimiento del modelo.


In [None]:
from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression

# Datos de ejemplo
X, y = load_digits(return_X_y=True)

# Selección hacia adelante utilizando RFE
model = LogisticRegression(max_iter=10000)
selector = RFE(model, n_features_to_select=5)
selector = selector.fit(X, y)

print("Características seleccionadas:", selector.support_)


KeyboardInterrupt: 

### <font color="blue">6.3.2 Selección Hacia Atrás (Backward Elimination)
En este enfoque, comenzamos con todas las características y, en cada paso, eliminamos la característica que tenga el menor impacto en el rendimiento del modelo.


In [None]:
# Selección hacia atrás utilizando RFE
selector = RFE(model, n_features_to_select=5, step=1)
selector = selector.fit(X, y)

print("Características seleccionadas:", selector.support_)


Características seleccionadas: [False False False False False False  True False False False False False
 False False False False False False False False False False  True False
 False False False False False False False False False  True False False
 False False  True False False False False False False False False False
 False False False False False False False False False False False False
 False False  True False]


## <font color="red">6.4 Regularización para Selección de Características
La regularización es una técnica utilizada para reducir el sobreajuste en los modelos y puede ser aplicada para la selección de características. Se añaden penalizaciones a los coeficientes del modelo, lo que lleva a que algunas características sean eliminadas durante el entrenamiento.
### <font color="blue">6.4.1 Lasso (L1 Regularización)
El Lasso utiliza la penalización L1, que tiende a llevar los coeficientes de las características menos relevantes a cero, eliminándolas efectivamente del modelo.


In [None]:
from sklearn.linear_model import Lasso
from sklearn.datasets import make_regression

# Crear datos de ejemplo
X, y = make_regression(n_samples=100, n_features=10, noise=0.1)

# Ajustar el modelo Lasso
lasso = Lasso(alpha=0.1)  # La regularización controlada por alpha
lasso.fit(X, y)

print("Coeficientes seleccionados por Lasso:", lasso.coef_)


Coeficientes seleccionados por Lasso: [76.91794675 28.25497443 52.45792284 25.4999109  26.29010598  4.71361178
 82.16252971 73.08298537 33.09923363 53.99740392]


### <font color="blue">6.4.2 Ridge (L2 Regularización)
La regularización Ridge utiliza una penalización L2, que reduce la magnitud de los coeficientes pero no los lleva a cero. A pesar de no eliminar completamente las características, puede ser útil para manejar la multicolinealidad.


In [None]:
from sklearn.linear_model import Ridge

# Ajustar el modelo Ridge
ridge = Ridge(alpha=0.1)
ridge.fit(X, y)

print("Coeficientes seleccionados por Ridge:", ridge.coef_)


Coeficientes seleccionados por Ridge: [76.92693893 28.32436001 52.50482689 25.5868141  26.33958905  4.80431124
 82.19549854 73.11811076 33.18306639 54.03445227]


### <font color="blue">6.4.3 Elastic Net
Elastic Net es una combinación de Lasso y Ridge, que permite aprovechar las ventajas de ambos. Es útil cuando hay muchas características correlacionadas entre sí.


In [None]:
from sklearn.linear_model import ElasticNet

# Ajustar el modelo Elastic Net
elastic_net = ElasticNet(alpha=0.1, l1_ratio=0.5)  # L1 y L2 combinados
elastic_net.fit(X, y)

print("Coeficientes seleccionados por Elastic Net:", elastic_net.coef_)


Coeficientes seleccionados por Elastic Net: [72.7671119  26.36532137 49.67712703 24.54886137 25.90891868  4.44147465
 78.83900107 68.88838301 31.68313296 51.23858562]
