# Análisis Discriminante

El Análisis Discriminante es un conjunto de técnicas en el campo del aprendizaje automático y la estadística que se utilizan para clasificar o distinguir entre dos o más grupos de objetos o eventos. La idea básica es encontrar una forma de describir, o "discriminar", las diferencias entre estos grupos.

Imagina que tienes un conjunto de frutas, como manzanas y naranjas, y quieres crear un modelo que pueda identificar si una fruta desconocida es una manzana o una naranja basándose en características como el color, el tamaño y el peso. El Análisis Discriminante te ayudaría a encontrar las características que mejor separan las manzanas de las naranjas, de modo que cuando tengas una nueva fruta, puedas usar estas características para predecir a qué grupo pertenece.

In [1]:
# Librerías necesarias
from sklearn.datasets import load_iris # Importa el conjunto de datos iris
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis, QuadraticDiscriminantAnalysis # Importa los algoritmos de análisis discriminante
from sklearn.model_selection import train_test_split # Librerías para crear conjuntos de entrenamiento y de prueba
from sklearn.metrics import accuracy_score # Librería para calcular métricas para comparar modelos

## Carga de Datos

In [2]:
# Carga de datos desde scikit-learn
iris = load_iris()

# Definición de variables independientes (predictores - X) y dependiente (target - y)
X = iris.data
y = iris.target

In [3]:
# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

In [5]:
X_train[:10]

array([[5.9, 3. , 4.2, 1.5],
       [5.8, 2.6, 4. , 1.2],
       [6.8, 3. , 5.5, 2.1],
       [4.7, 3.2, 1.3, 0.2],
       [6.9, 3.1, 5.1, 2.3],
       [5. , 3.5, 1.6, 0.6],
       [5.4, 3.7, 1.5, 0.2],
       [5. , 2. , 3.5, 1. ],
       [6.5, 3. , 5.5, 1.8],
       [6.7, 3.3, 5.7, 2.5]])

## Análisis Discriminante Lineal (LDA)

In [6]:
# Crea instancia del modelo
lda = LinearDiscriminantAnalysis()

# Se entrena el modelo
lda.fit(X_train, y_train)

# Predicción utilizando datos de prueba
y_pred_lda = lda.predict(X_test)

# Medición de la exactitud
accuracy_lda = accuracy_score(y_test, y_pred_lda)
print(f'Exactitud LDA: {accuracy_lda:.2f}')

Exactitud LDA: 0.97


## Análisis Discriminante Cuadrático (QDA)

In [10]:
# Crea instancia del modelo
qda = QuadraticDiscriminantAnalysis()

# Se entrena el modelo
qda.fit(X_train, y_train)

# Predicción utilizando datos de prueba
y_pred_qda = qda.predict(X_test)

# Medición de la exactitud
accuracy_qda = accuracy_score(y_test, y_pred_qda)
print(f'Exactitud QDA: {accuracy_qda:.2f}')

Exactitud QDA: 0.97


## LDA Regularizado como aproximación a RDA

In [11]:
# Crear instancia del modelo
lda_rda = LinearDiscriminantAnalysis(solver='lsqr', shrinkage='auto')

# Se entrena el modelo
lda_rda.fit(X_train, y_train)

# Predicción utilizando datos de prueba
y_pred_lda_rda = lda_rda.predict(X_test)

# Medición de la exactitud
accuracy_lda_rda = accuracy_score(y_test, y_pred_lda_rda)
print(f'Exactitud LDA (Regularizado): {accuracy_lda_rda:.2f}')

Exactitud LDA (Regularizado): 0.97
