# Aplicación del Algoritmo Discriminante Lineal (LDA) para Clasificar Estrellas
Este notebook utiliza el dataset de estrellas para entrenar un modelo con el algoritmo de Análisis Discriminante Lineal (LDA) y evaluar su desempeño mediante una matriz de confusión.

El dataset contiene características físicas de estrellas y la clasificación por tipo de estrella.

In [None]:
# Importar las bibliotecas necesarias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.metrics import confusion_matrix, classification_report
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

## Cargar el Dataset
Cargamos el dataset que contiene información sobre diferentes tipos de estrellas.

In [None]:
# Cargar el dataset
data = pd.read_csv('/path/to/estrella.csv')
data.head()  # Mostrar las primeras filas del dataset

## Preprocesamiento
Separaremos las características independientes (`X`) de la variable objetivo (`y`), que indica el tipo de estrella.

In [None]:
# Separar las variables independientes y dependientes
X = data[['Temperature (K)', 'Luminosity(L/Lo)', 'Radius(R/Ro)', 'Absolute magnitude(Mv)']]
y = data['Star type']

## División del Conjunto de Datos
Dividimos los datos en un conjunto de entrenamiento y un conjunto de prueba utilizando un 70% para el entrenamiento y un 30% para las pruebas.

In [None]:
# Dividir el dataset en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

## Entrenamiento del Modelo LDA
Entrenamos el modelo de Análisis Discriminante Lineal (LDA) con el conjunto de entrenamiento.

In [None]:
# Crear y entrenar el modelo LDA
model = LinearDiscriminantAnalysis()
model.fit(X_train, y_train)

## Evaluación del Modelo
Realizamos predicciones en el conjunto de prueba y generamos la matriz de confusión para evaluar el desempeño del modelo.

In [None]:
# Realizar predicciones y generar la matriz de confusión
y_pred = model.predict(X_test)
conf_matrix = confusion_matrix(y_test, y_pred)

# Visualizar la matriz de confusión
plt.figure(figsize=(8,6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues', xticklabels=model.classes_, yticklabels=model.classes_)
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix for Star Type Prediction')
plt.show()

## Informe de Clasificación
Además de la matriz de confusión, generamos un informe de clasificación que incluye precisión, recall y F1-score.

In [None]:
# Mostrar el informe de clasificación
print(classification_report(y_test, y_pred))

## Visualización de la Proyección LDA
El algoritmo LDA puede reducir las dimensiones del conjunto de datos. Aquí visualizamos la proyección en el primer componente discriminante para observar cómo se distribuyen las clases.

In [None]:
# Reducir las dimensiones con LDA y visualizar la proyección
X_lda = model.transform(X_train)
plt.figure(figsize=(8,6))
colors = ['red', 'green', 'blue', 'orange', 'purple', 'brown']
for i, color in zip(np.unique(y_train), colors):
    plt.scatter(X_lda[y_train == i, 0], np.zeros_like(X_lda[y_train == i, 0]), 
                color=color, alpha=0.5, label=f'Star Type {i}')
plt.title('LDA Projection - First Discriminant Component')
plt.xlabel('Discriminant Component 1')
plt.legend(loc='best')
plt.show()