# Análisis de Componentes Principales (PCA)

## Introducción
El Análisis de Componentes Principales (PCA) es una técnica estadística utilizada para simplificar un conjunto de datos reduciendo su dimensionalidad.

## Explicación Teórica
PCA encuentra nuevas variables (componentes principales) que son combinaciones lineales de las variables originales y que explican la mayor parte de la varianza en los datos.

## Pasos del Algoritmo PCA
1. Estándarizar los datos
2. Calcular la matriz de covarianza
3. Obtener los eigenvalores y eigenvectores
4. Seleccionar las componentes principales
5. Proyectar los datos

In [None]:
# Importación de bibliotecas necesarias
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

In [None]:
# Carga y preprocesamiento de datos
data = pd.read_excel(r'..\Data\front.xlsx')
features = data.columns[:-1]
X = data[features]
X = StandardScaler().fit_transform(X)

In [None]:
# Cálculo de la media y la matriz de covarianza
mean_vec = np.mean(X, axis=0)
cov_mat = np.cov(X.T)

In [None]:
# Cálculo de los eigenvalores y eigenvectores
eigen_vals, eigen_vecs = np.linalg.eig(cov_mat)

In [None]:
# Selección de componentes principales
# Ordenar los eigenvalores y eigenvectores
eigen_pairs = [(np.abs(eigen_vals[i]), eigen_vecs[:,i]) for i in range(len(eigen_vals))]
eigen_pairs.sort(key=lambda x: x[0], reverse=True)

# Seleccionar las k componentes principales
k = 2
W = np.hstack([eigen_pairs[i][1].reshape(-1,1) for i in range(k)])

In [None]:
# Proyección de los datos a las componentes principales
X_pca = X.dot(W)

In [None]:
# Visualización de resultados
plt.scatter(X_pca[:, 0], X_pca[:, 1])
plt.xlabel('Componente Principal 1')
plt.ylabel('Componente Principal 2')
plt.title('Proyección de los datos en las primeras dos componentes principales')
plt.show()