# Matemáticas para IA con Python.

 <p xmlns:cc="http://creativecommons.org/ns#" xmlns:dct="http://purl.org/dc/terms/"><a property="dct:title" rel="cc:attributionURL" href="https://github.com/luiggix/intro_MeIA_2023">Matemáticas para IA con Python</a> by <span property="cc:attributionName">Luis Miguel de la Cruz Salas</span> is licensed under <a href="http://creativecommons.org/licenses/by-nc-sa/4.0/?ref=chooser-v1" target="_blank" rel="license noopener noreferrer" style="display:inline-block;">CC BY-NC-SA 4.0<img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1"><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1"><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/nc.svg?ref=chooser-v1"><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1"></a></p> 

# Análisis de Componentes Principales (PCA)

## Entendiendo la varianza, la covarianza y la correlación

Uno de los conceptos más recurrentes con el que te encuentras en estadística y aprendizaje automático es la **covarianza**.

Muchos de los métodos de preprocesamiento o análisis predictivo, dependen de este elemento, por ejemplo para reducir dimensiones en los datos, realizar regresiones, detectar valores atípicos multivariados, entre otros. Conocer la covarianza puede proporcionar mucha más información sobre cómo resolver problemas de varias variables. 

Para entender mejor este concepto veamos primero lo que significa la **varianza**. Sabemos que la varianza representa la variación de valores en una sola variable y se esribe como sigue:

$$
\sigma^2 = \frac{1}{n-1} \sum_{i}^{n}(x_i - \bar{x})^2
$$

donde $x_i$ representan el conjunto de datos, para $i=1, \dots, n$ y $\bar{x}$ es la media muestral.

Veamos un ejemplo:

In [None]:
import numpy as np
import pandas as pd
import scipy
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets

import macti.vis as mvis
import macti.math as mmat

In [None]:
np.random.seed(0)

N = 20 # cantidad de datos

# Generación de un conjunto de datos
x = np.array([i for i in range(N)])
y = np.random.rand(N)*0.5-0.5
z = np.random.randn(len(y))

In [None]:
print(x)
print(y)
print(z)

In [None]:
print('Varianza baja: {}'.format(y.var(ddof=1)))

plt.scatter(x, y, zorder=5)
plt.ylim(-3,3)
plt.xticks(x)
plt.grid()
plt.show()

In [None]:
print('Varianza alta: {}'.format(z.var(ddof=1)))

plt.scatter(x, z)
plt.ylim(-3,3)
plt.xticks(x)
plt.grid()
plt.show()

La **covarianza** se calcula entre dos variables diferentes y su propósito es calcular cómo estas dos variables varian en conjunto. La covarianza se escribe como sigue:

$$
S_{xy} = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})
$$

El resultado del cálculo de la covarianza, se puede poner en forma de una matriz somo sigue:

$$
\left[
\begin{array}{cc}
S_{xx} & S_{xy} \\
S_{xy} & S_{yy}
\end{array}\right] =
\left[
\begin{array}{cc}
cov(x,x) & cov(x,y) \\
cov(y,x) & cov(y,y)
\end{array}\right] = 
\left[
\begin{array}{cc}
var(x) & cov(x,y) \\
cov(y,x) & var(y)
\end{array}\right] =
\left[
\begin{array}{cc}
\sigma^2_{x} & S_{xy} \\
S_{xy} & \sigma^2_{y}
\end{array}\right] 
$$

Esta matriz es simétrica. Además, los términos de la diagonal se transforman en la varianza correspondiente.

Definamos varios arreglos de datos y calculemos la covarianza entre ellos:

In [None]:
# Generación de un conjunto de datos
x0 = np.linspace(0,10,N) 
y0 = x + np.random.randn(N)*2

x1 = np.random.randn(len(y))*10
y1 = np.random.randn(len(y))*10

x2 = np.arange(0,N)*100
y2 = -x2 + np.random.randn(N)*500

In [None]:
print('Arreglo x :\n{}'.format(x0))
print('Arreglo y :\n{}'.format(y0))

print('Arreglo x1 :\n{}'.format(x1))
print('Arreglo y1 :\n{}'.format(y1))

print('Arreglo x2 :\n{}'.format(x2))
print('Arreglo y2 :\n{}'.format(y2))

In [None]:
plt.figure(figsize=(10,5))

ax = plt.subplot(221)
plt.scatter(x,y, fc='C1', ec='C0', alpha=0.75)
plt.xlabel('$x$')
plt.ylabel('$y$')
plt.ylim(-5,5)

ax0 = plt.subplot(222)
plt.scatter(x0,y0, fc='C1', ec='C0', alpha=0.75)
plt.xlabel('$x0$')
plt.ylabel('$y0$')

ax1 = plt.subplot(223)
plt.scatter(x1,y1, fc='C3', ec='C0', alpha=0.75)
plt.xlabel('$x1$')
plt.ylabel('$y1$')

ax2 = plt.subplot(224)
plt.scatter(x2,y2, fc='C3', ec='C0', alpha=0.75)
plt.xlabel('$x2$')
plt.ylabel('$y2$')

plt.tight_layout()
plt.show()

In [None]:
A = np.cov(x,y)
A

In [None]:
A0 = np.cov(x0,y0)
A0

In [None]:
A1 = np.cov(x1,y1)
A1

In [None]:
A2 = np.cov(x2,y2)
A2

La covariance solo nos proporciona información a cerca de la variación y dirección de la relación entre dos variables. 

Por otro lado la **correlación** está limitada entre $-1$ y $1$.

In [None]:
print(np.corrcoef(x, y))
print(np.corrcoef(x0, y0))
print(np.corrcoef(x1, y1))
print(np.corrcoef(x2, y2))

## Eigenvalores y eigenvectores de la covarianza

Los eigenvalores y eigenvectores de la matriz de covarianza representan la magnitud de la dispersión en la dirección de las componentes principales. Recordemos que:

$$
A u = \lambda u
$$

donde $A$ es la matriz, $u$ es un eigenvector y $\lambda$ es un eigenvalor. 

Podemos por ejemplo, calcular los eigenvectores de las matrices de covarianza de los ejemplos anteriores:

In [None]:
# Lo podemos hacer con np.linagl.eig()
np.linalg.eig(A)

Usaremos las funciones `eigen_land()` y `print_Aulu()` que hemos definido en nuestro módulo `matem`.

In [None]:
w, v = mmat.eigen_land(A)
print()
mmat.print_Aulu(A, w, v)

In [None]:
w0, v0 = mmat.eigen_land(A0)
print()
mmat.print_Aulu(A0, w0, v0)

In [None]:
w1, v1 = mmat.eigen_land(A1)
print()
mmat.print_Aulu(A1, w1, v1)

In [None]:
w2, v2 = mmat.eigen_land(A2)
print()
mmat.print_Aulu(A2, w2, v2)

Vamos a graficar los eigenvectores con nuestra función `macti.vis.plot_vectors()`:

In [None]:
ax_par = [dict(title = 'v'),
          dict(title = 'v0'),
          dict(title = 'v1'),
          dict(title = 'v2')]
vis = mvis.Plotter(2,2, axis_par = ax_par)

vis.plot_vectors(1, [v[:,0], v[:,1]], w=[0.030, 0.030])
vis.plot_vectors(2, [v0[:,0], v0[:,1]], w=[0.040, 0.040])
vis.plot_vectors(3, [v1[:,0], v1[:,1]], w=[0.030, 0.030])
vis.plot_vectors(4, [v2[:,0], v2[:,1]], w=[0.0175, 0.0175])

In [None]:
vis = mvis.Plotter(2,2, fig_par = dict(figsize = (7,7)), axis_par = ax_par)

ax, ax0, ax1, ax2 = vis.axes(1), vis.axes(2), vis.axes(3), vis.axes(4)

vis.plot_vectors(1, [v[:,0]*w[0]*0.3, v[:,1]*w[1]*0.3], 
                 baseline=np.array([[np.mean(x),np.mean(y)], [np.mean(x),np.mean(y)]]),
                 w=[0.020, 0.030])
vis.scatter(1, x, y, fc='C3', ec='C0', alpha=0.75)
ax.set_ylim(-3, 3)
ax.set_xlim(-1, 21)

vis.plot_vectors(2, [v0[:,0]*w0[0]*0.25, v0[:,1]*w0[1]*0.25],
                 baseline=np.array([[np.mean(x0),np.mean(y0)], [np.mean(x0),np.mean(y0)]]),
                 w=[0.040, 0.040])    
vis.scatter(2, x0,y0, fc='C3', ec='C0', alpha=0.75)
ax0.set_ylim(-2, 21)
ax0.set_xlim(-2, 12)
                     
vis.plot_vectors(3, [v1[:,0]*w1[0]*0.25, v1[:,1]*w1[1]*0.25],
                 baseline=np.array([[np.mean(x1),np.mean(y1)], [np.mean(x1),np.mean(y1)]]),
                 w=[0.020, 0.020])
vis.scatter(3, x1,y1, fc='C3', ec='C0', alpha=0.75)
ax1.set_ylim(-30, 30)
ax1.set_xlim(-30, 30)

vis.plot_vectors(4, [v2[:,0]*w2[0]*0.0025, v2[:,1]*w2[1]*0.0025], 
                 baseline=np.array([[np.mean(x2),np.mean(y2)], [np.mean(x2),np.mean(y2)]]), 
                 w=[0.0175, 0.0175])
vis.scatter(4, x2,y2, fc='C3', ec='C0', alpha=0.75)
ax2.set_ylim(-2500, 1000)
ax2.set_xlim(-500, 2500)

vis.show()

**Recapitulando.**

* Los eigenvalores de la matriz de covarianza representan la magnitud de la dispersión en la dirección de las componentes principales.
* Cuando la covarianza es pequeña, los eigenvalores son muy parecidos a los valores de la varianza.

In [None]:
print('Matriz de covarianza: \n {}'.format(A))
print('Eigenvalores: \n {}'.format(w))

In [None]:
print('Matriz de covarianza: \n {}'.format(A0))
print('Eigenvalores: \n {}'.format(w0))

In [None]:
print('Matriz de covarianza: \n {}'.format(A1))
print('Eigenvalores: \n {}'.format(w1))

In [None]:
print('Matriz de covarianza: \n {}'.format(A2))
print('Eigenvalores: \n {}'.format(w2))

# Pasos para realizar *PCA*

El Análisis de Componentes Principales (PCA por sus siglas en inglés) es un método para reducir la dimensionalidad de conjuntos de datos de gran tamaño. La idea es **transformar un conjunto de variables amplio en otro más reducido (componentes principales) que mantenga la mayor cantidad de información** y donde estas componentes están ordenadas según la cantidad de varianza.

Supón que tienes datos en 10 dimensiones (10 variables). PCA encuentra combinaciones lineales de estas variables tales que:

* Capturan la mayor parte de la varianza (información).

* Son ortogonales entre sí (no están correlacionadas).

**Aplicaciones**.

* Visualización (por ejemplo, reducir de 10D a 2D o 3D).

* Eliminar colinealidad entre variables.

* Acelerar modelos de machine learning.

* Encontrar las variables más relevantes.

Veamos como se realiza un PCA paso a paso.

## Paso 1. Estandarización.

La estandarización de variables, también conocida como normalización, implica transformar los valores de una variable para que tengan una media de cero y una desviación estándar de uno. Esto se logra restando la media de la variable a cada valor y dividiendo por la desviación estándar.

$$
z = \frac{x - \bar{x}}{\sigma_x}
$$

donde $x$ representan los datos, $\bar{x}$ la media y $\sigma_x$ la desviación estándar.

Esta es conocida como la estandarización Z y es útil cuando se desea comparar variables que están en diferentes escalas o unidades. Al estandarizar las variables, se eliminan las diferencias en las escalas y se asegura que todas las variables tengan la misma escala relativa.

Por ejemplo, si tienes un conjunto de variables con diferentes unidades de medida, como peso en kilogramos y altura en metros, puedes estandarizar ambas variables para que sean comparables y no se vean afectadas por las diferencias en las unidades.

Existen varios métodos para estandarizar los datos, véase por ejemplo [Cómo estandarizar variables](https://www.kaggle.com/code/manuelmartinrivas/c-mo-estandarizar-variables/notebook).

Hagamos esta estandarización con uno de los ejemplos anteriores.

In [None]:
print('datos: \n\n x0 = {} \n\n y0 = {}'.format(x0, y0))

El método `scipy.stats.zscore()` realiza este la estandarización Z:

In [None]:
z_x0 = scipy.stats.zscore(x0)
z_y0 = scipy.stats.zscore(y0)
print('datos estandarizados: \n\n z_x0 = {} \n\n z_y0 = {}'.format(z_x0, z_y0))

In [None]:
print(f"z_x0: Media = {np.mean(z_x0):5.4f}, 𝜎 = {z_x0.std():5.4f}")
print(f"z_y0: Media = {np.mean(z_y0):5.4f}, 𝜎 = {z_y0.std():5.4f}")

In [None]:
vis = mvis.Plotter(1, 2, fig_par = dict(figsize = (10,5)))
ax, ax0 = vis.axes(1), vis.axes(2)
   
vis.scatter(1, x0,y0, fc='C3', ec='C0', alpha=0.75)
ax.set_xlabel('$x0$')
ax.set_ylabel('$y0$')
ax.set_title('Datos originales')

vis.scatter(2, z_x0, z_y0, fc='C3', ec='C0', alpha=0.75)
ax0.set_xlabel('$z\_x_0$')
ax0.set_ylabel('$z\_y_0$')
ax0.set_title('Datos estandarizados')

plt.tight_layout()
vis.show()

## Paso 2. Eigenvalores de la matriz de covarianza

Ahora calculamos los eigenvalores y eigenvectores de la matriz de covarianza de los datos estandarizados para encontrar las componentes principales.

In [None]:
As = np.cov(z_x0, z_y0)
ws, vs = mmat.eigen_land(As)
print()
mmat.print_Aulu(As, ws, vs)

In [None]:
vis = mvis.Plotter(1, 2, fig_par = dict(figsize = (10,5)))
ax, ax0 = vis.axes(1), vis.axes(2)

vis.plot_vectors(1, [v0[:,0]*w0[0]*0.25, v0[:,1]*w0[1]*0.25],
                 baseline=np.array([[np.mean(x0),np.mean(y0)], [np.mean(x0),np.mean(y0)]]),
                 w=[0.030, 0.030])    
vis.scatter(1, x0,y0, fc='C3', ec='C0', alpha=0.75)
ax.set_ylim(-2, 21)
ax.set_xlim(-2, 12)
ax.set_xlabel('$x0$')
ax.set_ylabel('$y0$')
ax.set_title('Datos originales')

vis.plot_vectors(2, [vs[:,0]*ws[0], vs[:,1]*ws[1]],
                 baseline=np.array([[np.mean(z_x0),np.mean(z_y0)], [np.mean(z_x0),np.mean(z_y0)]]),
                 w=[0.020, 0.020])    
vis.scatter(2, z_x0, z_y0, fc='C3', ec='C0', alpha=0.75)
ax0.set_ylim(-2, 2.5)
ax0.set_xlim(-2, 2)
ax0.set_xlabel('$z\_x_0$')
ax0.set_ylabel('$z\_y_0$')
ax0.set_title('Datos estandarizados')

## Paso 3. Porcentaje de varianza.

Calculamos el porcentaje de varianza de cada componente, es decir la información que contiene: 
$$\text{Porcentaje de varianza} = \frac{\lambda_i}{\sum_{i} \lambda_i}$$

In [None]:
# Recordemos que ws contiene los eigenvalores
pv = [l / np.sum(ws) for l in ws]
pv

Observa que la primera componente (primer eigenvalor) contiene el 97% de toda la información, mientas que la segunda
(segundo eigenvalor) solo contiene aproximadamente el 2.9% .

## Paso 4. Vector de características (*Feature vector*)

Con el cálculo anterior podemos decidir si mantenemos o no toda la información. Es posible formar una matriz cuyas columnas sean los eigenvectores que decidamos mantener. Los eigenvectores se ordenan de mayor a menor significancia, con base en su eigenvalor.

Esto nos dirige hacia la reducción de dimensiones, si tenemos originalmente $n$ dimensiones y decidimos solo mantener $p$ de ellas, con $p<n$, entonces reducimos la dimensionalidad en $n-p$ dimensiones. 

En nuestro ejemplo, si mantenemos toda la información tendríamos:

In [None]:
fv = np.array([vs[:,0], vs[:,1]]).T
fv

Pero si decidimos eliminar la segunda componente tendríamos:

In [None]:
fv = np.array([vs[:,0]]).T
fv

## Paso 5. Reducción de la dimensionalidad

Usando el vector de características podemos hacer una proyección hacia el número de dimensiones reducidas mediante la siguiente operación:

$$
A_r = A_s \cdot f_v
$$

donde:
* $A_s$ es una matriz de datos, cuyas columnas son los datos originales estandarizados. Esta matriz es de tamaño $n \times v$, con $n$ el número de muestras y $v$ el número de variables.

* $f_v$ es el vector de características, cuyas columnas son los eigenvectores ordenados de acuerdo con su eigenvalor de mayor a menor. Esta es una matriz de tamaño $v \times nc$ con $nc$ el número de componentes que deseamos mantener.

* $A_r$ es la matriz de datos reducida, cuyas columnas contienen los datos reducidos. Esta es una matriz de $n \times nc$, cuya dimensión ha sido reducida.

In [None]:
# matriz de datos estandarizados
sdata = np.array([z_x0, z_y0]).T
print(sdata.shape)
sdata

In [None]:
# Feature vector
print(fv.shape)
fv

In [None]:
# matriz de datos reducidos
rdata = np.dot(sdata, fv)
print(rdata.shape)
rdata

In [None]:
vis = mvis.Plotter(1, 2, fig_par = dict(figsize = (10,5)))
ax0, ax1 = vis.axes(1), vis.axes(2)
  
vis.scatter(1, z_x0, z_y0, fc='C3', ec='C0', alpha=0.75)
ax0.set_xlabel('$z\_x_0$')
ax0.set_ylabel('$z\_y_0$')
ax0.set_title('Datos estandarizados')

vis.scatter(2, np.arange(len(rdata)), rdata[:,0], fc='C3', ec='C0', alpha=0.75)
ax1.set_title('Datos reducidos')

vis.show()

# Aplicación a un conjunto de datos.


## Función `mi_PCA()`

Primero definimos la función `mi_PCA()` con los pasos necesarios para realizar un PCA.

In [None]:
def mi_PCA(data, feature, comp = 2):
    """
    
    """
    # Paso 1. Estandarización de los datos
    sdata = scipy.stats.zscore(data)
    
    # Paso 2. Cálculo de los eigenvalores y eigenvectores de la matriz de covarianza de los nuevos datos
    covmat = np.cov(sdata.T)
    w, v = np.linalg.eig(covmat)
        
    # Paso 3. Porcentaje de varianza y ordenamiento de los vectores
    
    # np.argsort() regresa el índice de los elementos
    # de menor a mayor. Usando [::-1] generamos el 
    # vector en reversa, de tal manera que tendremos
    # los índices de los eigenvalores de mayor a menor.
    w_index = np.argsort(w)[::-1]
    
    # Selección de las componentes principales
    n_cols = w_index[:comp]

    # Selección de eigenvalores principales
    w_total = w.sum()
    wv = np.array([round(100*w[i]/w_total,2) for i in n_cols])
    
    # Selección de eigenvectores principales
    fv = v[:, n_cols]
    
    # Selección del nombre de la componente principal
    feat = [feature[i] for i in n_cols]
    
    # Reducción de la dimensionalidad
    P = np.dot(sdata, fv)

    return covmat, wv, fv, feat, P

## Obtención del conjunto de datos

Usaremos datos definidos en el módulo `sklearn`. Revisa [Dataset loading utilities](https://scikit-learn.org/stable/datasets.html) para más información.

In [None]:
# Lectura de los datos.
grupo = datasets.load_diabetes()

## Explorando los datos

In [None]:
print(type(grupo))

In [None]:
print(grupo)

In [None]:
print(grupo.DESCR)

In [None]:
# Extracción de la información
feature = grupo.feature_names
data    = grupo.data
target  = grupo.target

In [None]:
print(type(feature), type(data), type(target))

In [None]:
print(len(feature))
print(feature)

In [None]:
print(data.shape)
data

In [None]:
print(target.shape)
target

## Graficación

In [None]:
[print('{}) {}'.format(i, feature[i])) for i in range(len(feature))]

v1 = int(input('Selecciona una variable'))
v2 = int(input('Selecciona otra variable'))

vis = mvis.Plotter(1, 1, fig_par = dict(figsize = (10,6)))
ax = vis.axes(1)

ax.set_title(f'Diabetes {feature[v1]} vs {feature[v2]}')
ax.set_xlabel(feature[v1])
ax.set_ylabel(feature[v2])
ax.grid()

sns.scatterplot(
    x = data[:,v1],
    y = data[:,v2],
    hue = target,
    zorder = 5, 
    ax = ax
)

ax.legend(title='Información',
           title_fontsize=7,
           fontsize=8,
           ncol=2,
           frameon=True)

vis.show()

## PCA usando `mi_PCA()`

Ahora realizamos la reducción de dimensiones usando nuestra función `mi_PCA()`:

In [None]:
covmat, wv, fv, feat, P = mi_PCA(data, feature, 2)

Revisemos cómo está la matriz de covarianza:

In [None]:
df_covmat = pd.DataFrame(covmat, 
                         columns=grupo.feature_names,
                         index = grupo.feature_names)
df_covmat

In [None]:
df_covmat_heatmap = df_covmat.style.background_gradient(cmap='Oranges')
df_covmat_heatmap

In [None]:
sns.heatmap(data=df_covmat, annot=True, cmap="Oranges")
plt.show()

Ahora revisamos las componentes principales: eigenvalores y *Feature vector* $f_v$:

In [None]:
wv

In [None]:
wv.sum()

In [None]:
feat

In [None]:
df_pcomp = pd.DataFrame(np.array([wv]))
df_pcomp

In [None]:
sns.barplot(data=df_pcomp)

In [None]:
fv

## Graficamos los datos reducidos

In [None]:
vis = mvis.Plotter(1, 1, fig_par = dict(figsize = (10,6)))
ax = vis.axes(1)

ax.set_title('Conjunto de datos de sklearn')
ax.set_xlabel("Componente 1")
ax.set_ylabel("Componente 2")
ax.grid()

sns.scatterplot(
    x = P[:,0],
    y = P[:,1],
    hue = target,
    zorder = 5, 
    ax = ax,
)

plt.legend(title='Información',
           title_fontsize=7,
           fontsize=8,
           ncol=2,
           frameon=True)

plt.show()

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

# 1. Crear datos simulados de 10 dimensiones
#np.random.seed(42)
#datos = np.random.rand(100, 10)  # 100 muestras, 10 variables
df = pd.DataFrame(data, columns=[f'Var{i+1}' for i in range(10)])

# 2. Normalizar los datos (es recomendable antes de PCA)
escalador = StandardScaler()
datos_normalizados = escalador.fit_transform(df)
print(np.linalg.norm(scipy.stats.zscore(data) - datos_normalizados))

# 3. Aplicar PCA
pca = PCA(n_components=2)  # Queremos reducir a 2 dimensiones
componentes = pca.fit_transform(datos_normalizados)
print(componentes.shape)
# 4. Visualizar los dos primeros componentes

vis = mvis.Plotter(1, 1, fig_par = dict(figsize = (10,6)))
ax = vis.axes(1)

ax.set_xlabel('Componente Principal 1')
ax.set_ylabel('Componente Principal 2')
ax.set_title('PCA con datos de 10 dimensiones')
ax.grid()

sns.scatterplot(
    x = -componentes[:,0],
    y = componentes[:,1],
    hue = target,
    zorder = 5, 
    ax = ax
)

#vis.scatter(1, P[:,0], P[:, 1], s=150, c="k", alpha = 0.75)

plt.legend(title='Información',
           title_fontsize=7,
           fontsize=8,
           ncol=2,
           frameon=True)

vis.show()

# 5. Porcentaje de varianza explicada
print("Varianza explicada por cada componente:")
print(pca.explained_variance_ratio_)
print(f"Varianza total explicada por los dos componentes: {sum(pca.explained_variance_ratio_):.2%}")
