### Modelo PCA desde una Matriz de Covarianza

In [None]:
Sigma <- matrix(c(1, -2, 0,
                  -2, 5, 0,
                  0,  0, 2),
                nrow = 3, byrow = TRUE)

¿A qué elementos de Sigma están asociadas las CP?

    A los vectores y valores propios de la matriz

In [14]:
eig <- eigen(Sigma)
# Autovectores ordenados en base a los autovalores 
lambda <- eig$values
p_vectors <- eig$vectors

Por las propiedades de la descomposición en valores propios se tiene que

$ P^T \Sigma P = \Lambda$ 

Siendo esto una transformación de semejanza

In [15]:
DiagLambda <- t(p_vectors) %*% Sigma %*% p_vectors
print(round(DiagLambda,3))

      [,1] [,2]  [,3]
[1,] 5.828    0 0.000
[2,] 0.000    2 0.000
[3,] 0.000    0 0.172


### Comprobación de la Varianza de las Nuevas Variables $y_i$ 

In [16]:
vars_pc <- sapply(1:3,function(i) as.numeric(t(p_vectors[,i])) %*% Sigma %*% p_vectors[,i])
vars_pc

### Comprobación de la Covarianza de las Nuevas Variables $y_i$

In [19]:
covs_pc <- matrix(0,3,3)
for(i in 1:3) for(j in 1:3) covs_pc[i,j] <- as.numeric(t(p_vectors[,i])) %*% Sigma %*% p_vectors[,j]

round(covs_pc,3)

0,1,2
5.828,0,0.0
0.0,2,0.0
0.0,0,0.172


### Proposición: 
$$\text{sum}_{i}\ \text{Var}(X_i) = Tr(\Sigma) = Tr(\Lambda) = \text{sum}_{i}\ \text{Var}(y_i)$$

In [21]:
c(sum(lambda) , sum(diag(Sigma)))

Los componentes principales son de la siguiente manera:

$ y_1 = a_1^TX = a_{11}X_1 + a_{12}X_2 + a_{13}X_3 = -0.3826*X_1 + 0.9238X_2$ 

$ y_2 = a_2^TX = a_{21}X_1 + a_{22}X_2 + a_{33}X_3 = X_3$ 

$ y_3 = a_3^TX = a_{31}X_1 + a_{32}X_2 + a_{33}X_3 =  0.9238X_1 + 0.3826*X_2$ 

Donde $X$ es la matriz de las variables originales (es de $p \times n$ ) y las $a_{ik}$ es la entrada $k$ del autovector $i$

### Proporción de la Varianza Explicada

In [None]:
# Varianza explicada por cada componente
lambda / sum(lambda)

In [39]:
# Varianza explicada acumulada
cumsum(lambda / sum(lambda))

### Correlaciones entre Componentes y Variables 

$$ \rho_{y_i,X_k} = \frac{e_{ik}\sqrt{\lambda_i}}{\sqrt{\sigma_{kk}}} $$

In [58]:
rho <- matrix(NA,3,3,
dimnames = list(paste0("Y",1:3),paste0("X",1:3)))

for (i in 1:3) 
{
    for (j in 1:3)
    {
        rho[i,j] <- p_vectors[j,i] * sqrt(lambda[i]/Sigma[j,j])
    }
}

rho

Unnamed: 0,X1,X2,X3
Y1,-0.9238795,0.99748421,0
Y2,0.0,0.0,1
Y3,0.3826834,0.07088902,0
