# Descomposición en valores singulares

Para ilustrar la descomposición en valores singulares de una matriz vamos a hacer uso del Ejemplo VI.1.8 de [[I. Ojeda, J. Gago, Métodos matemáticos para la Estadística](https://publicauex.unex.es/libro/metodos-matematicos-para-estadistica_135467/)].


Otro buen ejemplo de cálculo de esta descomposición paso a paso se puede encontrar [aquí](https://rpubs.com/aaronsc32/singular-value-decomposition-r).

In [1]:
A<-rbind(c(2,0,1),c(3,-1,1),c(-2,4,1),c(1,1,1))

### Usando `svd`

Vamos a hacer uso de `svd` que calcula la descomposición directamente.

In [4]:
dA<-svd(A)
dA

0,1,2
-0.2672612,-0.5,-0.77197017
-0.5345225,-0.5,0.27710193
0.8017837,-0.5,-0.07258877
2.498002e-16,-0.5,0.567457

0,1,2
-0.7071068,-0.5773503,0.4082483
0.7071068,-0.5773503,0.4082483
1.665335e-16,-0.5773503,-0.8164966


In [11]:
zapsmall((dA$u)%*%diag(dA$d)%*%t(dA$v))

0,1,2
2,0,1
3,-1,1
-2,4,1
1,1,1


In [12]:
zapsmall(dA$d)

Como el último valor es nulo, nos quedamos con las componentes que nos interesan de $U$ y $V$ para obtener una descomposición en valores singulares corta.

In [18]:
U<-dA$u[,1:2]
V<-dA$v[,1:2]
d<-dA$d[1:2]
zapsmall(U%*%diag(d)%*%t(V))

0,1,2
2,0,1
3,-1,1
-2,4,1
1,1,1


### Usando `caracas`

In [19]:
library(caracas)


Attaching package: ‘caracas’


The following objects are masked from ‘package:base’:

    %*%, det, diag, diag<-




`singular_values` nos devuelve los valores singulares.

In [20]:
singular_values(as_sym(A))

[[1]]
[caracas]: 2⋅√7

[[2]]
[caracas]: 2⋅√3

[[3]]
[caracas]: 0


Con la función `singular_value_deomposition` de `sympy` podemos obtener la descomposición en valores singulares.

In [21]:
dcA<-sympy_func(as_sym(A),"singular_value_decomposition")
dcA

[caracas]: ⎛⎡     -√14 ⎤                          ⎞
           ⎜⎢1/2  ─────⎥                ⎡√3  -√2 ⎤⎟
           ⎜⎢       14 ⎥                ⎢──  ────⎥⎟
           ⎜⎢          ⎥                ⎢3    2  ⎥⎟
           ⎜⎢     -√14 ⎥                ⎢        ⎥⎟
           ⎜⎢1/2  ─────⎥  ⎡2⋅√3   0  ⎤  ⎢√3   √2 ⎥⎟
           ⎜⎢       7  ⎥, ⎢          ⎥, ⎢──   ── ⎥⎟
           ⎜⎢          ⎥  ⎣ 0    2⋅√7⎦  ⎢3    2  ⎥⎟
           ⎜⎢     3⋅√14⎥                ⎢        ⎥⎟
           ⎜⎢1/2  ─────⎥                ⎢√3      ⎥⎟
           ⎜⎢       14 ⎥                ⎢──   0  ⎥⎟
           ⎜⎢          ⎥                ⎣3       ⎦⎟
           ⎝⎣1/2    0  ⎦                          ⎠

La salida es una lista `caracas`; la posición 0 es $U$, la 1 es la diagonal y la 2 es $V$.

In [62]:
dcA[[1]][0]

Matrix([
[1/2,  -sqrt(14)/14],
[1/2,   -sqrt(14)/7],
[1/2, 3*sqrt(14)/14],
[1/2,             0]])

Usamos `matrify` para convertirlas a matrices de `R`.

In [46]:
cU<-matrify(dcA[[1]][0])
cU

[caracas]: ⎡     -√14 ⎤
           ⎢1/2  ─────⎥
           ⎢       14 ⎥
           ⎢          ⎥
           ⎢     -√14 ⎥
           ⎢1/2  ─────⎥
           ⎢       7  ⎥
           ⎢          ⎥
           ⎢     3⋅√14⎥
           ⎢1/2  ─────⎥
           ⎢       14 ⎥
           ⎢          ⎥
           ⎣1/2    0  ⎦

In [48]:
cd<-matrify(dcA[[1]][1])
cd

[caracas]: ⎡2⋅√3   0  ⎤
           ⎢          ⎥
           ⎣ 0    2⋅√7⎦

In [52]:
cV<-matrify(dcA[[1]][2])
cV

[caracas]: ⎡√3  -√2 ⎤
           ⎢──  ────⎥
           ⎢3    2  ⎥
           ⎢        ⎥
           ⎢√3   √2 ⎥
           ⎢──   ── ⎥
           ⎢3    2  ⎥
           ⎢        ⎥
           ⎢√3      ⎥
           ⎢──   0  ⎥
           ⎣3       ⎦

In [54]:
cU%*%cd%*%t(cV)

[caracas]: ⎡2   0   1⎤
           ⎢         ⎥
           ⎢3   -1  1⎥
           ⎢         ⎥
           ⎢-2  4   1⎥
           ⎢         ⎥
           ⎣1   1   1⎦

### Proceso paso a paso a partir de los valores propios de $A^tA$

Vamos a hacer el proceso paso a paso. Como sabemos, los valores singulares son las raíces cuadradas de los valores propios de $A^tA$.

In [118]:
vp<-eigenval(as_sym(t(A)%*%A))
vp

[[1]]
[[1]]$eigval
[caracas]: 28

[[1]]$eigmult
[1] 1


[[2]]
[[2]]$eigval
[caracas]: 12

[[2]]$eigmult
[1] 1


[[3]]
[[3]]$eigval
[caracas]: 0

[[3]]$eigmult
[1] 1



In [119]:
d1<-sqrt(vp[[1]]$eigval)
d1

[caracas]: 2⋅√7

In [120]:
d2<-sqrt(vp[[2]]$eigval)
d2

[caracas]: 2⋅√3

In [121]:
vcp<-eigenvec(as_sym(t(A)%*%A))
vcp

[[1]]
[[1]]$eigval
[caracas]: 0

[[1]]$eigmult
[1] 1

[[1]]$eigvec
[caracas]: [-1/2  -1/2  1]ᵀ


[[2]]
[[2]]$eigval
[caracas]: 12

[[2]]$eigmult
[1] 1

[[2]]$eigvec
[caracas]: [1  1  1]ᵀ


[[3]]
[[3]]$eigval
[caracas]: 28

[[3]]$eigmult
[1] 1

[[3]]$eigvec
[caracas]: [-1  1  0]ᵀ



La matriz $V$ está formada por los vectores propios correspondientes a 28 y 12.

In [122]:
V<-cbind(vcp[[3]]$eigvec,vcp[[2]]$eigvec)

In [123]:
V<-QRdecomposition(V)$Q
V

[caracas]: ⎡-√2   √3⎤
           ⎢────  ──⎥
           ⎢ 2    3 ⎥
           ⎢        ⎥
           ⎢ √2   √3⎥
           ⎢ ──   ──⎥
           ⎢ 2    3 ⎥
           ⎢        ⎥
           ⎢      √3⎥
           ⎢ 0    ──⎥
           ⎣      3 ⎦

In [124]:
D<-diag_(c(toString(d1),toString(d2)))
D

[caracas]: ⎡2⋅√7   0  ⎤
           ⎢          ⎥
           ⎣ 0    2⋅√3⎦

Como $A=UDV^t$, tenemos $AV=UD$, luego $U$ se calcula como sigue.

In [125]:
U<-as_sym(A)%*%V%*%inv(D)
U

[caracas]: ⎡-√14      ⎤
           ⎢─────  1/2⎥
           ⎢  14      ⎥
           ⎢          ⎥
           ⎢-√14      ⎥
           ⎢─────  1/2⎥
           ⎢  7       ⎥
           ⎢          ⎥
           ⎢3⋅√14     ⎥
           ⎢─────  1/2⎥
           ⎢  14      ⎥
           ⎢          ⎥
           ⎣  0    1/2⎦

Comprobemos que es efectivamente una descomposición de $A$.

In [126]:
U%*%D%*%t(V)

[caracas]: ⎡2   0   1⎤
           ⎢         ⎥
           ⎢3   -1  1⎥
           ⎢         ⎥
           ⎢-2  4   1⎥
           ⎢         ⎥
           ⎣1   1   1⎦

In [127]:
A

0,1,2
2,0,1
3,-1,1
-2,4,1
1,1,1
