# Singular Value Decomposition (SVD)

<img src="https://cdn.memegenerator.es/imagenes/memes/full/14/5/14051825.jpg">

La descomposición por valor singular, o SVD, es un método de descomposición de matriz que permite reducir una matriz a sus partes constituyentes, `con el fin de simplificar ciertos cálculos de matriz posteriores.`

$$
A = U \Sigma V^T
$$

Donde $A$ es una matriz de $mxn$ que deseamos descomponer, $U$ es una matriz de $mxm$, $\Sigma$ es una matriz diagonal de $mxn$, y $V^T$ es la transposición de una matriz de $nxn$, donde $T$ significa transpuesto.

Los valores diagonales en la matriz $\Sigma$ se conocen como los `valores singulares de la matriz original` $A$. Las columnas de la matriz $U$ se denominan `vectores singulares a la izquierda` de $A$, y las columnas de $V$ se denominan `vectores singulares a la derecha` de $A$.

#### `La SVD se calcula mediante métodos numéricos iterativos. No entraremos en detalles sobre estos métodos. Cada matriz rectangular tiene una descomposición por valor singular.`

SVD se usa ampliamente tanto en el cálculo de otras operaciones matriciales, como la matriz inversa, como también como un `método de reducción de datos en el aprendizaje automático.` 

----
# Calcular la SVD

La SVD se puede calcular usando la función `svd()` de la librería `scipy`

La función toma una matriz y devuelve los elementos $U$, $\Sigma$ y $V^T$. La matriz diagonal $\Sigma$ es devuelta como un vector de valores singulares. La matriz $V$ es devuelta en su forma transpuesta.

El siguiente ejemplo define una matriz de $3×2$ y se calcula la descomposición por valor singular.

In [1]:
# Singular-value decomposition
import numpy as np
from scipy.linalg import svd

# define a matrix
A = np.array([[1, 2], [3, 4], [5, 6]])
print("Matriz a descomponer:")
print(A)

# SVD
U, s, VT = svd(A)
print("\nMatriz U:")
print(U)
print("\nMatriz s: Ojo que no es la matriz diagonal Sigma!")
print(s)
print("\nMatriz V^T:")
print(VT)

Matriz a descomponer:
[[1 2]
 [3 4]
 [5 6]]

Matriz U:
[[-0.2298477   0.88346102  0.40824829]
 [-0.52474482  0.24078249 -0.81649658]
 [-0.81964194 -0.40189603  0.40824829]]

Matriz s: Ojo que no es la matriz diagonal Sigma!
[9.52551809 0.51430058]

Matriz V^T:
[[-0.61962948 -0.78489445]
 [-0.78489445  0.61962948]]


Al ejecutar el ejemplo, primero se imprime la matriz $3 × 2$ definida, luego la matriz $U$ de $3 × 3$, el vector $\Sigma$ de 2 elementos y los elementos de la matriz $V^T$ de $2 × 2$ calculados a partir de la descomposición.

----
# Reconstrucción de una matriz a partir de su descomposición por SVD

La matriz original se puede reconstruir a partir de los elementos $U$, $\Sigma$ y $V^T$.

Los elementos `U`, `s` y `V` devueltos por `svd()` no se pueden multiplicar directamente.

El vector `s` debe convertirse en una `matriz diagonal` utilizando la función `diag()`. Por defecto, esta función creará una matriz cuadrada que de $n x n$, en relación con nuestra matriz original. Esto causa un problema ya que el tamaño de las matrices no se ajusta a las reglas de la multiplicación de matrices, donde el número de columnas en una matriz debe coincidir con el número de filas en la matriz posterior.

Después de crear la matriz diagonal cuadrada, $\Sigma$, los tamaños de las matrices son relativos a la matriz original $m x n$ que estamos descomponiendo, de la siguiente manera:

In [2]:
# create m x n Sigma matrix
Sigma = np.zeros((A.shape[0], A.shape[1]))
print("Matriz Sigma vacía:")
print(Sigma)

# populate Sigma with n x n diagonal matrix
Sigma[:A.shape[1], :A.shape[1]] = np.diag(s)
print("\nMatriz Sigma formada a partir del vector s:")
print(Sigma)

# reconstruct matrix
A_reconstr = U.dot(Sigma.dot(VT))
print("\nMatriz original:")
print(A)
print("\nMatriz reconstruida:")
print(A_reconstr)

Matriz Sigma vacía:
[[0. 0.]
 [0. 0.]
 [0. 0.]]

Matriz Sigma formada a partir del vector s:
[[9.52551809 0.        ]
 [0.         0.51430058]
 [0.         0.        ]]

Matriz original:
[[1 2]
 [3 4]
 [5 6]]

Matriz reconstruida:
[[1. 2.]
 [3. 4.]
 [5. 6.]]


La complicación anterior con la diagonal $\Sigma$ sólo existe con el caso en que $m$ y $n$ no son iguales. La matriz diagonal se puede usar directamente al reconstruir una matriz cuadrada, como se indica a continuación.

In [3]:
# Reconstruct SVD
# define a matrix
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("Matriz original:")
print(A)

# Singular-value decomposition
U, s, VT = svd(A)

# create n x n Sigma matrix
Sigma = np.diag(s)
print("\nMatriz Sigma:")
print(Sigma)

# reconstruct matrix
A_reconstr = U.dot(Sigma.dot(VT))
print("\nMatriz reconstruida:")
print(A_reconstr)

Matriz original:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

Matriz Sigma:
[[1.68481034e+01 0.00000000e+00 0.00000000e+00]
 [0.00000000e+00 1.06836951e+00 0.00000000e+00]
 [0.00000000e+00 0.00000000e+00 1.47280825e-16]]

Matriz reconstruida:
[[1. 2. 3.]
 [4. 5. 6.]
 [7. 8. 9.]]


---
# SVD para reducción de dimensionalidad

Una aplicación popular de SVD es la `reducción de dimensionalidad.`

#### `Los datos con una gran cantidad de características, como más características (columnas) que observaciones (filas) pueden reducirse a un subconjunto más pequeño de características que son más relevantes para el problema de predicción.`

El resultado es una matriz con un rango inferior que se dice que se aproxima a la matriz original.

Para hacer esto, podemos realizar una operación SVD en los datos originales y seleccionar los `K valores singulares` más grandes en $\Sigma$. Estas columnas se pueden seleccionar de $\Sigma$ y las filas seleccionadas de $V^T$.

Entonces se puede reconstruir una $A'$ de la matriz $A$ original:

$$
A' = U  \Sigma_k V_k^T
$$

En la práctica, podemos retener y trabajar con un subconjunto descriptivo de los datos llamado $B$. `Este es un resumen denso de la matriz.`

$$
B = U \Sigma_k
$$

El siguiente ejemplo demuestra la reducción de datos con SVD.

Primero se define una matriz de $3 × 10$, con más columnas que filas. Se calcula la SVD y solo se seleccionan las dos primeras características. Los elementos se recombinan para dar una reproducción precisa de la matriz original.

In [4]:
from numpy import array
from numpy import diag
from numpy import zeros
from scipy.linalg import svd

# define a matrix
A = array([
    [1,2,3,4,5,6,7,8,9,10],
    [11,12,13,14,15,16,17,18,19,20],
    [21,22,23,24,25,26,27,28,29,30]])
print("Matriz original:")
print(A)

# Singular-value decomposition
U, s, VT = svd(A)

# create m x n Sigma matrix
Sigma = zeros((A.shape[0], A.shape[1]))
# populate Sigma with n x n diagonal matrix
Sigma[:A.shape[0], :A.shape[0]] = diag(s)

# select only 2
n_elements = 2
Sigma = Sigma[:, :n_elements]
VT = VT[:n_elements, :]

# reconstruct
A_aprox = U.dot(Sigma.dot(VT))
print("\nMatriz reconstruida:")
print(A_aprox)

# transform
B = U.dot(Sigma)
print("\nMatriz reducida:")
print(B)

Matriz original:
[[ 1  2  3  4  5  6  7  8  9 10]
 [11 12 13 14 15 16 17 18 19 20]
 [21 22 23 24 25 26 27 28 29 30]]

Matriz reconstruida:
[[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
 [11. 12. 13. 14. 15. 16. 17. 18. 19. 20.]
 [21. 22. 23. 24. 25. 26. 27. 28. 29. 30.]]

Matriz reducida:
[[-18.52157747   6.47697214]
 [-49.81310011   1.91182038]
 [-81.10462276  -2.65333138]]


Scikit-learn proporciona una clase `TruncatedSVD` que implementa esta capacidad directamente.

Se puede crear la clase `TruncatedSVD` en la que debe especificar el número de características o componentes deseables para seleccionar, por ejemplo: 2. Una vez creado, puede ajustar la transformación (por ejemplo, calcular $V^T_k$) llamando a la función `fit()`, luego aplicarla a la matriz original llamando a la función `transform()`. El resultado es la transformación de $A$ llamada $B$ arriba.

El siguiente ejemplo muestra la clase `TruncatedSVD`

In [5]:
from numpy import array
from sklearn.decomposition import TruncatedSVD
# define array
A = array([[1,2,3,4,5,6,7,8,9,10],
    [11,12,13,14,15,16,17,18,19,20],
    [21,22,23,24,25,26,27,28,29,30]])
print("Matriz original:")
print(A)

# svd
svd = TruncatedSVD(n_components=2)
svd.fit(A)
result = svd.transform(A)

print("\nMatriz reducida:")
print(result)

Matriz original:
[[ 1  2  3  4  5  6  7  8  9 10]
 [11 12 13 14 15 16 17 18 19 20]
 [21 22 23 24 25 26 27 28 29 30]]

Matriz reducida:
[[18.52157747  6.47697214]
 [49.81310011  1.91182038]
 [81.10462276 -2.65333138]]


Podemos ver que los valores coinciden con los calculados manualmente arriba, excepto por el signo en algunos valores. Podemos esperar que haya cierta inestabilidad cuando se trata del signo dada la naturaleza de los cálculos involucrados y las diferencias en las bibliotecas y métodos subyacentes utilizados. Esta inestabilidad del signo no debería ser un problema en la práctica, siempre y cuando la transformación esté entrenada para su reutilización.

In [6]:
print("Matriz original:")
print(A)
print("\nMatriz reconstruida a partir de la matriz reducida:")
print(svd.inverse_transform(result))

Matriz original:
[[ 1  2  3  4  5  6  7  8  9 10]
 [11 12 13 14 15 16 17 18 19 20]
 [21 22 23 24 25 26 27 28 29 30]]

Matriz reconstruida a partir de la matriz reducida:
[[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
 [11. 12. 13. 14. 15. 16. 17. 18. 19. 20.]
 [21. 22. 23. 24. 25. 26. 27. 28. 29. 30.]]


<img src="https://i1.wp.com/www.sopitas.com/wp-content/uploads/2018/06/memes-prohibicion-union-europea.jpg">