\* Notebook adaptado do material do prof. Luis Gustavo Nonato

# SVD - Singular Value Decomposition

## Dedução Matemática

Seja $A$ uma matriz $m \times n$. A matriz $A^\top A$ é uma matriz $n \times n$ simétrica semi-definida positiva.  

Desta forma, temos que:

$$A^\top A = V\Lambda V^\top \text{\quad(teorema espectral)}$$

onde as colunas de $V$ são autovetores ortogonais de $A^\top A$ e $\Lambda$ é matriz diagonal, em que os elementos diagonais são os autovalores de $A^\top A$, ou seja, denotando as colunas de $V$ por $v_i$, temos a relação:

$$A^\top A v_i = \lambda_i v_i$$

A matriz $A$ transforma vetores de $\mathbb{R}^n$ em $\mathbb{R}^m$, então $\tilde{u_i} = A v_i$ é um vetor de $\mathbb{R}^m$. 

$$\tilde{u}^\top_j\tilde{u_i}=(Av_j)^\top(Av_i)=v_j^\top(A^\top Av_i)=\lambda_i v_j^\top v_i$$

Desta forma, como os vetores $v_i$ são ortogonais, a equação acima mostra que $\tilde{u}_i = Av_i$  também formam uma base ortogonal. Em outras palavras, a transformação $A$ mapeia o conjunto de vetores ortogonais $v_1, \cdots, v_n$ no conjunto de vetores ortogonais $\tilde{u}_1, \cdots, \tilde{u}_n$. Fazendo $u_i=\frac{1}{\sqrt{\lambda_i}}\tilde{u}_i$, tornamos o conjunto $u_i$ ortonormal.

Considere as matrizes:

$$
U=\begin{bmatrix}
| &  & | \\
u_1 & \cdots & u_m\\
| &  & |
\end{bmatrix}\quad
\Sigma=\begin{bmatrix}
\sqrt{\lambda_1} & 0 & \cdots & 0 \\
0 & \sqrt{\lambda_2} & & 0\\
 &  & \ddots & \\
 0 & 0 & \cdots & \sqrt{\lambda_k}\\
\end{bmatrix}\quad
v=\begin{bmatrix}
| &  & | \\
v_1 & \cdots & v_n\\
| &  & | 
\end{bmatrix}
$$

Temos a seguinte relação:

$$
U{\Sigma} = A V\\
\Downarrow
$$

$$A = U\Sigma V^\top\quad\text{(decomposição SVD)}$$

Por construção, a decomposição SVD é única.

**Em resumo:** na decomposição SVD:

1. As colunas de $V$ são autovetores de $A^\top A$
2. As colunas de $U$ são autovetores de $AA^\top$
3. $A^\top A$ e $AA^\top$ possuem os mesmos autovalores não nulos $\Lambda$, sendo $\Sigma=\Lambda^\frac{1}{2}$

## Dimensões

Na dedução acima negligenciamos as dimensões da matriz $A$. Considerando que $A$ tem posto máximo, temos três casos a considerar:

1. $m = n$ (matriz quadrada). Neste caso a dedução acima vale exatamente como foi feita.

In [None]:
import numpy as np

m = n = 10
A = np.random.uniform(0, 2, (m, n))

U, S, Vt = np.linalg.svd(A)

print(U.shape)
print(S.shape)
print(Vt.shape)

2. $m > n$. Neste caso, o conjunto $u_i=\frac{1}{\sqrt{\lambda_i}}Av_i$ não é suficiente para gerar $\mathbb{R}^m$.

$$
\left[
\begin{array}{ccc}
 & & \\
 & A & \\ 
  & & \\
  & & \\
  & & \\
  & & 
\end{array}\right]= 
\left[\begin{array}{ccc|ccc}
 & & & | & & | \\
 & U & & | & \cdots & |\\ 
 & & & | & & | \\
  & & & | & & | \\
   & & & | & & | \\
    & & & | & & | 
\end{array}\right]
\left[\begin{array}{ccc}
 & & \\
 & \Sigma & \\ 
 & & \\\hline
0 & &  \\
 & \ddots &  \\
 & & 0
\end{array}\right]
\left[
\begin{array}{ccc}
 & & \\
 & V^\top & \\ 
  & & 
\end{array}\right]
$$

In [None]:
import numpy as np

m = 10
n = 7
A = np.random.uniform(0, 2, (m,n))

U, S, Vt = np.linalg.svd(A)

print(U.shape)
print(S.shape)
print(Vt.shape)

3. $m < n$. Neste caso, o número de vetores $v_i$ é maior que o número de vetores $u_i$ necessários para gerar $\mathbb{R}^m$.

$$
\left[
\begin{array}{ccccccc}
& & & & & &\\
& & & \mathbf{A} & & &\\ 
 & & & & &&
\end{array}\right]= 
\left[\begin{array}{ccc}
 & & \\
 & \mathbf{U} & \\ 
 & & 
\end{array}\right]
\left[\begin{array}{ccc|ccc}
 & & & 0 & &\\
 & \mathbf{\Sigma} & & & \ddots &\\ 
 & & & & & 0
\end{array}\right]
\left[
\begin{array}{ccc}
 & & \\
 & \mathbf{V}^\top & \\ 
 & & \\\hline
 - & - & -\\
 - & - & - 
\end{array}\right]
$$


In [None]:
import numpy as np

m = 7
n = 10
A = np.random.uniform(0, 2, (m,n))

U, S, Vt = np.linalg.svd(A)

print(U.shape)
print(S.shape)
print(Vt.shape)

## Aplicação: Compressão de Imagens

Imagens podem ser representadas matematicamente por matrizes de pixeis. Nesse sentido, é possível aplicar o SVD para aproximar essas matrizes até certo nível (rank).

A simples aplicação abaixo exibe uma imagem com sua matriz original e diferentes aproximações para a matriz utilizando-se do SVD.

In [None]:
from matplotlib.image import imread
import matplotlib.pyplot as plt
import numpy as np

# Leitura da matriz da imagem em escala de cinza:
A = np.mean(imread('dog.png'), -1)

# Exibição da imagem:
img = plt.imshow(A)
img.set_cmap('gray')
plt.axis('off')
plt.title('Imagem Original')
plt.show()


In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Aplicação do SVD:
U, S, Vt = np.linalg.svd(A)
S = np.diag(S)

# Definição dos diferentes ranks a serem testados:
ranks = (5, 20, 100)

# Teste com diferentes ranks:
j = 0
for r in ranks:
    A_aproximada = U[:,:r] @ S[0:r,:r] @ Vt[:r,:]
    img = plt.imshow(A_aproximada)
    img.set_cmap('gray')
    plt.axis('off')
    plt.title('Imagem aproximada com rank = ' + str(r))
    plt.show()
    plt.figure(j + 1)
    j += 1