# TE62MI - Algebre linéaire et réduction de dimension

## TP 1. Décomposition en Valeurs Singulières (SVD)

### Description
L'objectif de ce TP est d'étudier la Décomposition en Valeurs Singulières (SVD) comme méthode de réduction de dimensionnalité, sur des données réelles.

### Rappels de cours

Soit $X \in \mathbb{R}^{nd}$. La Décomposition en Valeurs Singulières (SVD) de X s'écrit $X = U \Sigma V^T$, où
- $U \in \mathbb{R}^{nn}$ a pour colonnes les vecteurs propres de $XX^T$ et vérifie $UU^T=I_n$
- $\Sigma \in \mathbb{R}^{nd}$ est une matrice diagonale avec les valeurs singulières de $X$ dans la diagonale (= racines carrées des valeurs propres de $XX^T$)
- $V \in \mathbb{R}^{dd}$ a pour colonnes les vecteurs propres de $X^TX$ et vérifie $VV^T=I_d$

SVD permet une représentation exacte de n'importe quelle matrice, et donne la meilleure approximation (*) de rang $k \leq min(n,d)$ de $X$:

\begin{equation}
    Y = U_{nk}\Sigma_{kk} V_{kd}^T \approx X
\end{equation}

(*) au sens où l'approximation $Y$ de rang $k$ minimise la norme de Frobenius $||X-Y||_F$
où $||X||_F = \sqrt{\sum_{i=1}^n \sum_{j=1}^d x_{ij}^2 } = \sqrt{\sum_{i=1}^{min(n,d)} \sigma_i^2}$

En pratique, le but n'est pas de reconstruire réellement la matrice d'origine, mais d'utiliser la matrice de rang inférieur $U_{nk}\Sigma_{kk} V^T_{kd}$ afin d'analyser les données.

### Tâches à effectuer dans ce TP

Compléter les champs de code manquant, entre `### TODO ###` et `### ENDO ###`
- Appliquer la décomposition SVD sur $X$ (`section 2`)
- Reconstruire $X$ en utilisant les $k$ plus grandes valeurs singulières (`section 3`) 
- Quelle est l'erreur de chaque approximation/reconstruction? (`section 4`)
- Comparer ces approximations de l'image originale. Qu'observez-vous ? (`section 5`)
- Inspecter la distribution des valeurs singulières de $X$. (`section 5`)
- Tester SVD avec une autre image / url de votre choix (`section 1`)

## 1. Load an image X as an $nd$ data matrix

In [None]:
#!pip install scikit-image

In [None]:
# Load an image as an nxd matrix

from skimage.io import imread
#url = "https://upload.wikimedia.org/wikipedia/commons/thumb/f/fa/Paul_Val%C3%A9ry_-_photo_Henri_Manuel.jpg/1200px-Paul_Val%C3%A9ry_-_photo_Henri_Manuel.jpg"
url = "https://upload.wikimedia.org/wikipedia/commons/thumb/7/79/Nina_Simone_1965.jpg/640px-Nina_Simone_1965.jpg"
X = imread(url)

# Convert RGB image to a gray / black & white image (n x d matrix)
if len(X.shape) == 3:
    X = X[:,:,0]

In [None]:
# Print X shape (n,d)
X.shape

In [None]:
# Plot the original image
import matplotlib.pyplot as plt
plt.figure(1)
plt.imshow(X,cmap = "gray")
plt.title('Original image (rank {})'.format(min(X.shape)))
plt.axis('off')
plt.draw()

## 2. Implement SVD

In [None]:
# Perform SVD decomposition on X
import numpy as np

### TODO ###
#
### ENDO ###

In [None]:
assert U.shape == (X.shape[0], X.shape[0])
assert S.shape == (min(X.shape[0],X.shape[1]),)
assert V.shape == (X.shape[1], X.shape[1])

## 3. Low rank approximation matrix

In [None]:
# Reconstruct X (approximation) using the top k = [10, 20, 50, 100, 200] singular values

### TODO ###
#
#
#
#
#
### ENDO ###

In [None]:
assert X10.shape == (X.shape[0], X.shape[1])
assert X20.shape == (X.shape[0], X.shape[1])

## 4. Test your implementation

In [None]:
# Print error of approximation

### TODO ###
#
#
#
#
#
### ENDO ###

## 5. Analyse results

In [None]:
# Plot the optimal rank-k approximation for various values of k

# Create a figure with 6 subfigures
plt.figure(2, figsize=(15,10))

# Rank 10 approximation
plt.subplot(231)
plt.imshow(X10,cmap = "gray")
plt.title('Best rank' + str(10) + ' approximation')
plt.axis('off')

# Rank 20 approximation
plt.subplot(232)
plt.imshow(X20,cmap = "gray")
plt.title('Best rank' + str(20) + ' approximation')
plt.axis('off')

# Rank 50 approximation
plt.subplot(233)
plt.imshow(X50,cmap = "gray")
plt.title('Best rank' + str(50) + ' approximation')
plt.axis('off')

# Rank 100 approximation
plt.subplot(234)
plt.imshow(X100,cmap = "gray")
plt.title('Best rank' + str(100) + ' approximation')
plt.axis('off')

# Rank 200 approximation
plt.subplot(235)
plt.imshow(X200,cmap = "gray")
plt.title('Best rank' + str(200) + ' approximation')
plt.axis('off')

# Original
plt.subplot(236)
plt.imshow(X,cmap = "gray")
plt.title('Original image (Rank 480)')
plt.axis('off')

plt.draw()

In [None]:
# Plot the singular values of X versus their rank k
plt.figure(3) 

### TODO ###
#
### ENDO ###

plt.xlabel('k'), 
plt.ylabel(r'$\sigma_k$')
plt.title('Singular values of the image matrix')
plt.draw()

plt.show() 