# Problème 1 (Processus de Markov et EVD)

Faites la décomposition en valeurs propres de $K_{XX}$ telle que donnée ci-dessous afin d’obtenir
les matrices U et D pour $\sigma_{X}^{2} = 1$, $N = 4$, $\rho = 0.1, 0.5, 0.95$

In [2]:
import numpy as np


def EVD(sigma, p):
    K_x = sigma * np.array([[1, p, p**2, p**3], [p, 1, p, p**2], [p**2, p, 1, p], [p**3, p**2, p, 1]])
    Lambda, U = np.linalg.eig(K_x)
    U_inv = np.linalg.inv(U)
    D = np.diag(Lambda)
    return K_x, U, D, U_inv

In [3]:
# Test de notre décomposition en valeurs propres...
K_x, U, D, U_inv = EVD(1, 0.1)
K = U@D@U_inv
assert np.allclose(K, K_x), "Erreur dans la décomposition en valeurs propres !"

In [4]:
# On va prendre la matrice des valeurs propres pour ρ = 0.1, 0.5, 0.95, et on va observer les différences...
rho = {0.1, 0.5, 0.95}
list_matrices_Valeur_Propres = []
for p in rho:
    K_x, U, D, U_inv = EVD(1, p)
    print("ρ = " , p)
    print("Valeurs propres = ", np.diagonal(D))
    print("Moyenne = ", np.average(np.diagonal(D)))
    print("Variance = ", np.var(np.diagonal(D)))

ρ =  0.1
Valeurs propres =  [1.17112442 1.05221441 0.84678559 0.92987558]
Moyenne =  1.0000000000000002
Variance =  0.015100499999999992
ρ =  0.5
Valeurs propres =  [2.0855823 1.        0.5394177 0.375    ]
Moyenne =  1.0000000000000004
Variance =  0.4453125000000002
ρ =  0.95
Valeurs propres =  [3.75676632 0.16265327 0.05060868 0.02997173]
Moyenne =  0.9999999999999999
Variance =  2.5358021953124985


On peut constater que lorsque ρ augmente, on a la variance de nos valeurs propres qui augmente également. De plus, on a des valeurs propres qui sont de plus en plus grande, mais qui décroissent de plus en plus rapidement...

# Problème 2 (Expliquer quelques concepts)

### Expliquer le lien entre la décomposition en valeurs propres (EVD) et en valeurs singulières (SVD).

On a que pour tout $X \in \mathbb{R}^{n*m}$, $X$ peut s'écrire comme (SVD):
$$X = U S V^{T}$$
On a que pour tout $A \in \mathbb{R}^{n*n}$, $A$ peut s'écrire comme (EVD):
$$A = Y \Sigma Y^{T}$$
On a que $U$ est une matrice construite avec les vecteurs propres de $XX^{T}$, et comme $XX^{T}$ est une matrice carrée, on utilise EVD et on a: $XX^{T} = U \Sigma U^{T}$, S est une matrice construite avec la racine carrée des valeurs propres de $XX^{T}$ ou de $X^{T}X$, et $V^{T}$ est construite avec les vecteurs propres de $X^{T}X$, obtenus à nouveau grâce à la décomposition en valeurs propres: $X^{T}X = V \Sigma^{'} V^{T}$. Le lien entre la décomposition en valeurs propres et en valeurs singulières est donc assez direct.

### Expliquer pour quelles matrices on peut appliquer chacune de ces décompositions.

On peut appliquer la décomposition en valeurs propres sur les matrices carrées, et la décomposition en valeurs singulières sur les matrices qui ne sont pas carrées, mais aussi sur des matrices carrées. La décomposition en valeurs singulières est donc un peu une généralisation de la décomposition en valeurs propres.

###  Peut-on appliquer la décomposition en valeurs singulières (SVD) à des matrices de covariance ? Qu’obtiendra-t-on ?

regarder slides à partir de la page 81 !!!

On peut appliquer la décomposition en valeurs propres à des matrices de covariance $K_{XX}$. On aura donc, sachant que $K_{XX} = K_{XX}^{T}$:

$K_{XX} = USV^{T}$ avec
* $K_{XX}K_{XX}^{T} = K_{XX}^{2} = U\Sigma^{2}U^{T}$ selon EVD car $K_{XX}$ est une matrice carrée.
* $S = \sqrt{\Sigma^{2}} = \Sigma$
* $K_{XX}^{T}K_{XX} = K_{XX}^{2} = U\Sigma^{2}U^{T}$ donc $V^{T} = U^{T}$

On a donc la décomposition en valeurs singulières qui est égale à la décomposition en valeurs propres pour la matrice de covariance.

# Problème 3 (Transformation affine)

1. Quel est l’impact d’une transformation linéaire (affine) x = Az sur
- la moyenne $\bar{x}$ ?
On a:

$$\mathbb{E}[x_{1}] = \mathbb{E}[z_{1}*a_{1,1} + \dots + z_{n}*a_{1, n}] = \sum_{1}^{n}\mathbb{E}[z_{i}*a_{1, i}] = \sum_{1}^{n}\mathbb{E}[z_{i}]*a_{1, i} = \sum_{1}^{n}\bar{z_{i}}*a_{1, i}\\
\mathbb{E}[x_{2}] = \sum_{1}^{n}\bar{z_{i}}*a_{2, i}\\
\vdots \\
\mathbb{E}[x_{n}] = \sum_{1}^{n}\bar{z_{i}}*a_{n, i}\\$$

Donc on a que:
$$\bar{x} = A\bar{z}$$
Le vecteur moyenne est donc simplement multipliée par la matrice de la transformation linéaire, et on trouve ainsi le vecteur moyenne transformé.
- la matrice de covariance $K_{XX}$ ?
On a:
$$ K_{XX} = \begin{pmatrix}
\mathbb{E}[(X_{1} - \mathbb{E}[X_{1}])(X_{1} - \mathbb{E}[X_{1}])] & \cdots & \mathbb{E}[(X_{1} - \mathbb{E}[X_{1}])(X_{N} - \mathbb{E}[X_{N}])] \\
\vdots & \ddots & \vdots \\
\mathbb{E}[(X_{N} - \mathbb{E}[X_{N}])(X_{1} - \mathbb{E}[X_{1}])] & \cdots & \mathbb{E}[(X_{N} - \mathbb{E}[X_{N}])(X_{N} - \mathbb{E}[X_{N}])]
\end{pmatrix}
= \begin{pmatrix}
Var(X_ {1}) & \cdots & Cov(X_{1}, X_{N}) \\
\vdots & \ddots & \vdots \\
Cov(X_{N}, X_{1}) & \cdots & Var(X_{N})
\end{pmatrix}
= \begin{pmatrix}
Var(X_ {1}) & \cdots & Cov(X_{1}, X_{N}) \\
\vdots & \ddots & \vdots \\
Cov(X_{N}, X_{1}) & \cdots & Var(X_{N})
\end{pmatrix}
$$
et:
$$Var(X_{1}) = Var(\sum_{1}^{n}Z_{i}a_{1, i}) = \sum_{1}^{n}a_{1, i}^{2}Var(Z_{i})\\
\vdots \\
Var(X_{n}) = \sum_{1}^{n}a_{n, i}^{2}Var(Z_{i})$$
et:
$$Cov(X_{1}, X_{2}) = \mathbb{E}[(X_{1} - \mathbb{E}[X_{1}])(X_{2} - \mathbb{E}[X_{2}])] = \mathbb{E}[(\sum_{1}^{n}Z_{i}a_{1, i} - \sum_{1}^{n}\bar{z_{i}}*a_{1, i})]

2. Trouver l’expression exacte de p(x) directement grâce à la formule de la figure ci-dessus, c’est-à-dire sans utiliser le point 1.

$$p_{x} = \frac{p_{z}(A^{-1}x)}{|det(A)|} = \frac{1}{|det(A)|}\frac{1}{\sqrt{(2\pi)^{N}|det(K_{zz})|}}\text{e}^{-\frac{1}{2}(A^{-1}x -\bar{z})^{T}K_{zz}^{-1}(A^{-1}x -\bar{z})}$$

3. Vous devriez trouver une nouvelle gaussienne dont la moyenne et la matrice de covariance ont changés. Ecrivez-la de sorte à identifier $\bar{x}$ et $K_{XX}$ tels que trouvés au point 1.

On a:
$$(A^{-1}x - \bar{z}) = A^{-1}(x - A\bar{z})\\
(A^{-1}x - \bar{z})^{T} = (A^{-1}(x - A\bar{z}))^{T} = (x - A\bar{z})^{T}(A^{-1})^{T}
$$

Donc:
$$(A^{-1}x -\bar{z})^{T}K_{zz}^{-1}(A^{-1}x -\bar{z})=
(x - A\bar{z})^{T}(A^{-1})^{T}K_{zz}^{-1}A^{-1}(x - A\bar{z})
= (x - A\bar{z})^{T}(A^{T}K_{zz}A)^{-1}(x - A\bar{z})$$
et:
$$A^{-1T}K_{zz}^{-1}A^{-1} = (A^{T}K_{zz}A)^{-1} = K_{xx}^{-1}$$
Comme $\bar{x} = A\bar{z}$, on a:
$$(A^{-1}x -\bar{z})^{T}K_{zz}^{-1}(A^{-1}x -\bar{z})
= (x - \bar{x})^{T}K_{xx}^{-1}(x - \bar{x})$$
et:
$$|det(K_{xx})| = |det(A^{T})||det(K_{zz})||det(A)| = |det(A)|^{2}|det(K_{zz})|
$$
Donc:
$$p_{x} = \frac{1}{|det(A)|}\frac{1}{\sqrt{(2\pi)^{N}|det(K_{zz})|}}\text{e}^{-\frac{1}{2}(A^{-1}x -\bar{z})^{T}K_{zz}^{-1}(A^{-1}x -\bar{z})}
= \frac{1}{\sqrt{(2\pi)^{N}|det(A)|^{2}|det(K_{zz})|}}\text{e}^{-\frac{1}{2}(x - \bar{x})^{T}K_{xx}^{-1}(x - \bar{x})}
= \frac{1}{\sqrt{(2\pi)^{N}|det(K_{xx})|}}\text{e}^{-\frac{1}{2}(x - \bar{x})^{T}K_{xx}^{-1}(x - \bar{x})}