***
# **APP. OPT. -- M1 MA 2020/2021 -- Université Paris-Saclay**
***


In [1]:
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

def verifier_gradient(f,g,x0):
    N = len(x0)
    gg = np.zeros(N)
    for i in range(N):
        eps = 1e-4
        e = np.zeros(N)
        e[i] = eps
        gg[i] = (f(x0+e) - f(x0-e))/(2*eps)
    print('erreur numerique dans le calcul du gradient: %g (doit etre petit)' % np.linalg.norm(g(x0)-gg))

$$\newcommand{\nr}[1]{\|#1\|}
\newcommand{\Rsp}{\mathbb{R}}$$
$\newcommand{\sca}[2]{\langle#1|#2\rangle}$

# TP1 :  Optimisation sans contraintes
## Méthode des différences finies pour $-u'' = f$

### Existence et unicité

On veut approcher le problème $-u''=f$ avec conditions de Dirichlet : 

$$
\left\{\begin{aligned}
&-u''(x) = f(x) \hbox{ sur } (0,1) \\
&u(0) = u(1) = 0
\end{aligned}\right.$$

par le système linéaire de dimension finie 

$$
\left\{\begin{aligned}
&-\frac{1}{h^2}(u_{i-1} - 2 u_i + u_{i+1}) = f_i \hbox{ pour } 1\leq i\leq N\\
&u_{0} = 0, u_{N+1} = 0 
\end{aligned}\right.,$$

où $h = 1/(n+1)$ et $x_j = h j$ pour $0\leq j\leq n$ et $f_j = f(t_j)$. 

**Q1)** Montrer que si on pose $ U = (u_1,\dots, u_n)$ et $ F = (f_1,\dots,f_n)$, le système linéaire peut être écrit sous la forme $A_n  U = h^2 F$, où $A_n$ est une matrice symétrique et définie positive. 

Le but de ce TP est donc de proposer et comparer des méthodes de
résolution de systèmes linéaires du type $A_n x = b$, où $A$ est une
matrice **symétrique et définie positive**.
En particulier on cherche à résoudre un système linéaire
 $A_n x = b$ par des méthodes de descent de gradient en trouvant le minimiseur de 
\begin{equation}
\label{problem}
J(x) := \frac{1}{2}\sca{A_nx}{x} - \sca{b}{x}.
\end{equation}

**Q2)** On veut montrer existence et unicité.

**Q2.a)** Montrer que $J(x)\to+\infty$ quand $\nr{x}\to+\infty$ et en déduire l'existence d'un minimiseur.

**Q2.b)** Calculer $\nabla J(x)$ et $D^2J(x)$.

**Q2.c)** Montrer que  tout minimiseur $x^\star$ résout   l'équation $A_n x = b$.

**Q2.d)** Soit $x^\star$ l'unique solution de $A_n x = b$, montrer que 
$$ J(x+x^\star)=J(x^\star)+\frac{1}{2}\sca{A_nx}{x} $$
et en déduire  que $x^\star$ est l'unique minimiseur de $J$.



## Exercice 0

**Q1)** Soit $f(x) = 1$, implementer en python deux fonctions `A(n)` et `F(x)`qui retournent la matrice $A_n$ et le vecteur $F$. 

In [19]:
# <completer>


**Q2)** Soit $n=30$, résoudre le système linaire en utilisant `np.linalg.solve`. Tracer sur la même figure  la solution approchée et la solution analytique.

In [20]:
# <completer>


## Exercice 1- La méthode du gradient à pas fixe

Soit $\mathcal J(x)$ la fonctionelle définie par 
\begin{equation}
\mathcal J(x)=\dfrac{1}{2}<x|A_n x>-<b|x>,
\end{equation}
où $<\cdot|\cdot>$ désigne le produit scalaire euclidien, $A_n\in\mathcal M_n(\mathbb R)$ et $b\in\mathbb R^n$.

**Q1)** Implementer $\mathcal J $ et $\nabla\mathcal J$ en utilsant deux fonctions `J(x,A,b)` et  `gradJ(x,A,b)`.
On rappelle que pour `A,b` donnés, on peut définir une fonction dans la seule variable `x` comme `gradJn =lambda x : gradJ(x,A,b)`. Utiliser la fonction `verifier_gradient` pour varifier d'avoir bien calculé le gradient de $\mathcal J$ en utilisant la matrice $A_n$ et le vecteur $F$ trouvé dans l'exercice 0. 



In [21]:
# <completer>


$$\newcommand{\nr}[1]{\left\Vert #1 \right\Vert}$$

**Q2)** 
La méthode de gradient à pas constant $\tau>0$ consiste à construire une
  suite minimisante définie par récurrence comme suit:
    $$\begin{cases} x_0 \in \mathbb R^n\\
    d^{(k)} = -\nabla J(x^{(k)}) \\
   x^{(k+1)} = x^{(k)} + \tau d^{(k)}
  \end{cases}$$
 Soit $T_\tau(x)=x-\tau\nabla J(x)=(I_n-\tau A)x+\tau b$ tel que $x^{(k+1)}=T_\tau(x^{(k)})$.
 
 **Q2.a)** Montrer que $x^\star=T_{\tau}(x^\star)$ où $x^\star$ est l'unique minimum de $J$.
 
 **Q2.b)** Donner une condition sur $\tau$ telle que $T_\tau$ est contactante.
 
 **Q2.c)** Montrer que la suite $(x^{(k)})$ converge vers $x^*$ quelque soit la valeur de $x_0$ et $\tau$ vérifiant la condition trouvée précédemment.
 
 **Q2.d)** *(bonus)* Montrer que le meilleur choix est $\tau^\star=\dfrac{2}{\lambda_{1}+\lambda_{n}}$, où $\lambda_1$ ($\lambda_n$) est la plus petite (grande) valeur propre de $A_n$. Calculer $\tau^\star$ à l'aide de la fonction `np.linalg.eigvalsh`.
 


In [22]:
# <completer>


**Q3)** Implémenter l'algorithme du gradient à travers une fonction de la forme 

`gradient_fixe(gradJ,x0,tau,epsilon,iterMax) `

prennant en argument le gradient `gradJ`, la valeur initiale `x0`, le pas `tau`, le nombre maximal d'iterations autorisées `IterMax` et la tolerance `epsilon`. Cette fonction devra retourner:
- `x` dernier terme de la suite. 
- `err` liste de $\parallel \nabla \mathcal J(\bf u_k)\parallel$.




In [23]:
# <completer>


**Q4)**  Pour $n=20,50,100$ résoudre le systéme trouvé dans l'exercice 0 et  tracer sur la même figure les solutions approchées. On prendra $\tau=0.1$ et $\epsilon=10^{-6}$. Tracer en échelle logarithmique `err` en fonction du nombre des itérations. Commenter les résultats.


In [24]:
# <completer>


**Q5)** Reprendre l'expérience précédent en utlisant le meilleur choix de $\tau^\star$ trouvé au début de l'exercice. Commenter les résultats. 

In [25]:
# <completer>


## Exercice 2- La méthode du gradient à pas optimal

On rappelle que les iterées de la  methode du gradient à pas optimal sont définies comme

$$\begin{cases} d^{(k)} = - \nabla \mathcal J (x^{(k)}) \\
    \tau^{(k)} = \frac{\langle d^{(k)}|d^{(k)}\rangle}{\langle d^{(k)}|A d^{(k)}\rangle}\\
    x^{(k+1)} = x^{(k)} + \tau^{(k)}d^{(k)}
  \end{cases}$$
  
**Q0)** On veut montrer que la suite des itérées $(x^{(k)})$ converge vers l'unique minimiseur $x^\star$.

**Q0.a)** Montrer que 
$$ J(x^{(k+1)})= J(x^{(k)})-\dfrac{\tau^{(k)}}{2}\nr{\nabla J(x^{(k)})}^2$$
et en déduire que
$$ J(x^{(k+1)})\leq J(x^{(k)})-\dfrac{1}{2\lambda_{n}}\nr{\nabla J(x^{(k)})}^2,$$
où $\lambda_n$ est la plus grande valeur propre de $A$. 

**Q0.b)** Montrer alors que pour tout $K\geq 0$ on a l'inégalité suivante
$$ \sum_{0\leq k\leq K}\nr{\nabla J(x^{(k)})}^2\leq 2\lambda_n(J(x^{(0)})-J(x^\star)) $$
et en déduire que $\lim_{k\to\infty}\nr{\nabla J(x^{(k)})}=0$.

**Q0.c)**  Conclure que 	$x^{(k)}\to x^\star$.

  


<div class="alert alert-block alert-danger">
<b>Vitesse de convergence </b>

On définit le conditionnement de $A$ comme $\kappa(A)=\frac{\lambda_n}{\lambda_1}$ où $\lambda_1$ ($\lambda_n$) désigne la plus petite (grande) valeur propre de $A$. Dans le cas du gradient à pas optimal on obtient alors l'inégalité suivante 
$$ J(x^{(k)})-J(x^\star)\leq \Big( \dfrac{\kappa(A)-1}{\kappa(A)+1} \Big)^{2k}(J(x^{(0)})-J(x^\star)). $$
On en déduit que plus $\kappa(A)$ est proche de $1$, plus la méthode  du gradient à pas optimal converge rapidement. 
Par contre lorsque $\kappa(A)$ est grand, c'est-à-dire lorsque les valeurs propres extrêmes sont très différentes, la méthode est très lente.

Pour plus des détails voir Hirriart-Urruty, *Optimisation et analyse convexe*, p 17-19 et p 53-56.
</div>

**Q1)** Implémenter l'algorithme du gradient à pas optimal à travers une fonction de la forme 

`gradient_optimal(J,gradJ,A,x0,epsilon,iterMax) `

prennant en argument la fonction `J`, le gradient `gradJ`,la matrice `A`, la valeur initiale `x0`, le pas `tau`, le nombre maximal d'iterations autorisées `IterMax` et la tolerance `epsilon`. Cette fonction devra retourner:
- `x` dernier terme de la suite. 
- `err` liste de $\parallel \nabla \mathcal J(\bf u_k)\parallel$.
- `F` liste de $\mathcal J(x^{(k)})$.

In [26]:
# <completer>


**Q2)**  Pour $n=20,50,100$ résoudre le systéme trouvé dans l'exercice 0 et  tracer sur la même figure les solutions approchées. On prendra $\epsilon=10^{-6}$. Tracer en échelle logarithmique `err` en fonction du nombre des itérations. Afficher pour chaque $n$ le conditionnement de $A_n$ et commenter les résultats.

In [34]:
# <completer>


## Exercice 3 - La méthode du gradient conjugué

$\newcommand{\sca}[2]{\langle#1|#2\rangle}$

L'idée principale est de choisir des directions de descentes qui soient orthogonales les unes aux autres pour le produit scalaire $\sca{x}{y}_A = \sca{x}{A y}$ induit par la matrice $A$.  La méthode
  du gradient conjugué prend la forme suivante: on fixe $x_0=0$, puis
  pour $k\geq 0$,
\begin{equation}
\label{eq:a}
\left\{
\begin{aligned}
&g^{(k)} =  b - A x^{(k)}\\
&p^{(k)} = g^{(k)}- \frac{\sca{Ap^{(k-1)}}{g^{(k)}}}{\sca{A p^{(k-1)}}{p^{(k-1)}}} p^{(k-1)}\\
&\tau^{(k)} = \frac{\sca{p^{(k)}}{g^{(k)}}}{\sca{A p^{(k)}}{p^{(k)}}}\\
&x^{(k+1)} = x^{(k)} + \tau^{(k)} p^{(k)}
\end{aligned}
\right.
\end{equation}


**Q1)** Implémenter l'algorithme du gradient conjugué à travers une fonction de la forme 

`gradient_conj(A,b,x0,epsilon,iterMax) `

prennant en argument la matrice `A`, le vecteur `b`, la valeur initiale `x0`, le nombre maximal d'iterations autorisées `IterMax` et la tolerance `epsilon`. Cette fonction devra retourner:
- `x` dernier terme de la suite. 
- `err` liste de $\parallel \nabla \mathcal J(\bf u_k)\parallel$.


In [2]:
# <completer>


**Q2)** Pour $n=20,50,100$ résoudre le systéme trouvé dans l'exercice 0 et  tracer sur la même figure les solutions approchées. On prendra $\epsilon=10^{-6}$. Tracer en échelle logarithmique `err` en fonction du nombre des itérations et commenter les résultats.


In [12]:
# <completer>


## Exercice 4- Application : régularisation de signaux 

Dans cette partie on s'intéresse à un problème de débruitage. Étant donné un signal 1D $v:[0,1]\to\mathbb{R}$ continu et un paramètre $\alpha > 0$, on cherche à construire un signal régularisé en résolvant l'équation différentielle

$$
(D)\hspace{3cm} \left\{\begin{aligned}
&-u''(t) + \alpha (u(t) - v(t)) = 0 \hbox{ sur } (0,1) \\
&u'(0) = u'(1) = 0
\end{aligned}\right.,$$

que l'on discrétise comme dans la section précédente.

**Q1)** Poser $U = (u_0,\dots, u_{N+1})$ et écrire le système sous la forme $A_n U = F$ où la matrice $A_n$ et le vecteur $F$ sont à construire. Montrer que la matrice $A_n$ est symétrique et définie positive. Écrire une fonction `Areg(n,alpha)` construisant la matrice $A_n$.

In [13]:
# <completer>


 **Q2)**  En utilisant les agorithmes de descente de gradient, résoudre le système à partir du signal $v$ donné ci-dessous (une somme de Gaussiennes auquelles on a rajouté un bruit uniforme),  pour $\alpha\in\{50,100,1000\}$ et $n=50$. Tracer les solutions sur la même figures et commenter.

In [14]:
n=100
h=1/(n+1)
t = np.linspace(0,1,n+2)
v = 4*np.exp(-500*np.square(t-.8)) + np.exp(-50*np.square(t-.2))
v = v + .5*np.random.random(n+2) 
# <completer>




