***
# **M1MAO -- M1 MA 2020/2021 -- Université Paris-Saclay**
***

In [13]:
%matplotlib inline
import matplotlib.pyplot as plt
import matplotlib.tri as tri
import numpy as np
import matplotlib.tri as tri

# TP2 :  Optimisation sous contraintes
##  Le problème d'obstacle

$$
\newcommand{\sca}[2]{\langle #1\mid #2 \rangle}
\newcommand{\nr}[1]{\left\|#1\right\|}
\newcommand{\LL}{\mathrm{L}} 
\newcommand{\Rsp}{\mathbb{R}}
\newcommand{\Psp}{\mathbb{P}}
\newcommand{\Class}{\mathcal{C}}
\newcommand{\id}{\mathrm{id}}
$$
Soit $\Omega$ un ouvert de $\Rsp^d$ (avec $d=1,2$) et $\Psi\in H^1_0(\Omega) \cap \Class^\infty(\Omega)$. On s'intéresse à la résolution du problème d'obstacle:
$$
\min_{v\in C} \int_\Omega \nr{\nabla v}^2
$$
où $C = \{ u\in H^1_0(\Omega) \mid u \geq \Psi\}$.
On discrétise ce problème par la méthode des éléments finis en dimension d. 
On part d'une triangulation $T_h$ de l'ouvert $\Omega$, et on note:
* $V_h$ l'espace des éléments finis $\Psp_1$ sur $T_h$, de sorte que $V_h\subseteq V := H^1(\Omega)$;
* $N_h :=\dim(V_h)$;
* $x_1,\dots,x_{N_h}$ les sommets de la triangulation et $\phi_1,\dots,\phi_{N_h}$ les fonctions chapeau correspondantes. On note $J_h$ l'ensemble des indices des sommets du bord.
* $V_{0h} = \{ v\in V_h\mid \forall k\in J_h, v(x_k) = 0 \}$
* $C_h = \{ v\in V_{0h}\mid \forall 1\leq i\leq N_h,~~ v(x_i) \geq \Psi(x_i) \}$

Le problème discret est alors donné par 
$$
\min_{v\in C_h} \int_\Omega \nr{\nabla v}^2.
$$

**Q0)** On note $W = (v_1,\dots,v_{N_h}) \in \Rsp^{N_h}$ les valeurs d'une fonction $v\in V_h$ sur les sommets $x_1,\dots,x_{N_h}$ (i.e. $v = \sum_{1\leq i\leq N_h} v_i \phi_i$ où $\phi_i$ est la base de $V_h$ formée des fonctions chapeau). Montrer que le problème peut être mis sous la forme

$$ \min_{W\in D_h} J(W):=\sca{W}{A W} $$
$$D_h = \{ W\in \Rsp^{N_h} \mid \forall 1\leq i\leq N_h, W_i \geq \Psi(x_i) \hbox{ et } \forall k\in J_h,~ W_k = 0\},$$

où $A_{ij} = \int_\Omega \sca{\nabla \phi_i}{\nabla \phi_j}$. Montrer que la matrice $A$ est symétrique et définie positive.





### Algorithme du gradient projeté 

$$ \newcommand{\id}{\mathrm{id}}
\newcommand{\D}{\mathrm{D}}
$$
L'objectif de cette premiere partie est d'introduire et de demontrer la convergence de l'algorithme du gradient projeté.

<div class="alert alert-block alert-danger">
<b>Algorithme du gradient projete</b>
Soit $J \in \Class^1(\Rsp^n)$ et $K\subseteq \Rsp^n$ un ensemble convexe fermé non vide. L'algorithme du gradient projeté à pas constat $\tau>0$ est donné par :

\begin{equation}  
\label{GP}
x^{(k+1)}=p_K(x^{(x)}-\tau\nabla J(x^{(k)})), 
\tag{GP}
\end{equation}
où $p_K(x)$ est la projection d'un point $x\in\Rsp^n$ sur $K$.

</div>

**Q1)** [**Constante de Lipschitz de $\id - \tau \nabla J$** ] On suppose  que $J\in \Class^2(\Rsp^n)$ et qu'il
    existe deux constantes $L\geq 0, \alpha>0$ telles que
    $$ \forall x,y\in \Rsp^n,\quad \nr{\nabla J(x) - \nabla J(y)} \leq L\nr{x - y} $$
    $$ \forall x,v\in \Rsp^n,\quad \sca{\D^2 J(x) v}{v} \geq \alpha
    \nr{v}^2, $$ la deuxième condition impliquant que $\D^2
    J\geq\alpha \mathrm{Id}_n$ au sens des matrices symétriques.
- (i) Démontrer que si $\tau \in (0,2\alpha/L^2)$, alors l'application $F_\tau: x\in \Rsp^n\mapsto x - \tau \nabla J(x)$ est contractante.   
- (ii) En déduire que pour tout $x^{(0)}\in\Rsp^n$, la suite définie par $x^{(k+1)} = F_\tau(x^{(k)})$ converge vers l'unique minimiseur de $J$ sur $\Rsp^n$



**Q2)** Dans cette question, on suppose que $J(x) = \frac{1}{2}\sca{x}{Ax}$, où $A$ est symétrique et définie positive de valeurs propres $0<\lambda_1\leq\cdots\leq\lambda_n$.
- (a) Montrer que si $\tau \in (0,2/\lambda_n)$ alors les valeurs propres de la matrice $\mathrm{Id}_n - \tau A$ sont dans $(-1,1)$.  
- (b) En déduire que pour tout $x^{(0)}\in\Rsp^n$, la suite définie par $x^{(k+1)} = x^{(k)} - \tau \nabla J(x^{(k)})$ converge vers l'unique minimiseur de $J$ sur $\Rsp^n$.



Soit maintenant $J \in\Class^1(\Rsp^n)$ une fonction convexe et soit $K$ un convexe fermé de $\Rsp^n$. 

<div class="alert alert-block alert-danger">
<b>Projection sur un convexe</b>
  
On note $p=p_K(x)$ la projection d'un point $x\in \Rsp^n$ sur $K$, qui par théorème est l'unique point $p\in K$ vérifiant $\forall y\in K,\quad \sca{x - p}{p-y} \geq  0.$

</div>

**Q3)** Montrer que $x \in \arg\min_{K} J$ si et seulement si $\forall
    y \in K, \sca{-\nabla J(x)}{x-y} \geq 0$. 
    


**Q4)** Démontrer que l'application $p_K$ est $1$-lipschitzienne.



**Q5)**  En utilisant la caractérisation précédente, démontrer
    l'équivalence entre:
    
- (i) $x$ minimise $J$ sur $K$  ;

- (ii) $\exists \tau>0$ tel que $p_K(x - \tau\nabla J(x)) = x$ ;

- (iii) $\forall \tau>0$ tel que $p_K(x - \tau\nabla J(x)) = x$ ;




**Q6)**  On se place sous les hypothèses de la question **Q1**. Montrer que pour tout $\tau \in (0,2\alpha/L^2),$
  et  tout $x^{(0)}\in \Rsp^n$, la suite $x^{(k+1)} := p_K(x^{(k)} - \tau\nabla J(x^{(K)}))$ converge vers le minimiseur de $J$ sur $K$, qui est unique.
  
**Q7)** On se place sous les hypothèses de la question **Q2**. Montrer que pour tout $\tau \in (0,2/\lambda_n),$ et tout $x^{(0)}\in \Rsp^n$, la suite $x^{(k+1)}:= p_K(x^{(k)} - \tau\nabla J(x^{(k)}))$ converge vers un point $x^*$ qui est l'unique minimiseur de $J$ sur $K$.

**Q8)**  Dans cette question , on suppose $K = \{V \in \Rsp^n \mid \forall i, V_i \geq \Psi_i\}$ où $\Psi\in\Rsp^n$ est donnée. Montrer que si $\bar{x} \in \arg\min_K J$ où $J\in\Class^1(\Rsp^n)$, alors $\lambda := -\nabla J(\bar x)$ vérifie
\begin{equation} 
\label{kkt} 
\begin{cases}
 \lambda_i = 0 &\hbox{ si } \bar{x}_i > \Psi_i \\ \lambda_i \leq 0
&\hbox{ sinon }
\end{cases}
\tag{kkt}
\end{equation}



**Q9)** Dans cette question, on suppose que $J\in\Class^1(\Rsp^n)$ est convexe. Démontrer que si $\bar{x}\in K$ et si $\lambda := -\nabla J(\bar x)\in \Rsp^n$ vérifie l'équation \eqref{kkt}, alors $\bar{x}$ minimise $J$ sur $K$.



**Q10)** En déduire (on suppose $J$ convexe) que 
  $$\bar x \in\arg\min_K J\iff \exists \lambda\in\Rsp^n\;t.q.
  \begin{cases}
  &\bar x \in K,\\
  &-\nabla J(\bar x)=\lambda \\
  & \lambda_i =0\;\text{si}\;\bar x_i> \Psi_i\\
  & \lambda_i <0 \;\text{si}\;\bar x_i= \Psi_i\
\end{cases}$$

**Q11)** Démontrer que la projection de $x\in \Rsp^n$ sur $K$ est donnée par
    $$p_K(x) = (\max(x_1,\Psi_1),\cdots, \max(x_n,\Psi_n)).$$

**Q12)** Soit $W\in \Rsp^{N_h}$. Vérifier que la projection orthogonale de $W$ sur $D_h$ est donnée par

$$ \Pi_{D_h}(W) = \begin{cases} \max(W_i,\Psi(x_i)) & \hbox{ si } i\not\in J_h \\
0 & \hbox{ sinon } 
\end{cases}. $$
 Écrire une fonction `projDh(W,Psi)` retournant la projection de $W$ sur $D_h$ 


In [14]:
# <completer>


**Q13)** Écrire explicitement l'algorithme de gradient projeté (à pas constant) dans le cas où $J(W) = W^T A W$ et $K =  D_h$. Expliciter la condition nécessaire sur le pas de descente en fonction des valeurs propres de la matrice $A$.

**Q14)** Implémenter cet algorithme dans le cas  $\Omega = (0,1)$, en utilisant $\Psi(x)=\max(1.5-20(x-0.4)^2, 0)$, $N_h=30$. On arretera les itérations lorsque $\nr{u^{(k+1)}-u^{(k)}}\leq\epsilon$ avec $\epsilon=10^{-8}$; stocker le vecteur $G=(\nr{x^{(k+1)} - x^{(k)}})$ et l'afficher en echelle logaritmique. Utiliser $\tau=0.015$. Tracer sur la même figure la solution approchée et la fonction $\Psi$. Tracer aussi la solution toutes les $10$ iterations.


In [15]:
# <completer>


**Q15)**  Afficher $2/\lambda_n$, où $\lambda_n$ est la plus grande valeure propre de $A$ et reprendre le test de la question precedente en utilisant. le taux optimal $\tau^\star=\frac{\lambda_1}{\lambda_n^2}$. Tracer sur la même figure la solution approchée et la fonction $\Psi$. Afficher aussi le vecteur $G$ et commenter.


In [16]:
# <completer>


**Q16)** Vérifier numeriquement que la solution approchée $U$ satisfait les conditions suivantes

$$ \begin{cases}
U_i = 0 & \hbox{ si } i \in J_h \hbox{ (bord) } \\
- A U_i < 0 & \hbox{ si } U_i = \Psi_i \\
- A U_i = 0 & \hbox{ si } U_i > \Psi_i 
\end{cases} $$

In [17]:
# <completer>


### Le cas d=2



In [18]:



from mpl_toolkits.mplot3d import Axes3D


#triangulation du carré [-1,1]^2
def triangulation_carre(n):
    x,y = np.meshgrid(np.linspace(-1.,1.,n),
                      np.linspace(-1.,1.,n))
    x = x.reshape(n*n,1)
    y = y.reshape(n*n,1)
    X = np.hstack((x,y))
    T = tri.Triangulation(x.flatten(), y.flatten()).triangles
    return X,T

# afficher la triangulation dont les sommets sont [X[:,0],X[:,1],Z] et les triangles T
def afficher_triangulation_3d(X,T,Z):
    fig = plt.figure(figsize=plt.figaspect(0.5))
    ax = fig.add_subplot(1, 2, 1, projection='3d',)
    ax.plot_trisurf(X[:,0],X[:,1],Z,triangles=T, cmap=plt.cm.Spectral, shade=True)
    plt.show()

#Matrices de masse et de rigidité sur chaque element de la triangulation
def M_elem(S1,S2,S3):
    x1 = S1[0]
    y1 = S1[1]
    x2 = S2[0] 
    y2 = S2[1]
    x3 = S3[0]
    y3 = S3[1]
    D = ((x2-x1)*(y3-y1) - (y2-y1)*(x3-x1))
    M=(1.*np.abs(D)/24)*np.ones([3,3])
    M[range(3),range(3)]=1.*np.abs(D)/12
    return M

def K_elem(S1,S2,S3):
    x1 = S1[0]
    y1 = S1[1]
    x2 = S2[0] 
    y2 = S2[1]
    x3 = S3[0]
    y3 = S3[1]
    norm = np.zeros([3, 2])
    norm[0, :] = np.array([y2-y3, x3-x2])
    norm[1, :] = np.array([y3-y1, x1-x3])
    norm[2, :] = np.array([y1-y2, x2-x1])
    D = ((x2-x1)*(y3-y1) - (y2-y1)*(x3-x1))
    K = np.zeros([3,3])
    for i in range(3):
        for j in range(3):
            K[i,j] = np.dot(norm[i,:],norm[j,:])
    return (1./(2*abs(D)))*K


# Assemblage matrices de masse et de rigidité
def masse_et_rigidite(X,T):
    NSom = X.shape[0]
    NTri = T.shape[0]
    K = np.zeros([NSom,NSom])
    M = np.zeros([NSom,NSom])
    for N in range(0,NTri):
        S1=X[T[N,0],:]
        S2=X[T[N,1],:]
        S3=X[T[N,2],:]
        Kel=K_elem(S1, S2, S3)
        Mel=M_elem(S1, S2, S3)
        for i in range(0,3): 
            I = T[N,i]
            for j in range(0,3): 
                J = T[N,j]
                M[I,J] = M[I,J] + Mel[i,j]
                K[I,J] = K[I,J] + Kel[i,j]
    return M,K


**Q1)** Implementer  l'algorithme du gradient projeté dans le cas du carré  $\Omega = (-1,1)^2$, en utilisant
$ \Psi(x,y) = \kappa(2x^2+2y^2) $
où $$\kappa(t) = \begin{cases}\exp(-1/(1-t^2))\;&\text{si}\;t<1\\
                              0\;&\text{sinon.}\end{cases}$$

On pourra utiliser `np.where` pour construire la liste $J$ des indices des poins du bord. On pourra visualiser le graphe d'une fonction en 3D en utilisant la fonction `afficher_triangulation`.
Afficher toutes les $100$ iterations les points où la contrainte est **active**, $u^{(k)}=\Psi$. Utiliser $\tau=0.2$. 

In [19]:
# <completer>


**Q2)** Vérifier numeriquement que la solution approchée $U$ satisfait les conditions de la question **Q16**.

In [20]:
# <completer>
