# Contrôle optimal TP 3

Contrôle optimal de l'équation de la chaleur

In [35]:
import numpy as np
import matplotlib.pyplot as plt  


## Introduction 



On considère une barre unidimensionnelle de longueur $L > 0$. La température de l'extrémité gauche de la barre ( $ x = 0 $ ) est maintenue à $0^{\circ}\mathrm{K}$, et on cherche à contrôler la température de la barre à l'extrémité droite ($x = L$) à l'aide d'un flux de chaleur $t \mapsto u(t)$. On appelle $y_u(t, x)$ la température de cette barre au temps $t \in [0, T]$ et en $x \in [0, L]$.

On suppose que $y_u$ résout l'équation de la chaleur
$$
\begin{cases}
    \partial_t y_u(t, x) - \partial_{xx} y_u(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    y_u(0, x) = 0, & x \in [0, L] \\
    y_u(t, 0) = 0, & t \in [0, T] \quad (\text{condition de Dirichlet homogène}) \\
    \partial_x y_u(t, L) = u(t), & t \in [0, T] \quad (\text{condition de Neumann non-homogène})
\end{cases}
$$

et on s'intéresse au problème de contrôle optimal
$$
\inf_{u \in L^2(]0, T[)} J(u)
$$
où
$
J(u) = \frac{1}{2} \int_{0}^{T} (y_u(t, L) - z_d(t))^2 \, dt + \frac{\varepsilon}{2} \int_{0}^{T} u(t)^2 \, dt \quad (\text{P})
$
où $\varepsilon > 0$ est un paramètre fixé, et $z_d \in L^2(]0, T[)$ est donnée.


## Question 1

Montrer que $J$ est différentiable. En introduisant un problème adjoint bien choisi, calculer le gradient de $J$ en $u$.

### Montrons la différentiabilité de $J$

$
J(u) = \frac{1}{2} \int_{0}^{T} (y_u(t, L) - z_d(t))^2 \, dt + \frac{\varepsilon}{2} \int_{0}^{T} u(t)^2 \, dt \quad (\text{P})
$
où $\varepsilon > 0$ est un paramètre fixé, et $z_d \in L^2(]0, T[)$ 


Soit $(u, h) \in U^2_{ad}$. Puisque $U_{ad}$ est convexe, alors $u + \varepsilon h $ appartient à $U_{ad}$.


Posons $z_h = \frac{ y_{u + \varepsilon h} - y_u}{\varepsilon}$ , on $z_h$ solution de 

$$
\begin{cases}
    \partial_t z_{h}(t, x) - \partial_{xx} z_{h}(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    z_{h}(0, x) = 0, & x \in [0, L] \\
    z_{h}(t, 0) = 0, & t \in [0, T] \\
    \partial_x z_{h}(t, L) =  h(t), & t \in [0, T] 
\end{cases}
$$

Si $ u \mapsto y_u $ est différentiable alors sa différentielle est $z_h$. Pour montrer la différentiabilité, on doit prouver que :

$$|| y_{u+h} - y_u - z_h ||_{L^2(]0, T[)} = o(||h||) $$





Posons $S_h = y_{u+h} - y_u - z_h$ , on a :

$$
\begin{cases}
    \partial_t S_{h}(t, x) - \partial_{xx} S_{h}(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    S_{h}(0, x) = 0, & x \in [0, L] \\
    S_{h}(t, 0) = 0, & t \in [0, T] \\
    \partial_x S_{h}(t, L) = 0, & t \in [0, T] 
\end{cases}
$$

Par unicité de la solution de l'EDP, on a :
$$S_{h} = 0 = o(||h||)$$
Il reste à montrer que $ h \mapsto z_h$ est continue où 
$$
\begin{cases}
    \partial_t z_{h}(t, x) - \partial_{xx} z_{h}(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    z_{h}(0, x) = 0, & x \in [0, L] \\
    z_{h}(t, 0) = 0, & t \in [0, T] \\
    \partial_x z_{h}(t, L) = h(t), & t \in [0, T] 
\end{cases}
$$

On veut monter qu'il existe $C>0$ tel que $ $




Par composition d'applications différentiables, la fonction $J$ est différentiable.


### Calculons le gradient de $J$

$
J(u) = J_1(u) + J_2(u) 
$

Avec $J_1(u) = \frac{1}{2} \int_{0}^{T} (y_u(t, L) - z_d(t))^2 \, dt$ et 
$J_2(u) = \frac{\varepsilon}{2} \int_{0}^{T} u(t)^2 \, dt $

Calculons la différentiel de $J_1(u)$ :

$ \frac{ J_1(u + \varepsilon h ) - J_1(u) }{\varepsilon}= 
\frac{1}{2\varepsilon} \int_{0}^{T} (y_{u + \varepsilon h }(t, L) - z_d(t))^2  - (y_{u}(t, L) - z_d(t))^2\, dt =
\frac{1}{2} \int_{0}^{T} [\frac{y_{u + \varepsilon h }(t, L) - y_h }{\varepsilon}][ y_{u + \varepsilon h }(t, L) + y_h(t, L) - z_d(t)] \, dt $

Avec $z_h = \frac{y_{u + \varepsilon h }(t, L) - y_h(t, L) }{\varepsilon} $ 
Donc $ \nabla J_1(u)h = \underset{\varepsilon \to 0}{lim} \frac{ J_1(u + \varepsilon h ) - J_1(u) }{\varepsilon} = \int_{0}^{T}  z_h(t, L)  (y_{h}(t, L) - z_d(t))\, dt $


Calculons la différentiel de $J_2(u)$ :

$ \frac{ J_2(u + \varepsilon h ) - J_2(u) }{\varepsilon}= 
\frac{\alpha }{2\varepsilon} \int_{0}^{T} (u + \varepsilon h)^2 - u^2\, dt=
\frac{\alpha }{2\varepsilon} \int_{0}^{T}  2 \varepsilon h u - \varepsilon ^2 h^2\, dt =
\frac{\alpha }{2} \int_{0}^{T}  2 \varepsilon h u - \varepsilon  h\, dt 
$

Donc $ \nabla J_1(u)h = \int_{0}^{T} \alpha h u \, dt $


* Etape 1

    L'équation de $z_h$ est sous la forme $ Rz_h = 0$ avec $R = \partial_t -\Delta $ et on a $R^{*} = -\partial_t -\Delta $


* Etape 2

    Soit $p$ solution de $ -\partial_t p -\Delta p = G$
    où $G$ est un second membre à préciser.

* Etape 3

    On multiplie l’équation sur $z_h$ par $p$ et on intègre 
    $$
    \int_{0}^{T} \int_{0}^{L} (\partial_t z_h- \partial_{xx} z_h ) p \,dx \,dt = 0
    $$

    On intègre par parties : 
    $$
    \int_{0}^{L} [ z_{h}p]^{T}_{0} \,dx - \int_{0}^{T}\int_{0}^{L} z_h\cdot{} \partial_t p \,dx \,dt - \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0} + \int_{0}^{T}\int_{0}^{L} \partial_{x} z_h \cdot{}\partial_{x}p \,dx \,dt = 0
    $$

    
    Après simplification on obtient
    $$
    \int_{0}^{L} z_{h}(T,.)p(T,.) \,dx - \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0}\,dt + \int_{0}^{T}\int_{0}^{L} - z_h\cdot{} \partial_t p  + \partial_{x} z_h \cdot{}\partial_{x}p \,dx \,dt  = 0
    $$

    Intégrons par parties une deuxième fois en espace. il vient

    $$
    \int_{0}^{L} z_{h}(T,.)p(T,.) \,dx - \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0}\,dt  + \int_{0}^{T}\int_{0}^{L} -z_h\cdot{} \partial_t p - z_h \cdot{}\partial_{xx}p \,dx \,dt  + \int_{0}^{T} [ z_{h}\cdot{} \partial_x p]^{L}_{0} = 0
    $$

    Puisque $ -\partial_t p -\Delta p = G$ alors 

    $$
    \int_{0}^{L} z_{h}(T,.)p(T,.) \,dx - \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0}\,dt  + \int_{0}^{T}\int_{0}^{L} G z_{h} \,dx \,dt  + \int_{0}^{T} [ z_{h}\cdot{} \partial_x p]^{L}_{0} = 0
    $$

* Etape 3bis

    On multiplie l’équation sur $z_h$ par $p$ et on intègre 
    $$
    \int_{0}^{T} \int_{0}^{L} (\partial_t z_h- \partial_{xx} z_h ) p \,dx \,dt = 0
    $$

    On intègre par parties : 
    $$
    \int_{0}^{L} [ z_{h}p]^{T}_{0} \,dx - \int_{0}^{T}\int_{0}^{L} z_h\cdot{} \partial_t p \,dx \,dt - \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0} + \int_{0}^{T}\int_{0}^{L} \partial_{x} z_h \cdot{}\partial_{x}p \,dx \,dt = 0
    $$

    
    Après simplification on obtient
    $$
    \int_{0}^{L} z_{h}(T,.)p(T,.) \,dx - \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0}\,dt + \int_{0}^{T}\int_{0}^{L} - z_h\cdot{} \partial_t p  + \partial_{x} z_h \cdot{}\partial_{x}p \,dx \,dt  = 0 \quad (1)
    $$


    On multiplie l’équation sur $p$ par $z_h$ 
    $$
    \int_{0}^{T} \int_{0}^{L} (- \partial_t p- \partial_{xx} p ) z_h \,dx \,dt = \int_{0}^{T} \int_{0}^{L} G z_h
    $$

    On intègre par parties en espace : 
    $$
    \int_{0}^{T} \int_{0}^{L} -\partial_t p \cdot{}z_{h} +  \partial_{x}p\cdot{}\partial_{x}z_h  \,dx \,dt - \int_{0}^{T} [ \partial_{x}p\cdot{}z_{h}]^{L}_{0} \,dt = \int_{0}^{T} \int_{0}^{L} G z_h \,dx \,dt \quad (2)
    $$

    En soustraiyant $(2)$ par $(1)$, on a 
    $$
    -\int_{0}^{L} z_{h}(T,.)p(T,.) \,dx + \int_{0}^{T} [ \partial_{x} z_{h} \cdot{}p]^{L}_{0}\,dt - \int_{0}^{T} [ \partial_{x}p\cdot{}z_{h}]^{L}_{0} \,dt = \int_{0}^{T} \int_{0}^{L} G z_h \,dx \,dt 
    $$

    Comme $z_{h}(t,0) = 0$ et en choisissant $p(.,0) = p(.,L) = 0$  et aussi $G = y_u(t, L) − z_d(t)$ , on a 
    $$
    -\int_{0}^{L} z_{h}(T,.)p(T,.) \,dx - \int_{0}^{T} \partial_{x} p(.,L) \cdot{}z_{h}(.,L)  \,dt = \int_{0}^{T} \int_{0}^{L}  z_h (y_u(t, L) − z_d(t)) \,dx \,dt 
    $$



## Question 2

Décrire et mettre en œuvre une méthode numérique de résolution de l'équation de la chaleur par une méthode de type différences finies centrées en espace et décentrées en amont en temps. Vérifier sur des exemples simples que cette méthode fonctionne.

In [131]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.linalg import solve

def y_1(t, x):
    return 2 *t + x**2

def u_1(t, x):
    return 2 * L

def direct_scheme(Nx, Nt, L, T, y_func, u_func):
    dx = L / Nx
    dt = T / Nt
    x_values = np.linspace(0, L, Nx + 1)
    t_values = np.linspace(0, T, Nt + 1)

    # Construction de la matrice A
    A = np.diag(2 * np.ones(Nx)) - np.diag(np.ones(Nx-1 ), k=-1) - np.diag(np.ones(Nx -1), k=1)

    # Initialisation de la solution
    Y = np.zeros((Nt, Nx))



    # Construction de la matrice b
    for k in range(1, Nt):
        b = np.zeros(Nx)
        b[-1] = u_func(t_values[k], x_values[-1])  # Utilisation de u_func pour définir la source

        # Résolution du système linéaire
        Y[k, :] = solve(np.eye(Nx) + dt / (dx ** 2) * A, dt / dx * b)

    return x_values, t_values, Y

# Tester la méthode avec les fonctions fournies
L = 1.0
T = 0.1
Nx = 50
Nt = 100

# Appeler la fonction de résolution du problème direct
x_values, t_values, Y = direct_scheme(Nx, Nt, L, T, y_1, u_1)


# Calculer la solution exacte aux mêmes points
U_exact = np.array([[y_1(t, x) for x in x_values[:-1]] for t in t_values[:-1]])


# Calcul de l'erreur L2
dx = L / Nx
dt = T / Nt

l2_error = np.sqrt(np.sum((Y - U_exact)**2) * dx * dt / np.sum(U_exact**2))

print(f"L^2 Erreur : {l2_error}")


L^2 Erreur : 0.0044566139976085
(100, 50)
(100, 50)


## Question 3

Appelons $p$ l'état adjoint introduit pour calculer le gradient de $J$. On appelle $q$ la fonction définie sur $[0, T] \times [0, L]$ par $q(t, x) = p(T - t, x)$. Quelle est l'équation satisfaite par $q$? En déduire une méthode numérique permettant de calculer le gradient de $J$ en $u$.

## Question 4

Écrire un algorithme pour résoudre numériquement le problème (P).

In [60]:
import numpy as np
from scipy.linalg import solve
import matplotlib.pyplot as plt

import numpy as np
from scipy.linalg import solve

In [98]:
### resolution du probleme directe
def direct_scheme(Nx, Nt, L, T, u):
    dx = L / Nx
    dt = T / Nt
    x_values = np.linspace(0, L, Nx + 1)
    t_values = np.linspace(0, T, Nt + 1)

    # Construction de la matrice A
    A = np.diag(2 * np.ones(Nx - 1)) - np.diag(np.ones(Nx - 2), k=-1) - np.diag(np.ones(Nx - 2), k=1)


    # Initialisation de la solution
    Y = np.zeros((Nt + 1, Nx - 1))

    # Conditions initiales
    Y[0, :] = np.zeros(Nx - 1)

    # Construction de la matrice b
    for k in range(1, Nt + 1):
        b = np.zeros(Nx - 1)
        b[-1] = u[k] 

        # Résolution du système linéaire
        Y[k, :] = solve(np.eye(Nx - 1) + dt / (dx ** 2) * A, dt / dx * b + Y[k - 1, :])

    return x_values, t_values, Y

### resolution du probleme adjoint
def adjoint_scheme(Nx, Nt, L, T, zd,Y):
    dx = L / Nx
    dt = T / Nt
    x_values = np.linspace(0, L, Nx + 1)
    t_values = np.linspace(0, T, Nt + 1)

    # Construction de la matrice A
    A = np.diag(2 * np.ones(Nx - 1)) - np.diag(np.ones(Nx - 2), k=-1) - np.diag(np.ones(Nx - 2), k=1)


    # Initialisation de la solution
    P = np.zeros((Nt + 1, Nx - 1))

    # Conditions finales
    P[-1, :] = np.zeros(Nx - 1)

    # Construction de la matrice c
    for n in range(Nt, 0, -1):
        c = np.zeros(Nx - 1)
        c[-1] = Y[n, -1] -zd(t_values[n]) 


        # Résolution du système linéaire
        P[n - 1, :] = solve(np.eye(Nx - 1) + dt / (dx ** 2) * A, dt / dx * c + P[n, :])

    return x_values, t_values, P

### solver 
def solver(Nx, Nt, L, T, zd,epsilon):
    Maxit = 100
    # Initialisation du controle U
    U = np.zeros((Maxit , Nt + 1))

    # Conditions initiales du controle
    U[0, :] = np.ones(Nt + 1)

    for k in range(1,Maxit-1):  

        # Résolution du problème direct
        x_values_direct, t_values_direct, Y_direct = direct_scheme(Nx, Nt, L, T, U[k, :])

        # Résolution du problème adjoint
        x_values_adjoint, t_values_adjoint, P_adjoint = adjoint_scheme(Nx, Nt, L, T, zd,Y_direct )

        # calcul du gradient 
        gk = epsilon*U[k, :]

        # calcul du controle à k+1
        pas =0.01
        U[k+1, :] = U[k, :] - pas*gk
        
    return U



## Question 5

Tester cet algorithme pour diverses valeurs de $\varepsilon$, $T$, et $z_d$. Commenter et illustrer les résultats (on discutera en particulier l'influence des paramètres du problème sur sa résolution).