# Contrôle optimal TP 3

Contrôle optimal de l'équation de la chaleur

In [6]:
import numpy as np
import matplotlib.pyplot as plt  


## Introduction 



On considère une barre unidimensionnelle de longueur $L > 0$. La température de l'extrémité gauche de la barre ( $ x = 0 $ ) est maintenue à $0^{\circ}\mathrm{K}$, et on cherche à contrôler la température de la barre à l'extrémité droite ($x = L$) à l'aide d'un flux de chaleur $t \mapsto u(t)$. On appelle $y_u(t, x)$ la température de cette barre au temps $t \in [0, T]$ et en $x \in [0, L]$.

On suppose que $y_u$ résout l'équation de la chaleur
$$
\begin{cases}
    \partial_t y_u(t, x) - \partial_{xx} y_u(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    y_u(0, x) = 0, & x \in [0, L] \\
    y_u(t, 0) = 0, & t \in [0, T] \quad (\text{condition de Dirichlet homogène}) \\
    \partial_x y_u(t, L) = u(t), & t \in [0, T] \quad (\text{condition de Neumann non-homogène})
\end{cases}
$$

et on s'intéresse au problème de contrôle optimal
$$
\inf_{u \in L^2(]0, T[)} J(u)
$$
où
$
J(u) = \frac{1}{2} \int_{0}^{T} (y_u(t, L) - z_d(t))^2 \, dt + \frac{\varepsilon}{2} \int_{0}^{T} u(t)^2 \, dt \quad (\text{P})
$
où $\varepsilon > 0$ est un paramètre fixé, et $z_d \in L^2(]0, T[)$ est donnée.


## Question 1

Montrer que $J$ est différentiable. En introduisant un problème adjoint bien choisi, calculer le gradient de $J$ en $u$.

### Montrons la différentiabilité de $J$

$
J(u) = \frac{1}{2} \int_{0}^{T} (y_u(t, L) - z_d(t))^2 \, dt + \frac{\varepsilon}{2} \int_{0}^{T} u(t)^2 \, dt \quad (\text{P})
$
où $\varepsilon > 0$ est un paramètre fixé, et $z_d \in L^2(]0, T[)$ 


Soit $(u, h) \in U^2_{ad}$. Puisque $U_{ad}$ est convexe, alors $u + \varepsilon h $ appartient à $U_{ad}$.


Posons $z_h = \frac{ y_{u + \varepsilon h} - y_u}{\varepsilon}$ , on $z_h$ solution de 

$$
\begin{cases}
    \partial_t z_{h}(t, x) - \partial_{xx} z_{h}(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    z_{h}(0, x) = 0, & x \in [0, L] \\
    z_{h}(t, 0) = 0, & t \in [0, T] \\
    \partial_x z_{h}(t, L) =  h(t), & t \in [0, T] 
\end{cases}
$$

Si $ u \mapsto y_u $ est différentiable alors sa différentielle est $z_h$. Pour montrer la différentiabilité, on doit prouver que :

$$|| y_{u+h} - y_u - z_h ||_{L^2(]0, L[)} = o(||h||) $$





Posons $S_h = y_{u+h} - y_u - z_h$ , on a :

$$
\begin{cases}
    \partial_t S_{h}(t, x) - \partial_{xx} S_{h}(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
    S_{h}(0, x) = 0, & x \in [0, L] \\
    S_{h}(t, 0) = 0, & t \in [0, T] \\
    \partial_x S_{h}(t, L) = 0, & t \in [0, T] 
\end{cases}
$$

En multipliant par $S_h$ et en intégrant sur  $]0, T[$ on obtient :

$$ 
\int_{]0, T[} S_h \partial_t S_{h} - S_h \partial_{xx} S_{h} = 0
$$

Après une intégration par partie, on a :
$$
\int_{]0, T[} S_h \partial_t S_{h} - S_h \partial_{xx} S_{h}=
\int_{]0, T[} S_h \partial_t S_{h} + \partial_{x}S_h \partial_{x} S_{h} - (S_{h}(0, x) - )
$$




Soit $(u, v) \in U_{ad}^2$. Puisque $U_{ad}$ est convexe, $(1 - \varepsilon)u + \varepsilon v \in U_{ad}$ si $\varepsilon \in [0, 1]$ et si $\varepsilon > 0$ est assez petit. Par conséquent, il vient que $u + \varepsilon(v - u)$ est admissible (appartient à $U_{ad}$).

On définit $z_h = \lim_{{\varepsilon \to 0}} \frac{{y(u + \varepsilon(v - u)) - y(u)}}{\varepsilon}$. Il est clair que $z_h $ résout

$$
\begin{cases}
\partial_t z_{h}(t, x) - \partial_{xx} z_{h}(t, x)= 0, & (t, x) \in ]0, T[ \times ]0, L[ \\
z_{h}(0, x) = 0, & x \in [0, L] \\
z_{h}(t, 0) = 0, & t \in [0, T] \\
\partial_x z_{h}(t, L) =  h(t), & t \in [0, T] 
\end{cases}
$$

On en déduit que $z_h  = y(v) - y(u)$. Il reste à montrer que $z_h $ est la différentielle de $y$ en $u$ dans la direction $v - u$.

On a vu que l'application affine $L^2(Q) \to v \mapsto y(v) \in L^2(Q)$ est continue (donc différentiable, puisqu'elle est affine). Par conséquent, $L^2(Q) \to v \mapsto y(v) \in L^2(Q)$ est différentiable de différentielle $z_h $.


### Calculons le gradient de $J$

1)
L'équation de $z_h$ est sous la forme $ Rz_h = 0$ avec $R = \partial_t -\Delta $ et on a $R^{*} = -\partial_t -\Delta $


2)
Soit $p$ solution de $ -\partial_t p -\Delta p = G$
où $G$ est un second membre à préciser.

3)
On multiplie l’équation sur $z_h$ par $p$ et on intègre par partie

$$
\int_{0}^{T} \int_{0}^{L} (\partial_t z_h- \Delta z_h ) p \,dx \,dt = 0
$$

$$
\int_{0}^{L} [ z_{h}p]^{T}_{0} \int_{0}^{L} (\partial_t z_h- \Delta z_h ) p \,dx \,dt = 0
$$

## Question 2

Décrire et mettre en œuvre une méthode numérique de résolution de l'équation de la chaleur par une méthode de type différences finies centrées en espace et décentrées en amont en temps. Vérifier sur des exemples simples que cette méthode fonctionne.

## Question 3

Appelons $p$ l'état adjoint introduit pour calculer le gradient de $J$. On appelle $q$ la fonction définie sur $[0, T] \times [0, L]$ par $q(t, x) = p(T - t, x)$. Quelle est l'équation satisfaite par $q$? En déduire une méthode numérique permettant de calculer le gradient de $J$ en $u$.

## Question 4

Écrire un algorithme pour résoudre numériquement le problème (P).

## Question 5

Tester cet algorithme pour diverses valeurs de $\varepsilon$, $T$, et $z_d$. Commenter et illustrer les résultats (on discutera en particulier l'influence des paramètres du problème sur sa résolution).

In [8]:
import numpy as np
from scipy.linalg import solve

def direct_scheme(Nx, Nt, L, T, u, zd):
    dx = L / Nx
    dt = T / Nt
    x_values = np.linspace(0, L, Nx + 1)
    t_values = np.linspace(0, T, Nt + 1)

    # Construction de la matrice A
    A = np.diag(2 * np.ones(Nx - 1)) - np.diag(np.ones(Nx - 2), k=-1) - np.diag(np.ones(Nx - 2), k=1)
    A *= 1 / (dx ** 2)

    # Initialisation de la solution
    Y = np.zeros((Nt + 1, Nx - 1))

    # Conditions initiales
    Y[0, :] = np.zeros(Nx - 1)

    # Construction de la matrice b
    for k in range(1, Nt + 1):
        b = np.zeros(Nx - 1)
        b[0] = u(t_values[k]) * dt / dx  # Condition de Dirichlet
        b[-1] = zd(t_values[k]) * dt / dx  # Condition de Neumann

        # Résolution du système linéaire
        Y[k, :] = solve(np.eye(Nx - 1) + dt / (dx ** 2) * A, dt / dx * b + Y[k - 1, :])

    return x_values, t_values, Y

def adjoint_scheme(Nx, Nt, L, T, u, zd):
    dx = L / Nx
    dt = T / Nt
    x_values = np.linspace(0, L, Nx + 1)
    t_values = np.linspace(0, T, Nt + 1)

    # Construction de la matrice A
    A = np.diag(2 * np.ones(Nx - 1)) - np.diag(np.ones(Nx - 2), k=-1) - np.diag(np.ones(Nx - 2), k=1)
    A *= 1 / (dx ** 2)

    # Initialisation de la solution
    P = np.zeros((Nt + 1, Nx - 1))

    # Conditions finales
    P[-1, :] = np.zeros(Nx - 1)

    # Construction de la matrice c
    for n in range(Nt, 0, -1):
        c = np.zeros(Nx - 1)
        c[-1] = -zd(t_values[n]) * dt / dx  # Condition de Neumann

        # Résolution du système linéaire
        P[n - 1, :] = solve(np.eye(Nx - 1) + dt / (dx ** 2) * A, dt / dx * c + P[n, :])

    return x_values, t_values, P

# Exemple d'utilisation
Nx = 100
Nt = 200
L = 1.0
T = 0.1

def u(t):
    return np.sin(np.pi * t)

def zd(t):
    return np.cos(np.pi * t)

x_values_direct, t_values_direct, Y_direct = direct_scheme(Nx, Nt, L, T, u, zd)
x_values_adjoint, t_values_adjoint, P_adjoint = adjoint_scheme(Nx, Nt, L, T, u, zd)
