# Optimisation du pas de temps

## Cadre de l'étude

Ce travail a pour objectif l'étude de l'influence du choix du pas de temps dans les méthodes de résolution d'équations différentielles vues en cours.
Plus exactement, on se propose de résoudre des problèmes de la forme : $ x' = f(x) $ avec $x : \mathbb R^n \longrightarrow \mathbb R^m $ et $f : \mathbb R^m \longrightarrow \mathbb R^m $

L'étude s'est faite en deux temps : tout d'abord nous avons considéré un pas de temps fixe et analysé son influence sur les différents schémas numériques. Nous avons également étudié l'importance de l'ordre de ces derniers : en quoi un schéma d'ordre $n$ est-il plus performant qu'un schéma d'ordre inférieur ?
Ensuite nous nous sommes intéressés au cas où le pas de temps est variable lors de la résolution de l'équation. Un programme nous a été fourni, nous devions le comprendre et l'illustrer dans des cas pertinents

## Imports de modules

Nous avons décidé d'insérer ici, une bonne fois pour toutes, les modules python que nous avons utilisé tout au long de l'étude

In [1]:
import math as ma
from numpy import *

# Pas de temps fixe

Dans cette partie, nous donnerons nos implémentations de schémas numériques classiques (Euler, Runge-Kutta) et nous analyserons l'influence du choix du pas de temps sur ces derniers

### Euler

#### Cas explicite

Cet algorithme est classique, nous avons utilisé des vecteurs pour l'utilisation de fonctions agissant sur des espaces de dimension non réduite à 1

In [2]:
def solve_euler_explicit(f, x0, t0, dt, t_tot=2):

	''' Cette fonction renvoie la solution à l'équation différentielle dx/dt = f(x) 
	avec la méthode d'Euler explicite, pour une durée de t_tot seconde'''
	
	N = int(ma.floor(t_tot/dt))
	t,x = t0,1*x0    # Donne le temps actuel et la position
	T = [t]  # Liste de temps
	X = array(x)  # Liste de positions
	for _ in range(0,N):
		t += dt    # Nouveau temps
		x += dt*f(x)  # Nouvelle position
		T = vstack([T,t])
		X = vstack([X,x])

	return T, X.T


#### Cas implicite

Cet algorithme utilise le **théorème de Banach** appliqué à la fonction **phi**, qui est bien contractante pour $dt$ petit, il faut donc choisir à partir de quand on considère le point fixe recherché avec la fonction **phi** atteint. Nous avons pris le partie de faire 100 itérations de **phi** puis ensuite d'étudier la variation relative en norme de deux itérations consécutives, en s'arrêtant lorsque cette dernière devient inférieure à 5% (c'est le but de la fonction $next\_step$)

In [3]:
def euler_implicite(f, x0, t0, dt, t_tot = 2):
	N = int(ma.floor(t_tot/dt))  # Number of iterations
	t,x = t0,1*x0				# Current time & current position
	X = array(x)			# Liste de positions
	T = [t]				# Liste de temps

	def phi(approx):
		return x + dt*f(approx) 
	for _ in range(N):
		t += dt
		approx_pos = phi(x)
		x = next_step(approx_pos, phi)
		T = vstack([T,t])
		X = vstack([X,x])

	return T,X.T

def next_step(approx_pos,phi):
	for _ in range(100):
		approx_pos = phi(1*approx_pos)
	temp = phi(approx_pos)
	while linalg.norm(temp-approx_pos)/linalg.norm(approx_pos) > 0.1 :
		approx_pos = 1*temp
		temp = 1*phi(approx_pos)
	return approx_pos

### Runge-Kutta

Les méthodes de Runge-Kutta s'appuient sur des techniques d'approximation de dérivées entre les différents points d'évaluation de la solution (les $(t_i)_{i \in \mathbb N}$ ). On a ici implémenté deux de ces techniques : celles d'ordre 2 et 4.

#### Ordre 2

In [4]:
def Runge_Kutta_2(f, x0, t0, dt, t_tot = 2):

    N = int(ma.floor(t_tot/dt))  # Number of iterations
    t,x = t0,1*x0                # Current time & current position
    X = array(x)                 # Liste de positions
    T = [t]                      # Liste de temps

    for k in range(N):
        t += dt
        middle_pos = x + dt/2*f(x)  # On approxime la position intermédiaire avec la pente de la dérivée
        x += dt*f(middle_pos)       # On utilise la pente en ce point pour approximer l'intégrale entre deux positions

        T = vstack([T,t])
        X = vstack([X,x])

    return T,X.T

#### Ordre 4

In [5]:
def Runge_Kutta_4(f, x0, t0, dt, t_tot = 2):

    N = int(ma.floor(t_tot/dt))  # Number of iterations
    t,x = t0,1*x0                # Current time & current position
    X = array(x)                 # Liste de positions
    T = [t]                      # Liste de temps

    for k in range(N):
        t += dt
        middle_pos_1 = f(x)                      # Cette variante utilise 4 points intermédiaires, avec des poids différents
        middle_pos_2 = f(x + dt/2*middle_pos_1)
        middle_pos_3 = f(x + dt/2*middle_pos_2)
        middle_pos_4 = f(x + dt*middle_pos_3)
        x += dt/6*(middle_pos_1 + 2*middle_pos_2 + 2*middle_pos_3 + middle_pos_4)

        T = vstack([T,t])
        X = vstack([X,x])

    return T,X.T

### Résultat de tests

Nous avons décidé de comparer à la fois les méthodes entre elles et l'influence des pas de temps, afin de gagner en concision et en clarté. La méthode à pas variables proposée ensuite est aussi testée ici, cela est plus pratique que de remettre tous les tests une seconde fois.

#### Remarque importante

Les profils d'erreur que nous obtenions étaient très "bruités" (beaucoup de points parasites). Nous avons donc pris le parti de "lisser ces erreurs" en faisant une erreur "glissante", prenant le minimum de l'erreur sur les 30 erreurs précédentes. ($e_i = min(\{ e_j | j \in [i-29;i] \})$

#### Fonction exponentielle

La fonction exponentielle est un exemple intéressant car les erreurs faites lors d'une itération s'ajoutent très facilement, on arrive alors vite à des solutions qui divergent trop vite ou pas assez vite par rapport à la bonne solution

![image](tests/fonction_exp/resume.PNG)

#### Fonction carrée

![image](tests/fonction_carre/resume.PNG)

#### Fonction cosinus

![image](tests/cos_vectorise/resume.PNG)

On observe que ces schémas numériques sont tous **consistants** : l'erreur maximale entre la solution approximée et la vraie solution tend vers 0 lorsque le pas de temps diminue aussi vers 0. C'est une propriété essentielle pour n'importe quel schéma numérique.
On voit de plus ici que nos implémentations fonctionnent pour des cas scalaires (exponentielle et carrée) et vectoriels (cosinus). Il est cependant à noter que les méthodes d'Euler semblent moins efficaces que celles de Runge-Kutta d'ordre supérieur à 1. La méthode à pas de temps variable, implémentée plus loin, semble beaucoup plus efficace que ces derniers

## Pas de temps variable

Maintenant que nous avons étudié l'influence du pas de temps, nous voulons optimiser le choix de ce dernier en fonction des situations. En effet une zone "sensible" où la fonction varie beaucoup nécessite un pas plus petit qu'une zone totalement linéaire. C'est la raison expliquant la variation possible du pas de temps.
L'algorithme suivant a été codé dans ce sens : on garde un pas "d'enregistrement" constant, c'est-à-dire que la solution reste échantillonnée sur des intervalles de longueue fixe $dt_{max}$, mais un autre pas est introduit : le pas **interne** $p_i$
Ce pas interne détermine les sous-intervalles sur lesquelles nous font les intégrations prévues dans la méthode d'Euler explicite. Il est choisi de manière à garder l'erreur d'approximation entre deux échantillonages inférieure à un certain seuil $T_{rel}$ : en effet, si le pas de temps interne $p_i$ donne lieu à une trop grande erreur d'approximation (i.e si $ ||x_{back} - x_{next}||$ est grand) on réduit ce pas, et vice-versa.

In [6]:
def solve_ivp_euler_explicit_variable_step_test(f, x0, t0, t_f, dtmin = 1e-16, dtmax = 0.01, atol = 1e-6):
    dt = dtmax/10; # initial integration step
    ts, xs = [t0], [x0]  # storage variables
    t = t0
    ti = 0  # internal time keeping track of time since latest storage point : must remain below dtmax
    x = x0
    while ts[-1] < t_f:
        while ti < dtmax:
            t_next, ti_next, x_next = t + dt, ti + dt, x + dt * f(x)
            x_back = x_next - dt * f(x_next)
            ratio_abs_error = atol / (linalg.norm(x_back-x)/2)
            dt = 0.9 * dt * sqrt(ratio_abs_error)                  # modification du pas de temps
            if dt < dtmin:
                raise ValueError("Time step below minimum")
            elif dt > dtmax/2:                                     # valeur maximale autorisée pour le pas de temps
                dt = dtmax/2
            t, ti, x = t_next, ti_next, x_next
        dt2DT = dtmax - ti # time left to dtmax
        t_next, ti_next, x_next = t + dt2DT, 0, x + dt2DT * f(x)
        ts = vstack([ts,t_next])
        xs = vstack([xs,x_next])
        t, ti, x = t_next, ti_next, x_next
    return (dts, ts, xs.T)

### Intérêt de la méthode

Cette méthode permet d'aller aussi vite qu'un schéma d'euler explicit classique sur des zones "faciles" de la solution à approximer, et prend des pas de temps plus petits pour des zones plus sensibles. Nous allons illustrer cela sur les exemples suivants. Ils sont construits de la manière suivante: en haut se trouve le pas de temps interne choisi entre deux évaluations de la solution (entre $t_i$ et $t_{i+1}$) en bas on trouve la solution approximée et la vraie solution.

#### Variation du pas de temps

Comment faire varier le pas en utilisant le fait que $e^{j+1} = O(\Delta t^2)$ (voir annexe calculs) ?  
Nous n'avons pas réussi à justifier la méthode employée avec seulement cette hypothèse. Mais si on fait l'hypothèse que $e^{j+1} = C\Delta t^2 + O(\Delta t^3)$ avec $C \in \mathbb{R}$  
On a alors $e^{j+2} = C\Delta t_{new}^2 + O(\Delta t_{new}^3)$  
Avec $C = \frac{e^{j+1}}{\Delta t^2} + O(\Delta t)$  
Donc $e^{j+2} = \frac{e^{j+1}}{\Delta t^2}\Delta t_{new}^2 + O(\Delta t\Delta t_{new}^2) + O(\Delta t_{new}^3)$  
Et $\Vert \frac{e^{j+1}}{\Delta t^2}\Delta t_{new}^2 \Vert \leqslant TOL_{abs} \Leftrightarrow \boxed{\Delta t_{new} \leqslant \Delta t \sqrt{\frac{TOL_{abs}}{\Vert e^{j+1} \Vert}}}$  
On passerait alors d'une erreur d'ordre 2 à une erreur d'ordre 3 en le pas de temps, ce qui justifierait la méthode de variation du pas de temps implémentée.

#### Cosinus

On voit dans l'exemple suivant que le pas de temps choisi est stationnaire (en zoomant on le voit bien). Or on voit que l'erreur d'approximation du cosinus s'amplifie, ce qui veut dire que l'algorithme ne se "rend pas compte" que l'erreur grandit. Nous avons donc imposé une tolérance acceptée en fonction du nombre de points que l'on va echantilloné, en se servant de la propriété de l'algorithme.

![image](tests/IVP/cos_1.png)

Nous avons testé la fonction pour deux valeurs différentes valeurs $a_{tol}$ ($10^{-6}$ ci-dessus et $6*10^{-10}$ ci-dessous, la seconde valant $\frac{10^{-6}}{nb_{points}}$), Ce qui donne lieu à des pas de temps choisis différents. On voit par exemple qu'il varie ici entre 2.5 et 5 en logarithme en fonction de l'erreur choisie.
L'erreur accumulée chute alors fortement ! Elle passe de l'ordre de 0.1 à l'ordre de 0.001.
On voit d'ailleurs par ce biais que l'algorithme IVP ne garantit pas que le seuil de tolérance $a_{tol}$ soit toujours respecté entre deux points d'échantillonage de la solution (entre $t_i$ et $t_{i+1}$). 
En effet, l'algorithme est censé avoir comme propriété le fait que si $x^{i}$ est la vraie solution au temps $t_i$ alors l'erreur absolue au temps $t_{i+1}$ est inférieure à $a_{tol}$. Ceci est censé garantir (par récurrence) que $||x(t_i)-x^{i}|| \leq i*a_{tol}$.
Pourtant, notre $a_{tol}$ était choisi de telle sorte à ce que si cette propriété était vérifiée, on aurait toujours une erreur d'approximation absolue inférieure à $10^{-6}$, ce qui n'est pas le cas.

![image](tests/IVP/cos_2.png)

#### Exponentielle

L'exponentielle est un cas intéressant car l'on s'attend à ce que le pas de temps choisi diminue en continu, car l'erreur calculée par l'algorithme augmentera nécessairement du fait de l'augmentation de $f$, la dérivée de $x$.
Les résultats sont en accord avec cela, l'algorithme est de plus en plus lent et on voit bien l'évolution linéaire du temps choisi en logarithme (donc exponentielle sans l'application du logarithme !). Cependant, l'erreur absolue (entre la vraie solution et celle qui est simulée) reste de l'ordre de 0.01 à la fin de la simulation.

![image](tests/IVP/exp.png)

#### Carre

La fonction carré donne les mêmes résultats que la fonction cosinus. On obtient encore un pas de temps choisi stationnaire et une erreur absolue d'approximation croissante.

![image](tests/IVP/carre.png)

### Annexe calculs :

Tout d'abord on peut écrire plus clairement la formule qui est en fait : $e^{j+1} = (x^j + \int_{t_{j}}^{t_{j+1}} f(s,\tilde x(s)) ds) - x^{j+1}\\
$  
Où $\tilde x$ est la solution de :

$  \begin{equation}
\left\lbrace
\begin{array}{}
\dot{\tilde x}(t) = f(t,x)\\
\tilde x(t_j) = x^{j}\\
\end{array}\right.
\end{equation}\\
e^{j+1} = (x^j + \int_{t_{j}}^{t_{j+1}} f(s,\tilde x(s)) ds) - x^{j+1} \\
= (x^j + \tilde x(t_{j+1}) - \tilde x(t_j)) - (x^j + \int_{t_{j}}^{t_{j+1}} f(t_j,x^j) ds)) \\
= \tilde x(t_{j+1}) - \tilde x(t_j) - \Delta t f(t_j,x^j) \\
\text{Et en utilisant un développement de Taylor à l'ordre 2 sur } \tilde x \text{ car } f \in \mathcal{C}^1 (\mathbb{R}x\mathbb{R}^m,\mathbb{R}^m) \, et \, donc \, \tilde x \in \mathcal{C}^2 (\mathbb{R}^n,\mathbb{R}^m) \, : \\
= \dot{\tilde x}(t_j)\Delta t + \frac{\ddot{\tilde x}(t_j)}{2}\Delta t^2- \Delta t f(t_j,x^j) + O(\Delta t ^3) \\
= f(t_j,\tilde x(t_j))\Delta t + \frac{\partial f}{\partial t}(t_j,\tilde x(t_j))\frac{\Delta t^2}{2} +f(t_j,\tilde x(t_j))\frac{\partial f}{\partial x}(t_j,\tilde x(t_j))\frac{\Delta t^2}{2}- \Delta t f(t_j,x^j) + O(\Delta t ^3) \\
= \frac{\partial f}{\partial t}(t_j,\tilde x(t_j))\frac{\Delta t^2}{2} + f(t_j,\tilde x(t_j))\frac{\partial f}{\partial x}(t_j,\tilde x(t_j))\frac{\Delta t^2}{2} + O(\Delta t ^3)\\
= \frac{\partial f}{\partial t}(t_j,x^j)\frac{\Delta t^2}{2} + f(t_j,x^j)\frac{\partial f}{\partial x}(t_j,x^j) + O(\Delta t ^3)\\
\text{Or en utilisant un développement de Taylor à l'ordre 1 sur } f \text{ car } f \in \mathcal{C}^1 (\mathbb{R}x\mathbb{R}^m,\mathbb{R}^m) \, : \\
f(t_{j+1},x^{j+1}) = f(t_j,x^j) + \Delta t \frac{\partial f}{\partial t}(t_j,\tilde x(t_j)) + (x^{j+1} - x^j)\frac{\partial f}{\partial x}(t_j,x^j) + O(\Delta t^2)\\
= f(t_j,x^j) + \Delta t \frac{\partial f}{\partial t}(t_j,\tilde x(t^j)) + \Delta t f(t_j,x^j)\frac{\partial f}{\partial x}(t_j,x^j) + O(\Delta t^2) \; \; \; \; \; \; \; \; \; \; \; \; \text{(E1)}\\
\text{Donc } f(t_j,x^j)\frac{\partial f}{\partial x}(t_j,x^j)\frac{\Delta t^2}{2} = f(t_{j+1},x^{j+1})\frac{\Delta t}{2} - f(t_j,x^j)\frac{\Delta t}{2} - \frac{\partial f}{\partial t}(t_j,\tilde x(t_j)) \frac{\Delta t^2}{2} + O(\Delta t ^3)\\
\text{Donc } e^{j+1} = f(t_{j+1},x^{j+1})\frac{\Delta t}{2} - f(t_j,x^j)\frac{\Delta t}{2} + O(\Delta t ^3) \\
= \frac{\Delta t}{2}(f(t_{j+1},x^{j+1}) - f(t_j,x^j)) + O(\Delta t ^3)\\
\text{Et enfin par inégalité triangulaire : } \vert \Vert e^{j+1} \Vert - \Vert \frac{\Delta t}{2}(f(t_{j+1},x^{j+1}) - f(t_j,x^j)) \Vert \vert \leqslant \Vert e^{j+1} - \frac{\Delta t}{2}(f(t_{j+1},x^{j+1}) - f(t_j,x^j)) \Vert = O(\Delta t ^3) \\
\text{Donc : } \boxed{\Vert e^{j+1} \Vert = \frac{\Delta t}{2} \Vert (f(t_{j+1},x^{j+1}) - f(t_j,x^j)) \Vert + O(\Delta t ^3)}\\
\text{D'après (E1) : } (f(t_{j+1},x^{j+1}) - f(t_j,x^j)) = O(\Delta t) \\
\text{Et donc } \boxed{e^{j+1} = O(\Delta t^2)}$
