# Méthodes itératives : methodes de splitting

## La méthode de Jacobi

On remarque que si les éléments diagonaux de $A$ sont non nuls, le système linéaire $A\mathbf{x}=\mathbf{b}$ est équivalent à :

$$
\label{eq}
x_i=\frac{1}{a_{ii}}\left(b_i-\sum_{j=1,j\neq
i}^na_{ij}x_j\right),\,\,\,\,\,i=1,\ldots,n.
$$
Pour une donnée initiale $\mathbf{x}^{(0)}$ choisie, on calcule $\mathbf{x}^{(k+1)}$ par

$$
\label{jac}
x_i^{(k+1)}=\frac{1}{a_{ii}}\left(b_i-\sum_{j=1,j\neq i}^na_{ij}x_j^{(k)}\right)
,\,\,\,\,\,i=1,\ldots,n.
$$
Cela permet d&#8217;identifier le *splitting* suivant pour $A$ :

$$
P=D,\quad N=D-A=E+F,
$$
où $D$ est la matrice diagonale avec sur la diagonale les éléments diagonaux de $A$, $E$ est la matrice $E=(e_{ij})$ triangulaire inférieure

$$
\begin{cases}
e_{ij}=-a_{ij} &\quad\rm{ si} \,\, i>j\\
e_{ij}=0       &\quad \rm{ si} \,\, i\leq j,
\end{cases}, \quad
E=\begin{bmatrix} 0 &   0 & 0&\ldots &0\\
              -a_{21} &   0  & 0&\ldots &0\\
              -a_{31} & -a_{32} & 0 &\ldots&0 \\
               \vdots     & \vdots    & \ddots & \ddots     & \vdots \\
               -a_{n1}& -a_{n2} & \ldots& -a_{nn-1}& 0
\end{bmatrix}
$$
$F$ est la matrice $F=(f_{ij})$ triangulaire supérieure

$$
\begin{cases}
f_{ij}=-a_{ij} &\quad \rm{ si} \,\, j>i\\
f_{ij}=0       &\quad \rm{ si} \,\, j\leq i.
\end{cases}, \quad
F=\begin{bmatrix} 0 &   -a_{12} & -a_{13}&\ldots &-a_{1n}\\
              0 &   0    & -a_{23}&\ldots &-a_{2n}\\
              0 &    0 & 0    &\ddots  & \vdots  \\
               \vdots     & \vdots    & \ddots & \ddots     & -a_{n-1n} \\
               0& 0 & \ldots& 0& 0
\end{bmatrix}
$$
On a alors que $A=D-(E+F)$.
$B_J$ et $g$ de la méthode de Jacobi sont données par :

$$
B_J = D^{-1}(E+F)=I-D^{-1}A, \quad g_J = D^{-1}\mathbf{b}.
$$

## La méthode de Gauss-Seidel

Pour cette méthode on a

$$
\label{gs}
x_i^{(k+1)}=\frac{1}{a_{ii}}\left(b_i-\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)}-
\sum_{j=i+1}^na_{ij}x_j^{(k)}\right)
,\,\,\,\,\,i=1,\ldots,n.
$$
Dans ce cas, le *splitting* de $A$ est

$$
P=D-E,\,\,\,N=F,
$$
et donc la matrice d&#8217;itération et $g$  sont données par

$$
B_{GS} = (D-E)^{-1}F,\quad g_{GS} = (D-E)^{-1}\mathbf{b}.
$$

## La méthode de relaxation SOR (Successive over-relaxation)

Pour un paramètre $\omega$ (dit de *relaxation*), on définit

$$
\label{sor}
x_i^{(k+1)}=\frac{\omega}{a_{ii}}\left(b_i-\sum_{j=1}^{i-1}a_{ij}x_j^{(k+1)}-
\sum_{j=i+1}^na_{ij}x_j^{(k)}\right)+(1-\omega)x_i^{(k)}
,\,\,\,\,\,i=1,\ldots,n.
$$
Cela se traduit par la relation

$$
x_i^{(k+1)}=\omega x_{i,GS}^{(k+1)}+ (1-\omega)x_{i}^{(k)},
$$
où $x_{i,GS}^{(k+1)}$ et la valeur de la $i$-ème composante qu&#8217;on obtient en utilisant la formule [[eq7]](#eq7).
Cette méthode s&#8217;écrit sous forme vectorielle comme

$$
(I-\omega D^{-1}E)\mathbf{x}^{(k+1)}=
  [(1-\omega)I+\omega D^{-1}F]\mathbf{x}^{(k)}+\omega D^{-1}\mathbf{b},
$$
d&#8217;où la matrice d&#8217;itération $B(\omega)$ et $g(\omega)$

$$
B(\omega)=(I-\omega D^{-1}E)^{-1}[(1-\omega)I+\omega D^{-1}F], \quad g(\omega) = \omega D^{-1}\mathbf{b}.
$$
Cette méthode coïncide pour $\omega=1$ avec la méthode de Gauss-Seidel.
*Note:* Si $\omega\in(0,1)$ la méthode est dite de *sous-relaxation* tandis que si $\omega>1$ elle est appelée de *sur-relaxation*.

## Quelques résultats de convergence

On a les résultats suivants.
Théorème: Condition suffisante pour la convergence de la méthode de Jacobi et Gauss-Seidel
Si $A$ est une ***matrice à diagonale dominante stricte par lignes***, alors les méthodes de Jacobi et de Gauss-Seidel sont convergentes.
*Preuve*\
* **Cas de Jacobi**\
La matrice $A$ étant à diagonale dominante stricte, on a par définition $\displaystyle  \forall 1\leq i\leq n,\quad|a_{ii}|>\sum_{j\neq
i}|a_{ij}|$. Par conséquent,

  
$$
\|B_J\|_{\infty}=\max_{i}\sum_{j}|b_{ij}|=\max_{i}\sum_{j\neq i}\frac{|a_{ij}|}{|a_{ii}|} < 1
$$

  et comme $\rho(B_J)\leq\|B_J\|_{\infty} <1$ on obtient la convergence de la méthode de Jacobi. $\Box$


*Théorème : Condition suffisante pour la convergence de la méthode de Gauss-Seidel*\
Si $A$ est une ***matrice symétrique définie positive***, alors la méthode de Gauss-Seidel converge de manière monotone pour la norme $\| \cdot \|_A$ (la méthode de Jacobi pas forcément).
*Preuve*\
Voir le Théorème 4.5 du livre de Quarteroni et Sacco, p. 121. $\Box$
*Théorème : Condition nécessaire et condition suffisante pour la convergence de la méthode SOR*\

1. Une *condition nécessaire* pour assurer la convergence de la méthode SOR est que $0<\omega<2$.
1. Si $A$ est une ***matrice symétrique définie positive***, alors une telle *condition est aussi suffisante* pour la convergence.

*Preuve*\
En effet, comme latexmath:[B(\omega)=(I-\omega
D{-1}E){-1}[(1-\omega)I+\omega D^{-1}F]], on tire que


$$
\det B(\omega)=\underbrace{\det(I-\omega D^{-1}E)^{-1}}_{\displaystyle=1}\det[(1-\omega)I+\omega D^{-1}F]=(1-\omega)^n
$$

Ainsi, en notant avec $\lambda_i$ les valeurs propres de $B(\omega)$, on obtient que


$$
|\lambda_{max}|^n\geq|\prod_{i=1}^n\lambda_i|=|1-\omega|^n
$$

ce qui donne que $\rho(B(\omega))\geq |\omega -1|$. Donc si la méthode converge on a $|\omega -1|<1$, soit donc $0<\omega<2$. $\Box$
*Théorème: paramètre optimal pour SOR*\

1. Si $A$ est à **diagonale dominante stricte**, alors la méthode SOR converge si $0<\omega\leq 1$.
1. Dans le cas particulier où $A$ est **symétrique définie positive et tridiagonale**, alors le paramètre $\omega$ optimal pour la méthode SOR est donné par :



$$
\label{omegaopt}
\omega_{opt}=\frac{2}{1+\sqrt{1-\rho(B_J)^2}}.
$$
## Implémentations en {python}

## Jacobi

Voici deux implémentations de la méthode de Jacobi en {python}.


In [0]:
Unresolved directive in 3-splitting.adoc - include::example$tan/syslin/jacobi.py[]



1. nous implémentons `jacobi1` en  utilisant <<eq:2>>
2. nous implémentons `jacobi2` en utilisant la forme algébrique <<eq:3>> de stem:[B_J] et stem:[g_J]
3. nous appliquons la méthode itérative pour calculer les itérés.## Gauss-Seidel

Voici deux implémentations de la méthode de Gauss-Seidel en {python}.


In [0]:
Unresolved directive in 3-splitting.adoc - include::example$tan/syslin/gauss_seidel.py[]



1. nous utilisons `scipy.linalg.solve_triangular` pour résoudre le système triangulaire inférieur associé à la méthode de Gauss-Seidel stem:[(D-E)^{-1}]
2. nous implémentons `gauss_seidel1` en  utilisant <<eq7>>
3. nous implémentons `gauss_seidel2` en utilisant la forme algébrique <<eq8>>## SOR

Voici deux implémentations de la méthode de relaxation SOR en {python}.


In [0]:
Unresolved directive in 3-splitting.adoc - include::example$tan/syslin/sor.py[]



1. nous utilisons `scipy.linalg.solve_triangular` pour résoudre les systèmes triangulaire.
2. nous implémentons `sor1` en  utilisant <<eq:sor:1>>
3. nous implémentons `sor2` en utilisant la forme algébrique <<eq:sor:2>>
4. dans le cas de `sor2` nous utilisons la fonction `solve_triangular` de la bibliothèque `scipy.linalg` pour résoudre le système triangulaire.## Exemples

Dans les sections suivantes nous utiliserons les matrices suivantes :
*Exemple 1*\
Soit $A$ une matrice à diagonale dominante stricte par ligne


$$
A=\begin{pmatrix}
5 & 1 & 1 & -1 \\
1 & 5 & 1 & -2 \\
1 & 1 & 6 & 1 \\
-1 & 2 & 1 & 7
\end{pmatrix}.
$$

On a alors :


$$
D=\begin{pmatrix}
5 & 0 & 0 & 0 \\
0 & 5 & 0 & 0\\
0 & 0 & 6 & 0\\
0 & 0 & 0 & 7
\end{pmatrix},
\quad
E=\begin{pmatrix}
0 & 0 & 0 & 0 \\
-1 & 0 & 0 & 0\\
-1 & -1 & 0 & 0\\
1 & -2 & -1 & 0
\end{pmatrix},
\quad
F=\begin{pmatrix}
0 & -1 & -1 & 1 \\
0 & 0 & -1 & -2\\
0 & 0 & 0 & -1\\
0 & 0 & 0 & 0
\end{pmatrix}.
$$

Pour extraire de la matrice $A$ les trois matrices $D$, $E$ et $F$ en Python on utilise le code suivant :


In [0]:
D=np.diag(np.diag(A))
E=-(np.tril(A),-1)
F=-(np.triu(A),1)


Nous avons donc


In [0]:
import numpy as np

# A est a diagonale dominante stricte

A=np.array([[5, 1, 1, -1],
            [1, 5, 1, -2],
            [1, 1, 6, 1],
            [-1, 2, 1, 7]])

# Extract the diagonal of A
D = np.diag(np.diag(A))

# Extract the lower triangular part of A and subtract D
E = -np.tril(A,-1)

# Extract the upper triangular part of A and subtract D
F = -np.triu(A,1)

print("D:\n", D)
print("E:\n", E)
print("F:\n", F)
# we compute the iteration matrix
B = np.linalg.inv(D).dot(E+F)
print("B:\n", B)
# we compute the spectral radius of B
rho = np.max(np.abs(np.linalg.eigvals(B)))
print("rho:\n", rho)


Considérons à présent une matrice $A_{sdp}$ symétrique définie positive.
Soit la matrice $A$ suivante :


$$
A_{sdp}=\begin{pmatrix}
5 & 1 & 1 & -1 \\
1 & 5 & 2 & 0.5\\
1 & 2 & 4 & 1\\
-1 & 0.5 & 1 & 6
\end{pmatrix}.
$$

Vérifions que $A$ est symétrique définie positive.


In [0]:
A_sdp = np.array([[5, 1, 1, -1],
              [1, 5, 2, 0.5],
              [1, 2, 4, 1],
              [-1, 0.5, 1, 6]])
# verifions qu'elle est s.d.p
sdp  = np.allclose( A_sdp, A_sdp.T )
sdp &= np.all( np.linalg.eigvals(A_sdp) > 0 )
print(f"A_sdp est symétrique définie positive: {sdp}")
assert sdp == True

D_sdp = np.diag(np.diag(A_sdp))
E_sdp = -np.tril(A_sdp,-1)
F_sdp = -np.triu(A_sdp,1)


Dans ce qui suit nous vérifions systématiquement le rayon spectrale, grâce à fonction suivante:


In [0]:
def spectral_radius(B):
    rho = np.max(np.abs(np.linalg.eigvals(B)))
    return rho

def is_convergent(B):
    rho = spectral_radius(B)
    return rho < 1


## Jacobi

Nous pouvons maintenant appliquer la méthode de Jacobi pour résoudre le système $A\mathbf{x}=\mathbf{b}$.
Considérons la première matrice $A$ de l&#8217;exemple [[ex:1]](#ex:1).


In [0]:
import numpy as np
from tan.syslin.jacobi import jacobi1,jacobi2
import time

# vérifions le rayon spectral
B_J = np.linalg.inv(D).dot(E+F)
print(f"Jacobi converge: {is_convergent(B_J)}")

# testons les méthodes de Jacobi
for jacobi in [jacobi1,jacobi2]:
    print(f"\n** jacobi={jacobi.__name__}")
    t = time.time()
    [x_j, niter_j, inc_j] = jacobi(A, np.ones(4), np.zeros(4), 1e-6, 100)
    t_end = time.time()
    print(f"time={t_end-t:.3e}s")
    print(f"x_j:\n{x_j}")
    print(f"niter_j:\n{niter_j}")
    print(f"inc_j:\n{inc_j}")


## Gauss-Seidel

Appliquer la méthode Gauss-Seidel pour résoudre le système $A\mathbf{x}=\mathbf{b}$.


In [0]:
import numpy as np
from tan.syslin.gauss_seidel import gauss_seidel1, gauss_seidel2
import time

B_GS = np.linalg.inv(D-E).dot(F)
print(f"Gauss-Seidel converge: {is_convergent(B_GS)}")

for gauss_seidel in [gauss_seidel1, gauss_seidel2]:
    print(f"\n** gauss_seidel={gauss_seidel.__name__}")
    t = time.time()
    [x_gs, niter_gs, inc_gs] = gauss_seidel(A, np.ones(4), np.zeros(4), 1e-6, 100)
    t_end = time.time()
    print(f"time={t_end-t:.3e}s")
    print(f"x_gs:\n{x_gs}")
    print(f"niter_gs:\n{niter_gs}")
    print(f"inc_gs:\n{inc_gs}")


## SOR

On applique la méthode SOR pour résoudre le système latexmath :[A\mathbf{x}=\mathbf{b}].

Dans un premier temps nous prenons une valeur de $\omega < 1$ (sous relaxation)


In [0]:
import numpy as np
import scipy.linalg
from tan.syslin.sor import sor1,sor2
import time

omega = 0.9
invD = np.diag(1./np.diag(D))
B_SOR = scipy.linalg.solve_triangular(np.eye(len(A))-omega*invD@E,(1-omega)*np.eye(len(A))+omega*invD@F, lower=True)
print(f"SOR converge: {is_convergent(B_SOR)}")

for sor in [sor1,sor2]:
    print(f"\n** sor={sor.__name__}")
    t = time.time()
    [x_sor, niter_sor, inc_sor] = sor(A, np.ones(4), np.zeros(4), omega=0.9, tol=1e-6, maxiter=100)
    t_end = time.time()
    print(f"time={t_end-t:.3e}s")
    print(f"x_sor:\n{x_sor}")
    print(f"niter_sor:\n{niter_sor}")
    print(f"inc_sor:\n{inc_sor}")


Puis, nous prenons une valeur de $\omega > 1$ (sur relaxation)


In [0]:
omega = 1.1
invD = np.diag(1./np.diag(D))
B_SOR = scipy.linalg.solve_triangular(np.eye(len(A))-omega*invD@E,(1-omega)*np.eye(len(A))+omega*invD@F, lower=True)
print(f"SOR converge: {is_convergent(B_SOR)}")

for sor in [sor1,sor2]:
    print(f"\n** sor={sor.__name__}")
    t = time.time()
    [x_sor_sur, niter_sor_sur, inc_sor_sur] = sor(A, np.ones(4), np.zeros(4), omega=1.1, tol=1e-6, maxiter=100)
    t_end = time.time()
    print(f"time={t_end-t:.3e}s")
    print(f"x_sor_sur:\n{x_sor_sur}")
    print(f"niter_sor_sur:\n{niter_sor_sur}")
    print(f"inc_sor_sur:\n{inc_sor_sur}")


*Note:* dans les deux cas (sur et sous relaxation) avec $0 < \omega < 2$, la méthode SOR converge.

Nous pouvons comparer l&#8217;ensemble des méthodes, jacobi, gauss-seidel et sor pour l&#8217;exemple donné, tracons avec `plotly` les incréments en fonction du nombre d&#8217;itérations en mode `semilogy`


In [0]:
import plotly.graph_objects as go

fig = go.Figure()
fig.add_trace(go.Scatter(x=np.arange(niter_j + 1), y=inc_j, mode='lines+markers', name='Jacobi'))
fig.add_trace(go.Scatter(x=np.arange(niter_gs + 1), y=inc_gs, mode='lines+markers', name='Gauss-Seidel'))
fig.add_trace(go.Scatter(x=np.arange(niter_sor + 1), y=inc_sor, mode='lines+markers', name='SOR sous relaxation'))
fig.add_trace(go.Scatter(x=np.arange(niter_sor_sur + 1), y=inc_sor_sur, mode='lines+markers', name='SOR sur relaxation'))
fig.update_layout(title='Incréments en fonction du nombre d\'itérations', xaxis_title='Nombre d\'itérations', yaxis_title='Incrément',yaxis_type="log")
fig.show()


Testons à présent le cas où la condition nécessaire n&#8217;est pas vérifiée, i.e $\omega > 2$ (sur relaxation) afin de vérifier [la condition nécessaire $0 < \omega < 2$](#thm:3)


In [0]:
omega = 2.1
invD = np.diag(1./np.diag(D))
B_SOR = scipy.linalg.solve_triangular(np.eye(len(A))-omega*invD@E,(1-omega)*np.eye(len(A))+omega*invD@F, lower=True)
print(f"SOR converge: {is_convergent(B_SOR)}")

for sor in [sor1,sor2]:
    print(f"\n** sor={sor.__name__}")
    t = time.time()
    [x_sor, niter_sor, inc_sor] = sor(A, np.ones(4), np.zeros(4), omega=2.1, tol=1e-6, maxiter=100)
    t_end = time.time()
    print(f"time={t_end-t:.3e}s")
    print(f"x_sor:\n{x_sor}")
    print(f"niter_sor:\n{niter_sor}")
    print(f"inc_sor:\n{inc_sor}")


*Note:* dans ce cas la méthode SOR doit diverger, c&#8217;est effectivement le cas.

Considérons, à présent, une matrice symétrique définie positive afin de vérifier que dans ce cas [la condition $0 < \omega < 2$](#thm:3) est nécessaire et suffisante pour la convergence de la méthode SOR.

Vérifions que la méthode SOR converge pour un échantillonage de $]0,2[$


In [0]:
omegas=np.logspace(1e-2,1.99,20)
ok = True
for omega in omegas:
    # testons les méthodes SOR pour omega
    for sor in [sor1]:
        t = time.time()
        [x_sor, niter_sor, inc_sor] = sor(A, np.ones(4), np.zeros(4), omega=1.1, tol=1e-6, maxiter=100)
        t_end = time.time()
        ok &= (inc_sor[-1] < 1e-6)
assert ok == True
print(f"toutes les méthodes SOR convergent pour omega dans un échantillonage de l'intervalle ]0,2[: {ok}")


*Note:* dans ce cas, la méthode SOR converge.
