# Résolution de systèmes linéaires

Nous considérons le système linéaire
$$
Ax = b
$$
où $A \in \mathbb{R}^{n \times n}$, $b \in \mathbb{R}^n$, et nous cherchons à déterminer le vecteur $x \in \mathbb{R}^n$. Nous supposons de plus que le rang de $A$ vaut $n$.

In [None]:
using LinearAlgebra
using BenchmarkTools

## Élimination de Gauss (algorithme naïf)

Adapté de https://lemesurierb.people.charleston.edu/introduction-to-numerical-methods-and-analysis-julia/docs/linear-equations-1-row-reduction.html

Considérons de système
$$
\begin{pmatrix}
4 & 2 & 7 \\ 3 & 5 & -6 \\ 1 & -3 & 2
\end{pmatrix}
x =
\begin{pmatrix}
2 \\ 3 \\ 4
\end{pmatrix}
$$
Nous pouvons définir $A$ et $b$ comme suit.

In [None]:
A = [4.0 2.0 7.0; 3.0 5.0 -6.0; 1.0 -3.0 2.0];
b = [2.0; 3.0; 4.0];

Nous pouvons résoudre le système directement en Julia comme suit:

In [None]:
x = A\b

La stratégie de base de la réduction de ligne ou de l'élimination de Gauss se décrit comme suit:
- Choisir une équation et isoler une variable en l'éliminant de toutes les autres équations non encore considérées;
- Répétez, de manière récursive, sur les équations restantes pour éliminer progressivement les inconnues restantes de toutes les autres équations.

On obtient une équation finale à une seule inconnue, dont on peut déduire immédiatement la valeur, et en injectant cette valeur dans les autres équations, on peut répéter le processus pour déterminer toutes les variables, une à une.

La méthode la plus simple, qui cependant ne fonctionnera pas dans tous les cas, consiste à éliminer progressivement la $i^e$ variable de la $i^e$ contrainte, pour $i$ allant de 1 jusque $n$. Cette approche se résume dans le code suivant.

In [None]:
function rowreduce(A, b)
    # On copie A et b pour ne pas modifier la matrice et le vecteur d'origine.
    U = copy(A)
    c = copy(b)
    n = length(b)
    L = zeros(n, n)

    for k in 1:n-1
        for i in k+1:n
            # élimine la variable k des équations k+1 à n
            ℓ = U[i,k] / U[k,k]  # cela suppose U[k,k] différent de 0...
            U[i,k+1:n] -= ℓ * U[k,k+1:n]

            # On met des 0 sous la diagonale principale dans la colonne k de U pour pouvoir l'illustrer.
            U[i,1:k] .= 0.
            # Mise à jour du terme de droite.
            c[i] -= ℓ * c[k]
        end
    end
    
    return (U, c)
end;

In [None]:
(U, c) = rowreduce(A, b)

Autrement dit, on obtient le système
\begin{align*}
4x_1 + 2x_2 + 7x_3 &= 2 \\
3.5x_2 -11.25x_3 &= 1.5 \\
11x_3 &= 5.0
\end{align*}
Il est alors facile de calculer récursivement $x_k$, pour $k$ allant de $n$ à $1$ en décroissant.

In [None]:
for k in n:1
    x[k] = (c[k]-U[k,k+1:n]*x[k+1:n])/U[k,k]
end

In [None]:
x

En pratique, des méthodes plus robustes doivent être employées et il est tentant de travailler en inversant explicitement $A$.

## Temps de calul et inversion

Nous allons créer un matrice test qui nous servira à calculer les temps de calcul en utilisant l'inversion matricielle ou les techniques de factorisation. L'inversion prend $O(n^3)$ opérations, tandis que la factorisation requiert $O(n^2)$ opérations, où $n$ est l'ordre de $A$ et la dimension de $b$ et $x$.

In [None]:
n = 10000

In [None]:
A = zeros(n,n)
for i = 1:n
    A[i,i] = 2.0
end
for i = 1:n-1
    A[i,i+1] = A[i+1,i] = -1.0
end

In [None]:
A

In [None]:
inv(A)

Nous pouvons déjà remarque que $A$ est creuse, alors que son inverse est dense.

Créons le membre de droite du système.

In [None]:
b = ones(n)

Nous résolvons à présent le système avec les deux techniques.

In [None]:
x1 = inv(A)*b

In [None]:
x2 = A\b

Comparons la précision des résultats.

In [None]:
[norm(A*x1-b), norm(A*x2-b)]

Nous voyons que la technique de factorisation est légèremement plus précise.

Comparons les temps d'exécution.

In [None]:
@benchmark inv(A)*b

In [None]:
@benchmark A\b

Nous allons à présent exploiter le caractère creux de $A$.

In [None]:
using SparseArrays

In [None]:
A2 = sparse(A)

In [None]:
inv(A2)

Nous voyons que Julia détecte que l'opération d'inversion serait inefficace au niveau mémoire.

In [None]:
x3 = A2\b

In [None]:
@benchmark A2\b

In [None]:
norm(A*x3-b)

La précision reste similaire au cas dense, mais le temps d'exécution est significativement plus faible.

## Précision des résultats

Nous allons modifier la diagonale de la matrice pour accentuer les résultats.

In [None]:
for i = 1:n
    A[i,i] = 10.0^(-i)
end

A

Nous calculons le système suivant les deux techniques.

In [None]:
x1 = inv(A)*b

In [None]:
x2 = A\b

Calculons aussi en utilisant une matrice creuse.

In [None]:
A2 = sparse(A)

In [None]:
x3 = A2\b

In [None]:
[norm(A*x1-b) norm(A*x2-b) norm(A*x3-b)]

À nouveau, nous voyons que la technique d'inversion donne des résultats moins intéressants.

Le phénonème peut être observé même sur des matrices de petite dimension quand la matrice est presque singulière.

In [None]:
b = [1.0 ; 1.0]
M = [ 1.01 1+10^(-12) ; 1+10^(-12) 1.01 ]

In [None]:
det(M)

In [None]:
x1 = inv(M)*b

In [None]:
x2 = M\b

In [None]:
[ norm(M*x1-b) norm(M*x2-b) ]

L'inversion est un peu moins précise, mais acceptable. Considérons une situation encore plus proche de la singularité.

In [None]:
M = [ 1.0 1+10^(-8) ; 1+10^(-8) 1.0 ]

In [None]:
det(M)

In [None]:
x1 = inv(M)*b

In [None]:
x2 = M\b

In [None]:
[ norm(M*x1-b) norm(M*x2-b) ]

Ici, la précision est nettement meilleure avec la factorisation.

Remarquons en fait qu'inverser une matrice revient à résoudre un système linéaire pour chaque vecteur de la base canonique.

In [None]:
Minv = M\I

In [None]:
x3 = Minv*b

In [None]:
norm(M*x3-b)

On retrouve la même précision qu'avec l'utilisation de la fonction `inv`. En fait, les matrices sont les mêmes!

In [None]:
Minv-inv(M)

Utiliser l'inversion revient donc à effectuer une étape coûteuse de calcul préalable, et à accumuler davantage les erreurs de calcul. De plus, si $A$ est creuse, $A^{-1}$ peut être dense et entraîner des problèmes mémoire.