## Imports

In [43]:
import numpy as np
from math import sqrt
from scipy import linalg as lg

## Gauss-Seidel
a.

In [25]:
def gaussseidel(A, b, N, eps, x0):
    """
        Compute the Gauss-Seidel algorithm to resolve the equation Ax = b.
        
        Parameters:
            A: matrix A
            b: vector b
            N: maximum number if iterations
            eps: precision used to stop the test
            x0: initial vector to start the algorithm
            
        Returns:
            If the algorithm converges:
                x: found solution
                i: number of iterations to converge
            Else:
                None
    """
    n = A.shape[0]
    
    for i in range(N):
        x = np.zeros(b.shape)
        
        for k in range(n):
            x[k] = (b[k] - np.sum(np.multiply(A[k,:k], x0[:k])) - np.sum(np.multiply(A[k,k + 1:], x0[k + 1:]))) / A[k, k]
        
        if np.linalg.norm(x - x0) / np.linalg.norm(x) < eps:
            return x, i + 1
        
        x0 = x
    
    print('Error: the Algorithm couldn\'t converge.')
    return None, None

In [9]:
from scipy.sparse import diags

# Generate A and b
A = diags([1, 3, 1], [-1, 0, 1], shape=(10, 10), dtype=int).toarray()
print(A)

b = np.array([1, ] * 10)
b

[[3 1 0 0 0 0 0 0 0 0]
 [1 3 1 0 0 0 0 0 0 0]
 [0 1 3 1 0 0 0 0 0 0]
 [0 0 1 3 1 0 0 0 0 0]
 [0 0 0 1 3 1 0 0 0 0]
 [0 0 0 0 1 3 1 0 0 0]
 [0 0 0 0 0 1 3 1 0 0]
 [0 0 0 0 0 0 1 3 1 0]
 [0 0 0 0 0 0 0 1 3 1]
 [0 0 0 0 0 0 0 0 1 3]]


array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

b.(i): Pour que la méthode de Gauss-Seidel converge, il faut que A soit symétrique définie positive. 

A est symétrique, car tridiagonale.
Pour qu'elle soit définie positive, il faut que toutes ses valeurs propres soient strictement positives. Vérifions cela avec la fonction `eig` de la libraire numpy.

In [30]:
eig, _ = np.linalg.eig(A)
eig

array([1.08101405, 1.31749293, 1.69027853, 2.16916997, 2.71537032,
       3.28462968, 4.91898595, 4.68250707, 4.30972147, 3.83083003])

Elles sont bien toutes strictement positives. On peut donc utiliser la méthode de Gauss-Seidel.

b.(ii):

In [27]:
x, i = gaussseidel(A, b, 500, 1e-9, b)
print(f'The solution is {x}, number of iterations is {i}')

The solution is [0.27638191 0.17085427 0.21105528 0.1959799  0.20100503 0.20100503
 0.1959799  0.21105528 0.17085427 0.27638191], number of iterations is 52


In [28]:
np.dot(A, x)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

On trouve la bonne solution. Essayons avec la méthode de Cholesky, avec les fonctions du TP1 :

In [41]:
def triang_inf(T,b):
    """calcule x selon l'équation Tx=b avec T une matrice triangulaire inférieure et b un vecteur connu
    Return:
        x: vecteur solution de l'équation
    """
    n = T.shape[0]
    x = np.zeros((n, 1))

    for k in range(n):
        x[k] = (b[k] - np.sum(np.multiply(T[k], np.transpose(x)))) / T[k,k]
    
    return x

def triang_sup(T,b):
    """calcule x selon l'équation Tx=b avec T une matrice triangulaire supérieure et b un vecteur connu
    Return:
        x: vecteur solution de l'équation
    """
    n = T.shape[0]
    x = np.zeros((n, 1))

    for k in range(n - 1 , -1, -1):
        x[k] = (b[k] - np.sum(np.multiply(T[k], np.transpose(x)))) / T[k,k]
    
    return x

def cholesky(A):
    """ calcule la matrice C correspondant à la 
        décomposition de cholesky d'une matrice A
        A doit etre une matrice symétrique positive définie
    """
    n = A.shape[0]
    C = np.zeros((n,n))
    
    C[0,0] = sqrt(A[0,0])
    C[1:,0] = A[1:,0] / C[0,0]
    
    for j in range(1,n):
        for i in range(j+1):
            tmp_sum = np.sum(np.multiply(C[i,:i],C[j,:i]))
            
            #diagonal coefs
            if i == j:
                C[j,i] = sqrt( (A[i,j] - tmp_sum ) ) # j > 1
            else:
            #other
                C[j,i] = (A[i,j] - tmp_sum ) / (C[i,i])  
    return C

C = cholesky(A)

y = triang_inf(C, b)

x = triang_sup(np.transpose(C), y)
x

array([[0.27638191],
       [0.17085427],
       [0.21105528],
       [0.1959799 ],
       [0.20100503],
       [0.20100503],
       [0.1959799 ],
       [0.21105528],
       [0.17085427],
       [0.27638191]])

In [42]:
np.dot(A, x)

array([[1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.]])

On trouve la même solution.

c. Essayons trois méthodes de résolution : avec la décomp LU, Cholesky et Gauss-Seidel. Regardons le temps pris par chaque méthode et comparons.

In [61]:
def decomp_lu(A):
    """ Calcule la décomposition LU d'une matrice carré inversible A
    """
    n = A.shape[0]
    
    L = np.zeros((n,n))
    U = np.zeros((n,n))
    
    # 1ere ligne de U = 1ere ligne de A
    U[0] = A[0]
        
    # 1ere colonne de L = 1ere colonne de A
    L[:,0] = A[:,0] / U[0,0]
    
    for i in range(1, n):
        L[i,i] = 1
        U[i,i] = A[i,i] - np.sum(np.multiply(L[i,:i], U[:i,i]))
        
        for j in range(i + 1, n):
            U[i,j] = A[i,j] - np.sum(np.multiply(L[i,:i], U[:i,j]))
            L[j,i] = (A[j,i] - np.sum(np.multiply(L[j,:i], U[:i,i]))) / U[i,i]
        
    return L,U

def res_LU(A, b):
    """ Resolution of Ax = b with the decomp LU method. """
    L, U = decomp_lu(A)
    
    # Triang inf to resolve Ly = b
    y = triang_inf(L, b)
    
    # Triang sup to resolve Ux = y
    x = triang_sup(U, y)
    
    return x

def res_Chol(A, b):
    """ Resolution of Ax = b with Cholesky's method. """
    C = cholesky(A)

    y = triang_inf(C, b)

    x = triang_sup(np.transpose(C), y)
    
    return x

In [62]:
%timeit res_LU(A, b)

1.79 ms ± 8.63 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [55]:
%timeit res_Chol(A, b)

1.32 ms ± 21.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [58]:
%timeit gaussseidel(A, b, 500, 1e-3, b)

6.28 ms ± 59.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


La magic function `%timeit` nous permet de mesurer le temps pris en moyenne par chaque fonction.

On voit que la plus rapide est la méthode de Choleski. Cependant, si on augmente la taille de la matrice A, Gauss-Seidel devrait être plus rapide.

In [67]:
# Generate A and b
n = 100
A = diags([1, 3, 1], [-1, 0, 1], shape=(100, 100), dtype=int).toarray()

b = np.array([1, ] * 100)

In [68]:
%timeit res_LU(A, b)

171 ms ± 905 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [69]:
%timeit res_Chol(A, b)

86.8 ms ± 7.4 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [70]:
%timeit gaussseidel(A, b, 500, 1e-3, b)

64.8 ms ± 792 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


En augmentant la dimension de la matrice A à 100x100, on voit bien que la méthode indirecte est plus rapide.