# Quelques notions sur les matrices

L’analyse de données repose principalement sur la manipulation d’objets mathématiques aux propriétés particulières. Si effectuer des opérations avec des scalaires nous est familier depuis le plus jeune âge, comme additionner 2 et 3, les réaliser avec des structures de plus haute dimensionnalité à de quoi nous dérouter. Aussi, plutôt que de les comprendre, on préfère déléguer à des bibliothèques spécialisées la responsabilité de la tâche.

Prenons l’exemple simple d’une série de notes :

In [None]:
notes = [12, 7, 9, 14, 16]

Pour obtenir la moyenne des notes, nous appelons la fonction `mean()` du module *statistics* :

In [None]:
from statistics import mean

print(f"La moyenne des notes est de : {mean(notes)}")

Dans ce cas, nous savons tou·tes ce que représente une moyenne arithmétique et utiliser la fonction d’un module spécialisé de Python ne porte pas à conséquence puisque nous sommes capables de la calculer à la main grâce à la formule :

$$
\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i
$$

Où :

- $n$ est le nombre d’éléments dans la série ;
- $x_i$ représente chaque élément individuellement.

In [None]:
mean = 1 * sum(notes) / len(notes)

print(f"La moyenne des notes est de : {mean}")

Qu’en est-il d’une notion moins familère, comme la médiane ? Si l’on nous apprend que la fonction `median()` du module *statistics* permet de l’obtenir immédiatement, nous nous contenterons de l’utiliser afin de répondre à la demande sans forcément connaître le concept qui la sous-tend :

In [None]:
from statistics import median

print(f"La médiane des notes est de : {median(notes)}")

Si l’on ignore que l’obtention de la médiane passe par le tri des données, par leur décompte et par une condition de parité, peut-on assurer que nous en avons la connaissance pleine et entière ? Si l’argument vaut pour une notion comme la médiane, que dire d’une méthode de réduction de la dimensionnalité comme l’ACP quand on ne sait pas décomposer soi-même une matrice en éléments propres ?

Penchons-nous alors sur ces objets que sont les matrices pour se réapproprier la connaissance de certaines méthodes fondamentales en analyse des données.

## Définition

### Une bibliothèque logicielle pour les matrices

Avant de commencer, chargeons *NumPy* (*Numerical Python*), une bibliothèque spécialisée dans la manipulation tableaux multidimensionnels qui est très largement utilisée dans l’ingénierie et dans le milieu scientifique. Elle met notamment à disposition une nouvelle structure de données, le `ndarray` pour *N-dimensional array*.

In [None]:
import numpy as np

### Un peu de vocabulaire

#### Scalaire

Un scalaire est simplement un nombre unidimensionnel ($2$, $-\frac{2}{3}$, $\pi$) faisant partie de l’ensemble $\mathbb{R}$ lorsqu’il est utilisé pour multiplier un vecteur.

#### Vecteur

Un vecteur quant à lui se représente sous la forme d’un tableau unidimensionnel de valeurs :

$$
\begin{pmatrix}
  2 \\
  -\frac{2}{3} \\
  \pi
\end{pmatrix}
$$

Il est constitué d’autant de composantes que de dimensions de l’espace où il se situe. Dans l’exemple précédent, le vecteur se situant dans un espace vectoriel en trois dimensions, il dispose de trois composantes.

#### Matrice

Une matrice se conçoit comme un tableau bidimensionnel de *m* lignes et *n* colonnes servant à enregistrer des valeurs. Elle se note $A \in \mathbb{R}^{m \times n}$. Une matrice $A$ d’ordre $(3, 2)$ se représente par exemple ainsi :

$$
A = \begin{bmatrix}
    2 & 0.667 \\
    -1.432 & 1.81 \\
    0.1 & -2.908
\end{bmatrix}
$$

La méthode `.array()` de *NumPy* prend en entrée une liste de listes pour former une matrice :

In [None]:
A = np.array([
    [2, 0.667],
    [-1.432, 1.81],
    [0.1, -2.908]
])

Il en ressort un objet de type `ndarray` :

In [None]:
type(A)

L’attribut `.shape` permet à tout moment de connaître ses dimensions :

In [None]:
A.shape

#### Tenseur

Un tenseur est une généralisation des vecteurs et des matrices à des dimensions supérieures. Il peut être vu comme un tableau multidimensionnel de valeurs. Un tenseur à trois dimensions se représente comme un empilement de plusieurs matrices, elles-mêmes constituées de plusieurs vecteurs :

$$
\begin{pmatrix}
  \begin{pmatrix}
    \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix},
    \begin{pmatrix} 5 & 6 \\ 7 & 8 \end{pmatrix}
  \end{pmatrix},
  \begin{pmatrix}
    \begin{pmatrix} 9 & 10 \\ 11 & 12 \end{pmatrix},
    \begin{pmatrix} 13 & 14 \\ 15 & 16 \end{pmatrix}
  \end{pmatrix}
\end{pmatrix}
$$

Avec *NumPy*, un tenseur se crée toujours avec la méthode `.array()` :

In [None]:
tensor = np.array([
    [[1, 2], [3, 4]],
    [[5, 6], [7, 8]],
    [[9, 10], [11, 12]]
])

tensor.shape

#### La transposée d’une matrice

De nombreuses équations font appel à la transposée d’une matrice, une manipulation qui consiste simplement à permuter les lignes avec les colonnes :

$$
A = \begin{bmatrix}
    4 & -2 & 0 \\
    -1 & 1 & 3
\end{bmatrix}
\hspace{2em}
A^T = \begin{bmatrix}
    4 & -1 \\
    -2 & 1 \\
    0 & 3
\end{bmatrix}
$$

Avec *Numpy*, on obtient la transposition avec la méthode `.transpose()` ou grâce à la notation abrégée `.T` :

In [None]:
A = np.array([
    [4, -2, 0],
    [-1, 1, 3]
])

A.transpose().T

## Opérations arithmétiques

Les matrices supportent les opérations arithmétiques élémentaires dans la mesure où elles s’appliquent sur des matrices de mêmes dimensions.

### Addition

Prenons deux matrices de dimensions $(2, 3)$ :

$$
A = \begin{bmatrix}
    1 & -2 & 3 \\
    -1 & 2 & 1
\end{bmatrix}
\hspace{2em}
B = \begin{bmatrix}
    -1 & 2 & -2 \\
    0 & -2 & 1
\end{bmatrix}
$$

L’opération revient à additionner un nombre avec celui situé à la même coordonnée dans l’autre matrice :

$$
\begin{align}
    A + B &= \begin{bmatrix}
        1 + (-1) & -2 + 2 & 3 + (-2) \\
        -1 + 0 & 2 + (-2) & 1 + 1
    \end{bmatrix}\\
    &= \begin{bmatrix}
        0 & 0 & 1 \\
        -1 & 0 & 2
    \end{bmatrix}
\end{align}
$$

Vérifions avec Python :

In [None]:
A = np.array([
    [1, -2, 3],
    [-1, 2, 1]
])
B = np.array([
    [-1, 2, -2],
    [0, -2, 1]
])

A + B

### Soustraction

Le principe est identique pour la soustraction :

$$
\begin{align}
    A - B &= \begin{bmatrix}
        1 - (-1) & -2 - 2 & 3 - (-2) \\
        -1 - 0 & 2 - (-2) & 1 - 1
    \end{bmatrix}\\
    &= \begin{bmatrix}
        2 & -4 & 5 \\
        -1 & 4 & 0
    \end{bmatrix}
\end{align}
$$

Vérifions avec Python :

In [None]:
A - B

### Multiplication

Une multiplication élément par élément (produit Hadamard) de deux matrices est une matrice de mêmes dimensions :

$$
\begin{align}
    A * B &= \begin{bmatrix}
        1 \times (-1) & -2 \times 2 & 3 \times (-2) \\
        -1 \times 0 & 2 \times (-2) & 1 \times 1
    \end{bmatrix}\\
    &= \begin{bmatrix}
        -1 & -4 & -6 \\
        0 & -4 & 1
    \end{bmatrix}
\end{align}
$$

Vérifions avec Python :

In [None]:
A * B

### Division

La division suit le même principe :

$$
\begin{align}
    A \div B &= \begin{bmatrix}
        1 \div (-1) & -2 \div 2 & 3 \div (-2) \\
        -1 \div 0 & 2 \div (-2) & 1 \div 1
    \end{bmatrix}\\
    &= \begin{bmatrix}
        -1 & -1 & -1.5 \\
        -\infty & -1 & 1
    \end{bmatrix}
\end{align}
$$

In [None]:
A / B

### Le produit matriciel

Lorsque l’on multiplie deux matrices, on cherche le plus souvent à obtenir le produit matriciel plutôt qu’un produit élément par élément. Cette opération ne peut toutefois se réaliser qu’avec des matrices compatibles.

Pour une matrice de dimensions $(m, n)$ on aura besoin d’une matrice $(n, p)$ où le nombre de colonnes de la première sera égal au nombre de lignes de la seconde :

$$
A = \begin{bmatrix}
    1 & -2 & 3 \\
    -1 & 2 & 1
\end{bmatrix}
\hspace{2em}
B = \begin{bmatrix}
    -1 & 2 \\
    0 & -2 \\
    4 & -1
\end{bmatrix}
$$

L’opération consiste à multiplier la ligne de la matrice $A$ par la colonne de la matrice $B$, puis à additionner les résultats :

$$
\begin{align}
    A \cdot B &= \begin{bmatrix}
        (1 \times -1) + (-2 \times 0) + (3 \times 4) & (1 \times 2) + (-2 \times -2) + (3 \times -1) \\
        (-1 \times -1) + (2 \times 0) + (1 \times 4) & (-1 \times 2) + (2 \times -2) + (1 \times -1)
    \end{bmatrix} \\
    &= \begin{bmatrix}
        -1 + 0 + 12 & 2 + 4 - 3\\
        1 + 0 + 4 & -2 - 4 - 1
    \end{bmatrix} \\
    &= \begin{bmatrix}
    11 & 3 \\
    5 & -7
    \end{bmatrix}
\end{align}
$$

Le produit matriciel d’une matrice $A^{(m, n)}$ avec une matrice $B^{(n, p)}$ donnera une matrice $C^{(m,p)}$.

La méthode de la librairie *Numpy* à invoquer est `.dot()` :

In [None]:
A = np.array([
    [1, -2, 3],
    [-1, 2, 1]
])
B = np.array([
    [-1, 2],
    [0, -2],
    [4, -1],
])

A.dot(B)

Il est à noter que l’opération inverse consistant à obtenir le produit matriciel de $B$ par $A$ ne donnerait pas le même résultat :

In [None]:
B.dot(A)

## Les matrices carrées

### Définition

Une matrice carrée est une matrice particulière dont le nombre de lignes est égal au nombre de colonnes :

$$
A = \begin{bmatrix}
    0 & 1 & 2 \\
    1 & 2 & 0 \\
    2 & 0 & 1
\end{bmatrix}
$$

### La matrice identité

La matrice identité prend la forme d’une matrice carrée dont la diagonale est remplie de 1 quand toutes les autres valeurs sont à 0 :

$$
A = \begin{bmatrix}
    1 & 0 & 0 \\
    0 & 1 & 0 \\
    0 & 0 & 1
\end{bmatrix}
$$

Parmi ses propriétés notables, la matrice identité constitue l’élément neutre pour la multiplication des matrices carrées de même ordre :

$$
\begin{bmatrix}
    4 & -1 & -2 \\
    1 & 0 & 3 \\
    0 & 2 & 0
\end{bmatrix} \times
\begin{bmatrix}
    1 & 0 & 0 \\
    0 & 1 & 0 \\
    0 & 0 & 1
\end{bmatrix}
= \begin{bmatrix}
    4 & -1 & -2 \\
    1 & 0 & 3 \\
    0 & 2 & 0
\end{bmatrix}
$$

Qu’on la transpose ou que l’on cherche son inverse, le résultat sera égal à elle-même :

$$
\begin{align}
    A^T &= A \\
    A^{-1} &= A
\end{align}
$$

Vérifions tout cela avec *Numpy* et la notation `.T` pour la transposée et la méthode `.linalg.inv()` pour l’inverse de la matrice :

In [None]:
A = np.array([
    [1, 0, 0],
    [0, 1, 0],
    [0, 0, 1]
])
B = np.array([
    [4, -1, -2],
    [1, 0, 3],
    [0, 2, 0]
])

print(f"## Transposée ##\n{A.T}",
      f"## Inverse ##\n{np.linalg.inv(A)}",
      f"## Produit matriciel B.A ##\n{B.dot(A)}",
      sep="\n")

**Remarque :** il est à noter qu’une méthode `.identity()` permet de générer une matrice identité d’ordre *n* :

In [None]:
np.identity(3)

### Calcul du déterminant

Trouver le déterminant d’une matrice carrée est une opération qui revient souvent lorsque l’on analyse des vecteurs. C’est aussi un préalable nécessaire pour trouver l’inverse d’une matrice.

Pour le déterminant d’une matrice $(2, 2)$, il faut soustraire le produit de ses diagonales :

$$
\text{det} \begin{bmatrix}
    a & b \\
    c & d
\end{bmatrix} = 
(a \times d) - (b \times c)
$$

Pour des matrices d’ordre supérieur, il faudra répéter l’opération sur certaines mineures. Soit la matrice carrée $A$ d’ordre $(3, 3)$ :

$$
A = \begin{bmatrix}
    -2 & 3 & 0 \\
    3 & 1 & 1 \\
    2 & -1 & 0
\end{bmatrix}
$$

Pour calculer son déterminant, nous allons d’abord choisir une ligne (généralement celle avec le plus de 0, à défaut la première) et trouver les cofacteurs de chacune de ses valeurs. Par exemple le vecteur $(A_{11}, A_{12}, A_{13})$ qui vaut $(-2, 3, 0)$. Par définition, nous savons déjà que le cofacteur de $A_{13}$ vaut 0. Pour trouver celui de $A_{11}$, nous voudrons calculer d’abord la mineure de la matrice d’ordre $(2, 2)$ constituée des valeurs qui ne se trouvent ni dans sa colonne ni sur sa ligne, à savoir :

$$
\text{det} \begin{bmatrix}
    1 & 1 \\
    -1 & 0
\end{bmatrix} =
(1 \times 0) - (1 \times -1) = 1
$$

Ensuite, il suffit de multiplier le déterminant par $A_{11}$ (soit $1 \times -2 = -2$) puis de fixer son signe en le multipliant par $1$ ou $-1$ en se référant au tableau ci-dessous :

$$
\begin{bmatrix}
    + & - & + \\
    - & + & - \\
    + & - & +
\end{bmatrix}
$$

Dans notre exemple, $-2 \times 1 = -2$. Le cofacteur $A_{11}$ vaut donc $-2$. Si nous détaillons le calcul du cofacteur $A_{12}$, nous obtenons 6 :

$$
\begin{align}
    \text{det} \begin{bmatrix}
        3 & 1 \\
        2 & 0
    \end{bmatrix} &=
    (3 \times 0) - (1 \times 2) = -2 \\
    -2 \times A_{12} &= -6 \\
    -6 \times -1 &= 6
\end{align}
$$

Maintenant que nous avons les cofacteurs de chaque élément, il reste à les additionner pour obtenir le déterminant de la matrice $A$ :

$$-2 + 6 + 0 = 4$$

Avec *Numpy*, nous pouvons faire appel à la méthode `.linalg.det()` :

In [None]:
A = np.array([
    [-2, 3, 0],
    [3, 1, 1],
    [2, -1, 0]
])
np.linalg.det(A)

### Définir la comatrice

La comatrice d’une matrice carrée s’obtient en échangeant les valeurs sur les diagonales puis en multipliant la diagonale secondaire par $-1$ :

$$
\text{com} \begin{bmatrix}
    a & b \\
    c & d
\end{bmatrix} =
\begin{bmatrix}
    d & -c \\
    -b & a
\end{bmatrix}
$$

Pour des matrices carrées d’ordre supérieur, il faut calculer le déterminant de chaque valeur puis le multiplier par $1$ ou $-1$ en fonction du tableau des signes.

## Décomposer une matrice en éléments propres

La décomposition d’une matrice est une étape indispensable de certains algorithmes de réduction de la dimensionnalité, comme l’analyse en composantes principales. Pour une matrice, il s’agira de trouver ses valeurs propres (*eigenvalues*) et les vecteurs propres (*eigenvectors*) qui leur sont associées.

### Calculer les valeurs propres

Les valeurs propres d’une matrice sont les racines de son polynôme caractéristique. La formule pour calculer le polynôme caractéristique d’une matrice $M$ vaut :

$$
P_M(x) = \text{det}[x.I_n − M]
$$

Ou :

$$
P_M(x) = \text{det}[M - x.I_n]
$$

**Remarque :** les deux formules donnent des résultats opposés, mais comme nous recherchons des racines, le signe n’a aucune importance.

Prenons une matrice carrée d’ordre $(2, 2)$ :

$$
A = \begin{bmatrix}
    -2 & 1 \\
    3 & 0
\end{bmatrix}
$$

Et résolvons l’équation étape par étape avec, comme première opération $x.I_2 − A$ :

$$
\begin{align}
    x.I_2 − A &= x \cdot \begin{bmatrix}
        1 & 0 \\
        0 & 1
    \end{bmatrix} -
    \begin{bmatrix}
    -2 & 1 \\
    3 & 0
    \end{bmatrix} \\
    &= \begin{bmatrix}
        x & 0 \\
        0 & x
    \end{bmatrix} -
    \begin{bmatrix}
    -2 & 1 \\
    3 & 0
    \end{bmatrix} \\
    &= \begin{bmatrix}
    x + 2 & -1 \\
    -3 & x
    \end{bmatrix}
\end{align}
$$

Il reste ensuite à trouver le déterminant de cette matrice pour faire ressortir le polynôme :

$$
\begin{align}
    \text{det} \begin{bmatrix}
        x + 2 & -1 \\
        -3 & x
    \end{bmatrix} &= ((x + 2) \times x) - (- 1 \times -3) \\
    &= x^2 + 2x - 3
\end{align}
$$

Les valeurs propres seront les racines du polynôme de degré 2 : $x^2 + 2x - 3$, soit $\lambda_1 = 1$ et $\lambda_2 = -3$.

#### Rappel : calcul des racines d’un polynôme

Pour un polynôme de degré $n$, il ne peut y avoir au plus que $n$ racines. Déterminer le nombre de racines passe par le calcul du discriminant. Dans la formule quadratique, le discriminant vaut $\Delta = b^2 - 4ac$. Pour notre exemple, le discriminant est égal à 16. Comme le résultat est supérieur à 0, nous savons qu’il y a deux solutions à notre polynôme (en dessous de 0 il n’aurait pas eu de solution et s’il avait été égal à 0 il n’en aurait une qu’une).

Comme nous savons que notre polynôme est composé de deux racines, nous allons nous attacher à les trouver en appliquant la formule quadratique :

$$
x = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}
$$

Dans notre exemple, les racines sont bien :

$$
\begin{align}
    x_1 &= \frac{-2 + \sqrt{16}}{2} \\
    &= \frac{-2 + 4}{2} \\
    &= \frac{2}{2} \\
    &= 1 \\
    x_2 &= \frac{-2 - \sqrt{16}}{2} \\
    &= \frac{-6}{2} \\
    &= -3
\end{align}
$$

### Calculer les vecteurs propres

Les vecteurs propres sont les vecteurs associés aux valeurs propres d’une matrice. Elles répondent au système d’équation ci-dessous où $I_n$ est la matrice identité et $\vec{X}$ un vecteur des racines du polynôme caractéristique :

$$
(M − \lambda I_n)\vec{X} = \vec{0}
$$

Pour notre exemple où :

$$
A = \begin{bmatrix}
    -2 & 1 \\
    3 & 0
\end{bmatrix}
$$

Et dont les valeurs propres valent $\lambda_1 = 1$ ; $\lambda_2 = -3$. Pour $\lambda_1$, le calcul aboutit à un système d’équations :

$$
\begin{align}
    \left( \begin{bmatrix}
        -2 & 1 \\
        3 & 0
    \end{bmatrix} - \begin{bmatrix}
        1 & 0 \\
        0 & 1
    \end{bmatrix} \right) \cdot \begin{bmatrix}
        x_1 \\
        x_2
    \end{bmatrix} &= \vec{0} \\
    \begin{bmatrix}
        -2 - 1 & 1 \\
        3 & 0 - 1
    \end{bmatrix} \cdot \begin{bmatrix}
        x_1 \\
        x_2
    \end{bmatrix} &= \vec{0} \\
    \begin{bmatrix}
        -3 & 1 \\
        3 & - 1
    \end{bmatrix} \cdot \begin{bmatrix}
        x_1 \\
        x_2
    \end{bmatrix} &= \vec{0} \\
    \left \{
    \begin{array}{c @{=} c}
        -3x_1 + x_2 = 0 \\
        3x_1 - x_2 = 0
    \end{array}
    \right.
\end{align}
$$

Le vecteur propre associé à $\lambda_1$ est par conséquent $\begin{bmatrix} 1 \\ 3 \end{bmatrix}$.

Et pour $\lambda_2$, le système d’équations vaut :

$$
\begin{align}
    \left( \begin{bmatrix}
        -2 & 1 \\
        3 & 0
    \end{bmatrix} - \begin{bmatrix}
        -3 & 0 \\
        0 & -3
    \end{bmatrix} \right) \cdot \begin{bmatrix}
        x_1 \\
        x_2
    \end{bmatrix} &= \vec{0} \\
    \begin{bmatrix}
        -2 + 3 & 1 - 0 \\
        3 - 0 & 0 + 3
    \end{bmatrix} \cdot \begin{bmatrix}
        x_1 \\
        x_2
    \end{bmatrix} &= \vec{0} \\
    \begin{bmatrix}
        1 & 1 \\
        3 & 3
    \end{bmatrix} \cdot \begin{bmatrix}
        x_1 \\
        x_2
    \end{bmatrix} &= \vec{0} \\
    \left \{
    \begin{array}{c @{=} c}
        x_1 + x_2 = 0 \\
        3x_1 + 3 x_2 = 0
    \end{array}
    \right.
\end{align}
$$

Le vecteur propre associé à $\lambda_2$ est ainsi $\begin{bmatrix} -1 \\ 1 \end{bmatrix}$.

Avec *Numpy*, la méthode `.eig()` renvoie un tuple avec les valeurs propres et les vecteurs propres associés :

In [None]:
A = np.array([
    [-2, 1],
    [3, 0]
])

eigenvalues, eigenvectors = np.linalg.eig(A)

for i, eigenvalue in enumerate(eigenvalues):
    print(f"Les vecteurs propres de {eigenvalue} sont : {eigenvectors[:, i]}")

Une couche de normalisation est rajoutée par *Numpy* selon la formule :

$$
\vec{n} = \frac{\vec{v}}{\| \vec{v} \|}
$$

Si nous prenons pour exemple la valeur propre $\lambda_1 = 1$ dont le vecteur propre est $\begin{bmatrix} 1 \\ 3 \end{bmatrix}$ :

$$
\begin{align}
    \vec{v} &= \begin{bmatrix} 1 \\ 3 \end{bmatrix} \div \sqrt{1^2 + 3^2} \\
    \vec{v} &= \begin{bmatrix} 1 \\ 3 \end{bmatrix} \div \sqrt{10} \\
    \vec{v} &= \begin{bmatrix} \frac{1}{\sqrt{10}} \\ \frac{3}{\sqrt{10}} \end{bmatrix} \\
    \vec{v} &= \begin{bmatrix} 0.31622 \\ 0.94868 \end{bmatrix}
\end{align}
$$