In [None]:
import numpy as np

In [None]:
# Avoid inaccurate floating values (for inverse matrices in dot product for instance)
# See https://stackoverflow.com/questions/24537791/numpy-matrix-inversion-rounding-errors
np.set_printoptions(suppress=True)

In [None]:
%%html
<style>
.pquote {
  text-align: left;
  margin: 40px 0 40px auto;
  width: 70%;
  font-size: 1.5em;
  font-style: italic;
  display: block;
  line-height: 1.3em;
  color: #5a75a7;
  font-weight: 600;
  border-left: 5px solid rgba(90, 117, 167, .1);
  padding-left: 6px;
}
.notes {
  font-style: italic;
  display: block;
  margin: 40px 10%;
}
img + em {
  text-align: center;
  display: block;
  color: gray;
  font-size: 0.9em;
  font-weight: 600;
}
</style>

$$
\newcommand\bs[1]{\boldsymbol{#1}}
$$

# Introduction

Le produit scalaire est un concept majeur de l'algèbre linéaire et donc de l'apprentissage automatique et de la science des données. Nous verrons quelques propriétés de cette opération. Ensuite, nous aurons quelques intuitions sur le lien entre matrices et systèmes d'équations linéaires.

# 2.2 Multiplication de matrices et de vecteurs

La manière standard de multiplier des matrices n'est pas de multiplier chaque élément de l'une avec chaque élément de l'autre (appelé le *produit par élément*) mais de calculer la somme des produits entre lignes et colonnes. Le produit matriciel, également appelé **produit point**, se calcule comme suit :

<img src="images/dot-product.png" width="400" alt="Un exemple sur comment calculer le produit scalaire entre une matrice et un vecteur" 
title="Le produit scalaire entre une matrice et un vecteur">
<em>Le produit scalaire entre une matrice et un vecteur</em>

Le nombre de colonnes de la première matrice doit être égal au nombre de lignes de la deuxième matrice. Si les dimensions de la première matrice sont ($m \times n$), la deuxième matrice doit avoir la forme ($n \times x$). La matrice résultante aura la forme ($m \times x$).

### Exemple 1.

Commençons par la multiplication d'une matrice et d'un vecteur.

$$\bs{A} \bs{b} = \bs{C}$$

with $
\bs{A}=
\begin{bmatrix}
    1 & 2\\\\
    3 & 4\\\\
    5 & 6
\end{bmatrix}
$ and $\bs{b}=\begin{bmatrix}
    2\\\\
    4
\end{bmatrix}$.

Nous avons vu que la formule est la suivante :

$$
\begin{align*}
&\begin{bmatrix}
    A_{1,1} & A_{1,2} \\\\
    A_{2,1} & A_{2,2} \\\\
    A_{3,1} & A_{3,2}
\end{bmatrix}\times
\begin{bmatrix}
    B_{1,1} \\\\
    B_{2,1}
\end{bmatrix}=\\\\
&\begin{bmatrix}
    A_{1,1}B_{1,1} + A_{1,2}B_{2,1} \\\\
    A_{2,1}B_{1,1} + A_{2,2}B_{2,1} \\\\
    A_{3,1}B_{1,1} + A_{3,2}B_{2,1}
\end{bmatrix}
\end{align*}
$$

Alors on aura:

$$
\begin{align*}
&\begin{bmatrix}
    1 & 2 \\\\
    3 & 4 \\\\
    5 & 6
\end{bmatrix}
\begin{bmatrix}
    2 \\\\
    4
\end{bmatrix}=\\\\
&\begin{bmatrix}
    1 \times 2 + 2 \times 4 \\\\
    3 \times 2 + 4 \times 4 \\\\
    5 \times 2 + 6 \times 4
\end{bmatrix}=
\begin{bmatrix}
    10 \\\\
    22 \\\\
    34
\end{bmatrix}
\end{align*}
$$

C'est une bonne habitude de vérifier les dimensions de la matrice pour voir ce qui se passe. Nous pouvons voir dans cet exemple que la forme de $\bs{A}$ est ($3 \times 2$) et que la forme de $\bs{b}$ est ($2 \times 1$). Les dimensions de $\bs{C}$ sont donc ($3 \times 1$).

### Avec Numpy

La fonction Numpy `dot()` peut être utilisée pour calculer le produit matriciel (ou produit scalaire). Essayons de reproduire le dernier exemple :

In [None]:
A = np.array([[1, 2], [3, 4], [5, 6]])
A

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
B = np.array([[2], [4]])
B

array([[2],
       [4]])

In [None]:
C = np.dot(A, B)
C

array([[10],
       [22],
       [34]])

C'est équivalent à utiliser la méthode `dot()` des tableaux Numpy :

In [None]:
C = A.dot(B)
C

array([[10],
       [22],
       [34]])

### Exemple 2.

Multiplication de deux matrices.

$$\bs{A} \times \bs{B} = \bs{C}$$

Avec:

$$\bs{A}=\begin{bmatrix}
    1 & 2 & 3 \\\\
    4 & 5 & 6 \\\\
    7 & 8 & 9 \\\\
    10 & 11 & 12
\end{bmatrix}
$$

et:

$$\bs{B}=\begin{bmatrix}
    2 & 7 \\\\
    1 & 2 \\\\
    3 & 6
\end{bmatrix}
$$

Alors on a:

$$
\begin{align*}
&\begin{bmatrix}
    1 & 2 & 3 \\\\
    4 & 5 & 6 \\\\
    7 & 8 & 9 \\\\
    10 & 11 & 12
\end{bmatrix}
\begin{bmatrix}
    2 & 7 \\\\
    1 & 2 \\\\
    3 & 6
\end{bmatrix}=\\\\
&\begin{bmatrix}
    2 \times 1 + 1 \times 2 + 3 \times 3 & 7 \times 1 + 2 \times 2 + 6 \times 3 \\\\
    2 \times 4 + 1 \times 5 + 3 \times 6 & 7 \times 4 + 2 \times 5 + 6 \times 6 \\\\
    2 \times 7 + 1 \times 8 + 3 \times 9 & 7 \times 7 + 2 \times 8 + 6 \times 9 \\\\
    2 \times 10 + 1 \times 11 + 3 \times 12 & 7 \times 10 + 2 \times 11 + 6 \times 12 \\\\
\end{bmatrix}\\\\
&=
\begin{bmatrix}
    13 & 29 \\\\
    31 & 74 \\\\
    49 & 119 \\\\
    67 & 164
\end{bmatrix}
\end{align*}
$$

Vérifions le résultat avec Numpy :

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
A

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [None]:
B = np.array([[2, 7], [1, 2], [3, 6]])
B

array([[2, 7],
       [1, 2],
       [3, 6]])

In [None]:
C = A.dot(B)
C

array([[ 13,  29],
       [ 31,  74],
       [ 49, 119],
       [ 67, 164]])

Ça marche!

# Formalisation du produit scalaire

Le produit scalaire peut être formalisé par l'équation suivante :

$$
C_{i,j} = A_{i,k}B_{k,j} = \sum_{k}A_{i,k}B_{k,j}
$$

# Propriétés du produit scalaire

Nous allons maintenant voir quelques propriétés intéressantes du produit scalaire. En utilisant des exemples simples pour chaque propriété, nous allons nous habituer aux fonctions Numpy.

## La mutliplication matricielle est distributive


$$\bs{A}(\bs{B}+\bs{C}) = \bs{AB}+\bs{AC}$$

### Exemple 3.

$$
\bs{A}=\begin{bmatrix}
    2 & 3 \\\\
    1 & 4 \\\\
    7 & 6
\end{bmatrix}, 
\bs{B}=\begin{bmatrix}
    5 \\\\
    2
\end{bmatrix}, 
\bs{C}=\begin{bmatrix}
    4 \\\\
    3
\end{bmatrix}
$$


$$
\begin{align*}
\bs{A}(\bs{B}+\bs{C})&=\begin{bmatrix}
    2 & 3 \\\\
    1 & 4 \\\\
    7 & 6
\end{bmatrix}\times
\left(\begin{bmatrix}
    5 \\\\
    2
\end{bmatrix}+
\begin{bmatrix}
    4 \\\\
    3
\end{bmatrix}\right)=
\begin{bmatrix}
    2 & 3 \\\\
    1 & 4 \\\\
    7 & 6
\end{bmatrix}\times
\begin{bmatrix}
    9 \\\\
    5
\end{bmatrix}\\\\
&=
\begin{bmatrix}
    2 \times 9 + 3 \times 5 \\\\
    1 \times 9 + 4 \times 5 \\\\
    7 \times 9 + 6 \times 5
\end{bmatrix}=
\begin{bmatrix}
    33 \\\\
    29 \\\\
    93
\end{bmatrix}
\end{align*}
$$

est équivalent à

$$
\begin{align*}
\bs{A}\bs{B}+\bs{A}\bs{C} &= \begin{bmatrix}
    2 & 3 \\\\
    1 & 4 \\\\
    7 & 6
\end{bmatrix}\times
\begin{bmatrix}
    5 \\\\
    2
\end{bmatrix}+
\begin{bmatrix}
    2 & 3 \\\\
    1 & 4 \\\\
    7 & 6
\end{bmatrix}\times
\begin{bmatrix}
    4 \\\\
    3
\end{bmatrix}\\\\
&=
\begin{bmatrix}
    2 \times 5 + 3 \times 2 \\\\
    1 \times 5 + 4 \times 2 \\\\
    7 \times 5 + 6 \times 2
\end{bmatrix}+
\begin{bmatrix}
    2 \times 4 + 3 \times 3 \\\\
    1 \times 4 + 4 \times 3 \\\\
    7 \times 4 + 6 \times 3
\end{bmatrix}\\\\
&=
\begin{bmatrix}
    16 \\\\
    13 \\\\
    47
\end{bmatrix}+
\begin{bmatrix}
    17 \\\\
    16 \\\\
    46
\end{bmatrix}=
\begin{bmatrix}
    33 \\\\
    29 \\\\
    93
\end{bmatrix}
\end{align*}
$$

In [None]:
A = np.array([[2, 3], [1, 4], [7, 6]])
A

array([[2, 3],
       [1, 4],
       [7, 6]])

In [None]:
B = np.array([[5], [2]])
B

array([[5],
       [2]])

In [None]:
C = np.array([[4], [3]])
C

array([[4],
       [3]])

$\bs{A}(\bs{B}+\bs{C})$:

In [None]:
D = A.dot(B+C)
D

array([[33],
       [29],
       [93]])

est équivalent à $\bs{AB}+\bs{AC}$:

In [None]:
D = A.dot(B) + A.dot(C)
D

array([[33],
       [29],
       [93]])

## La mutliplication matricielle est associative

$$\bs{A}(\bs{BC}) = (\bs{AB})\bs{C}$$

In [None]:
A = np.array([[2, 3], [1, 4], [7, 6]])
A

array([[2, 3],
       [1, 4],
       [7, 6]])

In [None]:
B = np.array([[5, 3], [2, 2]])
B

array([[5, 3],
       [2, 2]])

$\bs{A}(\bs{BC})$:


In [None]:
D = A.dot(B.dot(C))
D

array([[100],
       [ 85],
       [287]])

est équivalent à $(\bs{AB})\bs{C}$:

In [None]:
D = (A.dot(B)).dot(C)
D

array([[100],
       [ 85],
       [287]])

## La multiplication matricielle n'est pas commutative

$$\bs{AB} \neq \bs{BA}$$

In [None]:
A = np.array([[2, 3], [6, 5]])
A

array([[2, 3],
       [6, 5]])

In [None]:
B = np.array([[5, 3], [2, 2]])
B

array([[5, 3],
       [2, 2]])

$\bs{AB}$:

In [None]:
AB = np.dot(A, B)
AB

array([[16, 12],
       [40, 28]])

est different de $\bs{BA}$:

In [None]:
BA = np.dot(B, A)
BA

array([[28, 30],
       [16, 16]])

## Cependant, la multiplication des vecteurs est commutative

$$\bs{x^{ \text{T}}y} = \bs{y^{\text{T}}x} $$

In [None]:
x = np.array([[2], [6]])
x

array([[2],
       [6]])

In [None]:
y = np.array([[5], [2]])
y

array([[5],
       [2]])

$\bs{x^\text{T}y}$:

In [None]:
x_ty = x.T.dot(y)
x_ty

array([[22]])

est équivalent à $\bs{y^\text{T}x}$:

In [None]:
y_tx = y.T.dot(x)
y_tx

array([[22]])

## Simplification du produit matriciel

$$(\bs{AB})^{\text{T}} = \bs{B}^\text{T}\bs{A}^\text{T}$$

In [None]:
A = np.array([[2, 3], [1, 4], [7, 6]])
A

array([[2, 3],
       [1, 4],
       [7, 6]])

In [None]:
B = np.array([[5, 3], [2, 2]])
B

array([[5, 3],
       [2, 2]])

$(\bs{AB})^{\text{T}}$:

In [None]:
AB_t = A.dot(B).T
AB_t

array([[16, 13, 47],
       [12, 11, 33]])

est équivalent à $\bs{B}^\text{T}\bs{A}^\text{T}$:

In [None]:
B_tA = B.T.dot(A.T)
B_tA

array([[16, 13, 47],
       [12, 11, 33]])

# Système d'équations linéaires

C'est une partie importante de la raison pour laquelle l'algèbre linéaire peut être très utile pour résoudre une grande variété de problèmes. Nous allons voir ici qu'elle peut être utilisée pour représenter des systèmes d'équations.

Un système d'équations est un ensemble d'équations multiples (au moins 1). Par exemple, nous pourrions avoir :


<div>
$
\begin{cases}
y = 2x + 1 \\\
y = \frac{7}{2}x +3
\end{cases}
$
</div>

Elle est définie par son nombre d'équations et son nombre d'inconnues. Dans cet exemple, il y a 2 équations (la première et la deuxième ligne) et 2 inconnues ($x$ et $y$). De plus, nous appelons cela un système d'équations **linéaires** car chaque équation est linéaire. Nous pouvons représenter cela en 2 dimensions : nous avons une ligne droite par équation et les dimensions correspondent aux inconnues. Voici le tracé de la première équation :

<img src="images/plot-linear-equation.png" width="300" Représentation d'une ligne à partir d'une équation" 
title="Tracé d'une équation linéaire">
<em>Representation d'une equation linéaire</em>

<span class='pquote'>
    Dans notre système d'équations, les inconnues sont les dimensions et le nombre d'équations est le nombre de lignes (en 2D) ou de plans à $n$ dimensions.
</span>

## Utilisation de matrices pour décrire le système

Les matrices peuvent être utilisées pour décrire un système d'équations linéaires de la forme $\bs{Ax}=\bs{b}$. Voici un tel système :

$$
A_{1,1}x_1 + A_{1,2}x_2 + A_{1,n}x_n = b_1 \\\\
A_{2,1}x_1 + A_{2,2}x_2 + A_{2,n}x_n = b_2 \\\\
\cdots \\\\
A_{m,1}x_1 + A_{m,2}x_2 + A_{m,n}x_n = b_n
$$

Les inconnues (ce que nous voulons trouver pour résoudre le système) sont les variables $x_1$ et $x_2$. C'est exactement la même forme que dans le dernier exemple mais avec toutes les variables du même côté. $y = 2x + 1$ devient $-2x + y = 1$ avec $x$ correspondant à $x_1$ et $y$ correspondant à $x_2$. Nous aurons $n$ inconnues et $m$ équations.

Les variables sont nommées $x_1, x_2, \cdots, x_n$ par convention car nous verrons que cela peut se résumer au vecteur $\bs{x}$.

### Côté gauche

Le côté gauche peut être considéré comme le produit d'une matrice $\bs{A}$ contenant les poids de chaque variable ($n$ colonnes) et de chaque équation ($m$ lignes) :

<div>
$
\bs{A}=
\begin{bmatrix}
    A_{1,1} & A_{1,2} & \cdots & A_{1,n} \\\
    A_{2,1} & A_{2,2} & \cdots & A_{2,n} \\\
    \cdots & \cdots & \cdots & \cdots \\\
    A_{m,1} & A_{m,2} & \cdots & A_{m,n}
\end{bmatrix}
$
</div>

avec un vecteur $\bs{x}$ contenant les $n$ inconnues

<div>
$
\bs{x}=
\begin{bmatrix}
    x_1 \\\
    x_2 \\\
    \cdots \\\
    x_n
\end{bmatrix}
$
</div>

Le produit scalaire de $\bs{A}$ et de $\bs{x}$ donne un ensemble d'équations. Voici un exemple simple :

<img src="images/system-linear-equations-matrix-form.png" width="400" alt="Matrix form of a system of linear equation" title="Matrix form of a system of linear equation">
<em>Matrix form of a system of linear equations</em>

On a un ensemble de deux équations avec deux inconnues. Donc le nombre de lignes de $\bs{A}$ donne le nombre d'équations et le nombre de colonnes donne le nombre d'inconnues.

### Les deux côtés

Le système d'équations peut être écrit comme suit :

$$
\begin{bmatrix}
    A_{1,1} & A_{1,2} & \cdots & A_{1,n} \\\\
    A_{2,1} & A_{2,2} & \cdots & A_{2,n} \\\\
    \cdots & \cdots & \cdots & \cdots \\\\
    A_{m,1} & A_{m,2} & \cdots & A_{m,n}
\end{bmatrix}
\begin{bmatrix}
    x_1 \\\\
    x_2 \\\\
    \cdots \\\\
    x_n
\end{bmatrix}
=
\begin{bmatrix}
    b_1 \\\\
    b_2 \\\\
    \cdots \\\\
    b_m
\end{bmatrix}
$$

Ou simplement:

$$\bs{Ax}=\bs{b}$$

### Exemple 4.

Nous allons essayer de convertir la forme courante d'une équation linéaire $y=ax+b$ à la forme matricielle. Si nous voulons garder la notation précédente, nous aurons à la place :

<div>
$x_2=ax_1+b$
</div>

Ne confondez pas les variables $x_1$ et $x_2$ avec le vecteur $\bs{x}$. Ce vecteur contient toutes les variables de nos équations :

<div>
$
\bs{x} =
\begin{bmatrix}
    x_1 \\\
    x_2
\end{bmatrix}
$
</div>

Dans cet exemple, nous utiliserons l'équation suivante :

<div>
$
\begin{aligned}
&x_2=2x_1+1 \\\
\Leftrightarrow& 2x_1-x_2=-1
\end{aligned}
$
</div>

Pour obtenir ce système lorsque nous multiplions $\bs{A}$ et $\bs{x}$, nous avons besoin que $\bs{A}$ soit une matrice contenant les poids de chaque variable. Le poids de $x_1$ est de $2$ et celui de $x_2$ est de $-1$ :

<div>
$
\bs{A}=
\begin{bmatrix}
    2 & -1
\end{bmatrix}
$
</div>

Alors on a

<div>
$
\begin{bmatrix}
    2 & -1
\end{bmatrix}
\begin{bmatrix}
    x_1 \\\
    x_2
\end{bmatrix}
=
\begin{bmatrix}
2x_1-1x_2
\end{bmatrix}
$
</div>

Pour completer l'équation on a

<div>
$
\bs{b}=
\begin{bmatrix}
    -1
\end{bmatrix}
$
</div>

Qui donne

<div>
$
\begin{bmatrix}
    2 & -1
\end{bmatrix}
\begin{bmatrix}
    x_1 \\\
    x_2
\end{bmatrix}
=
\begin{bmatrix}
    -1
\end{bmatrix}
$
</div>

Ce système d'équations est donc très simple et ne contient qu'une équation ($\bs{A}$ a 1 ligne) et 2 variables ($\bs{A}$ a 2 colonnes).

En résumé, $\bs{A}$ sera une matrice de dimensions $m\times n$ contenant des scalaires multipliant ces variables (ici $x_1$ est multiplié par 2 et $x_2$ par -1). Le vecteur $\bs{x}$ contient les variables $x_1$ et $x_2$. Et le côté droit est la constante $\bs{b}$ :

<div>
$
\bs{A}=
\begin{bmatrix}
    2 & -1
\end{bmatrix}
$
</div>

<div>
$
\bs{x}=
\begin{bmatrix}
    x_1 \\\
    x_2
\end{bmatrix}
$
</div>

<div>
$
\bs{b}=
\begin{bmatrix}
    -1
\end{bmatrix}
$
</div>

On peut écrire ce système

<div>
$
\bs{Ax}=\bs{b}
$
</div>