# Multiplication des matrices : Algorithme de Strassen

Le but ce projet est de présenter un algorithme récursif et efficace (c'est-à-dire
économe en temps de calcul) pour calculer le produit de deux matrices.

Lorsque l'on fait calculer à une machine le produit de deux matrices, les
multiplications entre les coefficients des matrices coûtent plus de
ressources machines que les additions. L'algorithme de Strassen est donc
un algorithme qui utilise moins de multiplication que l'algorithme
classique pour le calcul du produit de deux matrices.

Le projet se décompose en deux parties :
- Une première partie qui vous fait découvrir pas à pas la méthode de Strassen
- Une deuxième partie où il vous est demandé d'implémenter la méthode.


## Algorithme de Strassen (Matrices $2\times 2$)


Dans cette partie on s'intéresse au nombre de multiplications effectuées
lorsqu'on calcule le produit de deux matrices. L'algorithme de Strassen
présenté dans cette partie permet de diminuer ce nombre.

Soit le produit de deux matrices de taille $2\times 2$,
$$A\times B=\begin{pmatrix}
a_{11} & a_{12}\\
a_{21} & a_{22}
\end{pmatrix}
\times
\begin{pmatrix}
b_{11} & b_{12}\\
b_{21} & b_{22}
\end{pmatrix}=\begin{pmatrix}
c_{11} & c_{12} \\
c_{21} & c_{22}
 \end{pmatrix}=C$$

1.  Combien de multiplications sont nécessaires pour calculer tous les
    coefficients $c_{ij}$ par la définition du produit matriciel usuelle ?

**À vous.....**
1. _Réponse_
\begin{equation*}
\begin{bmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{bmatrix}
\begin{bmatrix}
b_{11} & b_{12} \\
b_{21} & b_{22}
\end{bmatrix} =
\begin{bmatrix}
a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\
a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22}
\end{bmatrix}=C
\end{equation*}
donc 8

2.  Considérons les produits suivants :\
    $$\mbox{(Formules de Strassen) }\left\{\begin{array}{l}
    q_1 =(a_{11}-a_{12})b_{22}\\
    q_2=(a_{21}-a_{22})b_{11}\\
    q_3=a_{22}(b_{11}+b_{21})\\
    q_4=a_{11}(b_{12}+b_{22})\\
    q_5=(a_{11}+a_{22})(b_{22}-b_{11})\\
    q_6=(a_{11}+a_{21})(b_{11}+b_{12})\\
    q_7=(a_{12}+a_{22})(b_{21}+b_{22})
    \end{array}\right.$$

    Vérifier qu'on retrouve la matrice $C$ en effectuant les opérations
    suivantes :
    
      $$\begin{array}{c}
    c_{11}= q_1-q_3-q_5+q_7\\
    c_{12}=q_4-q_1\\
    c_{21}=q_2+q_3\\
    c_{22}=-q_2-q_4+q_5+q_6
    \end{array}$$


**À vous.....**

2. _Réponse_

    $$\begin{array}{c}
    c_{11}= q_1-q_3-q_5+q_7=(a_{11}-a_{12})b_{22}-a_{22}(b_{11}+b_{21})-(a_{11}+a_{22})(b_{22}-b_{11})+(a_{12}+a_{22})(b_{21}+b_{22})=a_{11}b_{11} + a_{12}b_{21}\\
    c_{12}=q_4-q_1=a_{11}(b_{12}+b_{22})-(a_{11}-a_{12})b_{22}=a_{11}b_{12} + a_{12}b_{22}\\
    c_{21}=q_2+q_3=(a_{21}-a_{22})b_{11}+a_{22}(b_{11}+b_{21})=a_{21}b_{11} + a_{22}b_{21}\\
    c_{22}=-q_2-q_4+q_5+q_6=-(a_{21}-a_{22})b_{11}-a_{11}(b_{12}+b_{22})+(a_{11}+a_{22})(b_{22}-b_{11})+(a_{11}+a_{21})+b_{11}+b_{12})=a_{22}b_{22}+a_{21}b_{12}
    \end{array}$$



3.  Conclure que les formules de Strassen permettent de calculer le
    produit $A\times B$. Qu'a-t-on gagné en nombre de multiplication ?

**À vous.....**

3. _Réponse_
ici on en a fait 7 on en gagner donc une seule


## Produit matriciel par blocs

1.  Produit par blocs: soit $A, B$ deux matrices de tailles $2n\times 2n$ 
On peut alors écrire $A$ et $B$ de la façon suivante
    $$
    A=\left(\begin{array}{c|c}
     A_{11} & A_{12} \\
    \hline
    A_{21} & A_{22}
             \end{array}\right)
             \mbox{ et }
     B=\left(\begin{array}{c|c}
    B_{11} & B_{12} \\
    \hline
    B_{21} & B_{22}          
             \end{array}\right).
    $$
    Les blocs $A_{11},\dots, B_{22}$ sont
    des matrices $n\times n$.

    Le calcul du produit $A\times B$ peut se faire par blocs à partir
    des produits des matrices $A_{ik}\times B_{kj}$ de la manière
    suivante: 
    $$C=A\times B=\left(\begin{array}{c|c}
     C_{11} & C_{12} \\
    \hline
    C_{21} & C_{22}\\
    \end{array}\right)=\left(\begin{array}{c|c}       
    A_{11}\times B_{11}+A_{12}\times B_{21} & A_{11}\times B_{12}+A_{12}\times B_{22}\\
    \hline
    A_{21}\times B_{11}+A_{22}\times B_{21} & A_{21}\times B_{12}+A_{22}\times B_{22}
    \end{array}\right)$$
    
    Calculer par blocs, en détaillant vos calculs, $C=A\times B$ où $A$ et $B$
    sont les matrices de taille $4\times 4$ définies par
    $$A=\begin{pmatrix}
       1 & 2 & 0 & 1\\
       3 & 4 & -1 & 1\\
       1 & 0 & 1 & 2\\
       0 & 1 & 3 & 4
      \end{pmatrix}, B=\begin{pmatrix}
      1 & -1 & 0& 1\\
      2 & 0 & 1 & 1\\
      0 & 1 & 1 & 0\\
      1 & 0 & 0 & -1
       \end{pmatrix}
     $$

**À vous.....**
- _Réponse_

\begin{aligned}
\begin{pmatrix}
1 & 2 \\
3 & 4
\end{pmatrix}
\begin{pmatrix}
1 & -1 \\
2 & 0
\end{pmatrix}&+
\begin{pmatrix}
0 & 1 \\
-1 & 1
\end{pmatrix}
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}&=
\begin{pmatrix}
6 & -1 \\
12 & -4
\end{pmatrix}\\
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
1 & -1 \\
2 & 0
\end{pmatrix}&+
\begin{pmatrix}
1 & 2 \\
3 & 4
\end{pmatrix}
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}&=
\begin{pmatrix}
2 & 2 \\
3 & 6
\end{pmatrix}\\
\begin{pmatrix}
1 & 2 \\
3 & 4
\end{pmatrix}
\begin{pmatrix}
0 & 1 \\
1 & 1
\end{pmatrix}&+
\begin{pmatrix}
0 & 1 \\
-1 & 1
\end{pmatrix}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}&=
\begin{pmatrix}
3 & 0 \\
6 & 3
\end{pmatrix}\\
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
0 & 1 \\
1 & 1
\end{pmatrix}&+
\begin{pmatrix}
1 & 2 \\
3 & 4
\end{pmatrix}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}&=
\begin{pmatrix}
1 & -1 \\
4 & -3
\end{pmatrix}\\
\end{aligned}

   finalement on a  
   $$
C = A \times B =\begin{pmatrix}
6 & -1 & 2 & 2 \\
12 & -4 & 3 & 6 \\
3 & 0 & 1 & -1 \\
6 & 3 & 4 & -3
\end{pmatrix}
$$

## Algorithme de Strassen (cas général)

1.  Soient $A$ et $B$ deux matrices de tailles
    $n\times n=2^k\times 2^k$. On découpe ces matrices en blocs (les
    sous-matrices sont de taille $2^{k-1}\times 2^{k-1}$) :
    
    $$
    A=\left(\begin{array}{c|c}
       A_{11} & A_{12} \\
       \hline
       A_{21} & A_{22}
            \end{array}
       \right) \mbox{ et }
    B=\left(\begin{array}{c|c}
       B_{11} & B_{12} \\
       \hline
       B_{21} & B_{22}     
            \end{array}
      \right)
    $$
    et on note $C=\left(\begin{array}{c|c}
                       C_{11} & C_{12} \\
                       \hline
                       C_{21} & C_{22}
                       \end{array}
                   \right)$ le produit $A\times B$.
    
    Écrire les formules de Strassen par blocs et vérifier qu'elles
    permettent de calculer $C$.

2.  Soit $u_k$ le nombre de multiplications nécessaires pour calculer le
    produit de deux matrices $A$ et $B$ de tailles $2^k\times 2^k$.
    Montrer que si on applique les formules de Strassen on a
    $u_k=7u_{k-1}$.

3.  Toujours en utilisant la méthode de Strassen, que vaut $u_1$ ?

4.  En déduire qu'il faut $u_k=7^k$ multiplications pour réaliser le
    produit de deux matrices de taille $2^k\times 2^k$.

5.  Posons $n=2^k$ et montrer que
    $u_k=n^{\frac{\ln(7)}{\ln(2)}}\simeq n^{2.81}$ (on pourra poser
    $u_k=n^\alpha$ et chercher à déterminer $\alpha$).

6.  Si on applique la méthode classique pour calculer le
    produit de deux matrices $A\times B$ de taille $n\times n$ combien
    de multiplications en fonction de $n$ sont nécessaires ?

7.  Application numérique : pour multiplier deux matrices de taille
    $128\times 128$ combien de multiplications économise-t-on en
    utilisant les formules de Strassen à la place du calcul classique ?

**Remarque :** Le cas général où $A$ et $B$ sont des matrices de tailles
$n\times n$ avec $2^{k-1}<n <2^k$ se résout en complétant les matrices
par des zéros de sorte à obtenir deux matrices de tailles
$2^k\times 2^k$.

**À vous.....**
1. _Réponse_
$$\mbox{(Formules de Strassen) }\left\{\begin{array}{l}
    q_1 =(A_{11}-A_{12})B_{22}\\
    q_2=(A_{21}-A_{22})B_{11}\\
    q_3=A_{22}(B_{11}+B_{21})\\
    q_4=A_{11}(B_{12}+B_{22})\\
    q_5=(A_{11}+A_{22})(B_{22}-B_{11})\\
    q_6=(A_{11}+A_{21})(B_{11}+B_{12})\\
    q_7=(A_{12}+A_{22})(B_{21}+B_{22})
    \end{array}\right.$$
    
    
$$\begin{array}{C}
C_{11}= q_1-q_3-q_5+q_7\\
C_{12}=q_4-q_1\\
C_{21}=q_2+q_3\\
C_{22}=-q_2-q_4+q_5+q_6
\end{array}$$


$$\begin{array}{C}
C_{11}= q_1-q_3-q_5+q_7=(A_{11}-A_{12})B_{22}-A_{22}(B_{11}+B_{21})-(A_{11}+A_{22})(B_{22}-B_{11})+(A_{12}+A_{22})(B_{21}+B_{22})=A_{11}B_{11} + A_{12}B_{21}\\
C_{12}=q_4-q_1=A_{11}(B_{12}+B_{22})-(A_{11}-A_{12})B_{22}=A_{11}B_{12} + A_{12}B_{22}\\
C_{21}=q_2+q_3=(A_{21}-A_{22})B_{11}+A_{22}(B_{11}+B_{21})=A_{21}B_{11} + A_{22}B_{21}\\
C_{22}=-q_2-q_4+q_5+q_6=-(A_{21}-A_{22})B_{11}-A_{11}(B_{12}+B_{22})+(A_{11}+A_{22})(B_{22}-B_{11})+(A_{11}+A_{21})+B_{11}+B_{12})=A_{22}B_{22}+A_{21}B_{12}
\end{array}$$



2. _Réponse_
On va montrer le résultat par récurrence,

Initialisation, pour $k=1$ on a $n=2^1$ donc on cherche à determiner le nombre d'opération du produit de deux matrice par la méthode de strassen avec deux martrices de dimension 2,
on à vu à la première question que nous avons 7 opération c'est à dire une de moin qu'avec le produit matriciel classique.
donc $u_1=7=

3. _Réponse_

On a vu au debut que pour le nombre de multiplication du produit matriciel en utilisant la méthode de strassen pour des matrice de taille 2*2 vallait 7 donc $u_1$ vau$7$

4. _Réponse_
On va montrer le résultat par résurence,

Initialisation, pour $k=1$ on a $u_1=7^1=7$ opération et donc valide 
on suppose k vrai pour un certain rang et on va montrer que l'hypothèse est vrai au rang k+1.

On sait que :
$u_k=7^k$ et $u_k=7u_{k-1}$ donc $u_{k+1}=7*7^k=7^{k+1}$

donc la propriété est vrai pour tout $k$.

5. _Réponse_
$u_k=7^k=n^\alpha$ on résout : $7^k=n^\alpha$,

$ln(7^k)=ln(n^\alpha)$

$k*ln(7)=\alpha*ln(2^k)$

$\frac{k*ln(7)}{k*ln(2)}=\alpha$

$\frac{ln(7)}{ln(2)}=\alpha= 2.81$

donc 
$u_k=n^{\frac{\ln(7)}{\ln(2)}}\simeq n^{2.81}$

6. _Réponse_
On doit faire $n$ multiplications pour chaque element de la martrice résultante et comme elle contient $n*n$ element alors on doit faire $n^3$ multiplications en tout 
7. _Réponse_
avec la méthode normale on a $128^3=2 097 152$ multiplications
avec la méthode de strassen on a $7^7=823 543$multiplications ($2^7=128$)
on a donc gagné 1 273 609 multiplications




# Implémentation de l'algorithme de Strassen

Une fois le principe de l'algorithme établi vous effecturez les taches
suivantes:

-   Implémenter l'algorithme de Strassen et l'algorithme de
    multiplication classique pour effecuter le produit de deux matrices
    carré $A$ et $B$ de tailles $2\times 2$.

-   Implémenter l'algorithme de Strassen (en utilisant la récursivité)
    et l'algorithme de multiplication classique (de manière directe ou récursive)
    pour calculer des matrices de tailles $2^k\times 2^k$

-   Déterminer l'entier $k$ à partir duquel l'algorithme de Strassen
    est plus rapide que l'algorithme classique pour calculer le produit
    de deux matrices carrés de taille $2^k$ (vous testerez votre
    programme en construisant des matrices aléatoires de taille $2^k$).

-   [Option] Implémenter l'algorithme de Strassen
    pour calculer des matrices de tailles $n\times n$ où $n$ n'est plus
    nécessairement une puissance de 2 

-   [Recherche bibliographique] Existe-t-il des algorithmes plus performant en terme de
    nombre d'opérations pour effectuer le produit de deux matrices ?

In [None]:
# Algorithme de multiplication classique pour matrices carrées de tailles 2 x 2
def classic(A, B):    
    C = [[0, 0], [0, 0]]    
    C[0][0] = A[0][0] * B[0][0] + A[0][1] * B[1][0]
    C[0][1] = A[0][0] * B[0][1] + A[0][1] * B[1][1]
    C[1][0] = A[1][0] * B[0][0] + A[1][1] * B[1][0]
    C[1][1] = A[1][0] * B[0][1] + A[1][1] * B[1][1]    
    return C
# test
A = [[1, 2], [3, 4]]
B = [[5, 6], [7, 8]]
C = classic(A, B)
print("la matrice est"+str(C))


In [5]:
# Algorithme de Strassen pour calculer le produit de deux matrices carrées de tailles 2 x 2
def strassen(A, B):    
    M1 = (A[0][0] - A[0][1]) * B[1][1]
    M2 = (A[1][0] - A[1][1]) * B[0][0]
    M3 = A[1][1] * (B[0][0] + B[1][0])
    M4 = A[0][0] * (B[0][1] + B[1][1])
    M5 = (A[0][0] + A[1][1]) * (B[1][1] - B[0][0])
    M6 = (A[0][0] + A[1][0]) * (B[0][0] + B[0][1])
    M7 = (A[0][1] + A[1][1]) * (B[1][0] + B[1][1])
    
    # Initialiser la matrice C
    C = [[0, 0], [0, 0]]  
    #on reprend les formules de strassen
    C[0][0] = M1 - M3 - M5 + M7
    C[0][1] = M4 - M1
    C[1][0] = M2 + M3
    C[1][1] = -M2 - M4 + M5 + M6   
    return C
A = [[1, 2], [3, 4]]
B = [[5, 6], [7, 8]]
C = strassen(A, B)
print("la matrice est"+str(C))

la matrice vaut[[19, 22], [43, 50]]


In [None]:
# Algorithme de multiplication classique pour calculer des matrices de tailles 2^k x 2^k
def classic(A, B, k):
    # Initialiser la matrice C
    C = [[0 for i in range(2**k)] for j in range(2**k)]
    
    # Calculer les éléments de la matrice C en utilisant la formule de multiplication classique
    for i in range(2**k):
        for j in range(2**k):
            for l in range(2**k):
                C[i][j] += A[i][l] * B[l][j]   
    
    return C
#test
A = [[1, 2, 3, 4],
     [5, 6, 7, 8],
     [9, 10, 11, 12],
     [13, 14, 15, 16]]
B = [[17, 18, 19, 20],
     [21, 22, 23, 24],
     [25, 26, 27, 28],
     [29, 30, 31, 32]]

C = classic(A, B, 2)
print(C)

In [None]:
#soustraction de deux matrices
def sub(A, B):
  # Vérifier si les matrices ont la même taille
  if len(A) != len(B) or len(A[0]) != len(B[0]):
    raise ValueError("Les matrices doivent être de la même taille pour pouvoir être soustraites.")

  # Initialiser la matrice C qui sera la différence des matrices A et B
  C = [[0 for j in range(len(A[0]))] for i in range(len(A))]

  # Soustraire les éléments des matrices A et B pour calculer la matrice C
  for i in range(len(A)):
    for j in range(len(A[0])):
      C[i][j] = A[i][j] - B[i][j]
  return C


#addition de deux matrice
def add(A, B):
  # Vérifier si les matrices ont la même taille
  if len(A) != len(B) or len(A[0]) != len(B[0]):
    raise ValueError("Les matrices doivent être de la même taille pour pouvoir être additionnées.")

  # Initialiser la matrice C qui sera la somme des matrices A et B
  C = [[0 for j in range(len(A[0]))] for i in range(len(A))]

  # Ajouter les éléments des matrices A et B pour calculer la matrice C
  for i in range(len(A)):
    for j in range(len(A[0])):
      C[i][j] = A[i][j] + B[i][j]
  return C

def strassen(A, B):
    M1 = (A[0][0] - A[0][1]) * B[1][1]
    M2 = (A[1][0] - A[1][1]) * B[0][0]
    M3 = A[1][1] * (B[0][0] + B[1][0])
    M4 = A[0][0] * (B[0][1] + B[1][1])
    M5 = (A[0][0] + A[1][1]) * (B[1][1] - B[0][0])
    M6 = (A[0][0] + A[1][0]) * (B[0][0] + B[0][1])
    M7 = (A[0][1] + A[1][1]) * (B[1][0] + B[1][1])
     
    C = [[0, 0], [0, 0]] 
   
    C[0][0] = M1 - M3 - M5 + M7
    C[0][1] = M4 - M1
    C[1][0] = M2 + M3
    C[1][1] = -M2 - M4 + M5 + M6   
    return C

def strassen_k(A, B):
  
  # Si les matrices sont de dimension 2 x 2, calculer leur produit en utilisant la fonction strassen
  if len(A) == 2:
    return strassen(A, B)
  
  # Diviser les matrices A et B en sous-matrices de dimension 2^(k-1) x 2^(k-1)
  n = len(A) // 2
  A11 = [[A[i][j] for j in range(n)] for i in range(n)]
  A12 = [[A[i][j] for j in range(n, len(A))] for i in range(n)]
  A21 = [[A[i][j] for j in range(n)] for i in range(n, len(A))]
  A22 = [[A[i][j] for j in range(n, len(A))] for i in range(n, len(A))]
  B11 = [[B[i][j] for j in range(n)] for i in range(n)]
  B12 = [[B[i][j] for j in range(n, len(B))] for i in range(n)]
  B21 = [[B[i][j] for j in range(n)] for i in range(n, len(B))]
  B22 = [[B[i][j] for j in range(n, len(B))] for i in range(n, len(B))]
  
 
  M1 = strassen_k(add(A11, A22), add(B11, B22))
  M2 = strassen_k(add(A21, A22), B11)
  M3 = strassen_k(A11, sub(B12, B22))
  M4 = strassen_k(A22, sub(B21, B11))
  M5 = strassen_k(add(A11, A12), B22)
  M6 = strassen_k(sub(A21, A11), add(B11, B12))
  M7 = strassen_k(sub(A12, A22), add(B21, B22))  

  C1 = [[0, 0]]
  C[0][0] = M1 - M3 - M5 + M7
  C[0][1] = M4 - M1
  C[1][0] = M2 + M3
  C[1][1] = -M2 - M4 + M5 + M6
    
  return C1

#affichage resultat
for i in range(len(C)):
  for j in range(len(C[i])):
    print(C[i][j], end=" ")
  print()

Recherche bibliographique : Il existe l'algorithme de Coppersmith-Winograd et l'algorithmes et l'agorithme de Le Gall