Travailler avec des vecteurs, des matrices et des tableaux dans NumPy

# Introduction
NumPy est un outil fondamental de la pile Python de machine learning. Il permet d'effectuer des op√©rations efficaces sur les structures de donn√©es fr√©quemment utilis√©es en machine learning¬†: vecteurs, matrices et tenseurs. Ce chapitre aborde les op√©rations NumPy les plus courantes que nous sommes susceptibles de rencontrer lors de nos travaux de machine learning.

# Installation et chargement de NumPy

In [2]:
#Installation et import
#!pip install numpy
import numpy as np


# Cr√©ation d‚Äôun vecteur

On veut cr√©er un vecteur.

Pour ce faire, on utilise NumPy pour cr√©er un tableau unidimensionnel :


In [7]:
# Cr√©er un vecteur comme une ligne
vecteur_ligne = np.array([1, 2, 3])

# Cr√©er un vecteur comme une colonne
vecteur_colonne = np.array([[1],
                            [2],
                            [3]])

La principale structure de donn√©es de NumPy est le tableau multidimensionnel. Un vecteur est simplement un tableau avec une seule dimension.
Pour cr√©er un vecteur, on cr√©e donc un tableau unidimensionnel.
Comme les vecteurs, ces tableaux peuvent √™tre repr√©sent√©s horizontalement (c‚Äôest-√†-dire en lignes) ou verticalement (c‚Äôest-√†-dire en colonnes).


# Cr√©ation d‚Äôune matrice

On souhaite cr√©er une matrice.

Pour cela, on utilise NumPy pour cr√©er un tableau √† deux dimensions :


In [8]:
# Cr√©er une matrice
matrice = np.array([[1, 2],
                    [1, 2],
                    [1, 2]])

Pour cr√©er une matrice, on peut utiliser un tableau √† deux dimensions avec NumPy.
Dans notre exemple, la matrice contient trois lignes et deux colonnes (une colonne de 1 et une colonne de 2).
NumPy poss√®de en r√©alit√© une structure de donn√©es sp√©cifique pour les matrices :
````python
matrice_objet = np.mat([[1, 2],
                        [1, 2],
                        [1, 2]])
````

Ce qui donnerait :
```
matrix([[1, 2],
        [1, 2],
        [1, 2]])
```

Cependant, cette structure pour les matrices n‚Äôest pas recommand√©e pour deux raisons :
- Les tableaux (array) sont la structure de donn√©es standard utilis√©e dans NumPy.
- La grande majorit√© des op√©rations effectu√©es avec NumPy retournent des tableaux, et non des objets matrix.



# Cr√©ation d‚Äôune matrice creuse

On dispose de donn√©es avec tr√®s peu de valeurs non nulles et on veut les repr√©senter efficacement.

On cr√©e donc une matrice creuse :


In [None]:
#!pip install scipy



In [14]:
# chager la biblioth√®que sparse de scipy pour travailler avec des matrices creuses (sparse matrices)
from scipy import sparse

# Cr√©er une matrice
matrice = np.array([[0, 0],
                    [0, 1],
                    [3, 0]])

# Cr√©er une matrice creuse au format CSR (Compressed Sparse Row)
matrice_creuse = sparse.csr_matrix(matrice)

In [15]:
print(matrice_creuse)

<Compressed Sparse Row sparse matrix of dtype 'int64'
	with 2 stored elements and shape (3, 2)>
  Coords	Values
  (1, 1)	1
  (2, 0)	3


En apprentissage automatique, on rencontre souvent de tr√®s grandes quantit√©s de donn√©es, dont la majorit√© des √©l√©ments sont des z√©ros.

Par exemple, imaginons une matrice o√π les colonnes repr√©sentent tous les films disponibles sur Netflix, les lignes repr√©sentent les utilisateurs, et chaque valeur indique combien de fois un utilisateur a regard√© un film donn√©.
La matrice aurait des dizaines de milliers de colonnes et des millions de lignes ! Mais comme la plupart des gens ne regardent qu‚Äôune petite fraction de ces films, l‚Äôimmense majorit√© des valeurs serait nulle.

Une matrice creuse est une matrice dans laquelle la plupart des √©l√©ments sont √† z√©ro. Ces matrices ne stockent que les valeurs non nulles et supposent que les autres sont des z√©ros, ce qui permet de gagner en m√©moire et en performance.

Dans l‚Äôexemple ci-dessus, nous avons cr√©√© une matrice NumPy avec deux √©l√©ments non nuls, puis nous l‚Äôavons convertie en matrice creuse. 
Si on affiche cette matrice‚ÄØ:

````python
print(matrice_creuse)
````

Cela donne :
````
  (1, 1)	1
  (2, 0)	3
````

Cela signifie que seuls les √©l√©ments non nuls sont stock√©s :
- Le 1 est √† l‚Äôindice (1, 1) ‚Äî deuxi√®me ligne, deuxi√®me colonne
- Le 3 est √† l‚Äôindice (2, 0) ‚Äî troisi√®me ligne, premi√®re colonne

**Comparaison avec une matrice plus grande**

Si on cr√©e une matrice plus grande, avec beaucoup plus de z√©ros‚ÄØ:

````python
matrice_large = np.array([[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
                          [0, 1, 0, 0, 0, 0, 0, 0, 0, 0],
                          [3, 0, 0, 0, 0, 0, 0, 0, 0, 0]])

matrice_large_creuse = sparse.csr_matrix(matrice_large)

print(matrice_large_creuse)
````

On obtient‚ÄØ:
````
  (1, 1)	1
  (2, 0)	3
````

M√™me avec davantage de colonnes et de z√©ros, la repr√©sentation creuse est identique. Cela montre bien l‚Äôint√©r√™t de ce type de structure : la taille en m√©moire reste la m√™me tant que les √©l√©ments non nuls ne changent pas.

**Types de matrices creuses**

Il existe plusieurs formats de matrices creuses, parmi lesquels :
- CSR (Compressed Sparse Row)
- CSC (Compressed Sparse Column)
- Liste de listes (lil)
- Dictionnaire de cl√©s (dok)

Chaque format a ses avantages et inconv√©nients. Il n‚Äôy a pas de ¬´‚ÄØmeilleur‚ÄØ¬ª format universel, mais il est important de choisir en fonction du contexte et des op√©rations √† effectuer.


# Pr√©allocation de tableaux NumPy

On est amener √† pr√©allouer des tableaux d‚Äôune taille donn√©e avec une certaine valeur.

NumPy propose des fonctions pour g√©n√©rer des vecteurs et des matrices de n‚Äôimporte quelle taille contenant des z√©ros, des uns, ou la valeur de au choix :


In [19]:
# Charger la biblioth√®que
import numpy as np

# G√©n√©rer un vecteur de forme (1,5) contenant uniquement des z√©ros
vecteur = np.zeros(shape=5)

# Afficher le vecteur
print("R√©sultat de np.zeros(shape=5) : ")
print(vecteur)



R√©sultat de np.zeros(shape=5) : 
[0. 0. 0. 0. 0.]


In [None]:
# G√©n√©rer une matrice de forme (3,3) contenant uniquement des uns
matrice = np.full(shape=(3,3), fill_value=1)

# Afficher la matrice
print("R√©sultat de np.full(shape=(3,3), fill_value=1) : ")
print(matrice)

R√©sultat de np.full(shape=(3,3), fill_value=1) : 
[[1 1 1]
 [1 1 1]
 [1 1 1]]


G√©n√©rer des tableaux pr√©remplis avec des donn√©es est utile dans plusieurs cas, comme :
- Am√©liorer les performances du code
- Cr√©er des donn√©es synth√©tiques pour tester des algorithmes
Dans de nombreux langages de programmation, pr√©allouer un tableau avec des valeurs par d√©faut (comme des z√©ros) est une pratique courante pour rendre le code plus stable et plus rapide.


# S√©lection d‚Äô√©l√©ments

On souhaite s√©lectionner un ou plusieurs √©l√©ments dans un vecteur ou une matrice.

Pour ce faire, les tableaux NumPy rendent la s√©lection d‚Äô√©l√©ments tr√®s simple :


In [22]:
# Cr√©er un vecteur ligne
vecteur = np.array([1, 2, 3, 4, 5, 6])

# S√©lectionner le troisi√®me √©l√©ment du vecteur
vecteur[2]  # R√©sultat : 3

np.int64(3)

In [23]:
# Cr√©er une matrice
matrice = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])

# S√©lectionner l‚Äô√©l√©ment de la deuxi√®me ligne, deuxi√®me colonne
matrice[1, 1]  # R√©sultat : 5

np.int64(5)

Comme dans la majorit√© des cas en Python, les tableaux NumPy sont index√©s √† partir de z√©ro, c‚Äôest-√†-dire que le premier √©l√©ment a l‚Äôindice 0.
NumPy offre une grande vari√©t√© de m√©thodes pour s√©lectionner (indexer et d√©couper) des √©l√©ments ou groupes d‚Äô√©l√©ments :
````python
# S√©lectionner tous les √©l√©ments d‚Äôun vecteur
vecteur[:]  # array([1, 2, 3, 4, 5, 6])

# S√©lectionner tout jusqu‚Äôau troisi√®me √©l√©ment inclus
vecteur[:3]  # array([1, 2, 3])

# S√©lectionner tout √† partir du quatri√®me √©l√©ment
vecteur[3:]  # array([4, 5, 6])

# S√©lectionner le dernier √©l√©ment
vecteur[-1]  # 6

# Inverser le vecteur
vecteur[::-1]  # array([6, 5, 4, 3, 2, 1])

# S√©lectionner les deux premi√®res lignes et toutes les colonnes de la matrice
matrice[:2, :]  
# R√©sultat : array([[1, 2, 3],
#                  [4, 5, 6]])

# S√©lectionner toutes les lignes et la deuxi√®me colonne
matrice[:, 1:2]  
# R√©sultat : array([[2],
#                  [5],
#                  [8]])
````
 üß†üìê


# Description d‚Äôune matrice

On veut conna√Ætre la forme, la taille et les dimensions d‚Äôune matrice.

On utilise les attributs ``shape``, ``size`` et ``ndim`` d‚Äôun objet NumPy :


In [24]:
# Cr√©er une matrice
matrice = np.array([[1, 2, 3, 4],
                    [5, 6, 7, 8],
                    [9, 10, 11, 12]])

# Afficher le nombre de lignes et de colonnes
matrice.shape  # R√©sultat : (3, 4)

(3, 4)

In [25]:
# Afficher le nombre total d‚Äô√©l√©ments (lignes √ó colonnes)
matrice.size  # R√©sultat : 12

12

In [26]:
# Afficher le nombre de dimensions
matrice.ndim  # R√©sultat : 2

2

Cela peut para√Ætre basique (et √ßa l‚Äôest), mais c‚Äôest extr√™mement utile pour :
- v√©rifier la coh√©rence des op√©rations qu'on fais sur les matrices
- comprendre la structure des donn√©es
- anticiper les erreurs li√©es √† des formes incompatibles
Que ce soit en phase de d√©bogage, de pr√©paration de donn√©es, ou simplement en train de valider les calculs, ces attributs sont des alli√©s pr√©cieux dans l‚Äôunivers de NumPy.


# Application de fonctions √† chaque √©l√©ment

On veut appliquer une fonction √† tous les √©l√©ments d‚Äôun tableau.

On utilise la m√©thode vectorize de NumPy :


In [27]:
# Cr√©er une matrice
matrice = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])

# Cr√©er une fonction qui ajoute 100 √† un √©l√©ment
ajouter_100 = lambda i: i + 100

# Cr√©er une fonction vectoris√©e
fonction_vectoris√©e = np.vectorize(ajouter_100)

# Appliquer la fonction √† tous les √©l√©ments de la matrice
fonction_vectoris√©e(matrice)

# R√©sultat :
# array([[101, 102, 103],
#        [104, 105, 106],
#        [107, 108, 109]])

array([[101, 102, 103],
       [104, 105, 106],
       [107, 108, 109]])

La m√©thode ``vectorize`` de NumPy permet de convertir une fonction en une fonction qui peut s‚Äôappliquer √† chaque √©l√©ment d‚Äôun tableau (ou d‚Äôun sous-tableau).
Cependant, il est important de noter que ``vectorize`` fonctionne comme une boucle ``for`` sur les √©l√©ments et n‚Äôam√©liore pas les performances.

NumPy permet aussi d‚Äôappliquer des op√©rations directement sur les tableaux, gr√¢ce √† un m√©canisme appel√© **broadcasting**.

Par exemple, on peut simplifier la solution pr√©c√©dente :
````python
# Ajouter 100 √† tous les √©l√©ments
matrice + 100

# R√©sultat :
# array([[101, 102, 103],
#        [104, 105, 106],
#        [107, 108, 109]])
````

üåÄ Broadcasting ne fonctionne pas dans toutes les situations ni avec toutes les formes de tableaux, mais c‚Äôest une m√©thode courante et puissante pour effectuer des op√©rations simples sur chaque √©l√©ment d‚Äôun tableau NumPy.

üí°üêç


# Trouver les valeurs maximale et minimale

On souhaite avoir la valeur maximale ou minimale dans un tableau.

On utilise les m√©thodes ``max`` et ``min`` de NumPy :


In [28]:
# Cr√©er une matrice
matrice = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])

# Retourner l‚Äô√©l√©ment maximal
np.max(matrice)  # R√©sultat : 9

np.int64(9)

In [29]:
# Retourner l‚Äô√©l√©ment minimal
np.min(matrice)  # R√©sultat : 1

np.int64(1)

Il est fr√©quent de vouloir conna√Ætre la valeur maximale ou minimale dans un tableau ou dans une portion du tableau. Pour cela, on utilise simplement les m√©thodes ``max`` et ``min``.

Gr√¢ce au param√®tre ``axis``, on peut appliquer ces op√©rations selon un axe particulier :
````python
# Trouver l‚Äô√©l√©ment maximal de chaque colonne
np.max(matrice, axis=0)  # R√©sultat : array([7, 8, 9])

# Trouver l‚Äô√©l√©ment maximal de chaque ligne
np.max(matrice, axis=1)  # R√©sultat : array([3, 6, 9])
````

üìå √Ä noter :
- ``axis=0`` signifie qu‚Äôon applique la fonction verticalement, c‚Äôest-√†-dire sur chaque colonne.
- ``axis=1`` signifie qu‚Äôon applique la fonction horizontalement, c‚Äôest-√†-dire sur chaque ligne.


# Calcul de la moyenne, de la variance et de l‚Äô√©cart type

On veut calculer des statistiques descriptives sur un tableau.

On utilise les fonctions ``mean``, ``var`` et ``std`` de NumPy :

In [30]:
# Cr√©er une matrice
matrice = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])

# Calculer la moyenne
np.mean(matrice)  # R√©sultat : 5.0

np.float64(5.0)

In [31]:
# Calculer la variance
np.var(matrice)  # R√©sultat : 6.666666666666667

np.float64(6.666666666666667)

In [32]:
# Calculer l‚Äô√©cart type
np.std(matrice)  # R√©sultat : 2.5819888974716112

np.float64(2.581988897471611)

Comme avec max et min, on peut facilement extraire des statistiques descriptives sur l‚Äôensemble d‚Äôun tableau ou bien selon un axe sp√©cifique :
````python
# Calculer la moyenne de chaque colonne
np.mean(matrice, axis=0)  # R√©sultat : array([4., 5., 6.])
````

üìå Rappel utile :
- ``axis=0`` applique l‚Äôop√©ration colonne par colonne (verticalement).
- ``axis=1`` l‚Äôapplique ligne par ligne (horizontalement).


# Remodeler des tableaux

On veut modifier la forme (nombre de lignes et de colonnes) d‚Äôun tableau sans en changer les valeurs.

Pour ce faire, on utilise la fonction ``reshape`` de NumPy :


In [33]:
# Cr√©er une matrice 4x3
matrice = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9],
                    [10, 11, 12]])

# Remodeler la matrice en une matrice 2x6
matrice.reshape(2, 6)

# R√©sultat :
# array([[ 1, 2, 3, 4, 5, 6],
#        [ 7, 8, 9, 10, 11, 12]])

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12]])

La fonction reshape permet de restructurer un tableau, en conservant toutes les donn√©es mais en modifiant leur disposition (lignes et colonnes).

üìå Condition importante :
Le nombre d‚Äô√©l√©ments dans la matrice d‚Äôorigine et la nouvelle forme doit √™tre identique.
On peut v√©rifier le nombre d‚Äô√©l√©ments avec :

````python
matrice.size  # R√©sultat : 12
````

Une option tr√®s pratique est d‚Äôutiliser -1 comme argument pour signifier ¬´ autant que n√©cessaire ¬ª :

````python
# Une ligne, autant de colonnes que n√©cessaire
matrice.reshape(1, -1)

# R√©sultat :
# array([[ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]])
````

Et si tu donnes un seul entier, tu obtiens un tableau unidimensionnel :
````python
matrice.reshape(12)

# R√©sultat :
# array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
````

# Transposer un vecteur ou une matrice

On souhaite transposer un vecteur ou une matrice.

On utilise donc la m√©thode ``.T`` :


In [34]:
# Cr√©er une matrice
matrice = np.array([[1, 2, 3],
                    [4, 5, 6],
                    [7, 8, 9]])

# Transposer la matrice
matrice.T

# R√©sultat :
# array([[1, 4, 7],
#        [2, 5, 8],
#        [3, 6, 9]])

array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

La transposition est une op√©ration courante en alg√®bre lin√©aire qui consiste √† √©changer les lignes et les colonnes d‚Äôune matrice.

üìå √Ä savoir :

Techniquement, un vecteur simple (comme ``np.array([1, 2, 3])``) ne peut pas √™tre transpos√© car c‚Äôest simplement une liste de valeurs sans orientation (ni ligne ni colonne). Par exemple :

````python
# Transposer un vecteur simple
np.array([1, 2, 3, 4, 5, 6]).T  # R√©sultat : array([1, 2, 3, 4, 5, 6])
````

Mais si on cr√©e explicitement un vecteur ligne, on peut le transposer en vecteur colonne‚ÄØ:

````python
# Transposer un vecteur ligne en vecteur colonne
np.array([[1, 2, 3, 4, 5, 6]]).T

# R√©sultat :
# array([[1],
#        [2],
#        [3],
#        [4],
#        [5],
#        [6]])
````

Et bien s√ªr, cela fonctionne aussi dans l‚Äôautre sens.


# üßÆ Aplatir une matrice

Il est question ici de transformer une matrice en tableau √† une seule dimension.

Pour cela, on utilise la m√©thode ``flatten`` :


In [3]:
# Cr√©er la matrice
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

# Aplatir la matrice
matrix.flatten()
# R√©sultat : array([1, 2, 3, 4, 5, 6, 7, 8, 9])

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

``flatten`` est une m√©thode simple qui permet de transformer une matrice en un tableau √† une dimension.

‚û°Ô∏è Alternativement, on peut utiliser ``reshape`` pour cr√©er un vecteur ligne :
````python
matrix.reshape(1, -1)
# R√©sultat : array([[1, 2, 3, 4, 5, 6, 7, 8, 9]])
````

‚û°Ô∏è Une autre m√©thode courante est ``ravel``. Contrairement √† ``flatten``, qui retourne une copie du tableau original, ``ravel`` travaille directement sur l‚Äôobjet existant, ce qui le rend l√©g√®rement plus rapide. Elle permet aussi d‚Äôaplatir une liste de tableaux, ce que ``flatten`` ne peut pas faire. Cette op√©ration est donc utile pour les tr√®s grands tableaux et pour optimiser le code :

````python
# Cr√©er une premi√®re matrice
matrix_a = np.array([[1, 2],
                     [3, 4]])

# Cr√©er une seconde matrice
matrix_b = np.array([[5, 6],
                     [7, 8]])

# Cr√©er une liste de matrices
matrix_list = [matrix_a, matrix_b]

# Aplatir toute la liste de matrices
np.ravel(matrix_list)
# R√©sultat : array([1, 2, 3, 4, 5, 6, 7, 8])

````




# üìè D√©terminer le rang d'une matrice

On est amener √† conna√Ætre le rang d'une matrice.

Pour cela , on utilise la m√©thode ``matrix_rank`` de l'alg√®bre lin√©aire de NumPy :


In [4]:
# Cr√©er la matrice
matrix = np.array([[1, 1, 1],
                   [1, 1, 10],
                   [1, 1, 15]])

# Retourner le rang de la matrice
np.linalg.matrix_rank(matrix)
# R√©sultat : 2

np.int64(2)

Le **rang** d'une matrice correspond aux dimensions de l‚Äôespace vectoriel engendr√© par ses colonnes ou ses lignes.
Mieux, le nombre de vecteurs colonnes/lignes de la matrice qui sont lin√©airement ind√©pendants.
Gr√¢ce √† la fonction ``matrix_rank`` dans NumPy, d√©terminer ce rang devient tr√®s simple.


# üî¢ Extraire la diagonale d'une matrice

On est amener parfois √† extraire les √©l√©ments diagonaux d'une matrice.

Donc, on utilise la m√©thode ``diagonal`` de NumPy :


In [5]:
# Cr√©er la matrice
matrix = np.array([[1, 2, 3],
                   [2, 4, 6],
                   [3, 8, 9]])

# Retourner les √©l√©ments diagonaux
matrix.diagonal()
# R√©sultat : array([1, 4, 9])

array([1, 4, 9])

NumPy rend l‚Äôextraction des √©l√©ments diagonaux tr√®s simple gr√¢ce √† la m√©thode ``diagonal``.`

‚û°Ô∏è Il est √©galement possible d‚Äôobtenir une diagonale d√©cal√©e par rapport √† la diagonale principale en utilisant le param√®tre ``offset`` :
````python
# Diagonale une position au-dessus de la principale
matrix.diagonal(offset=1)
# R√©sultat : array([2, 6])

# Diagonale une position en dessous de la principale
matrix.diagonal(offset=-1)
# R√©sultat : array([2, 8])
````





# ‚ûï Calculer la trace d'une matrice

On souhaite calculer la trace d'une matrice.

On utilise la m√©thode ``trace`` :


In [6]:
# Cr√©er la matrice
matrix = np.array([[1, 2, 3],
                   [2, 4, 6],
                   [3, 8, 9]])

# Retourner la trace de la matrice
matrix.trace()
# R√©sultat : 14

np.int64(14)

La trace d'une matrice est la somme des √©l√©ments diagonaux. Elle est souvent utilis√©e dans des m√©thodes d'apprentissage automatique.

‚û°Ô∏è Avec un tableau multidimensionnel NumPy, on peut utiliser directement ``trace``.

‚û°Ô∏è Alternativement, on peut extraire les √©l√©ments diagonaux avec ``diagonal()`` et en faire la somme :
````python
# Extraire la diagonale et sommer les √©l√©ments
sum(matrix.diagonal())
# R√©sultat : 14
````





# üîò Calcul du produit scalaire de deux vecteurs

On doit calculer ici le produit scalaire de deux vecteurs.

Pour ce faire, on utilise la fonction ``dot`` de NumPy :


In [7]:
# Cr√©er deux vecteurs
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])

# Calculer le produit scalaire
np.dot(vector_a, vector_b)
# R√©sultat : 32

np.int64(32)

Le produit scalaire de deux vecteurs, a et b, est d√©fini comme :

$\sum_{i=1}^{n} a_i \cdot b_i$

o√π $a_i$ est le i-√®me √©l√©ment du vecteur a, et $b_i$ celui du vecteur b.

‚û°Ô∏è Avec NumPy, on peut utiliser ``dot`` pour le calculer facilement.

‚û°Ô∏è Depuis Python 3.5+, on peut aussi utiliser l‚Äôop√©rateur ``@`` :
````python
# Calculer le produit scalaire avec l‚Äôop√©rateur @
vector_a @ vector_b
# R√©sultat : 32
````





# ‚ûï‚ûñ Addition et soustraction de matrices

On souhaite additionner ou soustraire deux matrices.

On utilise les fonctions ``add`` et ``subtract`` de NumPy :


In [8]:
# Cr√©er la premi√®re matrice
matrix_a = np.array([[1, 1, 1],
                     [1, 1, 1],
                     [1, 1, 2]])

# Cr√©er la deuxi√®me matrice
matrix_b = np.array([[1, 3, 1],
                     [1, 3, 1],
                     [1, 3, 8]])

# Additionner les deux matrices
np.add(matrix_a, matrix_b)
# R√©sultat : array([[ 2, 4, 2],
#                   [ 2, 4, 2],
#                   [ 2, 4, 10]])


array([[ 2,  4,  2],
       [ 2,  4,  2],
       [ 2,  4, 10]])

In [9]:

# Soustraire les deux matrices
np.subtract(matrix_a, matrix_b)
# R√©sultat : array([[ 0, -2, 0],
#                   [ 0, -2, 0],
#                   [ 0, -2, -6]])

array([[ 0, -2,  0],
       [ 0, -2,  0],
       [ 0, -2, -6]])

On peut aussi utiliser les op√©rateurs ``+`` et ``‚Äì`` pour faire la m√™me chose de mani√®re plus concise :
````python
# Additionner deux matrices
matrix_a + matrix_b
# R√©sultat : array([[ 2, 4, 2],
#                   [ 2, 4, 2],
#                   [ 2, 4, 10]])
````

‚ÑπÔ∏è Il faudrait s'assurer que les matrices ont les m√™mes dimensions, sinon NumPy l√®vera une erreur.


# ‚úñÔ∏è Multiplication de matrices

On souhaite effectuer une multiplication entre deux matrices.

Donc, on utilise la fonction ``dot`` de NumPy :


In [10]:
# Cr√©er la premi√®re matrice
matrix_a = np.array([[1, 1],
                     [1, 2]])

# Cr√©er la seconde matrice
matrix_b = np.array([[1, 3],
                     [1, 2]])

# Effectuer la multiplication matricielle
np.dot(matrix_a, matrix_b)
# R√©sultat : array([[2, 5],
#                   [3, 7]])

array([[2, 5],
       [3, 7]])

‚û°Ô∏è Depuis Python 3.5+, on peut utiliser l'op√©rateur ``@`` pour une syntaxe plus intuitive :

````python
# Multiplication matricielle avec l'op√©rateur @
matrix_a @ matrix_b
# R√©sultat : array([[2, 5],
#                   [3, 7]])
````

‚û°Ô∏è Pour effectuer une multiplication √©l√©ment par √©l√©ment (et non une multiplication matricielle), on utilise l'op√©rateur ``*`` :

````python
# Multiplication √©l√©ment par √©l√©ment
matrix_a * matrix_b
# R√©sultat : array([[1, 3],
#                   [1, 4]])
````

‚ÑπÔ∏è La multiplication matricielle suit les r√®gles de l‚Äôalg√®bre lin√©aire classique :

Le nombre de colonnes dans la premi√®re matrice doit correspondre au nombre de lignes dans la seconde.


# üîÅ Inversion d'une matrice carr√©e

On souhaite calculer l‚Äôinverse d‚Äôune matrice carr√©e.

Pour cela, on utilise la m√©thode ``inv`` du module ``linalg`` de NumPy :


In [11]:
# Cr√©er une matrice carr√©e
matrix = np.array([[1, 4],
                   [2, 5]])

# Calculer l'inverse de la matrice
np.linalg.inv(matrix)
# R√©sultat : array([[-1.66666667,  1.33333333],
#                  [ 0.66666667, -0.33333333]])

array([[-1.66666667,  1.33333333],
       [ 0.66666667, -0.33333333]])

L‚Äô**inverse** d‚Äôune matrice carr√©e $A$ est une matrice $A^{-1}$ telle que :

$A \cdot A^{-1} = I$

o√π $I$ est la matrice identit√©.

‚û°Ô∏è NumPy permet de calculer cette matrice inverse gr√¢ce √† ``np.linalg.inv()`` si l‚Äôinverse existe (c‚Äôest-√†-dire si la matrice est non singuli√®re).

üìå Pour v√©rifier, on peut multiplier la matrice par son inverse :
````python
# Multiplier la matrice par son inverse
matrix @ np.linalg.inv(matrix)
# R√©sultat : array([[1., 0.],
#                   [0., 1.]])
````

Cela donne bien la matrice identit√©, preuve que l‚Äôinversion a r√©ussi.


# üé≤ G√©n√©ration de valeurs al√©atoires

On souhaite g√©n√©rer des valeurs pseudo-al√©atoires.

Pour cela, il faudrait utiliser le module ``random`` de NumPy :


In [12]:
# D√©finir une graine (seed) pour rendre les r√©sultats reproductibles
np.random.seed(0)

# G√©n√©rer trois nombres flottants al√©atoires entre 0.0 et 1.0
np.random.random(3)
# R√©sultat : array([0.5488135 , 0.71518937, 0.60276338]) ---> on a utilis√© la graine 0 pour que les r√©sultats soient toujours les m√™mes
# (si on ne met pas de graine, les r√©sultats seront diff√©rents √† chaque ex√©cution

array([0.5488135 , 0.71518937, 0.60276338])

NumPy offre une grande vari√©t√© de fonctions pour g√©n√©rer des nombres al√©atoires ‚Äî bien plus que ce qu‚Äôon peut couvrir ici.

‚úÖ Exemple de g√©n√©ration d‚Äôentiers al√©atoires :
````python
# G√©n√©rer trois entiers al√©atoires entre 0 et 10 inclus
np.random.randint(0, 11, 3)
# R√©sultat : array([3, 7, 9])
````

‚úÖ Tirage depuis des distributions statistiques (attention, ce n‚Äôest pas techniquement al√©atoire, mais bas√© sur des lois probabilistes) :
````python
# Tirage dans une distribution normale (moyenne = 0.0, √©cart-type = 1.0)
np.random.normal(0.0, 1.0, 3)
# R√©sultat : array([-1.42232584, 1.52006949, -0.29139398])

# Tirage dans une distribution logistique (moyenne = 0.0, √©chelle = 1.0)
np.random.logistic(0.0, 1.0, 3)
# R√©sultat : array([-0.98118713, -0.08939902, 1.46416405])

# Tirage uniforme entre 1.0 inclus et 2.0 exclus
np.random.uniform(1.0, 2.0, 3)
# R√©sultat : array([1.47997717, 1.3927848 , 1.83607876])
````

üîÅ Pour que les r√©sultats soient pr√©visibles et reproductibles, on utilise la graine (seed) du g√©n√©rateur. Deux ex√©cutions avec la m√™me graine produisent les m√™mes r√©sultats, ce qui est tr√®s pratique pour les tests ou les tutoriels.


# Cr√©ation des donn√©es avec numpy 

## Cr√©er un numpy array avec une liste/liste de liste (matrice)

In [13]:
# Cr√©ation √† partir d'un liste
liste = [1, 2, 3, 4, 5]  # D√©finition de la liste d'√©l√©ment
array_with_liste = np.array(liste)
print(array_with_liste)  # affiche le numpy array

[1 2 3 4 5]


In [14]:
# Cr√©ation √† partir d'une matrice
# Cr√©ation d'un numpy array √† partir d'une liste de listes (matrice)
matrice = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
array_with_matrice = np.array(matrice)
print(array_with_matrice)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


## Cr√©er un numpy array √† partir des fonctions int√©gr√©es

In [None]:
#Cr√©er un numpy array √† partir de la fonction zeros
array_zeros = np.zeros((3,3))
print(array_zeros)

[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


In [None]:
#Cr√©er un numpy array √† partir de la fonction ones
array_ones = np.ones((4,2))
print(array_ones)

[[1. 1.]
 [1. 1.]
 [1. 1.]
 [1. 1.]]


In [None]:
#Cr√©er un numpay array avec la fonction eye 
array_eye = np.eye(3) #Pour cr√©er la matrice identit√©
array_eye


array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [None]:
#Cr√©er un numpay array avec la fonction arange: pour cr√©er des nombre entre le minimum et le maximum avec un pas
array_arange = np.arange(0, 11, 2) # Pour cr√©er un tableau de 0 √† 10 avec un pas de 2
array_arange

array([ 0,  2,  4,  6,  8, 10])

In [None]:
#Cr√©er un numpay array avec la fonction linspace 
#g√©n√©rer une s√©quence de nombre 
#entre deux valeurs donn√©es avec un nombre de points donn√©
#Tr√®s utile pour les graphiques
array_linspace = np.linspace(0, 1, 10) # Pour cr√©er un tableau de 0 √† 1 avec 10 points exacts
array_linspace

array([0.        , 0.11111111, 0.22222222, 0.33333333, 0.44444444,
       0.55555556, 0.66666667, 0.77777778, 0.88888889, 1.        ])

In [None]:
# Cr√©er un numpy array de valeurs al√©atoires avec la fonction random
# Utile pour initialiser les poids dans les r√©seaux de neurones, g√©n√©rer des donn√©es d'apprentissage synth√©tiques
array_random = np.random.random((5,4)) # Pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires comprises entre 0 et 1
print(array_random)

[[0.38460183 0.91191777 0.26433874 0.42778659]
 [0.86015894 0.33599314 0.07096604 0.53405233]
 [0.38777336 0.92685784 0.37362457 0.37665129]
 [0.66224501 0.04220367 0.09486011 0.24925666]
 [0.29675815 0.27890915 0.4802953  0.13089389]]


On peut utiliser aussi : 

-  ``np.random.rand(5,4)`` pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires comprises entre 0 et 1

-  ``np.random.randn(5,4)`` pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires suivant une distribution normale

-  ``np.random.randint(0, 10, (5,4))`` pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires enti√®res entre 0 et 10

-  ``np.random.choice([1, 2, 3, 4, 5], size=(5,4))`` pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires 
choisies parmi une liste

-  ``np.random.permutation([1, 2, 3, 4, 5])`` pour cr√©er un tableau de 5 √©l√©ments avec des valeurs al√©atoires choisies parmi une liste

-  ``np.random.shuffle([1, 2, 3, 4, 5])`` pour m√©langer les √©l√©ments d'une liste

- ``np.random.choice([1, 2, 3, 4, 5], size=(5,4), replace=True)`` pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires choisies parmi une liste avec remplacement

-  ``np.random.choice([1, 2, 3, 4, 5], size=(5,4), replace=False)`` pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires choisies parmi une liste sans remplacement

- `` np.random.uniform(0, 1, (5,4))``  Pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires comprises entre 0 et 1

- ``np.random.normal(0, 1, (5,4))``  Pour cr√©er un tableau de 5 lignes et 4 colonnes avec des valeurs al√©atoires suivant une distribution normale  de moyenne=0.0 et ecart-type=1.0 


# Fonctions math√©matiques et statistiques avec Numpy

In [None]:
#Fonction math√©matiques basiques
array1=array_with_liste
array_sum = np.sum(array1)
array_mean = np.mean(array1)
array_std = np.std(array1)
array_min = np.min(array1)
array_max = np.max(array1)
array_sqrt = np.sqrt(array1)
array_abs = np.abs(array1)
array_power = np.power(array1, 2)
array_exp = np.exp(array1)
array_log = np.log(np.abs(array1))
array_sin = np.sin(array1)
array_median = np.median(array1)
array_sum

15

In [None]:
array_median

3.0

# Manipulation des matrices avec Numpy

In [None]:
# Produit matriciel
matrice = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
produit_matriciel = np.dot(array_with_matrice, array_with_matrice)
print(produit_matriciel)

[[ 30  36  42]
 [ 66  81  96]
 [102 126 150]]


In [None]:
# Transpos√©e
transposee = np.transpose(array_with_matrice)
print(transposee)

[[1 4 7]
 [2 5 8]
 [3 6 9]]


In [None]:
# Inversion (pour les matrices carr√©es non singuli√®res)
inverse = np.linalg.inv(array_eye)
print(inverse)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


In [None]:
#D√©terminant
determinant=np.linalg.det(array_eye)
print(determinant)  

1.0


# Acc√©der  aux √©l√©ments, s√©lectionner, modifier et mettre √† jour un numpy array

In [None]:
# Acc√®s aux √©l√©ments
array1 = np.array([1,2,3,4,5]) 
premier_element = array1[0]
print(premier_element)


1


In [None]:
array1[2]

3

In [None]:
# Modification d'un √©l√©ment
array1[0] = 15
print(array1)

[15  2  3  4  5]


In [None]:
# S√©lection des √©l√©ments qui respectent une condition
condition = array1 > 5 # S√©lectionne les √©l√©ments sup√©rieurs √† 5
elements_respectant_condition = array1[array1 > 2] # Assigne √† une nouvelle variable les √©lements qui respectent la condition
elements_respectant_condition

array([15,  3,  4,  5])

In [None]:
condition = array1 > 3
condition
indices = np.where(array1 > 3) # pour obtenir les indices des √©l√©ments qui respectent la condition
indices

(array([0, 3, 4]),)

In [None]:
array1 > 5 # affiche un tableau de true/false pour chaque √©l√©ment du tableau array v√©rifiant la condition (True) ou non (False) 

array([ True, False, False, False, False])

In [None]:
# Utilisation de np.where
indices = np.where(array1 > 5)
elements_respectant_condition_np_where = array1[indices]
print(elements_respectant_condition_np_where)

In [None]:
# Mise √† jour d'un numpy array
array1[condition] = 0 # Met √† z√©ro les √©l√©ments qui respectent la condition
print(array1)

[0 2 3 0 0]


In [None]:
#  Slicing et indexation avanc√©e
array6 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# Slicing
premiere_ligne = array6[0, :]
premiere_ligne

array([1, 2, 3])

In [None]:
#Premi√®re colonne
premiere_colonne = array6[:, 0]
premiere_colonne


array([1, 4, 7])

In [None]:
#sous matrice
sous_matrice = array6[1:3, 1:3]
sous_matrice

array([[5, 6],
       [8, 9]])

In [None]:
# Indexation avanc√©e
lignes = [0, 1]
colonnes = [1, 2]
elements_selectionnes = array6[lignes, colonnes]
elements_selectionnes

array([2, 6])

In [None]:
# Op√©rations √©l√©mentaires et diffusion (broadcasting)
array7 = np.array([1, 2, 3])
array8 = np.array([4, 5, 6])


# Addition √©l√©mentaire
array_addition = array7 + array8
array_addition

array([5, 7, 9])

In [None]:
# Multiplication √©l√©mentaire
array_multiplication = array7 * array8
array_multiplication


array([ 4, 10, 18])

In [None]:
# Diffusion (broadcasting)
array9 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
array10 = np.array([1, 2, 3])
array9+array10

array([[ 2,  4,  6],
       [ 5,  7,  9],
       [ 8, 10, 12]])

# Redimensionnement, append, type de donn√©es taille etc

In [None]:
#r redimensionn√© le numpy array
array3 = np.arange(9)
array3_redimensionne = array3.reshape((3, 3))
print(array3_redimensionne)

[[0 1 2]
 [3 4 5]
 [6 7 8]]


In [None]:
array3 = np.arange(9)
array3

array([0, 1, 2, 3, 4, 5, 6, 7, 8])

In [None]:
#Ajouter des √©l√©ments dans un numpy array
array1_allonge = np.append(array1, [6, 7, 8])
print(array1_allonge)

[0 2 3 0 0 6 7 8]


In [None]:
#Connaitre les caract√©ristiques d'un numpy array
array_with_matrice.shape #dimension de l'array 

(3, 3)

In [None]:
#Connaitre le type de l'objet
type(array_with_matrice) #type de l'objet

numpy.ndarray

In [None]:
#Connaitre le type des √©l
array1.dtype #type des objets contenu dans le numpy array

dtype('int64')

In [None]:
array7 = np.array(['1', '2', '3'])
array7.dtype

dtype('<U1')