# TP 4 : Découverte du module NumPy : tableaux et calcul matriciel

Le module **NumPy** contient les éléments indispensables à la modélisation des vecteurs, des matrices et plus généralement des tableaux multidimensionnels. On y trouve de nombreuses fonctions de manipulation de tableaux et une bibliothèque mathématique importante.

Il s’agit d’un module stable, bien testé et relativement bien documenté :
<http://docs.scipy.org/doc/> , <http://docs.scipy.org/doc/numpy/reference/

Pour installer le module NumPy, on exécutera la commande : 

In [1]:
import numpy

pip install numpy

SyntaxError: invalid syntax (2100378928.py, line 3)

Pour importer le module python, on exécutera la commande :

In [None]:
import numpy as np  # toutes les fonctions NumPy seront alors préfixées par np.

----
## 1. Créations de tableaux de type ndarray

Pour travailler efficacement avec des tableaux (multidimensionnel), NumPy fournit le type *ndarray*, qui, bien que très proche sur
le plan syntaxique du type *list* , diffère de ce dernier sur plusieurs points importants :
* la taille des tableaux ndarray est fixée au moment de la création et ne peut plus être modifiée par la suite (on peut cependandant les *redimensionner*)
;
* les tableaux ndarray sont *homogènes*, c’est-à-dire constitués d’éléments de même type.

En contrepartie, l’accès aux éléments d’un tableau ndarray est incomparablement plus rapide, ce qui justifie
pleinement leur usage pour manipuler des matrices de grandes tailles.


**Nous travaillerons pour commencer uniquement avec des tableaux à une dimension (pour manipuler des vecteurs) ou deux dimensions (pour manipuler des matrices).**

On utilise la fonction `numpy.array()` pour créer un tableau de type *ndarray* : 
- à partir de la liste des éléments pour un tableau à une dimension 
- à partir de la liste des listes pour un tableau à deux dimensions 

In [None]:
# création d'un tableau d'élèments de type float à une dimension
B=np.array([1.1,0.3,3.6,-4.7])
print(B)
print(type(B))

In [2]:
# création d'une matrice 3 * 4 d'éléments de type int
A=np.array([[1,1,1,4],[1,2,-1,0],[0,5,2,1]])  
print(A)
print(type(A))

NameError: name 'np' is not defined

##### **Question 1 :** 
Si les éléments du tableau ont des types différents, certains seront automatiquement convertis. 

Par exemple, si la liste des coefficients contient des éléments de type *float* et de type *int*, ces derniers seront convertis en *float* :

Créez un tableau T de dimension 2 * 2 dont tous les éléments sont de type *int* sauf un qui est de type *float*. Affichez ce tableau et observez.

In [None]:
# Réponse
T = np.array([[1, 1],
              [1, 1.1]])
print(T)

Aussi, pour éviter toute ambiguïté il est préférable de préciser lors de la création le type des éléments souhaités avec le paramètre optionnel `dtype` (pour *data type*) :

In [None]:
B = np.array([1, 7, -1, 0, 2], dtype=int)
print(B)
C = np.array([1, 7, -1, 0, 2], dtype=float)
print(C)

----
## 2. Accés aux éléments d'un tableau

Pour un tableau *ndarray* à une dimension, on accède à un élément exactement de la même façon que pour une liste : à partir de son indice.

In [None]:
print(B)
print(B[0])

Pour les tableaux bi-dimensionnel, outre la syntaxe usuelle `A[i][j]`, il est aussi possible d’utiliser la syntaxe `A[i,j]` :

In [None]:
print(A)
print(A[2][3])
print(A[2,3])

Le slicing (les coupes) suit la même syntaxe que pour les listes Python. On retiendra surtout la syntaxe pour obtenir une vue d’une colonne ou d’une ligne d’une matrice :

In [None]:
A[2]  # 3ie ligne de A

In [None]:
A[:, 2] # 3e colonne de A

In [None]:
E= A[2,0:3]  # les 3 premiers éléments de la 3e ligne de A
print(A)
print(E)


##### **Question 2 :**  *Attention à la copie de tableau* 
Obervez et comparez les trois expériences suivantes : 

In [None]:
a = 1.0
b = a
print(b)
a = 4.0
print(b)

In [None]:
A = np.array([[2,2,2],[3,3,3]])
B = A
print(B)
A[0][0] = 55
print(B)

In [None]:
A = np.array([[2,2,2],[3,3,3]])
B = A[:,0]   # cas d'une coupe
print(B)
A[0,0]=66
print(B)

**A retenir :** Pour un tableau NumPy, par defaut on ne copie que l’adresse du tableau (pointeur) pas son contenu (les deux noms correspondent alors aux mêmes adresses en mémoire). Pour effectuer une copie des valeurs, il faut utiliser .copy().
Cela s'applique aussi aux objets de type *list*. 


----
## 3. Redimensionnement d'un tableau
La méthode `shape` sur un tableau *ndarray* permet de connaitre ses dimensions : elle retourne un tuple d'entiers. 
On notera que la commande `len(A)` correspond à la premiere valeur de ce tuple. La méthode `size` retourne le nombre d'éléments du tableau.

In [None]:
# cas d'un tableau bi-dimensionnel
a= np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(a.shape)  # équivalent à np.shape(a)
print(len(a))
print(a.size)  # équivalent à np.size(a)

In [None]:
# cas d'un tableau à une dimension
b=np.array([2,4,6,8])
b.shape

Modifier cet attribut permet de redimensionner le tableau, à condition bien sur que le nombre total d'éléments du tableau reste inchangé.

Les 12 éléments du tableau a peuvent donc être ré-ordonnées pour former un tableau de taille 2*6, ou un tableau 1D de taille 12 : 

In [None]:
a.shape = 2,6
a

In [None]:
a.shape = 12  # équivalent à a.shape = 12,
print(a)

C'est l'occasion d'observer que numpy différencie les tableaux à une dimension (mathématiquement, des nuplets ou des vecteurs), des tableaux bi-dimensionnels, même lorsque ces derniers ne comportent qu'une seule ligne ou une seule colonne : 

In [None]:
a.shape = 1,12  
print(a)  # observez la différence ...

On notera que redimensionner une matrice est une opération de coût constant. L'explication est simple : quelle que soit la forme de la matrice, ses coefficients sont stockés en mémoire dans des cases contiguës et le format de la matrice dans un emplacement spécifique : 

![](tableauDimension.png)

Connaître la case dans laquelle se trouve l'élément sur la $i$-ie ligne et $j$-ie colonne, n'est que le résultat d'un simple calcul : 

Pour une matrice de $n$ lignes et $p$ colonnes, il s'agit de la case de rang $i \times n + j$. 

Modifier les dimensions d'un tableau consiste tout simplement à changer cette formule, pas les emplacements en mémoire des éléments. 

---- 
## 4. Création de tableaux spécifiques

- La méthode `numpy.zeros()` permet de former des tableaux dont tous les coefficients sont nuls : on mettra en argument obligatoire un tuple qui précise la dimension du tableau. 


- De la même façon, la méthode `numpy.ones()` permet de former des tableaux dont tous les coefficients valent 1. : on mettra en argument obligatoire un tuple qui précise la dimension du tableau. 


- La méthode `numpy.identity()`constuit la matrice Identité d'ordre $n$ : on mettra en argument la valeur de $n$. 

- La méthode `numpy.diag()` appliquée à une liste renvoie la matrice diagonale formée à partir des coefficients de cette liste : 




##### **Question 3 :**

Construire les matrices suivantes : 
$$ O_{3,4}  \quad ; \quad   I_4 \quad  ; \quad  \begin{pmatrix} -1&0&0\\0&2&0\\0&0&5 \end{pmatrix} $$ 

In [None]:
# réponse : 
O = np.zeros((3,4))
I = np.identity(4)
M = np.diag([-1, 2, 5])

print(O)
print(I)
print(M)

##### **Question 4 :** 
Ecrire une fonction `matrice()`qui prend en entrée un entier $n$ et qui retourne le tableau ndarray correspond à la matrice $A$ carrée d'ordre $n$ suivante : 
 $$ \begin{pmatrix}
 2 & -1 & 0 & \cdots & \cdots & 0 \\
 -1 & 2 & -1 & \ddots & \cdots & \vdots \\
 0 & -1 & 2 & \ddots & \ddots & \vdots \\
 \vdots & \ddots & \ddots & \ddots & \ddots & 0 \\
  \vdots & \cdots & \ddots & -1 & 2 & -1 \\
  0 & \cdots & \cdots & 0 & -1 & 2 \\
 
 \end{pmatrix}
 $$ 



In [3]:
# Réponse : 
def matrice(n):
    A = np.zeros((n, n)) + np.diag([2 for i in range(0, n)]);
    for x in range(0, n):
        for y in range(0, n):
            if abs(x-y) == 1:
                A[x, y] = -1
    return A

In [4]:
# test de la fonction matrice()
matrice(5)

NameError: name 'np' is not defined

La fonction `numpy.arange()` permet de construire des tableaux à une dimension de suite de nombres : 

L'instruction `numpy.arange(a,b,step)` constuit le tableau de tous les nombres  : 
 $$ a + k*step \quad \text{ pour } \quad k=0,1,... \quad \text{ et tels que } \quad a+ k*step<b $$

In [5]:
print(np.arange(10)) # liste des entiers de 0 à 9
print(type(np.arange(10))) 

print(np.arange(3,10)) # liste des entiers de 3 à 9
print(np.arange(3,10,2)) # liste des entiers de 3 à 9 par pas de 2
print(np.arange(0,1,0.1)) # liste les nombres x de 0 à 0.9 par pas de 0.1

NameError: name 'np' is not defined

**Remarque :** pour des listes d’entiers dans une boucle for, on pourra utiliser de manière
équivalente la fonction range : 

```python
for i in np.arange(10): 
    print(i) # liste des entiers de 0 à 9
```

est similaire à : 
```python 
for i in range(10):
     print(i)
``` 
La différence est que `range(10)` définit un ”iterateur”, alors que `arange(10)` crée un tableau d’entiers, ensuite parcouru par la variable i. Pour des boucles sur des très grands nombres, il vaut mieux utiliser range.

----
## 5. Opérations sur les tableaux ndarray : calcul matriciel

##### **Question 5 :**  Les opérateurs + et * 
Exécutez et comprenez les commandes suivantes : 

In [6]:
# Sans NumPy, avec le type list
# Opérateurs + et * sur des listes de listes  
T=[[0,1],[2,3]] 
U=[[4,5],[6,7]]
print("T : ",U)
print("U : ",U)
print("T+U : ",T+U)
print("2*T : ",2*T)
print("T*2 : ",T*2)
print("T*U: ",T*U) 

T :  [[4, 5], [6, 7]]
U :  [[4, 5], [6, 7]]
T+U :  [[0, 1], [2, 3], [4, 5], [6, 7]]
2*T :  [[0, 1], [2, 3], [0, 1], [2, 3]]
T*2 :  [[0, 1], [2, 3], [0, 1], [2, 3]]


TypeError: can't multiply sequence by non-int of type 'list'

In [7]:
# Avec NumPy et le type ndarray
# Opérateurs + et * sur des tableaux ndarray : 
A= np.array([[1,2,3], [3,4,1]])
B= np.array([[4,6,1], [1,1,1]])
print("A :",A)
print("B : ", B)
print("A+B :", A+B)
print("3*A :", 3*A)
print("A*3 :", A*3)
print("A*B :", A*B)

NameError: name 'np' is not defined

**A retenir :** Attention à la commande `A * B`,  il ne s'agit pas du produit matriciel, mais du produit "terme à terme".

Pour le produit de deux matrices  A
et  B (celui qui n'est défini que quand  A possède autant de colonnes que  B a de lignes), il faut utiliser  : 

`np.matmul(A,B)`    ou     `A @ B`    ou    `np.dot(A,B)` 

In [8]:
A= np.array([[1,2,3], [3,4,1]])
C= np.array([[4,6],[0,1],[1,2]])
print(np.matmul(A,C))
print(A @ C)
print(np.dot(A,C))

NameError: name 'np' is not defined

##### **Question 6 :**
 
Exécutez et comprenez les commandes suivantes: 

In [9]:
A-1

NameError: name 'A' is not defined

In [10]:
A**2 

NameError: name 'A' is not defined

##### **Question 7 :**
On veut, pour une matrice donnée, élever chacun de ses élements au carré puis leur retrancher 1.  
Nous allons comparer les temps d'exécutions des deux méthodes suivantes : 
- avec un tableau ndarray et les opérateurs ** et - 
- avec une liste de listes et un parcours de chaque élément pour effectuer les opérations de façon itérative. 

In [11]:
# on génére une matrice d'entiers aléatoires de grande taille 
N= 1000
A= np.random.randint(300, size=(N,N))

NameError: name 'np' is not defined

In [12]:
# faisons une copie de A, mais comme une liste de listes:
B= [ [A[i,j] for j in range(N)] for i in range(N)] 
type(B)  # confirmation du type list de B

NameError: name 'A' is not defined

Complétez la fonction `test()`qui modifie B comme demandé en parcournant chaque élément de la liste : 

In [13]:
# réponse
def test(B):
    for x in range(len(B)):
        for y in range(len(B[0])):
            B[x][y] = (B[x][y]**2)-1

    

In [14]:
# temps d'exécution 
%time test(B)  

NameError: name 'B' is not defined

In [15]:
# temps d'exécution
%time A=A**2-1

NameError: name 'A' is not defined

##### **Question 8 :**

Réécrire plus simplement (sans boucle for) les fonctions `addLigne()`et `multLigne()`vues au TP3 pour des matrices stockées sous la forme de tableaux ndarray (et non de listes de listes) : 

In [16]:
# à compléter 
# Li <- kLi
def multLigneNP(A,k,i):
    A[i] *= k




# à compléter
# Li <- Li + kLj 
def addLigneNP(A,k,i,j):
    A[i] += k*A[j]

    

In [17]:
# test des fonctions addLigneNP() et multLigneNP() : 
A = np.ones((3, 3))
addLigneNP(A, 2, 1, 2)
multLigneNP(A, 4, 0)
print(A)

NameError: name 'np' is not defined

----
## 6. Le module numpy.linalg

Le module `linalg` (pour *algèbre linéaire*) de la bibliothèque NumPy est un ensemble d'outils mathématiques pour effectuer des calculs matriciels et ou des calculs linéaires en Python. Il contient des fonctions pour résoudre des systèmes d'équations linéaires, calculer les valeurs et vecteurs propres d'une matrice, déterminer la décomposition de matrices, etc. Il est souvent utilisé pour résoudre des problèmes de traitement d'images, de reconnaissance de formes, de traitement du signal et d'apprentissage automatique. Ces fonctions sont utiles pour résoudre des problèmes liés à l'analyse numérique et à la science des données.

In [18]:
import numpy.linalg as alg

La fonction `inv` du module numpy.linalg renvoie l’inverse d'une matrice carrée si elle existe.

In [19]:
A = np.diag([1,3,5,8])
A
alg.inv(A)

NameError: name 'np' is not defined

Pour résoudre le système linéaire $AX=B$  lorsque la matrice $A$ est inversible (système de Cramer), on peut employer la fonction `solve(A,B)` du module numpy.linalg : 

##### **Question 9 :** 
Reprendre le système de Cramer $AX=B$ utilisé comme exemple lors du TP3 (voir document exempleGauss.pdf) et utiliser `solve` pour retourver sa solution.

In [20]:
help(alg.inv)

Help on function inv in module numpy.linalg:

inv(a)
    Compute the (multiplicative) inverse of a matrix.
    
    Given a square matrix `a`, return the matrix `ainv` satisfying
    ``dot(a, ainv) = dot(ainv, a) = eye(a.shape[0])``.
    
    Parameters
    ----------
    a : (..., M, M) array_like
        Matrix to be inverted.
    
    Returns
    -------
    ainv : (..., M, M) ndarray or matrix
        (Multiplicative) inverse of the matrix `a`.
    
    Raises
    ------
    LinAlgError
        If `a` is not square or inversion fails.
    
    See Also
    --------
    scipy.linalg.inv : Similar function in SciPy.
    
    Notes
    -----
    
    .. versionadded:: 1.8.0
    
    Broadcasting rules apply, see the `numpy.linalg` documentation for
    details.
    
    Examples
    --------
    >>> from numpy.linalg import inv
    >>> a = np.array([[1., 2.], [3., 4.]])
    >>> ainv = inv(a)
    >>> np.allclose(np.dot(a, ainv), np.eye(2))
    True
    >>> np.allclose(np.dot(ainv, a), 

In [21]:
# réponse 
A=np.array([[1,-1,2,1],[2,-3,5,2],[3,2,1,2],[1,1,-1,-3]])
B=np.array([[1],[3],[0],[0]])
C = alg.solve(A, B)
C

NameError: name 'np' is not defined

##### **Question 10 :**

Retrouvez la solution du système précédent en utilisant l'inverse de A : 

In [22]:
# réponse
A=np.array([[1,-1,2,1],[2,-3,5,2],[3,2,1,2],[1,1,-1,-3]])
B=np.array([[1],[3],[0],[0]])
sol = alg.inv(A)@B
sol

NameError: name 'np' is not defined