# TD : Introduction à Numpy
[Mathématiques en Python](https://irma.math.unistra.fr/~guillot/teaching.html)

[Python pour les économistes](https://egallic.fr/Enseignement/Python/numpy.html)

## 1 - Introduction

Le module `numpy` est l'un des plus utilisés. Son nom évoque le calcul numérique en Python, mais concrètement, il s'agit surtout de fonctionnalités liées aux *tableaux*. 

Nous avons jusqu'ici traité les matrices comme des listes de listes. Mais il faut comprendre une chose : en Python, le fait même qu'une liste puisse contenir des éléments de n'importe quel type rend les choses très, très lentes. Lorsqu'on demande à Numpy de créer un tableau, il faut lui donner le type des éléments (par exemple "faire un tableau de 3 lignes et 4 colonnes composé de nombres entiers"), et sans rentrer dans les détails, ça change complètement la façon dont les données sont stockées en mémoire -- de manière bien plus compacte et efficace.

De plus, avec Numpy on va éviter de faire des boucles nous-mêmes, parce le module a été optimisé pour faire certaines choses très vite, comme appliquer une fonction à tous les éléments par exemple. (C'est notamment dû au fait que Numpy n'est pas lui-même écrit en Python, mais en langage C.)

Ici nous allons juste aborder les fonctionnalités les plus basiques de Numpy.

* Il est pratique de tout importer de NumPy dans une console Python :

In [None]:
from numpy import *

Mais il est plus facile à lire et à déboguer si vous utilisez des importations explicites.

In [None]:
import numpy as np   # il est standard de l'appeler 'np'
import matplotlib.pyplot as plt

## 2 - Création de tableaux

* Il existe des différences importantes entre les tableaux NumPy et les listes Python :

  * Les tableaux NumPy ont une taille fixe à la création.

  * Les éléments des tableaux NumPy doivent tous être du même type de données.

  * Les opérations sur les tableaux NumPy sont effectuées dans du code compilé pour des raisons de performance.

* La plupart des logiciels scientifiques/mathématiques basés sur Python d’aujourd’hui utilisent des tableaux NumPy.

* NumPy nous donne la simplicité du code de Python, mais l’opération est rapidement exécutée par du code C précompilé.

Pour créer un tableau, on peut utiliser la fonction `np.array` :

In [None]:
A = np.array([0,1,2,3])  #  list
B = np.array((4,5,6,7))  #  tuple
C = np.matrix('8 9 0 1') #  string (matlab syntax)

In [None]:
A, B, C

In [None]:
print(A, B, C)

Nous avons laissé Numpy deviner le type des éléments. Pour vérifier :

In [None]:
A.dtype, B.dtype, C.dtype

In [None]:
A*B

In [None]:
B*C

Ici `int` signifie "entier", et le 32 signifie "encodé sur 32 bits". En beaucoup plus clair (mais un informaticien ne vous le dira jamais comme ça), le type `int32` est formé des éléments de $\mathbb{Z}/2^{32}\mathbb{Z}$. Le nombre $2^{32}$ étant énorme, on peut travailler avec ces entiers pour modéliser les éléments de $\mathbb{Z}$.

Pour choisir le type :


In [None]:
B= np.array([[1,2], [3,4]], dtype= np.int8)
print(B)

In [None]:
C= np.array([[1,2], [3,4]], dtype= np.float64)  # nombre décimaux sur 64 bits
print(C)

Pour faire des tableaux remplis de 0 ou de 1 :

In [None]:
np.zeros(shape= (4,9), dtype= np.int8)

In [None]:
np.ones(shape= (1,10), dtype= np.float64) 

Dans ce dernier exemple, il y a une ligne et dix colonnes, mais c'est bel et bien un tableau (avec 2 dimensions). Or Numpy sait traiter n'importe quel nombre de dimensions ; voici des exemples :

In [None]:
np.array([1,2,3,4])

In [None]:
np.ones(shape= (10,)) # notez le "10," ; un tuple avec un seul nombre, 10

In [None]:
troisD= np.zeros(shape= (3,4,2))  # plus fort qu'une matrice : il y a trois dimensions

In [None]:
troisD  # affiche une liste de matrices

Voyons comment accéder aux élements :

In [None]:
A= np.array([[1,2], [3,4]])

In [None]:
A[0,0]

In [None]:
A[1,1]

In [None]:
troisD[2,1,1]   # trois dimensions donc trois indices

Et pour faire des modifications, sans surprise:

In [None]:
A[0,0]= 100
print(A)


## 3 - Opérations

On peut demander à Numpy d'appliquer une fonction à tous les éléments d'un tableau. Dans la plupart des cas, il s'agit de fonctions particulières, qui font partie du module Numpy. Par exemple, pour calculer le sinus de tous les nombres dans un tableau, on utilisera `np.sin`.

In [None]:
A= np.array([[1,2], [3,4]])

In [None]:
A

In [None]:
np.sin(A)

Une chose très agréable, c'est que les objets Numpy ont redéfini les opérations arithmétiques telles que `+` et `*` (nous verrons comment faire ça dans le dernier TP!). On peut donc écrire :

In [None]:
A+A

In [None]:
A*A

**Attention**, il ne s'agit pas du produit matriciel, mais du produit terme à terme. Il faut utiliser `np.matmul(A,B)` pour le produit des deux matrices $A$ et $B$ (celui qui n'est défini que quand $A$ possède autant de colonnes que $B$ a de lignes) ; nous n'en parlerons plus dans ce TP.

Numpy comprend aussi :

In [None]:
A-1

De sorte que si vous avez une fonction telle que :

In [None]:
def f(x):
    return x**2 - 1

Alors on peut faire :

In [None]:
f(A)

Au total, la fonction `f` a été appliquée aux éléments de `A`, un par un. Mais ça ne marche que parce que la définition de `f` n'utilise que des opérations que Numpy sait interpréter! 

*Remarque*. Il y a une syntaxe pour appliquer une fonction *quelconque* à tous les éléments d'un tableau, à savoir `np.vectorize(f)(A)`, mais ça n'a pas un grand intérêt car c'est très lent, et il reviendrait au même de faire une boucle.

Voyons un peu si on y gagne en vitesse. Prenons une matrice au hasard:

In [None]:
np.random.randint(10, size=(3,9))  # pour comprendre la syntaxe

Mais prenons-la beaucoup plus grosse :

In [None]:
N= 1000
A= np.random.randint(300, size=(N,N))

In [None]:
# faisons une copie de A, mais comme une liste de listes:
B= [ [A[i,j] for j in range(N)] for i in range(N)]

In [None]:
# une fonction qui met tout au carré dans B :
def test():
    for i in range(N):
        for j in range(N):
            B[i][j]= B[i][j]**2

In [None]:
%time test()  # essayons

In [None]:
%time A= A**2 # maintenant comparons avec la fonction "puissance" de Numpy

Avec la machine sur laquelle ce test a été fait la première fois, la deuxième méthode est 100 fois plus rapide. Et ça augmente avec la taille des tableaux.

Cette amélioration impressionnante explique pourquoi, dans certains cours de calcul numérique avec Python, on va jusqu'à dire que "les bons programmeurs ne font jamais de boucle for". Ils utilisent Numpy. C'est un peu exagéré.

## 4 - Numpy et les booléens



Voyons maintenant comment Numpy gère les "booléens" -- les conditions.

In [None]:
A= np.array([[1,2], [3,4]])
print(A == 2)   # renvoie un tableau de booléens

In [None]:
np.logical_or(A == 2, A == 3)  # voilà comment on fait un "ou" 

In [None]:
np.logical_and(1<A, A<4)    # et voilà le "et"

On peut récupérer les éléments qui satisfont une condition. Par exemple si:

In [None]:
condition= A > 1
print(condition)

Alors on peut faire:

In [None]:
A[condition]

La réponse est de dimension 1 (on ne peut pas prévoir à l'avance combien d'éléments vont satisfaire la condition, et comment ils seront disposés!). Mais les deux syntaxes suivantes fonctionnent aussi, et c'est très pratique :

In [None]:
A[condition]= 0  # on donne une seule valeur
print(A)

La réponse est bien encore un tableau de dimension 2! Prenez le temps de méditer sur le fait que les auteurs de Numpy ont redéfini les crochets et le signe `=`, entre autres.

La deuxième façon est :

In [None]:
A[condition]= np.array([11, 12, 13])  # on donne une liste
print(A)

In [None]:
def f(A):
    B= A.copy()
    B[ A < 0 ]= 0
    B[ A > 1 ]= 1
    return B

In [None]:
A= np.array([[-1, 2], [-3, 4]])

In [None]:
A

In [None]:
f(A)

In [None]:
A[ A < 0 ]= - A[ A < 0 ]

In [None]:
A

In [None]:
from matplotlib import pyplot as plt

In [None]:
plt.rcParams["figure.figsize"] = (10,10)

## 5 - Images à partir de matrices

Nous allons produire quelques images. Pour cela, nous allons faire appel au module `matplotlib`, que nous étudierons plus en détails dans le TP suivant.

Pour commencer, il faut importer l'objet suivant -- il est standard de l'appeler `plt`:

In [None]:
from matplotlib import pyplot as plt

La commande suivante permet d'agrandir un peu les figures, par défaut:

In [None]:
plt.rcParams["figure.figsize"] = (10,10)

Supposons que vous ayez une matrice $A$. Matplotlib possède une syntaxe toute simple pour faire la chose suivante, qui revient étonnamment souvent : on interprète les nombres dans $A$ comme des couleurs, et on affiche directement ça comme une image, chaque entrée de la matrice contrôlant un pixel. Pour interpréter les nombres comme des couleurs, matplotlib utilise des "colormaps" ; ce sont des listes de couleurs, et la première sera attribuée à la valeur minimale dans la matrice, la dernière à la valeur maximale, le reste étant interpolé.

Un exemple va rendre ça beaucoup plus clair!

In [None]:
N= 15
A= np.array([ [i]*N for i in range(N)   ])
print(A)

La commande en question s'appelle `imshow` :

In [None]:
plt.imshow(A)

Ici la "colormap" est celle par défaut (elle va du bleu au jaune). Vous pouvez augmenter $N$ ci-dessus, c'est plus joli. Essayons autre chose :

In [None]:
plt.imshow(A, cmap= "hot")

La "colormap" qui s'appelle "hot" va du noir au blanc en passant par les couleurs des flammes, de la plus froide à la plus chaude. 

Pour sauvegarder ça comme une image, c'est un peu compliqué, il faut importer un sous-module:

In [None]:
import matplotlib.image as mpl

Et maintenant :

In [None]:
mpl.imsave("mon-image.png", A, cmap= "hot")

Pour une liste de colormaps, allez voir :

https://matplotlib.org/3.1.0/tutorials/colors/colormaps.html

Vous pouvez ignorer le texte!

Une chose bien utile, que l'on peut mettre en valeur ici, c'est qu'en ajoutant `_r` au nom d'une colormap, on l'obtient inversée (reverse). Exemple :

In [None]:
plt.imshow(A, cmap= "hot_r")