# Introduction à la librairie NumPy

## A. Les tableaux NumPy

[NumPy (Numerical Python)](https://numpy.org/doc/stable/index.html) est une librairie open source utilisée pour traiter en Python des données numériques de manière simple et efficace. Elle s'appuie principalement sur la définition d'une nouvelle structure de données : **<font color='red'>le tableau multi-dimensionnel *ndarray* (ou N-dimensional array)</font>**.

Vous commencerez par importer la librairie NumPy en lui donnant l'alias `np` par convention

In [None]:
import numpy as np

Un tableau NumPy est caractérisé par :
- ses éléments : **tous de même type!**
- le type de ses éléments (`dtype`): par défaut int64 ou float64
- sa dimensionalité (`ndim`): 1 (vecteur), 2 (matrice) ou plus (tenseur)
- sa forme (`shape`): taille du tableau selon chaque dimension (nb. lignes, nb. colonnes, etc.)
- sa taille (`size`): le nombre total d'éléments dans le tableau

On peut initialiser un tableau NumPy à partir d'une liste Python puis vérifier ses prorpiétés à l'aide des attributs `dtype`, `ndim` et `shape`. Testez différentes configurations à partir du code ci-dessous :

In [None]:
v = np.array([1, 2, 3, 4, 5, 6], dtype=np.int64) # l'argument dtype est optionel

print(v)
print("Type des éléments:", v.dtype)
print("Dimensionalité:   ",v.ndim)
print("Forme du tableau: ",v.shape)
print("Taille du tableau: ",v.size)

### Exercice 1 : votre premier tableau NumPy

1. Construisez un tableau NumPy contenant vos moyennes à chaque compétence du semestre 1 (1ère ligne) et du semestre 2 (2ème ligne) du BUT1 :

2. Vérifiez (affichez) chacune des propriétés de votre tableau :

3. Quelle(s) structure(s) de tableau(x) NumPy proposeriez-vous pour stocker vos notes aux compétences du BUT1, du BUT2 et du BUT3? Construisez ce tableau avec des notes fictives.

Il existe d'autres méthodes (constructeurs) pour initialiser un tableau NumPy :
- `np.array(liste)` déjà vu
- `np.zeros(shape)` initialise avec des 0
- `np.ones(shape)` intialise avec des 1
- `np.full(shape, value)` intialise avec des *value*<!--- `np.empty(shape)` création du tableau sans initialiser (valeurs arbitraires) -->
- `np.arange([start], stop, [step])` initialise avec une suite de valeurs (*range*)
- `np.linspace(start, stop, num=50])` initialise avec une suite de *num* valeurs réparties de façon égale sur l'intervalle [start, stop]
- [`np.random.randn(dim0, dim1, ...)`](https://numpy.org/doc/1.16/reference/generated/numpy.random.randn.html#numpy.random.randn) initialise avec des valeurs tirées aléatoirement selon une loi normale centrée en 0 ($\mu = 0$) et de variance 1 ($\sigma^2=1$) : ${\cal N}(0,1)$

### Exercice 2 : différentes initialisations

Utilisez les différentes méthodes d'initialisation de tableaux NumPy afin de construire :
1. un vecteur de 10 zéros

2. une matrice 1 ligne x 10 colonnes contenant uniquement des 1 

3. un cube de taille 3x3x3 d'entiers tous initialisés à 10

4. une matrice des températures mensuelles des 4 dernières années en Mongolie, simulées par un distribution ${\cal N}(0,1)$ *(et oui, il fait froid en Mongolie!)*

5. Une séries de 100 valeurs régulièrement espacées dans l'intervalle [-1, 2]

... profitons-en pour tracer le graphe de la fonction $f(x)=x^2$ sur ce même intervalle :

In [None]:
from matplotlib import pyplot as plt
plt.plot(x, x**2)

6. un vecteur constitué de la suite des entiers naturels impairs plus petits que 20

Utiliser la méthode [`np.reshape()`](https://numpy.org/doc/stable/reference/generated/numpy.reshape.html#numpy-reshape) pour tranformer le vecteur précédent en une matrice (2x5)

Utiliser la méthode [`np.ravel()`](https://numpy.org/doc/stable/reference/generated/numpy.ravel.html) afin d'"applatir" le tableau des températures construit plus haut en un tableau à une seule dimension composé de toutes les valeurs

La méthode `np.concatenate((ArrayA, ArrayB), axis=0)` permet de concaténer deux tableaux Numpy (de formes compatibles) selon un axe :

![Axes dans un tableau Numpy](images/ndarray_axis.jpg)

Ainsi :
- si l'on souhaite assembler **verticalement** deux matrices M1 et M2 (ayant le même nombre de colonnes) on écrira

In [None]:
M1 = np.zeros((3,2))
M2 = np.ones((2,2))
M3 = np.concatenate((M1, M2), axis=0)
M3

- si l'on souhaite assembler **horizontalement** deux matrices M1 et M2 (ayant le même nombre de lignes) on écrira

In [None]:
M1 = np.zeros((3,4))
M2 = np.ones((3,2))
M3 = np.concatenate((M1, M2), axis=1)
M3

## B. Accès aux éléments d'un tableau NumPy

Comme pour les listes Python, on accède aux éléments d'un tableau NumPy :
- par les indices (ex. `t[0]`, `t[-1]`, `t[1, 2]`, etc.) 
- par un slice (ex. `t[1:4]`, `t[:3]`, `t[2:4, 1:6]`, etc.)

Soit la matrice $M$ suivante :

In [None]:
M = np.arange(20).reshape((4,5))
M

Comment accéder :
- à la valeur (2) située en 1ère ligne, 3ème colonne?
- à la 2ème ligne de $M$?
- à la 1ère colonne de $M$?
- aux 2 premières lignes de $M$?
- au bloc constitué des deux lignes centrales et 3 colonnes centrales dans $M$?
- aux deux dernières colonnes de $M$?

**<font color='red'>ATTENTION</font>** : l'indexation et le slicing renvoient une *vue* du tableau d'origine. Modifier les valeurs d'une vue modifie également les valeurs du tableau d'origine (pas de recopie).

Exemple :

In [None]:
notes_BUT1 = np.array([[12, 17, 8.5, 15, 9.75, 13],
                       [10, 12, 10., 13, 11.2, 14]])
notes_S1 = notes_BUT1[0, :]   # notes_S1 est une vue de notes_BUT1
notes_S1[2] = 20              # on modifie une valeur dans la vue
print("S1:", notes_S1)
print("BUT1:", notes_BUT1)    # la valeur est mofifiée dans le tableau dorigine

Lorsque l'on souhaite extraire des éléments en vue d'un traitement indépendant du tableau d'origine, on force la recopie dans un nouveau tableau avec la méthode `copy()`.

Exemple :

In [None]:
notes_BUT1 = np.array([[12, 17, 8.5, 15, 9.75, 13],
                       [10, 12, 10., 13, 11.2, 14]])
notes_S1 = notes_BUT1[0, :].copy()   # notes_S1 est la copie d'une partie de notes_BUT1
notes_S1[2] = 20                     # on modifie une valeur dans cette copie
print("S1:", notes_S1)
print("BUT1:", notes_BUT1)           # la valeur n'est pas mofifiée dans le tableau dorigine

NumPy facilite la sélection d'un sous-ensemble d'élements à partir de conditions. Pour cela on utilise l'indexation par des booléens.

Exemple :

In [None]:
t = np.arange(1,12)
selection = (t>5)   # on construit un vecteur de booléens définissant la sélection (masque)
res = t[selection]  # on filtre les éléments correspondant à la sélection
print(t)
print(selection)
print(res)

L'utilisation d'opérateurs booléens (`&`, `|`, `==`, `!=`) facilite la sélection d'éléments sur la base de conditions plus complexes

Exemple :

In [None]:
t = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(t[t < 5])         # renvoie le vecteur des éléments de t plus petits que 5
print(t[t%2==0])        # renvoie le vecteur des éléments pairs de t
print(t[t%3!=0])        # renvoie le vecteur des éléments de t qui ne sont pas divisibles par 3
print(t[(t>2) & (t<6)]) # renvoie le vecteur des éléments de t dans l'intervalle ]2,6[

### Exercice 3 : les années bissextiles

Une année est bissextile si elle est divisible par 4 mais pas par 100 ou si elle est divisible par 400 (*ex. 1900 n'était pas bissextile mais 2000 l'était*).

Combien y-a-t'il eu d'années bissextiles depuis l'an 0?

### Exercice 4 : simulation de notes

On souhaite constuire une simulation des moyennes aux 6 compétences d'un semestre du BUT pour 5 étudiants. Les moyennes sont générées à partir de distributions normales ${\cal N}(10,7)$.
Faire en sorte que toutes les notes supérieures à 20 (resp. inférieures à 0) soient modifiées en 20 (resp. 0).

### Exercice 5 : image et tableau NumPy

Une image peut être chargée dans un tableau NumPy où chaque valeur du tableau contient l'intensité d'un pixel (entier entre 0 et 255) :
- une image en noir et blanc de 500 x 1000 pixels sera stockée dans une matrice de *shape* (500, 1000) où chaque valeur correspond au niveau de gris d'un pixel (0 = pixel noir, 255 = pixel blanc)

- une image en couleur de 500 x 1000 pixels sera stockée dans un tenseur de *shape* (500, 1000, 3) composé de 3 matrices (500, 1000) chacune définissant l'intensité des pixels selon une couleur (<font color='red'>R*ed*</font>, <font color='green'>G*reen*</font>, <font color='blue'>B*lue*</font>).

Le code suivant permet de charger un tableau NumPy contenant les niveaux de gris des pixels d'une image puis de l'afficher :


In [None]:
image = np.load('images/logo.npy')
plt.imshow(image, cmap=plt.cm.gray)
plt.show()

Votre travail consiste à modifier cette image de sorte à :
1. zoomer sur le logo (supprimer le cadre extérieur blanc)
2. faire ressortir (en noir) la partie "informatique"
3. remettre le logo dans le bon sens