# Python par la pratique : partie 3 - NumPy

Ce notebook fournit des ressources pour la pratique de Python.

Pour chacune des méthodes, il vous faudra bien comprendre leur fonctionnement et vous pourrez vous documenter sur internet (docs officielles et forums).
N'hésitez pas à modifier les cellules pour tester d'autres configurations que celles données ici.

Si vous souhaitez connaitre les méthodes disponibles d'un objet particulier, utilisez la function ``dir(obj)``.

### Import

In [None]:
import numpy as np

### Création de Arrays

Les tableaux NumPy sont des objets de classe `NDArray`. Pour créer un tableau, **on ne crée pas** directement une instance de la classe `NDArray` mais on utilise la fonction `np.array` qui en est une interface.

Cette fonction prend un itérable en argument.

In [None]:
arr = np.array([])
arr.shape

In [None]:
arr = np.array([1, 2])
arr.shape

In [None]:
arr = np.array([[1, 2], [3, 4]])
arr.shape

In [None]:
arr = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
arr.shape

In [None]:
# La fonction np.zeros crée un tableau avec uniquement des 0. Les dimensions du tableau sont spécifiée en argument de la fonction
arr = np.zeros((2, 3))
arr

In [None]:
# Idem que np.zeros
arr = np.ones((2, 3))
arr

In [None]:
# Crée une matrice identité
arr = np.eye(4)
arr

### Génération d'une séquence de nombres

NumPy implémente un grand nombre de routine permettant de créer des séquences de nombre, en particulier les fonctions 
* `np.arange` qui est l'équivalent de la fonction `range`
* `np.linspace`

In [None]:
np.arange(2, 5, .5)

In [None]:
np.linspace(2, 5, 6)

### Etat d'un objet Array

In [None]:
arr = np.array([[1, 2], [3, 4]])

# Affiche les dimensions du tableau
print(arr.shape)
print(len(arr))

# Affiche le nombre de dimensions du tableau
print(arr.ndim)

# Affiche le nombre total d'éléments
print(arr.size)

# Affiche le type des données
print(arr.dtype)

In [None]:
# Modifie le type des données
arr2 = arr.astype(float)
arr2

### Opérations mathématiques

Les opérations mathématiques de base s'adaptent aux tableaux NumPy.

Les opérations `+`, `-`, `/` et `*` se font élément par élément.

In [None]:
arr = np.array([[1, 2], [3, 4]])
arr

In [None]:
# Addition élément par élément
arr + arr

In [None]:
# Soustraction élément par élément
arr - arr

In [None]:
# Multiplication élément par élément
arr * arr

In [None]:
# Division élément par élément
arr / arr

Voir aussi les routines ``np.add``, ``np.substract``, ``np.divide`` et ``np.multiply``

In [None]:
np.exp(arr)

In [None]:
np.sqrt(arr)

In [None]:
np.sin(arr)

In [None]:
np.cos(arr)

In [None]:
np.log(arr)

### Algèbre linéaire

Les opérations d'algèbre linéaire sont en partie implémentées dans le module ``numpy.linalg`` :
* produit matriciel et vectoriel
* décompositions de matrices
* valeurs propres, vecteurs propres
* normes
* etc.

voir https://numpy.org/doc/stable/reference/routines.linalg.html

In [None]:
# Produit matriciel entre deux Arrays. Le résultats est un tableau NumPy
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[1, 1], [1, 1]])

# Via la méthode dot
arr1.dot(arr2)

# Via l'opérateur @
arr1@arr2

In [None]:
# Inverse d'une matrice
arr = np.array([[1., 2.], [3., 4.]])
np.linalg.inv(arr)

### Comparaisons

In [None]:
# Comparaison de deux arrays, élément par élément
arr1 == arr2

In [None]:
# Comparaison des éléments d'une array avec un scalaire
arr1 < 3

In [None]:
# Test d'égalité de deux arrays
print(np.array_equal(arr1, arr2))
print(np.array_equal(arr1, arr1))

### Opérations statistiques

Les opérations statistiques (min, max, moyennes, etc.) agissent à la fois sur l'ensemble des valeurs de l'objet mais aussi sur les lignes (en utilisant l'argument ``axis = 0``) et sur les colonnes (en utilisant ``axis = 1``).

Noter que ``axis = -1`` correspond à la dernière dimension de l'array

In [None]:
print(arr)
print(arr.sum())
print(arr.sum(axis=0))
print(arr.sum(axis=1))

In [None]:
print(arr)
print(arr.min())
print(arr.min(axis=0))
print(arr.min(axis=1))

In [None]:
print(arr)
print(arr.max())
print(arr.max(axis=0))
print(arr.max(axis=1))

In [None]:
# Moyenne empirique
print(arr)
print(arr.mean())
print(arr.mean(axis=0))
print(arr.mean(axis=1))

In [None]:
# Médiane
print(arr)
print(np.median(arr))
print(np.median(arr, axis=0))
print(np.median(arr, axis=1))

In [None]:
# Ecart-type
print(arr)
print(np.std(arr))
print(np.std(arr, axis=0))
print(np.std(arr, axis=1))

### Tri

La méthode `sort` permet de trier l'ensemble du tableau, selon les différents axes. L'opération se fait `inplace`, c'est à dire en modifiant directement les valeurs du tableau.
Inversement, la fonction `np.sort` renvoie une copie triée du tableau passé en argument.

L'argument `axis` permet d'agir sur les lignes ou sur les colonnes.

In [None]:
arr = np.array([[1, -2], [4, 3]])
print(arr)

# tri inplace
arr.sort()
print(arr)

In [None]:
arr = np.array([[1, -2], [4, 3]])
print(arr)

# Renvoie une copie du tableau
print(np.sort(arr))

In [None]:
arr = np.array([[1, -2], [4, 3]])
print(arr)

# tri des colonnes
arr.sort(axis=0) 
print(arr)

### Indexing et slicing

L'indexing sur des tableaux NumPy se fait de façon similaire aux listes, c'est-à-dire via des index (ou positions).

La principale différence est que l'indexing se fait selon les différentes dimensions du tableau, indépendamment les unes des autres.

Par exemple, récupérer un élément d'une liste de liste nécessite d'extraire la ou les sous-listes en préalable:

```python
l = [[1, 2, 3],
     [4, 5, 6]]

print(l[0][1]) # affiche 2
```

Or pour un tableau NumPy, l'utilisation du caractère `,` permet d'indéxer sur les deux dimensions (ou plus) directement :

```python
arr = np.array([[1, 2, 3],
               [4, 5, 6]])

print(arr[0, 1])
```

Le caractère `:` permet d'extraire toutes les lignes ou toutes les colonnes (dans le cas 2D).

Voir https://numpy.org/doc/stable/user/basics.indexing.html

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr)

In [None]:
# Affiche une ligne, ou un sous-tableau si la dimension est > 2
arr[1]

In [None]:
# Affiche une colonne
arr[:, 1]

In [None]:
# Affiche un sous-tableau
arr[0:2]

In [None]:
# Affiche une colonne et un sous-ensemble des lignes
arr[0:2, 1]

In [None]:
# Affiche un sous-tableau
arr[0:2, 0:2]

In [None]:
# Affiche toutes les lignes et un sous-ensemble des colonnes
arr[:, 1:]

In [None]:
# Affiche toutes les lignes et un sous-ensemble des colonnes
arr[:, 2:]

In [None]:
# Spécifie les indexes des lignes/colonnes à extraire
indexes_1 = [0, 2, 0, 2]
indexes_2 = [0, 0, 2, 2]
arr[indexes_1, indexes_2]

In [None]:
arr[arr > 3]

In [None]:
indexes = np.where(arr > 3)
arr[indexes]

### Manipulation d'arrays

In [None]:
# Transposée
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr)

# version 1
print(np.transpose(arr))

# version 2, via la property T
print(arr.T)

In [None]:
# Reshape
arr = np.arange(0, 10, 1)
print(arr)
print(arr.reshape((2, 5)))

In [None]:
# Applatir une Array
arr.ravel()

In [None]:
### Combiner deux arrays par ligne
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr)
print(np.concatenate((arr, arr), axis=0))
print(np.vstack((arr, arr)))

In [None]:
### Combiner deux arrays par colonnes
print(arr)
print(np.concatenate((arr, arr), axis=1))
print(np.hstack((arr, arr)))

### Simulation de nombres aléatoires

La simulation de nombres aléatoires se fait via le module ``numpy.random``

In [None]:
# Simulation selon une loi Gaussienne
np.random.normal(loc=0, scale=1, size=10)

In [None]:
np.random.normal(loc=0, scale=1, size=10).reshape((2, 5))

In [None]:
mean = (0, 0)
cov = ((1, 0), (0, 100))
x1, x2 = np.random.multivariate_normal(mean, cov, 5000).T

In [None]:
np.random.exponential(scale=1, size=10)