# 1. Librairie Numpy

In [None]:
# import des modules usuels
import numpy as np
import matplotlib.pyplot as plt

# commande magique pour l'affichage des graphiques
%matplotlib inline

# options d'affichage
plt.style.use('seaborn-darkgrid')

Numpy introduit des tableaux multidimensionnels ndarray.

Un *ndarray* ou tableau multidimensionnel est une structure de données extrêmement puissante en Python.

Les données manipulées peuvent être de différents types : entiers, flottants, booléens, chaines de caractères, etc.

Ils supportent toutes les opérations standards :

- arithmétique
- mathématiques
- logique
- calcul vectoriel et matriciel
- calculs d'agrégats

Voir la documentation https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

## 1.1 Création d'un ndarray

Il existe différentes méthodes pour créer un *ndarray*.

fonction (extrait)|usage
-|-
arange|vecteur de nombres également répartis dans un intervalle (pas)
array|à partir d'un objet de type tableau
zeros|retourne un *ndarray* nul
zeros_like|retourne un *ndarray* nul aux dimensions identiques d'un autre *ndarray*
ones|retourne un *ndarray* unité
ones_like|retourne un *ndarray* unité aux dimensions identiques d'un autre *ndarray*
eye|retourne une matrice nulle avec des 1 sur la première diagonale
identity|retourne une matrice identité
full|retourne une matrice avec une valeur uniforme
linspace|vecteur de nombres également répartis dans un intervalle (nombre)

In [None]:
# création d'un vecteur (dimension 1)
a = np.arange(48)
a

In [None]:
a?

In [None]:
type(a)

In [None]:
# nombre de dimensions d'un ndarray
a.ndim

In [None]:
# dimensions d'un ndarray
a.shape

In [None]:
# nombre d'éléments d'un ndarray
a.size

In [None]:
# type des éléments d'un ndarray
a.dtype

On peut créer manuellement un ndarray de nombres flottants.

In [None]:
a = np.array(range(48), float)
a

In [None]:
a.dtype

On peut créer explicitement un ndarray.

In [None]:
# création explicite
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]], float)
a

In [None]:
# matrice de 0 identique
np.zeros_like(a)

On peut créer un vecteur d'éléments uniformément répartis : intervalle fermé + nombre d'éléments (utile pour les graphiques).

In [None]:
# vecteur d'éléments uniformément répartis
a = np.linspace(0, 100, 21)
a

#### Nombres pseudo-aléatoires

Le sous-module **numpy.random** permet de générer des nombres aléatoires selon plusieurs méthodes (extrait).

La méthode *seed()* permet d'amorcer le générateur de nombres aléatoires afin d'obtenir les mêmes résultats d'une expérience à l'autre.

Il existe des fonctions pour créer des *ndarray* avec des nombres aléatoires (extrait).

Fonction|Usage
-|-
randint|vecteur d'entiers aléatoires uniformément répartis dans un intervalle
random|vecteur de nombres aléatoires uniformément répartis dans un intervalle semi-ouvert
uniform|vecteur de nombres aléatoires uniformément répartis dans un intervalle
normal|vecteur de nombres répartis selon la loi normale

In [None]:
# tableau d'entiers aléatoires uniformément répartis entre 0 et 9
a = np.random.randint(0, 10, 10)
a

In [None]:
# avec la méthode seed
np.random.seed(0)
a = np.random.randint(0, 10, 10)
#np.random.seed(0)
b = np.random.randint(0, 10, 10)
a, b

#### Visualisation graphique des distributions aléatoires

N.B. : la librairie **matplotlib.pyplot** sera étudiées plus en détail plus loin.

In [None]:
# histogramme de 1000 entiers tirés aléatoirement entre 0 et 9
a = np.random.randint(0, 10, 1000)
plt.hist(a);

In [None]:
# histogramme de 1000 nombres flottants tirés uniformément entre 0 et 1
np.random.seed(37)
a = np.random.random(1000)
plt.hist(a, bins=50);

In [None]:
# histogramme de nombres tirés selon une loi normale
a = np.random.normal(0, 1, 1000)
plt.hist(a, bins=20);

## 1.2 Accès aux éléments

L'opérateur [] permet d'accéder aux éléments individuels ou à des sous-tableaux.

Rappel sur les accès par indices en Python qui s'applique aux *ndarray*.

Notation|Signification
-|-
a[i]|accès à l'élement situé à la position i (démarrant à 0)
a[i:j]|accès aux élements situés entre la position i et la position j-1
a[i:j:k]|accès aux élements situés entre la position i et la position j-1 par pas de k
a[:i]| accès à tous les éléments jusqu'à la position i-1
a[i:]|accès à tous les éléments à partir de la position i
a[:]|accès à tous les éléments
a[::-1]|accès à tous les éléments dans l'ordre inverse

Le multidimensionnel est géré par autant d'accès indiciels séparés par des virgules :
- vecteur : *a[i:j]*
- matrice : *a[i:j, m:n]*
- cube : *a[i:j, m:n, p:q]*

Pour une matrice, la notation *a[i, j]* est symboliquement équivalente à *a[i][j]*.

**Exercice**

Créer une matrice 6 x 6 remplie d’entiers aléatoires entre 0 et 9 inclus et sélectionner les entiers situés sur les lignes 2 à 4 inclus et les colonnes 2 et 3 inclus.

## 1.3 Modification des éléments

Les opérations de sélection permettent de modifier les éléments avec l'opérateur *=*.

Il est possible d'utiliser une valeur scalaire ou un ndarray de dimensions identiques.

In [None]:
# création de la matrice
a = np.random.randint(0, 10, (6, 6))
a[2:4, 2:4] = -1
a

In [None]:
# remplissage d'un ndarray avec une valeur uniforme
a.fill(-1)
a

## 1.4 Opérations de transformation

Il est possible de transformer un ndarray en un tableau de n'importe quelle dimension (du moment que le nombre total d'éléments soit identique).

In [None]:
# création d'un vecteur
a = np.random.randint(0, 9, 48)
a

In [None]:
# transformation en matrice
a = a.reshape(8, 6)
a

Il est possible de mettre à plat un ndarray en lignes ou en colonnes.

In [None]:
# par défaut en ligne (mode langage C)
a.flatten()

In [None]:
# en colonne (mode langage Fortran)
a.flatten('F')

In [None]:
# transposition
a.transpose()  # ou a.T

In [None]:
a.T

In [None]:
# tri
a = a.flatten()
a.sort()
a

In [None]:
# seuillage
a = np.random.random(20).reshape((4, 5))
a.clip(0.2, 0.8)

## 1.5 Opérations arithmétiques,  logiques, mathématiques et matricielles

Numpy possède toutes les fonctions arithmétiques, de comparaison, logiques, mathématiques, trigonométriques et de calcul matriciel.

Domaine|Fonctions
-|-
Arithmétique | + (add) - (subtract) &#42; (multiply) / (divide) &#42;&#42; (power)
Comparaison | ==, !=, =<, <, =>, >
Logique | & (and) &#124; (or) ~ (not) all() any()
Mathématiques | abs sign sqrt log log10 exp floor ceil rint
Trigonométrie | sin cos tan arcsin arccos arctan sinh cosh tanh arcsinh arccosh arctanh
Calcul matriciel | @ (dot) T (transpose)

**Exercice**

Fabriquer un vecteur de 10 entiers aléatoires entre 0 et 9 inclus.
Tester si tous les entiers sont nuls. Si l'un des entiers est nul avec *all()* et *any()*.

## 1.6 Sélection logique

L'opérateur [] permet d'effectuer une sélection logique à partir d'un masque booléen.

Les opérateur logiques sont : | (OU), & (ET) et ~ (NON).

In [None]:
# ndarray
a = np.random.randint(0, 10, 20)
a

In [None]:
# masque booléen
m = a < 5
m

In [None]:
# sélection par masque booléen
a[m]

In [None]:
# expression concise
a[a < 5]

**Exercice**

Fabriquer un vecteur aléatoire comportant 100 entiers compris en 0 et 9 inclus.

Sélectionner les entiers qui sont différent de 0, inférieurs à 7 et pairs.

## 1.7 Agrégats

Il existe des fonctions agrégatives qui synthétisent les valeurs d'un *ndarray*.

Il est possible d'appliquer ces fonctions sur l'ensemble d'un *ndarray* ou bien selon une dimension particulière. Cette dimension est dénommée *axis* dans le jargon de Python et vaut 0, 1, 2...

Atention, dans les opérations de synthèse, *axis* correspond à la dimension dans laquelle l'indice servant à effectuer la synthèse varie.

Par exemple, une matrice possède 2 dimensions : *axis=0* réprésente l'indice des lignes et *axis=1* représente l'indice des colonnes. Pour calculer la somme des lignes, on additionne les colonnes (*axis=1*) et inversement pour calculer la somme des colonnes, on additionne les lignes (*axis=0*).

Fonction|Usage
-|-
sum|calcul de la somme
prod|calcul du produit
min|calcul du minimum
max|calcul du maximum
argmin|calcul de l'indice du minimum
argmax|calcul de l'indice du maximum
cumsum|calcul de la somme cumulée
cumprod|calcul du produit cumulé
mean|calcul de la moyenne
median|calcul de la médiane

**Exercice**

Fabriquer une matrice 7 x 5 d'entiers aléatoires entre 0 et 3 inclus.

Calculer la somme totale, la somme des lignes, la somme des colonnes.

Afficher une marche aléatoire où à chaque pas on avance d'un nombre compris entre -0.5 et 0.5.