# Introduction à Numpy
<span style="color:blue; font-family:Georgia; font-size:1.5em;">Ahmed Ammar et Hassen Ghalila</span>

<span style="color:blue; font-family:Georgia; font-size:1em;">Faculté des Sciences de Tunis, Université de Tunis El Manar</span>

In [None]:
#Juste pour savoir la dernière fois que cela a été exécuté:
import time
print(time.ctime())

In [None]:
# De quoi s'agit-il de cette ligne?!? Réponse dans le cours MatplotlibIntro.
%pylab inline 

## Introduction

La bibliothèque `numpy` (module) est utilisé dans presque tous les calculs numériques à l'aide de Python. C'est une bibliothèque qui fournit des structures de données vectorielles, matricielles et de dimension supérieure à haute performance pour Python. Il est implémenté dans C et Fortran, alors lorsque les calculs sont vectorisés (formulés avec des vecteurs et des matrices), les performances sont très bonnes.

Pour utiliser `numpy`, vous devez importer le module à l'aide de l'exemple:

In [None]:
from numpy import *

Dans la bibliothèque `numpy`, la terminologie utilisée pour les vecteurs, les matrices et les ensembles de données à grande dimension est *array*.

## Création de tableaux `numpy`

Il existe plusieurs façons d'initialiser de nouveaux tableaux numpy, par exemple à partir de

* Une liste Python ou des tuples
* Utilisant des fonctions dédiées à la génération de tableaux numpy, tels que `arange`,` linspace`, etc.
* Lecture de données à partir de fichiers

### De listes

Par exemple, pour créer de nouveaux tableaux vectoriels et matriciels à partir de listes Python, nous pouvons utiliser la fonction `numpy.array`.

In [None]:
# Un vecteur: l'argument de la fonction array est une liste Python
v = array([1,2,3,4])

v

In [None]:
# Une matrice: l'argument de la fonction de tableau est une liste de Python imbriquée
M = array([[1, 2], [3, 4]])

M

Les objets `v` et` M` sont tous deux du type `ndarray` que fournit le module` numpy`.

In [None]:
type(v), type(M)

La différence entre les tableaux `v` et` M` n'est que leurs formes. Nous pouvons obtenir des informations sur la forme d'un tableau en utilisant la propriété `ndarray.shape`.

In [None]:
v.shape

In [None]:
M.shape

Le nombre d'éléments dans le tableau est disponible via la propriété `ndarray.size`:

In [None]:
M.size

De manière équivalente, nous pourrions utiliser la fonction `numpy.shape` et `numpy.size`

In [None]:
shape(M)

In [None]:
size(M)

Jusqu'à présent, le `numpy.ndarray` ressemble beaucoup à une liste Python (ou à une liste imbriquée). Pourquoi ne pas utiliser simplement les listes Python pour les calculs au lieu de créer un nouveau type de tableau?

Il existe plusieurs raisons:

* Les listes de Python sont très générales. Ils peuvent contenir tout type d'objet. Ils sont typiquement typés. Ils ne prennent pas en charge les fonctions mathématiques telles que les multiplications de matrice et de points, etc. L'implémentation de telles fonctions pour les listes Python ne serait pas très efficace en raison de la typage dynamique.
* Les tableaux Numpy sont ** typiquement typés ** et ** homogènes **. Le type d'éléments est déterminé lorsque le tableau est créé.
* Les tableaux Numpy sont efficaces pour la mémoire.
* En raison de la typage statique, la mise en œuvre rapide de fonctions mathématiques telles que la multiplication et l'ajout de tableaux `numpy` peut être implémentée dans une langue compilée (C et Fortran sont utilisés).

En utilisant la propriété `dtype` (type de données) d'un` ndarray`, on peut voir quel type les données d'un tableau ont:

In [None]:
M.dtype

Nous obtenons une erreur si nous essayons d'attribuer une valeur du type incorrect à un élément dans un tableau numpy:

In [None]:
M[0,0] = "hello"

Si nous voulons, nous pouvons définir explicitement le type de données du tableau lorsque nous le créons, en utilisant l'argument de mot-clé `dtype`:

In [None]:
M = array([[1, 2], [3, 4]], dtype=complex)

M

Le type commun qui peut être utilisé avec `dtype` est:` int`, `float`,` complex`, `bool`,` object`, etc.

Nous pouvons également définir explicitement la taille des bits des types de données, par exemple: `int64`,` int16`, `float128`,` complex128`.

#### Utilisation de fonctions génératrices de matrices

Pour les tableaux plus grands, il est inopérant d'initialiser les données manuellement, en utilisant des listes de pythons explicites. Au lieu de cela, nous pouvons utiliser l'une des nombreuses fonctions dans `numpy` qui génère des tableaux de différentes formes. Certains des plus communs sont:

#### arange

In [None]:
# create a range
x = arange(0, 10, 1) # Arguments: start, stop, step
x

In [None]:
x = arange(-1, 1, 0.1)

x

#### linspace et logspace

In [None]:
# En utilisant linspace, les deux points finaux sont inclus
linspace(0, 10, 25)

In [None]:
logspace(0, 10, 10, base=e)

#### mgrid

In [None]:
x, y = mgrid[0:5, 0:5] # Similaire à meshgrid dans MATLAB

In [None]:
x

In [None]:
y

#### random data

In [None]:
from numpy import random

In [None]:
# Nombres aléatoires uniformes dans [0,1]
random.rand(5,5)

In [None]:
# Nombres aléatoires distribués normalisés
random.randn(5,5)

#### diag

In [None]:
# Une matrice diagonale
diag([1,2,3])

In [None]:
# Diagonale avec décalage de la diagonale principale
diag([1,2,3], k=1) 

#### zeros et ones

In [None]:
zeros((3,3))

In [None]:
ones((3,3))

## File I / O


### Valeurs séparées par des virgules (CSV)

Un format de fichier très commun pour les fichiers de données sont les valeurs séparées par des virgules (CSV) ou un format connexe tel que TSV (valeurs séparées par des onglets). Pour lire les données de ce fichier dans les tableaux Numpy, nous pouvons utiliser la fonction `numpy.genfromtxt`. Par exemple,

In [None]:
!head data/stockholm_td_adj.dat

In [None]:
data = genfromtxt('data/stockholm_td_adj.dat')

In [None]:
data.shape

In [None]:
fig, ax = subplots(figsize=(14,4))
ax.plot(data[:,0]+data[:,1]/12.0+data[:,2]/365, data[:,5])
ax.axis('tight')
ax.set_title('tempeatures in Stockholm')
ax.set_xlabel('year')
ax.set_ylabel('tempature (C)');