# Introduction à NumPy
Les listes Python montrent vite leur limites en ce qui concerne le calcul scientifique:

In [None]:
liste = [1,2,3,4]

In [None]:
liste + 1

In [None]:
liste * 2  # it duplicate the list two times

En effet, contrairement à Matlab et IDL, le support des tableaux multidimensionels numériques n'est pas inclus dans le coeur du langage. 
 

## NumPy arrays

C'est pourquoi il existe une librairie, NumPy, qui permet de faire cela. NumPy est la brique de base à tout l'écosystème scientifique de Python.

In [None]:
import numpy as np

NumPy propose un type de tableau numérique N-dimensions : `array`. L'implémentation de NumPy repose sur du C (transparent) et est donc performante. L'interface utilisateur est très proche de celle de Matlab : 

In [None]:
# to create a NumPy array, call array() on a sequence 
my_array = np.array([0,1,2,3,4])

print(my_array)
print(type(my_array))

In [None]:
my_array + 1

In [None]:
my_array * 2

In [None]:
my_array ** 2

Parce que les array NumPy ont été conçus avec la problématique de la performance en tête, les array NumPy ont plusieurs propriétés spécifiques :

* Contrairement aux listes Python, on ne peut pas mélanger les types dans un tableau array NumPy

* Le type de données numériques peut être indiqué si besoin:

In [None]:
np.array([1.1, 2.2, 3.3]) # auto-guess 

In [None]:
np.array([1.1, 2.2, 3.3]).dtype

In [None]:
np.array([1.1, 2.2, 3.3], dtype='int') # casting into int

In [None]:
np.array([1.1, 2.2, 3.3], dtype='complex') 
# note that 1j or j is the imaginary unit in Python

In [None]:
array1 = np.arange(0, 9).reshape((3,3))
array2 = np.arange(9, 0, -1).reshape((3,3))
array1 + array2

**attention** : contrairement à matlab, l'opérateur * sur des tableaux NumPy effectue le produit élément par élément (cf.section broadcasting):

In [None]:
array1 * array2

In [None]:
array1 * np.eye(3)

Le produit matriciel (où produit *intérieur*) est obtenu avec la fonction `dot` :

In [None]:
np.dot(array1, array2)

In [None]:
array1.dot(np.eye(3))

## Fonctions utiles

Tout comme Matlab, NumPy proposes de nombreuses fonctions permettant de créer et éventuellement d'allouer des tableaux :

In [None]:
np.arange(0, 10, 1) # start, stop, step

In [None]:
np.zeros((5,3)) # the shape is a tuple

In [None]:
np.eye(4)

In [None]:
np.linspace(0, 10, num=6)

NumPy also provides all mathematical functions which are compatible with NumPy N-D arrays :

In [None]:
array = np.arange(0,9)
print(array)

In [None]:
array.shape
# also : ndim, size (!=matlab)

In [None]:
array.reshape((3,3))

In [None]:
array.min()

In [None]:
array.max()

In [None]:
# 9 random integers between 0 (included) to 10 (excluded)
array = np.random.randint(0, 10, 9)
print(array)

In [None]:
# get the array index of the first maximum value
array.argmax()

In [None]:
np.sum(array)

In [None]:
np.sqrt(array)

In [None]:
np.tan(array) / np.cos(array)

In [None]:
array3 = np.random.rand(3,3)
array3_inv = np.linalg.inv(array3)
print(array3_inv)

In [None]:
array3.dot(array3_inv) # OK

## Slicing arrays

Récupérer des tranches de valeurs fonctionne de la même manière que pour les listes : 

In [None]:
array

In [None]:
array[1:3]

In [None]:
array[1::2]

**Attention**: les *slices* sont des *vues* du tableau original. 

Ca veut dire que la modification de leurs éléments sont visibles dans le tableau original!

In [None]:
a = np.arange(16).reshape((4,4))

print(a)

a[1:3,1:3] = -1
print(a)

## Pay attention

* Operations that involve attributes or methods of `ndarray` occur *in-place*. 
* While functions that take an `ndarray` as an argument return a *modified copy*.
* With NumPy ndarray, a=b creates a new reference to b, not a copy.

In [None]:
a = np.random.rand(5)
b = np.arange(5)
b = a # b is a new reference to a.
b[0] = 10
print(b)

In [None]:
# Because b refers to a, modifyng b also modify a !
print(a)

In [None]:
b=a.copy() 
b[0] = 20
print(b)
print(a) # a has not been modified.

## Broadcasting

Broadcasting rules describe how arrays with different dimensions and/or shapes can be used for computations.

The general rule is that: 2 dimensions are compatible when they are equal or when one of them is 1.

![](http://www.astroml.org/_images/fig_broadcast_visual_1.png)

In [None]:
a = np.arange(3)
b = 5

In [None]:
a+b

In [None]:
a = np.ones((3,3))
b = np.arange(3)
a+b

In [None]:
a = np.arange(3).reshape(3,1)
b = np.arange(3)
a+b

<div class='exercice'><h3>Exercice</h3>
Générez le tableau [2^0, 2^1, 2^2, 2^3]

</div>

In [None]:
2**np.arange(4)

<div class='exercice'><h3>Exercice</h3>
Soit deux vecteur a et b, tels que shape(a)=(4,1) et shape(b)=(1,3). Calculer le produit exterieur a o b = a_i.b_j. Le resultat doit être de shape (4,3). 
</div>

In [None]:
a = np.arange(4).reshape(4,1) # reshapes into column vector
b = np.arange(3)
a*b

<div class='exercice'><h3>Quizz</h3>
Que va faire ? <br>
a = np.ones((4, 5)) <br>
a[0] = 2
</div>


In [None]:
a = np.ones((4, 5))
a[0] = 2 
a

## Fancy indexing, masking

Slicing is great when indices follow a regulary pattern.

But when one want arbitrary indexes, this is known as fancy indexing: the index is an integer array or a list of integer.

This requires a copy of the original array (so a performance cost)

In [None]:
a = np.arange(10)
print(a)

index = [3,1,6]
print(a[index])



Masking is like fancy indexing, except that it must be a *Boolean* *array* (not a Python list!).

As with fancy indexing, the application of a mask to an array will produce a copy of the original data.


In [None]:
mask = np.array([0,1,0,1,0,1,0,0,0,0], dtype=bool)
a[mask]

**Pay attention**: The following does not work as one could expect from Matlab behaviour !

In [None]:
a[[0,1,0,1,1,0,0,0,0,0,0]] # Here we use a Python list, not a Numpy array as mask.

<div class='exercice'><h3>Quizz</h3>
Pouvez-vous expliquer le dernier exemple ?
</div>

In [None]:
a[np.array([0,1,0,1,1,0,0,0,0,0], dtype=bool)] 

The mask can be generated in the indexing operation itself

In [None]:
a[a > 5]

It is also possible to combine masks with operators

In [None]:
a[(a>5) & (a<=8)]

La fonction NumPy `where()` prend en argument un tableau de booléen et retourne un tuple des indices où la condition est vérifiée (True). C'est l'équivalent du `find` de Matlab. 

In [None]:
np.where(a > 5)

In [None]:
a[np.where(a > 5)]

<div class='exercice'><h3>Exercice</h3>
Récupérez le courant plasma (signal SIPMES) pour le choc 47979 et tracez-le uniquement lorsque Ip>50 kA.
</div>

# Autres operations

## Comparaisons termes à termes:

In [None]:
a = np.array([1,2,3,4])
b = np.array([0,2,3,1])
a == b

In [None]:
a > b

## Comparaisons globales:

In [None]:
np.array_equal(a,b)

In [None]:
# Test whether all array elements evaluate to True.
np.all([1, 1, 0]) 

In [None]:
# Test whether any array element evaluates to True.
np.any([1, 1, 0])

<div class='exercice'><h3>Quizz</h3>
Ces dernières fonctions sont pratiques pour tester des égalités entre tableaux. Quel va être le résultat ci-dessous ?
</div>

In [None]:
>>> a = np.array([1, 2, 3, 2])
>>> b = np.array([2, 2, 3, 2])
>>> c = np.array([6, 4, 4, 5])

In [None]:
>>> ((a <= b) & (b <= c)).all()

## Tests avec des flottants

In [None]:
a = np.array([1.00001, 2, 3, 4])
b = np.array([1,2,3,4])

In [None]:
a == b

In [None]:
np.isclose(a,b)

In [None]:
np.array_equal(a,b)

In [None]:
np.allclose(a, b, rtol=1e-5)

## Operations logiques:

In [None]:
a = np.array([0,0,1,1])
b = np.array([0,1,0,1])
np.logical_and(a,b)

## Transposition

In [None]:
a=np.triu(np.ones(3)) # Upper triangle of an array
a

In [None]:
a.T

## Reductions

In [None]:
a = np.array([[1,1],[2,2]])
a.sum() # somme tous les elements par defaut

In [None]:
a.sum(axis=0)

In [None]:
a.sum(axis=1)

Idem pour la pluspart des fonctions : min, max, etc...

## Statistiques

In [None]:
a = np.random.rand(1000)

In [None]:
a.mean() # ou np.mean(a)

In [None]:
a.std() # ou np.std(a)

## Grilles

In [None]:
x, y = np.arange(4), np.arange(4).reshape(4,1)
# ou, astuce pour y : np.arange(4)[:, np.newaxis]
x * y

In [None]:
x, y = np.meshgrid(np.arange(4), np.arange(4))
print(x)
print(y)

## Aplatissement

In [None]:
a = np.array([[1,2,3],[4,5,6]])
a

In [None]:
a.ravel() # Flattening

In [None]:
a.T

In [None]:
a.T.ravel() # ou a.transpose().ravel()

<div class='exercice'><h3>Exercice</h3>
Utilisez les fonctions ravel() et flatten(). Quelle est la différence entre ces deux fonctions? (indice: laquelle retourne une vue et laquelle une copie?)
</div>

In [None]:
a = np.array([[1,2,3],[4,5,6]])
b = a.ravel() # Return a flattened array.
c = a.flatten() # Return a copy of the array collapsed into one dimension.

In [None]:
a[0,0] = -1
print(b)
print(c)


## Reshaping

In [None]:
a

Reshaper sans spécifier l'ensemble des dimensions :  

In [None]:
# unspecified (-1) value is inferred
a.reshape(3, -1) 

## Algebre lineaire
Le module [numpy.linalg](http://docs.scipy.org/doc/numpy-1.10.0/reference/routines.linalg.html) contiens les outils pour:

* Matrix and vector products
* Decompositions
* Matrix eigenvalues
* Norms and other numbers
* Solving equations and inverting matrices

In [None]:
a = [[1, 0], [0, 1]]
b = [[4, 1], [2, 2]]
print(a) 
print(b)
np.dot(a, b)

In [None]:
"""Load the CSS sheet 'custom.css' located in the directory"""
from IPython.display import HTML  
styles = f'<style>\n{open("./custom.css","r").read()}\n</style>'
HTML(styles) 