# NUMPY

# Table des matières
**[Chapitre 0 - Introduction](#M0)**  


**[Chapitre 1 - Création de tableaux numpy](#M1)**  
- [1. A partir de listes](#M11)  
- [2. A partir de fonctions dédiées](#M12)  
- [Exercice 1](#M13) 
- [3. A partir de fichiers](#M14) 
- [4. A partir d'un tableau](#M15) 

**[Chapitre 2 - Les attributs dimensionnels](#M2)**.   
- [1. L'attribut shape](#M21)  
- [2. L'attribut ndim](#M22)  
- [3. L'attribut size](#M23)  
- [4. L'attribut reshape](#M24)
- [5. Méthode ravel](#M25) 

**[Chapitre 3 - Vectorisation](#M3)**  
- [1. Le paramètre out](#M31) 
- [2. La méthode at](#M32)  
- [3. Tableaux constants](#M33)
- [4. Méthode indice](#M34)

**[Chapitre 4 - Slicing](#M4)**  
- [Exercice 2](#M41) 
- [1. Quelques éléments](#M42)  
- [2. Le symbole spécial np.newaxis](#M43)
- [3. Différences avec les listes](#M44)

**[Chapitre 5 - Complexité](#M5)**
- [1. Tri par fusion](#M51)
- [2. Avec la méthode sort de Numpy](#M52)

## <font color=#3876C2> Chapitre 0 - Introduction</font> <a name="M0"></a>

NumPy est une librairie utilisée dans presque tous les projets de calcul numérique sous Python

NumPy fournit des structures de données performantes pour la manipulation de vecteurs, de matrices, de tenseurs. On parlera de tableau ou array en Anglais (en fait techniquement, ndarray, pour n-dimension array)

NumPy est écrit en C et en Fortran d'où ses performances élevées lorsque les calculs sont vectorisés (formulés comme des opérations sur des tableaux)

Pour utiliser NumPy il faut commencer par l'importer :

In [None]:
import numpy as np

## <font color=#3876C2> Chapitre 1 - Création de tableaux numpy</font> <a name="M1"></a>

Plusieurs possibilités:

1.  à partir de listes ou n-uplets Python
2.  en utilisant des fonctions dédiées, telles que arange, linspace, etc.
3.  par chargement à partir de fichiers
4.  à partir d'un tableau


### <font color=#FEB229> 1. A partir de listes</font> <a name="M11"></a>

Au moyen de la fonction np.array :

In [None]:
# un vecteur à partir d'une liste Python
v = np.array([1, 3, 2, 4])
print(v)
print(type(v))

**Attention** : une erreur commune au début consiste à faire ceci, qui ne marche pas :

In [None]:
try:
    array = np.array(1, 2, 3, 4)
except Exception as e:
    print(f"OOPS, {type(e)}, {e}")

Tableau de dimension 2 (matrice):

In [None]:
# une matrice: l'argument est une liste emboitée
M = np.array([[1, 3], [2, 4]])
print(M)

In [None]:
# accéder à un élément
print(M[0, 0])
print(M[1, 1])

In [None]:
# accéder à une ligne
print(M[0])
print(M[1])

In [None]:
# accéder à une colonne
print(M[:,0])
print(M[:,1])

La variable M est aussi du type ndarray

In [None]:
type(M)

### <font color=#FEB229>2. A partir de fonctions dédiées</font> <a name="M12"></a>

mais aussi à partir d'un itérable

In [None]:
builtin_range = np.array(range(10))
builtin_range

Sauf que dans ce cas précis on préfèrera utiliser directement la méthode arange de numpy :

In [None]:
numpy_range = np.arange(10)
numpy_range

Avec l'avantage qu'avec cette méthode on peut donner des bornes et un pas d'incrément qui ne sont pas entiers :

In [None]:
numpy_range_f = np.arange(1.0, 2.0, 0.1)
numpy_range_f

## <font color='blue'>Exercice 1</font><a name="M13"></a>

In [None]:
# chargement de l'exercice
from corrections.exo_npmodif import exo_npmodif

On va écrire une fonction qui va créer une arange(n) et transformer
    en leurs opposés les termes d'indices compris entre a et b.
    La fonction retourne le tableau np modifié

In [None]:
exo_npmodif.example()

In [None]:
# Ecrivez votre fonction
def npmodif(n, a, b) :
    '''Ecrire votre fonction ici'''
    
    return list(Z)


In [None]:
%timeit npmodif(10,3,5)

In [None]:
# pour vérifier votre code
exo_npmodif.correction(npmodif)

**np.linspace**

Aussi et surtout, lorsqu'on veut créer un intervalle dont on connaît les bornes, il est souvent plus facile d'utiliser linspace, qui crée un intervalle un peu comme arange, mais on lui précise un nombre de points plutôt qu'un pas :

In [None]:
X = np.linspace(0., 10., 50)
X

Vous remarquez que les 50 points couvrent à intervalles réguliers l'espace compris entre 0 et 10 inclusivement. Notons que 50 est aussi le nombre de points par défaut. Cette fonction est très utilisée lorsqu'on veut dessiner une fonction entre deux bornes.

### <font color=#FEB229> 3. A partir de fichiers</font> <a name="M14"></a>

Par exemple à partir d'une image (voir activité 1)

### <font color=#FEB229> 4. A partir d'un tableau</font> <a name="M15"></a>

In [None]:
w = 2*v
print(w)

In [None]:
z = w**2
print(z)

## <font color=#3876C2> Chapitre 2 - Les attributs dimensionnels</font> <a name="M2"></a>

### <font color=#FEB229> 1. L'attribut shape</font> <a name="M21"></a>

v et M diffèrent par leur taille:

In [None]:
v.shape

In [None]:
M.shape

In [None]:
type(M.shape)

### <font color=#FEB229> 2. L'attribut ndim</font> <a name="M22"></a>

il permet de savoir quel est la dimension d'un ndarray

In [None]:
N = np.array([[1, 3], [2, 4], [2, 4]])
print(v.ndim)
print(M.ndim)
print(N.ndim)

### <font color=#FEB229> 3. L'attribut size</font> <a name="M23"></a>

il permet de savoir quel est le nombre d'éléments dans un ndarray

In [None]:
print(v.size)
print(M.size)
print(N.size)

### <font color=#FEB229> 4. reshape</font> <a name="M24"></a>

In [None]:
d2 = np.array([[11, 12, 13], [21, 22, 23]])
d2

In [None]:
# la forme (les dimensions) du tableau
d2.shape

In [None]:
# l'argument qu'on passe à reshape est le tuple
# qui décrit la nouvelle *shape*
v2 = d2.reshape((3, 2))
v2

In [None]:
# on change un tableau
d2[0][0] = 100
d2

In [None]:
# ça se répercute dans l'autre
v2

**Exemple d'un tableau à 3 dimensions**

In [None]:
T = np.array([[[1, 3, 2, 4]]])
print(T)

In [None]:
print(T.shape)
print(T.ndim)
print(T.size)
np.size(T)

### Résumé des attributs

Voici un résumé des attributs des tableaux `numpy` :

| *attribut* | *signification*               | *exemple*    |
|:-----------|:------------------------------|:-------------|
| `shape`    | tuple des dimensions          | `(3, 5, 7)`  |
| `ndim`     | nombre dimensions             | `3`          |
| `size`     | nombre d'éléments             | `3 * 5 * 7`  |
| `dtype`    | type de chaque élément        | `np.float64` |
| `itemsize` | taille en octets d'un élément | `8`          |

### <font color=#FEB229> 5. Méthode ravel</font> <a name="M25"></a>

#### Méthode `ravel` qui  permet d'aplatir n'importe quel tableau :

In [None]:
d2.ravel()

## <font color=#3876C2> Chapitre 3 - Vectorisation</font> <a name="M3"></a>

Exploitation du fait que les tableaux Numpy sont stockés dans des zones contigües de mémoire et que tous les éléments stockés ont la même dimension. Il est par conséquent extrêmement efficace de parcourir les différents éléments d'un tableau Numpy

In [None]:
a = np.arange(1000)
a

In [None]:
%timeit [x**2 + 2*x - 1 for x in a]

In [None]:
print([x**2 + 2*x - 1 for x in a])

In [None]:
a

In [None]:
%timeit a**2 + 2*a - 1

In [None]:
print(a**2 + 2*a - 1)

### <font color=#FEB229> 1. Le paramètre out</font> <a name="M31"></a>

Tous les opérateurs (+, *, ** ...) sont factorisés dans Numpy ainsi que certaines fonctions (sqrt...)

Certaines fonctions accueillent des paramètres permettant d'améliorer encore les performances tel out qui permet de spécifier dans quel objet on va écrire le résultat. Par défaut les fonctions vectorisées créent un nouvel objet. L'intérêt est donc d'utiliser un objet existant pour économiser le temps de création de cet objet et avoir un gain important en terme de mémoire.

In [None]:
a = np.arange(1, 1_000_000, dtype=np.float64)

"-r 1 -n 1" signifie qu'on ne fait qu'une seule fois l'opération'

In [None]:
%timeit -r 1 -n 1 np.sqrt(a)

In [None]:
%timeit -r 1 -n 1 np.sqrt(a, out = a)

### <font color=#FEB229> 2. La méthode at</font> <a name="M32"></a>

Certaines fonctions vectorisées possédent la méthode at qui permet d'appliquer cette fonction à une seule partie d'un ndarray

In [None]:
a

In [None]:
a[:5]

In [None]:
np.log.at(a, [2, 4])

In [None]:
a[:5]

### <font color=#FEB229> 3. Tableaux constants</font> <a name="M33"></a>

On peut aussi créer et initialiser un tableau avec `np.zeros` et `np.ones` :

In [None]:
zeros = np.zeros(dtype=np.complex128, shape=(1000, 100))
print(zeros)

In [None]:
fours = 4 * np.ones(dtype=float, shape=(8, 8))
fours

### <font color=#FEB229> 4. Méthode indice</font> <a name="M34"></a>

In [None]:
ix, iy = np.indices((3, 5))

In [None]:
ix

In [None]:
iy

Si on veut construire un tableau de taille (2, 4) dans lequel, par exemple :
```Python
tab[i, j] = 200*i + 2*j + 50
```
On n'a qu'à faire :

In [None]:
ix, iy = np.indices((2, 4))
tab = 200*ix + 2*iy + 50
tab

## <font color=#3876C2> Chapitre 4 - Slicing</font> <a name="M4"></a>

## <font color='blue'>Exercice 2</font><a name="M41"></a>

#### En utilisant la méthode `indices` écrire une fonction `creerarray` qui retourne le ndarray suivant lors de l'instruction `creerarray(5)`

![image.png](matrice.png)

In [None]:
# chargement de l'exercice
from corrections.exo_creerarray import exo_creerarray

In [None]:
exo_creerarray.example()

In [None]:
# Ecrivez votre fonction

def creerarray(n):
    


In [None]:
%timeit creerarray(5)

In [None]:
# pour vérifier votre code
exo_creerarray.correction(creerarray)

### <font color=#FEB229> 1. Quelques éléments</font> <a name="M42"></a>

In [None]:
# Rappel : grâce au slicing on peut référencer une colonne :

a5[:, 3]

# C'est un tableau à une dimension, mais vous pouvez tout de même modifier la colonne par une affectation :

a5[:, 3] = range(300, 305)
print(a5)

Ou par broadcasting (Le broadcasting est une fonctionnalité de numpy qui permet de réaliser des opérations entre des tableaux de dimensions différentes tant qu’une consistence existe entre ces tableaux).

On affecte un scalaire à une colonne :

In [None]:
a5[:, 2] = 200
print(a5)

In [None]:
# ou on ajoute un scalaire à une colonne
a5[:, 4] += 400
print(a5)

In [None]:
# Les slices peuvent prendre une forme générale :

a8 = creerarray(8)
print(a8)

# toutes les lignes de rang 1, 4, 7
a8[1::3]

In [None]:
# toutes les colonnes de rang 1, 5
a8[:, 1::4]

In [None]:
# et on peut bien sûr les modifier
a8[:, 1::4] = 0
print(a8)

In [None]:
# Du coup, le slicing peut servir à extraire des blocs :

# un bloc au hasard dans a8
print(a8[5:8, 2:5])

### <font color=#FEB229> 2. Le symbole spécial np.newaxis</font> <a name="M43"></a>

#### Mais auparavant les axes `axis`

In [None]:
a = np.arange(1, 10).reshape(3, 3)
a

In [None]:
np.sum(a)

In [None]:
np.sum(a, axis = 0)

In [None]:
np.sum(a, axis = 1)

In [None]:
print(a.ndim)

In [None]:
# np.sum(a, axis = 2)

In [None]:
# On peut utiliser également le symbole spécial `np.newaxis` en conjonction avec un slice pour "décaler" les dimensions :

X = np.arange(1, 7)
print(X)

In [None]:
X.shape

In [None]:
print(X.ndim)

In [None]:
Y = X[:, np.newaxis]
print(Y)

In [None]:
print(Y.shape)
print(Y.ndim)

In [None]:
# Et ainsi de suite :

Z = Y[:, np.newaxis]
Z

In [None]:
print(Z.shape)
print(Z.ndim)

In [None]:
# De cette façon, par exemple, en combinant le slicing pour créer X et Y,
# et le broadcasting pour créer leur somme,  on peut créer facilement la table de tous les tirages de 2 dés à 6 faces :

dice2 = X + Y
print(dice2)

In [None]:
# Ou tous les tirages à trois dés :

dice3 = X + Y + Z
print(dice3)

In [None]:
# utilitaire qui n'a rien à voir, mais avec `np.unique`, vous pourriez calculer le nombre d'occurrences dans le tableau,
# et ainsi calculer les probabilités d'apparition de tous les nombres entre 3 et 18 :

effectifs = np.unique(dice3, return_counts=True)
effectifs

In [None]:
effectifs[1]/np.sum(effectifs[1])

### <font color=#FEB229> 3. Différences avec les listes</font> <a name="M44"></a>

#### Avec l'indexation et le slicing, on peut créer des tableaux qui sont des vues sur des fragments d'un tableau ; on peut également déformer leur dimension grâce à `newaxis` ; on peut modifier ces fragments, en utilisant un scalaire, un tableau, ou un slice sur un autre tableau. Les possibilités sont infinies.

#### Il est cependant utile de souligner quelques différences entre les tableaux `numpy` et, les listes natives, pour ce qui concerne les indexations et le *slicing*.

#### On ne peut pas changer la taille d'un tableau avec le slicing.

#### La taille d'un objet `numpy` est par définition constante ; cela signifie qu'on ne peut pas, par exemple, modifier sa taille totale avec du slicing. 



## <font color=#3876C2> Chapitre 5 - Complexité</font> <a name="M5"></a>

https://docs.scipy.org/doc/numpy/reference/generated/numpy.sort.html

Comparons les performances de tri de tableau

### <font color=#FEB229> 1. Tri par fusion</font> <a name="M51"></a>

In [None]:
def triFusion(T, i, j) :
    if i < j :
        m = (i + j) // 2
        T1 = triFusion(T, i, m)
        T2 = triFusion(T, m + 1, j)
        return fusion(T1, T2)
    else :
        return T[i:i+1]


In [None]:
def fusion(T1, T2) :
    i = 0
    j = 0
    T = []
    while i < len(T1) and j < len(T2) :
        if T1[i] < T2[j] :
            T.append(T1[i])
            i += 1
        else:
            T.append(T2[j])
            j += 1
    while i < len(T1) :
        T.append(T1[i])
        i += 1
    while j < len(T2) :
        T.append(T2[j])
        j += 1           
    return T

In [None]:
print(triFusion([1, 5, 7, 2, 4, 3, 9, 8],0 ,7))

In [None]:
%timeit triFusion([1, 5, 7, 2, 4, 3, 9, 8],0 ,7)

 ### <font color=#FEB229> 2. Avec la méthode sort de Numpy</font> <a name="M52"></a>

In [None]:
a = np.array([1, 5, 7, 2, 4, 3, 9, 8])

In [None]:
np.sort(a)

In [None]:
%timeit np.sort(a)

In [None]:
%timeit np.sort(a,kind='quicksort')

In [None]:
%timeit np.sort(a,kind='mergesort')

In [None]:
%timeit np.sort(a,kind='heapsort')