# Manipuler des tableaux avec NumPy.

Diminutif de ***Numerical Python***, elle fournit un ensemble de fonctions pour effectuer efficacement des opérations sur les données, mais propose également un objet qui est au cœur de presque tout l’écosystème data en Python : **l’array**.

## Différenciez les arrays des listes classiques

Le tableau NumPy, ou array, en anglais, est d’une certaine manière similaire à une liste Python. 
Son avantage ? Il permet d’effectuer simplement et rapidement de nombreuses opérations complexes, en plus de faciliter le stockage et la manipulation des données.

In [None]:
# Pour installer numpy :
pip install numpy

In [None]:
# Fonction qui fait la moyenne d'une liste :
def moyenne(liste):
    return sum(liste)/len(liste)

revenus = [1800, 1500, 2200, 3000, 2172]
print(moyenne(revenus))

On estime qu’à mesure que la taille du tableau augmente, des opérations via array NumPy deviennent **environ 30 fois plus rapides** que via une liste Python classique. 

Cette différence aussi importante s’explique par le fait que les arrays NumPy ne peuvent contenir qu’un seul et même type. En effet, contrairement à une liste classique où l’on peut stocker tous types d’objets, NumPy n’acceptera qu’un seul type en entrée.
- ```np.mean()``` retourne la moyenne de la liste.

In [2]:
import numpy as np

revenus = [1800, 1500, 2200, 3000, 2172]

print(np.mean(revenus))

2134.4


NumPy donne également accès à de nombreuses autres fonctions mathématiques indispensables, applicables à des arrays ou même à des listes :

In [3]:
x = [-2, -1, 1, 2]

print("La valeur absolue: ", np.abs(x))
print("Exponentielle: ", np.exp(x))
print("Logarithme: ", np.log(np.abs(x)))

La valeur absolue:  [2 1 1 2]
Exponentielle:  [0.13533528 0.36787944 2.71828183 7.3890561 ]
Logarithme:  [0.69314718 0.         0.         0.69314718]


## Créez un array NumPy

on peux faire cela de différentes façons, mais la plus simple est de le faire… à partir d’une liste Python classique :

In [None]:
revenus = [1800, 1500, 2200, 3000, 2172]

revenus_array = np.array(revenus)
revenus_array


> Si dans la liste de départ il y a des données de types différents, *NumPy essaiera de tous les convertir au type le plus général*.
> Par exemple, si un tableau contient des entiers ```int``` et des nombres décimaux ```float```, tous ses éléments seront convertis en nombres décimaux ```float```.

Il existe également des fonctions NumPy permettant de créer des arrays selon un certain pattern ou une spécification particulière :

In [None]:
n = 7

print(f"Fait un array de n elements mis a 0: {np.zeros(n)}")
print(f"Fait un array de n elements mis a 1: {np.ones(n)}")
print(f"Fait un array de 0 a n elements par pas de 2: {np.arange(0, n, 2)}")
print(f"Fait un array de 3 valeurs espacées uniformément entre 1 et 9: {np.linspace(1, 9, 3)}")

On peux accéder au type des éléments d’un array via la méthode ```.dtype``` :

In [None]:
revenus_array.dtype

> Les types en NumPy seront toujours présentés via deux informations :
> le type (ici int ) ;
> la précision (ici 64 ).
> Cette dernière correspond au nombre de bits sur lesquels sont codés les nombres, définissant ainsi les différentes valeurs possibles. Par exemple, un int8  (entier codé sur 8 bits) pourra prendre des valeurs de -128 à 127 !

## Sélectionner des éléments au sein d’un array

L’accès à ***un élément spécifique d’un array*** se fait via la syntaxe : ```nom_array[indice]```.

### Accédez à un seul élément

In [None]:
revenus = [1800, 1500, 2200, 3000, 2172]

revenus_array = np.array(revenus)

# Pour accéder au 4eme éléments :
item = revenus_array[3]
print(item)

# Pour accéder au dernier éléments :
revenus_array[-1]


### Accédez à plusieurs éléments contigus

On peux accéder à un ensemble d'éléments contigus en combinant ```[]``` et ```:``` .

La syntaxe suit une règle simple : ```nom_array[i:j:p]``` , avec :
-  ```i``` : l’indice du début ;
-  ```j``` : l’indice de fin ;
-  ```p``` : le pas ;

In [None]:
# revenus = [1800, 1500, 2200, 3000, 2172]

# Récupère les 3 premiers éléments :
print(revenus_array[0:3])

# Les éléments à partir de l’indice 2 :
print(revenus_array[2:])

# Un élément sur deux :
print(revenus_array[::2])

# Avec le pas à -1, inverse l'array:
print(revenus_array[::-1])

### Accéder à plusieurs éléments selon une condition
Il est possible avec les arrays NumPy de renseigner la condition selon laquelle on souhaite sélectionner les éléments du tableau, avec l’écriture ```nom_array[condition de sélection]```.
- Voilà par exemple comment sélectionner uniquement les valeurs supérieures à 2 000 € :

In [None]:
revenus_array[revenus_array > 2000]

Il est naturellement possible de complexifier cela, avec plusieurs conditions :

In [None]:
revenus_array[(revenus_array > 2000) & (revenus_array < 3000)]

## Utiliser les méthodes d’array

On peut accéder facilement aux ***dimensions de notre array*** via la méthode ```.shape``` : 

In [None]:
# revenus = [1800, 1500, 2200, 3000, 2172]

revenus_array.shape

In [None]:
# calculer la moyenne
print(f"- La moyenne des valeurs de l'array: {revenus_array.mean()}")

# calculer le maximum (ou le minimum) :
print(f"- La valeurs maximum des valeurs de l'array: {revenus_array.max()}")
print(f"- La valeurs minimum des valeurs de l'array: {revenus_array.min()}")

# accéder à l’indice de l’élement minimum (ou maximum) :
print(f"- Indice du plus petit élément : {revenus_array.argmin()}")
print(f"- Indice du plus grand élément: {revenus_array.argmax()}")

# ordonner par ordre croissant :
revenus_array.sort()
print(f"- Array trie: {revenus_array}")

# Calculer la somme :
print(f"- La somme de tous les éléments: {revenus_array.sum()}")

## Création d'un tableau avec Numpy

Le plus souvent les array ne sont pas que sur une seulle colonne.

exemple :
Dans le milieu bancaire un client a plusieurs informations:
- Noms, mensualité, nombres d'enfants.

Voila comment l'on pourrait matérialiser ce tableau en Python, en utilisant des listes :

In [6]:
hugo = [21, 1400, 0]
richard = [54, 2800, 2]
emilie = [27, 3700, 3]
tableau = [hugo, richard, emilie]

print(tableau[0][1:])

[54, 2800, 2]


------------------------------------------------------------
# Créer des data frames avec Pandas.

------------------------------------------------------------
# Construire des data visualisations avec Matplotlib et Seaborn.