### Un excellent graphique est celui qui donne au spectateur le plus grand nombre d'idées avec le moins d'encre possible, dans le plus petit espace. 
Edward R. Tufte, Professeur de statistiques à l’université de Yale

En datascience, il existe plusieurs bibliothèques pour afficher des graphiques :
- matplotlib
- pandas : pandas utiliser une version trop simplifiée de matplotlib (à éviter si possible)
- seaborn : une version améliorée de matplotlib

Dans le cadre de ce TP nous allons utiliser seaborn. Pourquoi ? L'outil offre plus de graphiques comparé à matplotlib et des designs plus élégants. Toutefois, pour utiliser seaborn, il faudra utiliser (et importer) matplotlib pour afficher nos graphiques. Notez qu'il existe également yellowbrick ou encore bokeh pour gérer les graphiques.

Et pour tester ce nouvel outil, nous allons réutiliser notre DataFrame des naissances par département. Malgré son petit nombre de colonnes, il est possible de s'essayer avec plein de types de graphiques.

# Pour les utilisateurs de Google colab

Petit apparté pour les utilisateurs de google colab. Pour utiliser la méthode `pd.read_csv()`, il faudra rajouter quelques lignes de codes supplémentaires pour pouvoir charger un fichier, les voici.


```python
# Première cellule jupyter
from google.colab import files
uploaded = files.upload()
```

```python
# Seconde cellule jupyter
import io
# Très important : le nom du fichier passé en paramètre de la fonction "uploaded" doit avoir le même nom que le fichier que vous avez uploadé
df = pd.read_csv(io.BytesIO(uploaded['nom-du-fichier-uploader.csv']))
```

- [Voir plus  d'informations sur le chargement de fichiers externes avec Google colab](https://towardsdatascience.com/3-ways-to-load-csv-files-into-colab-7c14fcbdcb92)

In [None]:
import pandas as pd

# On importe seaborn et matplotlib vu que nous allons l'utiliser
import seaborn as sns
import matplotlib.pyplot as plt

plt.ion()

# le fichier est chargé en tant que DataFrame
liste_prenoms_source = pd.read_csv("data/naissances-par-departement-1900-2019.csv", sep=";") 
liste_prenoms_source.head()

In [None]:
liste_prenoms_nettoyage = liste_prenoms_source.copy()
# Nettoyage de notre dataset

# On supprime les colonnes avec les lignes ayant des données manquantes
liste_prenoms_nettoyage.dropna(inplace = True) 

# On supprime les lignes avec la valeur "_PRENOMS_RARES" pour la colonne "preusuel" ou
# XXXX comme valeur pour l'année ou 
# XX comme valeur pour le département
liste_prenoms_nettoyage = liste_prenoms_source[
       (liste_prenoms_source["preusuel"] != "_PRENOMS_RARES") &
        (liste_prenoms_source["annais"] != "XXXX") &
    (liste_prenoms_source["dpt"] != "XX")
]

# Ligne (line chart)

Assurément l'un des graphiques les plus simples, la ligne permet soit d'afficher la corrélation entre données (une données est exprimée sur l'axe X, et l'autre sur l'axe Y) ou l'évolution d'une donnée au fil du temps. Par ailleurs, notez qu'il est possible d'avoir plusieurs axe Y ou X, mais faites attention à la lisibilité.

In [None]:
# Pour commencer, nous allons afficher l'évolution du nombre de naissances d'un prénom

prenom = "agathe"
un_prenom_df = liste_prenoms_nettoyage[
    liste_prenoms_nettoyage["preusuel"].str.lower() == prenom
].sort_values(by=['annais'])

un_prenom_df = un_prenom_df.groupby(['annais','preusuel'], as_index=False).agg({'nombre': 'sum'})

plt.figure(figsize=(40, 10))
ligne_graph = sns.lineplot(
        x="annais", y="nombre", 
        data=un_prenom_df
)
plt.xticks(rotation=45)
ligne_graph.set_title('zoom')


Vous remarquez que malgré l'affichage d'un graphique

conda install -c conda-forge ipympl

%matplotlib widget

In [None]:
# pip install ipympl

# %matplotlib widget

In [4]:
from ipywidgets import interact
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

def f(var):
    sns.displot(np.random.normal(1, var, 1000))
    plt.show()
interact(f, var = (1,10))

interactive(children=(IntSlider(value=5, description='var', max=10, min=1), Output()), _dom_classes=('widget-i…

<function __main__.f(var)>