# Visualisation de données en Python
## Visualiser des séries temporelles

Question
* Comment visualiser des données sous forme de courbes temporelles?

Objectif
* Créer différents types de graphiques.

In [None]:
import pandas as pd

# Charger les données nettoyées
surveys_complet = pd.read_csv('../data/surveys_0_NA.csv')
surveys_complet

In [None]:
import altair as alt
alt.data_transformers.disable_max_rows()

## Visualiser des données selon le temps
* Nombre d'enregistrements par type d'espèce pour chaque année :

In [None]:
alt.Chart(surveys_complet).mark_line().encode(
    x=alt.X('year').type('ordinal'),
    y=alt.Y('count()').scale(type='log', base=2),
    color=alt.Color('species_id'),
)

* Poids médian par type d'espèce pour chaque mois :

In [None]:
alt.Chart(surveys_complet).mark_line().encode(
    x=alt.X('month').type('ordinal'),
    y=alt.Y('weight').aggregate('median'),
    color=alt.Color('species_id'),
    tooltip=['species_id'],
)

### Exercice - Visualisation selon le temps
`1`. Utilisez la fonction `pd.to_datetime()` pour générer une colonne
     de dates à partir des colonnes `year`, `month` et `day`. (3 min.)

In [None]:
# Décennie 1990 - pour éviter les 31 avril et 31 septembre 2000
dec_1990 = surveys_complet[
    surveys_complet['year'].isin(range(1990, 2000))].copy()

dec_1990['date'] = pd.to_datetime(dec_1990[['year', 'month', 'day']])
dec_1990['date']

`2`. Affichez le poids médian de chaque espèce selon la `date`.
(3 min.)

In [None]:
alt.Chart(dec_1990).mark_line().encode(
    x=alt.X('date'),
    y=alt.Y('weight').aggregate('median'),
    color=alt.Color('species_id'),
    tooltip=['species_id', 'date'],
)

## Résumé technique
* **Création d'une colonne de dates**
  * `df['date'] = pd.to_datetime(df[['year', 'month', 'day']])`
* **Choix du type de marqueurs** à afficher
  * `graphique.mark_line()`
* **Assigner des variables** à des canaux du graphique
  * `graphique.encode(...)`
  * Différents canaux :
    * `y=alt.Y('count()')`
    * `y=alt.Y('varY').aggregate('stat')`,
      avec les statistiques `'mean'`, `'median'`, etc.