# Visualisation de données en Python
## Construire un graphique par étapes

Question
* Comment personnaliser un graphique selon la
  *grammaire des graphiques* d'Altair?

Objectifs
* Configurer les couleurs des éléments d'un graphique.
* Modifier l'échelle des axes.
* Éditer le titre du graphique et le nom des axes.

In [None]:
import pandas as pd

# Charger les données nettoyées
surveys_complet = pd.read_csv('../data/surveys_0_NA.csv')
surveys_complet

In [None]:
import altair as alt
alt.data_transformers.disable_max_rows()

## Construire un graphique par étapes
Rappel : les éléments de base de tout graphique Altair sont
le `Chart()` avec le DataFrame, un type de graphique `mark_*()`
et des variables utilisées dans `encode()`.

* Ensuite, on commence à modifier le graphique pour en extraire
  davantage d'information. Par exemple, avec de la transparence :

In [None]:
alt.Chart(surveys_complet).mark_point().encode(
    x=alt.X('hindfoot_length'),
    y=alt.Y('weight'),
).configure_mark(
    opacity=0.05,
)

* Pour avoir une couleur différente pour chaque type d'espèce,
  il faut lier la variable `species_id` au canal `color` :

In [None]:
alt.Chart(surveys_complet).mark_point().encode(
    x=alt.X('hindfoot_length'),
    y=alt.Y('weight'),
    color=alt.Color('species_id'),
).configure_mark(
    opacity=0.05,
)

* Étant donné la similarité de certaines couleurs, on peut ensuite
  activer les `tooltip` avec les identifiants de `species_id` :

In [None]:
alt.Chart(surveys_complet).mark_point().encode(
    x=alt.X('hindfoot_length'),
    y=alt.Y('weight'),
    color=alt.Color('species_id'),
    tooltip=['species_id'],
).configure_mark(
    opacity=0.05,
)

* Utiliser une échelle verticale semi-log :

In [None]:
alt.Chart(surveys_complet).mark_point().encode(
    x=alt.X('hindfoot_length'),
    y=alt.Y('weight').scale(type='log', base=2),
    color=alt.Color('species_id'),
    tooltip=['species_id'],
).configure_mark(
    opacity=0.05,
).properties(
    height=384,
)

* Définir les titres et le nom des axes :

In [None]:
alt.Chart(surveys_complet).mark_point().encode(
    x=alt.X('hindfoot_length').title('Longueur arrière-pied (mm)'),
    y=alt.Y('weight').scale(type='log', base=2).title('Poids (g)'),
    color=alt.Color('species_id').title("Code d'espèce"),
    tooltip=['species_id'],
).configure_mark(
    opacity=0.05,
).properties(
    height=384,
    title="Poids selon la longueur de l'arrière-pied",
)

### Exercice - Enrichir le graphique à barres
Adaptez le graphique de l'exercice précédent en associant la variable
`sex` à une échelle de couleurs spécifique :
* L'encodage du canal `color` doit donc se faire avec la variable
  `'sex'`. La méthode `.scale()` permet ensuite d'associer les valeurs
  de domaine `'F'` et `'M'` aux couleurs `'orange'` et `'green'`.
  Voir [un exemple ici](https://altair-viz.github.io/user_guide/customization.html#color-domain-and-range)
* Dans le canal `tooltip`, ajoutez `'sex'` au début de la liste
* Expérimentez l'activation du canal `xOffset`

(4 min.)

In [None]:
alt.Chart(surveys_complet).mark_bar().encode(
    x=alt.X('plot_id').type('ordinal'),
    y=alt.Y('count()'),
    color=alt.Color('sex').scale(
        domain=['F', 'M'],
        range=['orange', 'green'],
    ),
    xOffset='sex',
    tooltip=['sex', 'count()'],
).properties(
    width=480,  # Fixer la largeur du graphique (pixels)
)

## Résumé technique
* **Assigner des variables** à des canaux du graphique
  * `graphique.encode(...)`
  * Différents canaux :
    * `x=alt.X('varX')` et `y=alt.Y('varY')`
      * `.scale(type='log', base=2)`
      * `.title('Nom axe X ou Y')`
    * `color=alt.Color('varCouleur')`
      * `.scale(domain=[...], range=['#114499', ...])`
      * `.title('Texte affiché pour varCouleur')`
    * `tooltip=['varX', 'varY', 'varCouleur', ...]`
    * `xOffset='nom_variable'`
* **Autres propriétés du graphique**
  * `graphique.configure_mark(...)`
    * `opacity=0.05`
  * `graphique.properties(...)`
    * `width=400`
    * `height=300`
    * `title='Titre de la figure'`