# Visualisation de données en Python
## Introduction à Altair

Question
* Comment faire des graphiques modernes et interactifs?

Objectif
* Comprendre les éléments de base d'une grammaire des graphiques.
* Créer un premier objet `alt.Chart`.
* Sauvegarder une figure en image ou en version interactive.

# Data Visualization in Python
## Introduction to Altair

Question
* How to create modern and interactive plots?

Objective
* Understanding the basics of a grammar of graphics.
* Create a first `alt.Chart` object.
* Save a figure as an image or as an interactive version.

## Grammaire des graphiques
* Introduite par Leland Wilkinson au début de la décennie 1990.
* Langage commun et structuré pour décrire et
  comprendre les aspects variés de toute visualisation.

Vidéo explicative intéressante :

[![YouTube - A Grammar of Graphics](https://img.youtube.com/vi/RCaFBJWXfZc/default.jpg)](https://www.youtube.com/watch?v=RCaFBJWXfZc)

## Grammar of graphics
* Introduced by Leland Wilkinson at the beginning of the 1990s.
* A common, structured language for describing and
  understanding the various aspects of any visualization.

Interesting explanatory video:

[![YouTube - A Grammar of Graphics](https://img.youtube.com/vi/RCaFBJWXfZc/default.jpg)](https://www.youtube.com/watch?v=RCaFBJWXfZc)

### Sept éléments centraux
1. Données
   * Qu’est-ce qu’on représente.
2. Esthétique
   * Comment on le représente.
3. Système de coordonnées
   * Comment on positionne nos données.
4. Échelle
   * Comment on passe de la donnée à la représentation esthétique.
5. Objets géométriques
   * Quel type d’objet géométrique on utilise.
6. Statistiques
   * Comment on calcule/modifie les données.
      * Par exemple, un comptage, des quartiles,
        des droites de régression, etc.
7. Facettes
   * Comment on divise nos données en plusieurs jeux ou graphiques.

### Seven central elements
1. Data
   * What do we represent.
2. Aesthetic
   * How we represent it.
3. Coordinate system
   * How we position our data.
4. Scale
   * How we move from data to aesthetic representation.
5. Geometric objects
   * What type of geometric object is used?
6. Statistics
   * How data is calculated/modified.
      * For example, the count, quartiles, regression lines, etc.
7. Facets
   * How we divide our data into multiple sets or graphs.

![Facets by year and sex](../images/facet-year-sex.png)

Dans la figure ci-dessus, on a :
1. Données
   * Variables `weight`, `hindfoot_length`, `species_id`
   * Répartition des données par `year` et par `sex`
2. Esthétique
   * Position selon `hindfoot_length` et `weight`
   * Couleur selon `species_id`
3. Système de coordonnées
   * Système cartésien
      * Deux axes : X et Y
4. Échelle
   * X (`hindfoot_length`) : de 0 à 65
   * Y (`weight`) : de 4 à 512
      * Échelle logarithmique en base 2
   * Couleurs (`species_id`) : bleu, orange, rouge, etc.
5. Objets géométriques
   * Cercles semi-transparents
6. Statistiques
   * Données représentées telles quelles, sans transformation
7. Facettes
   * Facettes par `year` et par `sex`

In the above figure, we have:
1. Data
   * Fields: `weight`, `hindfoot_length`, `species_id`
   * Data distribution by `year` and by `sex`
2. Aesthetic
   * Position according to `hindfoot_length` and `weight`
   * Color according to `species_id`
3. Coordinate system
   * Cartesian coordinate system
      * Two axes: X and Y
4. Scale
   * X (`hindfoot_length`): from 0 to 65
   * Y (`weight`): from 4 to 512
      * Logarithmic scale to base 2
   * Colors (`species_id`): blue, orange, red, etc.
5. Geometric objects
   * Semi-transparent circles
6. Statistics
   * Data represented as is, without transformation
7. Facets
   * Facets by `year` and by `sex`

### Grammaire des graphiques interactifs
Ajout d’éléments d’interaction par-dessus la grammaire des graphiques
* Événements
  * Clic sur un élément ou à proximité
  * Survol d'un élément
  * Déplacement
  * Zoom
* Sélection 
  * Qu’est-ce qui est sélectionné: point, région, sous-ensemble
* Actions
  * Qu’est-ce qui se produit

Voici une vidéo à ce sujet :

[![YouTube - Vega-Lite - A grammar of Interactive Graphics](https://img.youtube.com/vi/rydth27fB3Q/default.jpg)](https://www.youtube.com/watch?v=rydth27fB3Q)

### Grammar of interactive graphics
Adding interaction elements on top of the grammar of graphics
* Events
  * Click on or near an item
  * Hovering over an item
  * Shift
  * Zoom
* Selection 
  * What is selected: point, region, subset
* Actions
  * What happens to the chart

Here is a video about it:

[![YouTube - Vega-Lite - A grammar of Interactive Graphics](https://img.youtube.com/vi/rydth27fB3Q/default.jpg)](https://www.youtube.com/watch?v=rydth27fB3Q)

### Bibliothèques de visualisation
Plusieurs bibliothèques de visualisation se basent explicitement
sur la grammaire des graphiques dans leur design :
* **R** : ggplot
* **JavaScript** : Vega-Lite, nd3
* **En Python** : Altair, Bokeh, Plotly, Plotnine, Seaborn (>0.12)

Quelle bibliothèque Python choisir? Tout d'abord, selon le type :

### Visualization Libraries
Several visualization libraries explicitly rely
on the grammar of graphics in their design:
* **R** : ggplot
* **JavaScript** : Vega-Lite, nd3
* **Python** : Altair, Bokeh, Plotly, Plotnine, Seaborn (>0.12)

Which Python library to choose? First of all, depending on the type:

|                 Type                 |    Nom    | Forks | Étoiles |
| ------------------------------------ | ------------ | ---: | ----: |
| Traditionnel                         | `matplotlib` | 7900 | 21.2k |
| Traditionnel                         | `seaborn`    | 2000 | 13.1k |
| Grammaire des graphiques             | `plotnine`   |  233 |  4.2k |
| Grammaire des graphiques interactifs | `altair`     |  805 |  9.8k |
| Grammaire des graphiques interactifs | `bokeh`      | 4200 | 19.8k |
| Grammaire des graphiques interactifs | `plotly`     | 2600 | 17.1k |
| Spécialisé                           | `folium`     | 2200 |  7.1k |
| Spécialisé                           | `geoplotlib` |  175 |  1.0k |

|              Type               |     Name     | Forks | Stars |
| ------------------------------- | ------------ | ----: | ----: |
| Traditional                     | `matplotlib` |  7900 | 21.2k |
| Traditional                     | `seaborn`    |  2000 | 13.1k |
| Grammar of graphics             | `plotnine`   |   233 |  4.2k |
| Grammar of interactive graphics | `altair`     |   805 |  9.8k |
| Grammar of interactive graphics | `bokeh`      |  4200 | 19.8k |
| Grammar of interactive graphics | `plotly`     |  2600 | 17.1k |
| Specialized                     | `folium`     |  2200 |  7.1k |
| Specialized                     | `geoplotlib` |   175 |  1.0k |