
<hr style="border-width:2px;border-color:#75DFC1">
<center><h1>Introduction à la visualisation de données avec Bokeh</h1></center>
<center><h2>Les sources de Data est ses transformations</h2></center>
<hr style="border-width:2px;border-color:#75DFC1">

* Exécuter la cellule suivante pour importer les classes nécessaires et pouvoir afficher les dessins <b>Bokeh</b> dans des cellules jupyter.

In [2]:
import warnings
warnings.filterwarnings("ignore")
# Importation des fonctions dont l'on se servira pour toutes les figures

from bokeh.plotting import figure, output_notebook, show

# Précision de l'affichage des graphiques dans des cellules jupyter

output_notebook()

### La classe `ColumnDataSource`

> Chaque méthode *glyph* d'une `figure` **Bokeh** dispose d'un paramètre `source`. Ce paramètre prend en argument un objet de type **`ColumnDataSource`** à l'intérieur duquel des données sont stockées. Les objets `ColumnDataSource` permettent de transférer les données de Python vers la bibliothèque du navigateur BokehJS, et sont utilisées par de nombreuses fonctions.
>
>
> La classe `ColumnDataSource` représente un ensemble de noms de colonnes (chaînes de caractères) associés à des séquences de valeurs de la même manière qu'un `pandas.DataFrame`. Les valeurs peuvent être des listes, des tableaux **NumPy** ou des `pandas.Series`. Pour créer un objet de type `ColumnDataSource` on peut fournir en argument un dictionnaire ou un `pandas.DataFrame`. **La seule contrainte sur les colonnes est qu'elles doivent être de la même taille.**
>
>
> L'interêt majeur d'utiliser une base données `ColumnDataSource` est que l'instanciation de graphiques se fait simplement en passant les clés du `ColumnDataSource` en argument des paramètres usuels. Par exemple:
>
> ```py
    from bokeh.models import ColumnDataSource   # importation de la classe ColumnDataSource
    ```
> ```py
    x = [1, 2, 3, 4, 5]         # listes de coordonnées des points
    y = [-1, 1, 4, -2, 3]
    ```
> ```py
    base = ColumnDataSource({   # instanciation de ColumnDataSource
        'abscisses' : x,        # l'argument du constructeur est un dictionnaire
        'ordonnees' : y})
    ```
> ```py
    p = figure(plot_width = 600, plot_height = 400)   # instanciation d'une figure
    ```
> ```py
    p.circle(x = 'abscisses',   # instanciation d'un nuage de points
             y = 'ordonnees',   # || les coordonnées sont renseignées en passant en argument ||
             source = base)     # || les clés du dictionnaire dans la source                 ||    
    ```
>
>
>
> La classe `LabelSet` permet d'ajouter un ensemble de labels à une figure à partir d'un objet `ColumnDataSource`, son instanciation prend en arguments:
> - `source`: l'objet `ColumnDataSource` à partir duquel on extrait les données des labels.
> - `x`: le nom de la colonne contenant les abscisses des labels.
> - `y`: le nom de la colonne contenant les abscisses des labels.
> - `text`: le nom de la colonne contenant le texte des labels.
> - `x_offset` et `y_offset`: le décalage sur l'axe des abscisses ou des ordonnées; peut prendre un nombre qui affectera le même décalage à tous les labels ou une clé qui correspond au nom de la colonne contenant les décalages de chaque label.
>
>
> Les `LabelSet` sont un type d'annotation. Ainsi, pour ajouter un `LabelSet` à une `figure`, il faut aussi utiliser la méthode `add_layout` de la `figure` avec comme argument le dit `LabelSet`.

<div class="alert alert-info">
<i class="fa fa-info-circle"></i> &emsp; 
Si l'on souhaite préciser l'argument <code style = "background-color: transparent ; color : inherit">source</code> d'une méthode <i>glyph</i>, la syntaxe pour préciser l'argument <code style = "background-color: transparent ; color : inherit">x</code> et les autres est la même que celle précédemment décrite pour la classe <code style = "background-color: transparent ; color : inherit">LabelSet</code>. 
</div>


* Importer les classes `LabelSet` et `ColumnDataSource` depuis **bokeh.models**.


* Créer les listes:
    * **`x`**`= [1, 2, 3, 4, 5]`
    * **`y`**`= [5, 2, 13, 15, 9]`
    * **`couleur`**`= ['yellow', 'orange', 'red', 'pink', 'purple']`
    * **`taille`**`= [5, 10, 15, 20, 25]`.


* Instancier un objet `ColumnDataSource` appelé **`source`** à partir d'un dictionnaire contenant les listes créées précédemment. Les clés du dictionnaire peuvent être choisies librement.


* Instancier une figure de largeur 600 et hauteur 400 et y afficher un nuage de points en forme de cercles à partir des colonnes **`x`**, **`y`**, **`couleur`** et **`taille`** de **`source`**.


> Nous voulons maintenant labéliser chaque point avec une lettre de A à E.


* Créer une liste **`noms`** contenant les caractères entre `'A'` et `'E'` par ordre alphabétique.


* A l'aide de la méthode `add` de la classe `ColumnDataSource`, ajouter à `source` une clé `"noms"` correspondant à la liste `noms`. La méthode `add` prend en argument une liste et une chaîne de caractères correspondant à la clé.


* Instancier un objet `LabelSet` où les arguments de position et de contenu de chaque label seront extraits de `source`. Il faudra aussi ajouter un décalage de 10 pixels vers la droite et vers le haut pour éviter que les labels et les points ne se superposent.


* Ajouter le `Labelset` aux annotations de la figure.


* Afficher la figure.

In [None]:
### Insérez votre code ici



> Lorsque l'on crée un objet `ColumnDataSource` à partir d'un `pandas.DataFrame`; les colonnes auront les mêmes noms que celles du `pandas.DataFrame`.

* Charger le module **pandas** sous l'abréviation **`pd`**.


* Lire le fichier *ruspini.csv* dans un `pandas.DataFrame`, et afficher ses $5$ premières lignes.


* Instancier un objet `ColumnDataSource` **`source`**  à partir du *DataFrame* précédent.

In [None]:
### Insérez votre code ici



   indices   x   y
0        1   4  53
1        2   5  63
2        3  10  59
3        4   9  77
4        5  13  49


> Une fois créé, l'objet `ColumnDataSource` peut être utilisé par toutes les méthodes *glyphs* en précisant les clés des colonnes ainsi que la source pour créer des graphiques.

* Instancier une figure de largeur 600 et hauteur 400.


* Instancier un nuage de points en forme de cercles ayant pour abscisses la colonne **`'x'`** et pour ordonnées la colonne **`'y'`** de **`source`**.

In [None]:
### Insérez votre code ici



### L'outil `HoverTool` (suite)

> La classe `HoverTool` permet d'afficher des informations supplémentaires dans une fenêtre contextuelle lorsque l'utilisateur survole avec le curseur un graphique issu d'une méthode *glyph*. Cet objet doit s'instancier avec un paramètre `tooltips` qui représente une liste de tuples.
>
> On rappelle que chaque tuple de la liste `tooltips` sert à définir une information qui s'affichera dans la fenêtre contextuelle lorsque l'on survolera le dessin.
>
>Le premier élément d'un tuple de la liste est une chaîne de caractères correspondant au nom de l'information à afficher, le second élément est lui aussi une chaîne de caractères correspondant à l'adresse de l'information à afficher.
>
> La syntaxe pour le second élément est la suivante:
> - `'@variable'`: Signifie que l'on pointe vers la colonne `'variable'` contenue dans la `source`.
> - `$variable`: Signifie que l'on pointe vers un élément indépendant de la source et des éléments du graphe. Par exemple `$x` va pointer vers l'abscisse du curseur ou `$index` qui pointe vers l'index du point indépendemment de l'index de la source.
>
>
> Pour plus d'infos sur la configuration de l'objet `HoverTool` et la liste des éléments indépendants sur lesquels on peut pointer via `$`: regarder [ici](http://bokeh.pydata.org/en/latest/docs/user_guide/tools.html#hovertool).
>
> 
> L'outil `Hovertool` peut directement être ajouté à la liste d'outils au moment de la création d'une figure. Pour ce faire, il suffit de spécifier le paramètre `tools` lors de l'instanciation d'une figure. Ce paramètre prend en argument une liste d'outils (comme `HoverTool`) ou de chaînes de caractères pour des outils prédéfinis (comme `'wheel_zoom'` pour zoomer avec la molette de la souris).
>
> On rappelle aussi qu'il est possible de rajouter un argument dans un objet de type `HoverTool` qui précise sur quels graphiques appliquer celui-ci. Il s'agit du paramètre `renderers` qui prend en argument une liste de `GlyphRenderers`. Par défaut, l'outil sera ajouté à tous les dessins présents sur la figure.


* Importer l'objet `HoverTool` du sous-module `bokeh.models`.


* Créer une liste de tuples représentant les éléments `'indices'`, `'x'`, `'y'` contenus dans `source`.


* Instancier une figure de largeur 600 et hauteur 400 et y instancier un nuage de points en forme de cercles à partir du `ColumnDataSource` `source`. Stocker le `GlyphRenderer` généré dans une variable nommée `c`.


* Instancier un `HoverTool` nommé  **``hover``** qui permet d'afficher les indices, les abscisses et les ordonnées sur le nuage associé à `c`. On rappelle que le paramètre `renderers` prend en argument une **liste** de `GlyphRenderers`.


* Ajouter l'outil à la liste des outils de la figure et l'afficher.

In [None]:
### Insérez votre code ici


### Légende interactive

> Les légendes ajoutées aux figures *Bokeh* peuvent être rendues interactives. La légende fonctionnera comme un bouton qui masque ou affiche un graphique.
> 
> Ce mode est activé en assignant au sous-attribut `click_policy` de l'attribut `legend` de la figure la valeur `'hide'`. 

* Importer la bibliothèque **NumPy** sous l'alias `np`.


* Créer une suite **`x`** de $1000$ valeurs entre $-6\pi$ et $6\pi$ à l'aide de la fonction `linspace` de `NumPy`.


* Instancier une figure de largeur 600 et hauteur 400.


* Tracer les deux fonctions sinus et cosinus à l'aide des fonctions `sin` et `cos` de `NumPy` et de la méthode `line` de la figure.


* Activer l'interaction avec la légende de la figure. 


* Afficher la figure et cliquer sur la légende.

In [None]:
### Insérez votre code ici



### Interactions inter-figures

>Il est parfois utile de lier des figures pour ajouter une interactivité entre elles. Par exemple, il peut être intéressant que lorsqu'une figure est déplacée ou zoomée, les autres le soient également. Ou encore, lorsqu'on sélectionne des points dans une figure, les points correspondants dans les autres figures soient aussi sélectionnés.
>
>
>Il suffit pour cela d'afficher plusieurs figures en utilisant les fonctions `gridplot`, `row` ou `column` vues précedemment **en veillant à ce que les échelles (*i.e.* les paramètres `x_range` et `y_range`) soient communes aux différentes figures**. 
>
>
> On rappelle que la configuration des échelles d'une figure se fait grâce aux paramètres `x_range` pour les abscisses et  `y_range` pour les ordonnées lors de l'instanciation d'une figure. 
>
>Pour lier les figures entre elles, il faut donc instancier chaque figure en s'assurant que leurs échelles soient communes.

<div class="alert alert-success">
<i class='fa fa-exclamation-triangle'></i> &emsp; 
Si on a déjà créé une figure <b><code style = "background-color: transparent ; color : inherit">p</code></b> et que l'on souhaite créer une figure <b><code style = "background-color: transparent ; color : inherit">q</code></b> qui soit liée à <b><code style = "background-color: transparent ; color : inherit">p</code></b>, les échelles de <b><code style = "background-color: transparent ; color : inherit">p</code></b> peuvent être extraites grâce à ses attributs <code style = "background-color: transparent ; color : inherit">x_range</code> et <code style = "background-color: transparent ; color : inherit">y_range</code>. On peut par exemple instancier <b><code style = "background-color: transparent ; color : inherit">q</code></b> avec l'argument <b><code style = "background-color: transparent ; color : inherit">x_range = p.x_range</code></b> pour s'assurer que les échelles soient les mêmes.</div>

* Exécuter le code suivant.

* Déplacer une des figures pour voir l'interactivité entre les trois courbes.

In [10]:
# Importation de la fonction row

from bokeh.layouts import row

# Abscisses des 3 nuages

x = np.arange(0,5,0.2) 

# Ordonnées des 3 nuages

y1 = x**2.5
y2 = x**3
y3 = x**4

# Instanciation de la première figure et de son nuage

p1 = figure(width=250, plot_height=250)

p1.circle(x, y1,
          fill_color = "white",
          size = 8)

# Instanciation de la seconde figure et de son nuage

p2 = figure(x_range = p1.x_range, y_range = p1.y_range,   # les étendues de p2 seront les mêmes que celles de p1
            plot_width = 250, plot_height = 250)          # ceci va lier les deux figures

p2.circle(x, y2,
          fill_color = "red",
          line_color = "red",
          size = 6)

# Instanciation de la troisième figure et de son nuage

p3 = figure(x_range = p1.x_range, y_range = p1.y_range,width = 250, plot_height = 250)
                                                                                      
p3.line(x, y3,
        line_color = "orange",
        line_dash = "10 5")      # tracé en tirets: longueur de tiret 10 et espace entre chaque tirets de 5                  

# Affichage des trois figures sur la même ligne

p = row(p1, p2, p3)

show(p)

> Nous allons voir ici comment synchroniser les figures sur un outil de sélection de portion du graphe.
>
>
> Nous allons utiliser les outils `'box_select'` pour sélectionner les points qui nous intéressent avec une boîte et `'lasso_select'` pour sélectionner les points qui nous intéressent en dessinant la zone que l'on souhaite étudier.

* Importer la fonction `row` depuis le sous-module `bokeh.layouts`.


* Créer une suite **`x`** de valeurs allant de $1$ à $6$ avec un pas de $0.2$.


* Créer un dictionnaire **`data`** ayant pour clés: 
    * `'x' : x` 
    * `'y1' : x**3`
    * `'y2' : 1/x`
    * `'y3' : x**5`


* Instancier un objet de type `ColumnDataSource` à partir de `data`.


* Instancier 3 figures de longueur 300 et hauteur 300 disposant des outils `'box_select'` et `'lasso_select`.


* Instancier sur chacune des figures un nuage de points de coordonnées $(x, y_i), i = 1, 2, 3$ à partir des données contenues dans `data`. Il ne faut pas oublier de préciser le paramètre `source` dans l'instanciation des nuages.


* Afficher les $3$ figures précédentes à l'aide de `row`.


* Sélectionner des points pour voir l'interactivité entre les trois courbes.

In [None]:
## Insérez votre code ici:

