
<hr style="border-width:2px;border-color:#75DFC1">
<center><h1>Introduction à la visualisation de données avec Bokeh</h1></center>
<center><h2> Tracer des nuages de points et des courbes </h2></center>
<hr style="border-width:2px;border-color:#75DFC1">


### Premiers pas avec bokeh


> Pour utiliser le module ```bokeh``` afin de créer des graphiques interactifs, il faut importer la classe `figure` du sous-module **`bokeh.plotting`**. Cette classe permet d'instancier un graphique pour y afficher différents types de dessins.
>
>
> Pour indiquer le mode d'affichage ou de sauvegarde, les fonctions `output_file`, `output_notebook` et `output_server` du sous-module sont utilisées (parfois conjointement).
>
>
> La fonction `show` permet d'afficher les graphiques et les mises en page.
>
> Ainsi, pour créer et afficher des graphiques `bokeh` sur un *notebook* Jupyter, il faudra systématiquement éxécuter la cellule suivante au préalable:

In [27]:
import warnings
warnings.filterwarnings("ignore")
from bokeh.plotting import figure, show, output_notebook
output_notebook()

><div class="alert alert-info">
><i class="fa fa-info-circle"></i> &emsp; 
>L'instruction <code style = "background-color: transparent ; color : inherit">output_notebook</code> permet d'afficher tous les futurs graphiques dans l'output d'une cellule jupyter. Si cette instruction n'est pas lancée, la figure s'affichera dans un nouvel onglet.
></div>
>
>
> Pour créer une courbe à partir de deux listes de coordonnées **`x`** et **`y`**, nous allons instancier une `figure` **`p`** et appeler sa méthode ``line`` avec les arguments **`x`** et **`y`**. Ensuite, pour afficher la courbe dans l'output de la cellule, il faut utiliser la fonction `show` dont l'argument doit être un objet de type `figure`.


* Lancer le code suivant pour créer et afficher un premier graphique.

In [28]:
from bokeh.plotting import figure # Importation de la classe figure qui permet de créer un graphique bokeh.
from bokeh.plotting import show   # Importation de la fonction show qui permet d'afficher une figure.


# Instanciation d'une figure

p = figure()

# Listes de coordonnées

x = [1, 2, 3, 4, 5]  # abscisses de chaque point
y = [1, 2, 3, 4, 5]  # ordonnées de chaque point

# Création d'une courbe de type 'line' dans la figure p

p.line(x,    # abscisses
       y)    # ordonnées
      
# Affichage de la figure p dans l'output de la cellule
show(p) 

> Le constructeur de la classe `figure`  dispose de plusieurs paramètres qui permettent d'ajuster les outils et les aspects du graphique. Par exemple:
>
>
>- `plot_width` ou `plot_height` permettent respectivement d'ajuster la **largeur** et la **hauteur** du graphique.
>
>
>- `title`, `x_axis_label` et `y_axis_label` permettent d'ajouter un **titre** au graphique ou des **labels** aux axes.
>
>
>- `x_range` et `y_range` permettent de délimiter les axes des abscisses et ordonnées.
>
>
><div class="alert alert-info">
><i class="fa fa-info-circle"></i> &emsp; 
> La liste complète des paramètres du constructeur de la classe <code style = 'background-color: transparent ; color : inherit'>figure</code> est accessible dans la documentation <code style = 'background-color: transparent ; color : inherit'>bokeh</code> que vous pouvez trouver <a href="https://bokeh.pydata.org/en/latest/docs/reference/plotting.html" target="_blank">ici</a>.
></div>
>
>
> Si aucun argument n'est donné, une figure de dimensions 600 x 600 est créée, et les outils par défaut sont ajoutés dans la barre d'outils située en haut à droite.

* Importer la classe `figure` depuis le sous-module `bokeh.plotting`.


* Importer la fonction `show` depuis le sous-module `bokeh.plotting`.


* Instancier une figure `p` de largeur 500 et de hauteur 400, avec pour titre: "Ma première courbe Bokeh".


* Tracer une ligne prenant en abscisse les valeurs [0,2,4,6,8] et en ordonnée les valeurs [1,4,4,8,12].

In [29]:
### Insérez votre code ici
from bokeh.plotting import figure
from bokeh.plotting import show

p = figure(width = 500, height = 400, title = "Ma première courbe Bokeh")

p.line([0,2,4,6,8],
       [1,4,4,8,12])

show(p)


> Les méthodes comme `line` de la classe `figure` qui permettent de générer un type de graphique particulier sont appelées des méthodes "**glyph**" car elles instancient des objets de la classe `Glyph` de `bokeh`. Ces objets de type `Glyph` contiennent les attributs tels que la couleur, la forme ou les coordonnées des points, le type de graphique, etc., qui permettent à l'utilisateur de personnaliser un graphique.
>
>
> C'est pourquoi les caractéristiques d'une courbe ou d'un nuage de points sont toujours définies **en argument d'une méthode *glyph*** et **non dans le constructeur de la figure**.
>
>
> Dans l'exemple suivant, nous allons générer un nuage de points tel que les points sont représentés par des cercles de taille 10 et de couleur rouge.
> ```py
    p = figure()  # Instanciation d'une figure
        ```
> ```py
    p.circle(x, y, size=10, color='red')   # Création du nuage de points
    ```
> <br>
>
> * La méthode *glyph* `circle` génère un nuage de points où les points seront tous représentés par des cercles.
>
>
> * Le paramètre `size` définit la taille des cercles.
>
>
> * Le paramètre `color` définit la couleur des points.
>
>
>
> <div class='alert alert-warning'>
<i class='fa fa-exclamation-circle'></i> &emsp; 
Les arguments  <code style = "background-color: transparent ; color : inherit"><b>size</b></code> 
et <code style = "background-color: transparent ; color : inherit"><b>color</b></code> peuvent recevoir des listes, à la condition qu'elles soient de même taille que la liste des points à tracer. Ainsi, chaque point peut avoir sa propre taille et couleur.
</div>

* Instancier une figure de dimensions 500 x 500 ( paramètres `plot_width` et `plot_height` ).


* Créer les listes :
    * `x` = `[1, 2, 3, 4, 5]` qui sera la liste des coordonnées en abscisse des deux nuages que nous allons dessiner.        
    
    * `y1` = `[0, 2, 3, 8, 15]` qui sera la liste des coordonnées en ordonnée du premier nuage.
    
    * `y2` = `[5, 8, 11, 16, 22]` qui sera la liste des coordonnées en ordonnée du deuxième nuage.
    


* Représenter les points de coordonnées `x` et `y1` en noir en utilisant la méthode *glyph* `circle`.


* Représenter sur la même figure les points de coordonnées `x` et `y2` grâce à la méthode *glyph* `square` avec les paramètres suivants:
    * La taille des carrés doit être de 15.
    
    * Le premier point doit être jaune (`'yellow'`).
    
    * Le deuxième point doit être orange (`'orange'`).
    
    * Le troisième point doit être rouge (`'red'`).
    
    * Le quatrième point doit être rose (`'pink'`).
    
    * Le cinquième point doit être violet (`'purple'`).

<div class="alert alert-info">
<i class="fa fa-info-circle"></i> &emsp; 
Pour afficher plusieurs graphes sur une seule figure, il suffit d'appeler plusieurs méthodes sur un même objet de classe <code style = "background-color: transparent ; color : inherit"><b>figure</b>.</code></div>

In [30]:
## Insérez votre code ici

x = [1,2,3,4,5]
y1 = [0,2,3,8,15]
y2 = [5,8,11,16,22]

p = figure(width=500, height=500)

p.circle(x, y1, color='black')
p.square(x,y2,size=15,color=['yellow','orange','red','pink','purple'])

show(p)




> Pour donner plus de style à vos graphiques, il est possible de personnaliser l'apparence des lignes, le remplissage des formes et l'aspect du texte au sein des méthodes *glyph*.
>
>
> Les paramètres les plus communs pour personnaliser **l'apparence des lignes** sont  : 
- ``line_color`` : couleur des lignes.
- ``line_alpha`` : opacité des lignes. Doit être entre 0 et 1.
- ``line_width`` : épaisseur des lignes.
- ``line_dash`` : style de tracé des lignes (pointillés, point-tiret, etc). Peut prendre les valeurs `'dashed'`,`'dotted'`,`'dotdash'`,`'dashdot'` (et d'autres encore) pour différents styles de tracés.
>
>
> Pour l'apparence visuelle des **zones remplies** :
>- ``fill_color`` : couleur de remplissage.
>- ``fill_alpha`` : opacité du remplissage. Doit être entre 0 et 1.
>
>
> Pour l'apparence des **textes** du graphique
>- ``text_font`` : police du texte.
>- ``text_font_size`` : taille de police du texte.
>- ``text_color`` : couleur du texte.
>- ``text_alpha``: opacité du texte. 
>
> Le paramètre `legend`, présent dans toutes les méthodes, permet d'ajouter une légende à chaque graphique.
>
>
>Nous allons essayer de reproduire du mieux possible le graphique suivant :
> <img src="https://datascientest.fr/train/assets/bokeh_plot2.png">
>
>Pour cela:

* Instancier une figure **nommée `q`** telle que:
    * Le titre soit "Courbes multiples".
    * Le label d'axis soit "x" et celui d'ordonnée "y".
    * Ses dimensions soient de 600 en largeur et 400 en hauteur.
    * L'axe des ordonnées se restreindra à l'intervalle [0, 100]. Pour cela, vous pourrez utiliser le paramètre `y_range` du constructeur de la classe `figure`.

In [31]:
### Insérez votre code ici

q = figure(title = "Courbes multiples",  # Titre de la figure
           x_axis_label = 'x',           # Label de l'axe des abscisses
           y_axis_label = 'y',           # Label de l'axe des ordonnées
           plot_height = 400,            # Hauteur de la figure
           plot_width = 600,             # Largeur de la figure
           y_range = [0, 100])           # Etendue de l'axe des ordonnées

> La première courbe que nous allons tracer est celle correspondant à la fonction $f(x) = x$. Cette courbe est spéciale parce qu'**elle combine deux méthodes *glyph***, `circle` et `line`, pour créer un style de tracé particulier.


* Creér une liste de coordonnées `x` allant 0 à 5 avec un pas de 0,2. Pour cela, vous pourrez utiliser la fonction `arange` du module `numpy`.


* Créer dans la figure précédente une courbe correspondant à la fonction $f(x) = x$ en utilisant la méthode *glyph* `line`. La légende de cette courbe devra être `"y = x"`.


* Créer dans cette même figure un nuage de points en forme de cercle correspondant à la foncion $f(x) = x$ en utilisant la méthode *glyph* `circle` de la manière suivante:
    * La légende du nuage devra aussi être `"y = x"`.
    * La couleur de remplissage des cercles doit être blanche. Le paramètre correspondant est `fill_color`.
    * La taille des cercles doit être de 8. Le paramètre correspondant est `size`.


* Afficher la figure.


<div class='alert alert-warning'>
<i class='fa fa-exclamation-circle'></i> &emsp; 
Si vous n'obtenez pas l'effet désiré, vous pouvez toujours réinstancier la figure grâce aux cellules précédentes.
</div>

In [32]:
### Insérez votre code ici
import numpy as np
x = np.arange(0,5,0.2)

q.line(x,x,legend_label='y=x')
q.circle(x,x,legend_label='y=x',size=8,fill_color='white')

show(q)



Nous allons maintenant essayer de reproduire la courbe correspondant à la fonction $f(x) = x^3$ telle qu'elle est représentée sur ce <a href="https://datascientest.fr/train/assets/bokeh_plot2.png" target="_blank">graphique</a>.

Cette courbe fusionne aussi l'effet des méthodes *glyph* `line` et `circle`.

* Creér une liste de coordonnées `y3` correspondant à l'image de la liste de coordonnées `x` par la fonction $f(x) = x^3$.


* En vous inspirant de l'exercice précedent, obtenir le même style de tracé pour la courbe de la fonction $f(x) = x^3$:
    * La légende de cette courbe devra être `"y = x^3"`.
    * Sa couleur devra être orange. Les paramètres correspondants sont `line_color` pour la méthode `line` et `color` pour la méthode `circle`.
    * La taille des cercles devra être de 6.
    
    
* Afficher la figure.

In [33]:
### Insérez votre code ici
y3 = [i**3 for i in x]

q.line(x,y3,legend_label='y=x^3', line_color='orange')
q.circle(x,y3,legend_label='y=x^3',color='orange',size=6)

show(q)




>Les dernières courbes du <a href="https://datascientest.fr/train/assets/bokeh_plot2.png" target="_blank">graphique</a> correspondant aux fonctions $f(x) = x^2$ et $f(x) = x^4$ sont simplement des lignes, mais la courbe de la fonction $f(x) = x^4$ est tracée avec des tirets.
>
>Pour obtenir cet effet, la méthode *glyph* `line` dispose d'un paramètre `line_dash` qui peut prendre les valeurs :
>
>- `"dashed"` : tracé en tirets.
>- `"dotted"` : tracé en pointillé.
>- `"dotdash"` ou `"dashdot"` : tracé alterné entre tirets et pointillé (Les deux arguments sont équivalents).

* Créer les listes de coordonnées `y2` et `y4` correspondant aux images de la liste de coordonnées `x` par les fonctions $f(x) = x^2$ et $f(x) = x^4$.


* Dessiner la courbe correspondant à la fonction $f(x) = x^2$:
    * La légende de cette courbe doit être "y = x^2".
    * La couleur des lignes doit être bleue.
    * L'épaisseur des lignes doit être de 3. Le paramètre correspondant est `line_width`.
    

* Dessiner la courbe correspondant à la fonction $f(x) = x^4$:
    * La légende de cette courbe doit être "y = x^4".
    * La couleur des lignes doit être rouge.
    * Le tracé des lignes doit être fait avec des tirets.
    
    
* Afficher la figure.


In [34]:
### Insérez votre code ici

q.line(x, x**2, line_width=3, line_color='blue',legend_label='y=x^2')
q.line(x, x**4, line_dash='dashed', line_color='red',legend_label='y=x^4')

show(q)



> Les méthodes *glyph* retournent des objets de type **GlyphRenderer**. Ces objets contiennent les attributs qui définissent la source des données du graphe et la glyphe à dessiner. 
>
> Une fois ces objets **GlyphRenderer** instanciés, il est possible de les personnaliser ou de les modifier, comme dans l'exemple ci-dessous: 
> ```python
    p = figure(plot_width=500, plot_height=500) # instanciation de la figure
    r1 = p.circle(x, y1,legend='y1')            # instanciation d'un nuage de points en forme de cercles
    r1.glyph.size = 5                           # modification de la taille des cercles
    r1.glyph.color = 'green'                    # modification de la couleur des cercles
    ```
>
> L'attribut `glyph` de r1 nous permet d'accéder au nuage de points qui doit être dessiné.
   



* Créer les listes de coordonnées **`x = [1, 2, 3, 4, 5]`**, **`y1 = [1, 15, 5, 18, 13]`** et **`y2 = [5, 9, 10, 15, 25]`**.


* Dans une figure de taille 600x600: afficher les points de coordonnées $(x,y1)$ avec la légende `'y1'` dans un nuage de points en forme de cercles et stocker la sortie de la méthode glyphe dans un objet nommé **`r1`**.


* A l'aide des attributs de **`r1`**, faites en sorte que:
    * Les points aient une taille de 50. L'attribut correspondant est `size`.
    * L'intérieur des points ait une opacité 0,2. L'attribut correspondant est `fill_alpha`.
    * Le contour des points soit tracé en style pointillé. L'attribut correspondant est `line_dash`.
    * La couleur du contour des points soit `firebrick`. L'attribut correspondant est `line_color`.
    * L'épaisseur du contour des points soit de 2. L'attribut correspondant est `line_width`.


* Tracer une courbe à partir de **`x`** et **`y2`**, avec une ligne bleue d'épaisseur 1 tracée en style alterné pointillé-tirets dont la légende est `'y2'`.


* Afficher la figure.

In [35]:
## Insérez votre code ici
x=[1,2,3,4,5]
y1 = [1,15,5,18,13]
y2 = [5,9,10,15,25]

p=figure(width=600,height=600)
r1 = p.circle(x,y1,legend_label='y1')
r1.glyph.size = 50
r1.glyph.fill_alpha = 0.2
r1.glyph.line_dash = 'dashed'
r1.glyph.line_color = 'firebrick'
r1.glyph.line_width = 2

p.line(x,y2,line_color='blue',line_width=1,line_dash='dashdot',legend_label='y2')

show(p)




### L'outil HoverTool (introduction)

> Un des outils les plus utilisés parmi ceux disponibles sur Bokeh est `HoverTool` qui permet de modifier l'affichage d'un graphique lorsque le curseur de la souris le "survole" (*hover* en anglais).
>
>
> A l'intérieur d'une méthode *glyph* , il est possible de définir explicitement l'apparence qu'un graphique devrait avoir lorsque le curseur de la souris se trouve dessus. Les paramètres qui définissent cette apparence sont les mêmes que ceux que nous avons vu précédemment, et sont simplement précédés du préfixe `hover_`:
>
>
```python
r = p.circle(x,                          
             y,
             color = 'red',          # couleur des points 
             hover_color = 'blue',   # couleur du point survolé par la souris.
             hover_alpha = 0.5)      # opacité du point survolé par la souris.
```
>
>
> Pour obtenir l'effet désiré, il est nécessaire d'instancier un outil `HoverTool` et de l'associer à la figure sur laquelle nous voulons rajouter les interactions entre la souris et le graphique.
>
>
> Les paramètres à préciser lors de l'instanciation d'un `HoverTool` sont:
>* `renderers` : liste d'objets de type `GlyphRenderer` (sortie des méthodes *glyph*) avec lesquels nous voulons interagir.
>* `tooltips` : liste de couples `('label', 'value')` qui permet d'afficher un tableau contenant une série d'informations à propos du point qui est survolé par la souris.
>
> Lancer la cellule suivante et survoler les points du nuage avec le curseur de votre souris:

In [36]:
# Liste d'abscisses

x = [1, 2, 3, 4, 5]

# Liste d'ordonnées

y = [1, 15, 5, 18, 13]

# Instanciation de la figure

p = figure(plot_width = 600,           # largeur de la figure
           plot_height = 400)          # hauteur de la figure

# Instanciation d'un nuage de points

r = p.circle(x,                        # abscisses    
             y,                        # ordonnées 
             size = 50,                # taille des cercles
             color = 'red',            # couleur des points 
             
     # paramètres HoverTool 
             
             hover_color = 'blue',     # couleur du point survolé par le curseur de la souris.
             hover_alpha = 0.5)        # opacité du point survolé par le curseur de la souris.


# Importation de la classe HoverTool

from bokeh.models.tools import HoverTool

# Instanciation d'un outil HoverTool

h = HoverTool(renderers = [r],                      # liste de GlyphRenderer avec lesquels on veut intéragir
    
              tooltips = [( "(x, y)", "($x, $y)")]) # liste de couples d'informations à afficher à coté du point survolé
                                                    # les informations que nous affichons sont les coordonnées du point survolé.
    
# Ajout du HoverTool aux outils de la figure

p.add_tools(h)

# Affichage de la figure

show(p)

* Créer les listes de coordonnées `x = [1, 1.5, 3, 4.5, 7, 8]` et `y = [-1, 3, -4, 5, 8, -6]`.


* Instancier une figure de largeur 600 et hauteur 400.


* Instancier dans la figure un nuage de points tel que:
    * Les points soient déssinés avec des carrés de couleur bleue. Les paramètres correspondant est `color`.
    * Lorsque le curseur de la souris survole un des points, sa couleur doit être rouge, son opacité doit être de 0.5. Les paramètres correspondants sont `hover_color` et `hover_alpha`.


* Importer la classe `HoverTool` depuis le sous-module `bokeh.models.tools`.

    
* Instancier un objet de type `HoverTool` tel que:
    * Lorsque le curseur de la souris survole un des points, une *tooltip* doit afficher ses **coordonnées** et son **index**. Le couple qui devra être passé en argument de `tooltip` pour l'affichage de l'index dans la *tooltip* est `("index", "$index")`.
    * Cette instance `HoverTool` devra être associée au `GlyphRenderer` du nuage de points instancié précedemment grâce au paramètre `renderers` du constructeur de `HoverTool`.


* Ajouter cette instance `HoverTool` aux outils de la figure grâce à sa méthode `add_tools`.


* Afficher la figure et vérifier qu'elle interagit avec le curseur de la souris.

In [16]:
### Insérez votre code ici
from bokeh.models.tools import HoverTool

x = [1, 1.5, 3, 4.5, 7, 8] 
y = [-1, 3, -4, 5, 8, -6]

fig = figure(width=600, height=400)

c = fig.square(x,y,color='blue',hover_color='red',hover_alpha=0.5)

h = HoverTool(renderers = [c],
              tooltips = [( "(x, y)", "($x, $y)"),
                          ( "index","$index")])

fig.add_tools(h)
show(fig)


### Personnalisation des axes et de la grille d'une figure


> Les axes de la figure peuvent également être personnalisés grâce aux attributs `axis`, `xaxis` et `yaxis` de la classe `figure`. Les attributs `xaxis` et `yaxis` correspondent respectivement à l'axe des abscisses et des ordonnées tandis que l'attribut `axis` fait simultanément référence aux deux axes. 
>
>
> De même, la grille de la figure peut être modifiée grâce aux attributs `grid`, `xgrid` ou `ygrid` de la classe `figure`.
>
>
> La personnalisation des axes se fait grâce aux sous-attributs de `axis`, `xaxis` et `y_axis`:
* ``axis_label`` : Ajouter/Modifier le label d'un axe.
* ``axis_line_width`` : Modifier l'épaisseur d'un axe.
* ``axis_line_color`` : Modifier la couleur d'un axe.
* ``major_label_orientation`` : Modifier l'orientation des étiquettes de graduation.
* ``major_label_text_color`` : Modifier la couleur des labels de graduation.
* ``minor_tick_in / minor_tick_out`` : Modifier la taille des graduations.
>
> La personnalisation de la grille se fait grâce aux sous-attributs de `grid`, `xgrid`et `y_grid`:
* ``grid_line_color`` : Modifier la couleur des lignes de la grille.
* ``band_fill_color`` : Modifier la couleur de remplissage des bandes de grillage.
* ``grid_line_alpha`` : Modifier l'opacité de la grille.

* Créer une liste <b>`x`</b> de 50 abscisses allant de 0 à 10. Vous pourrez utiliser la fonction `linspace` du module `numpy`.


* Créer une liste <b>`y`</b> 50 ordonnées aléatoires entre 0 et 100. Vous pourrez utiliser la fonction `randint` du sous module `numpy.random`.


* Instancier une figure de largeur 600 et hauteur 400.


* Instancier un nuage de points en forme de cercles de couleur `'mediumblue'` à partir de <b>`x`</b> et <b>`y`</b>.


* A l'aide des sous-attributs des attributs `axis`, `xaxis`et `yaxis` personnaliser la figure pour que:
    * l'épaisseur des deux axes soit de 3.
    * la couleur des deux axes soit `'navy'`.
    * les labels de graduation des axes soient de couleur `'gold'`.
    * l'étiquette de l'axe des abscisses soit `'abscisses'` et celle des ordonnées soit `'ordonnées'`.
    * l'orientation des labels de graduation de l'axe des ordonnées soit `'vertical'`.


* A l'aide des sous-attributs de l'attribut `grid`, personnaliser la figure pour que:
    * l'opacité de la grille soit 0.
    
    
* Afficher la figure.

In [26]:
from numpy import linspace
from numpy.random import randint

## Insérez votre code ici
x=linspace(0,10,50)
y=randint(0,100,50)

fig = figure(width=600,height=400)

r = fig.circle(x,y,color='mediumblue')
fig.axis.axis_line_width =3
fig.axis.axis_line_color ='navy'
fig.axis.major_label_text_color = 'gold'
fig.xaxis.axis_label ='abscisses'
fig.yaxis.axis_label ='ordonnées'
fig.yaxis.major_label_orientation ='vertical'
fig.grid.grid_line_alpha=0

show(fig)





