
<hr style="border-width:2px;border-color:#75DFC1">
<center><h1>Introduction à la visualisation de données avec Bokeh</h1></center>
<center><h2>Les barplots</h2></center>
<hr style="border-width:2px;border-color:#75DFC1">

* Exécuter la cellule suivante pour importer les classes nécessaires et pouvoir afficher les dessins <b>Bokeh</b> dans des cellules jupyter.

In [1]:
import warnings
warnings.filterwarnings("ignore")

# Importation des fonctions dont on se servira pour toutes les figures

from bokeh.plotting import figure, output_notebook, show

# Précision de l'affichage des graphiques dans des cellules jupyter

output_notebook()

### Barres verticales et horizontales

> Les diagrammes à barres sont un type de graphique connu et très utilisé pour l'analyse statistique. Comme leur nom l'indique, les diagrammes à barres sont formés de barres, verticales ou horizontales. Ils sont utilisés pour décrire des variables qualitatives ou quantitatives discrètes. Il existe plusieurs méthodes pour créer des diagrammes à barres dans **Bokeh**.
>
>
> Si l'on souhaite créer un diagramme à barre dans **Bokeh**, il faut d'abord instancier un objet `figure` et ensuite utiliser les méthodes `vbar` ou `hbar` de cet objet. Ces méthodes prennent différents arguments:
> - `vbar`:
>      - `x`:  différentes valeurs des variables (pas forcément quantitatives), i.e. l'abscisse dans un diagramme vertical.
>      - `top`: fréquences de ces différentes valeurs.
>      - `width`: épaisseur des barres.
> - `hbar`:
>      - `y`: différentes valeurs des variables, i.e. l'ordonnée dans un diagramme horizontal
>      - `right`: fréquences de ces différentes valeurs
>      - `height`: épaisseur des barres

* Instancier une `figure` **`p`**.


* Instancier un diagramme à barres verticales avec en abscisse les entiers de 0 à 6, en ordonnée les fréquences `[3, 4, 5, 6, 5, 4, 3]` et d'épaisseur 0.9.


* Afficher la figure.

In [None]:
### Insérez votre code ici




> Pour préciser à **Bokeh** que la variable que l'on souhaite représenter est catégorielle, il faut le préciser à la `figure` que l'on utilise.
>
> Pour ce faire il faut passer en argument de `x_range` (si l'on souhaite faire un diagramme vertical) ou `y_range` (si l'on souhaite faire un diagramme horizontal), lors de l'instanciation de la figure, la séquence des modalités que le variable peut prendre.
>
> Il faudra quand même préciser lors de l'appel d'une méthode *glyph* de diagramme à barres que l'abscisse ou l'ordonnée représente la même séquence.
>
> Par exemple :
>
>```py
    cats = ['chats', 'chiens']         # catégories à représenter
    ```
> ```py
    p = figure(x_range = cats,                      # l'axe des abscisses devient un axe catégoriel
               plot_width = 600, plot_height = 400)
               ```
> ```py
    p.vbar(x = cats,           # abscisses
           top = [0.4, 0.6],   # ordonnées
           width = 1) 
            ```
<div class="alert alert-danger">
<i class='fa fa-exclamation-triangle'></i> &emsp; 
    Contrairement aux méthodes <i>glyph</i> que nous avons vues précédemment, les méthodes de diagramme à barres doivent <b>toujours prendre un argument d'épaisseur lors de l'instanciation</b>.
</div>

* Créer un diagramme à barres horizontales avec en ordonnée les lettres de A à G et en abscisses les hauteurs `[3, 4, 5, 6, 5, 4, 3]`, d'épaisseur $0.9$.

In [None]:
## Insérez votre code ici



> Puisque `vbar` est une méthode *glyph*, on peut l'utiliser avec des objets `ColumnDataSource` renseignés dans le paramètre `source`. 
>
>Toutes les données, même les différentes couleurs des barres peuvent être insérées dans un `ColumnDataSource` puis utilisées pour configurer le graphique.
>
> Pour afficher une légende, il faut donner les étiquettes de la légende au paramètre `legend`.
>
> Il est ensuite possible de configurer l'affichage de celle-ci grâce aux attributs `location` et `orientation` de l'attribut `legend` d'une `figure`:
>
> ```py
    source = ColumnDataSource({
                               'catégories' : ['chats', 'chiens']
                               'proportions' : [0.4, 0.6]
                               'légende' : ['Proportion de chats', 'Proportion de chiens']
                             })
       ```
> ```py
    p = figure(x_range = ['chats', 'chiens'],
               plot_width = 600, plot_height = 400)
    ```
> ```py
    p.vbar(x = 'catégories',
           top = 'proportions',
           legend = 'légende',
           width = 0.5)
    ```
> ```py
    p.legend.location = 'center'
    p.legend.orientation = 'horizontal'
    ```
>
> * `location` spécifie où la légende s'affiche, cet attribut prend comme valeur: `'top_left'`, `'top_center'`, `'top_right'`, `'center_left'`, `'center'`, `'center_right'`, `'bottom_left'`, `'bottom_center'`, `'bottom_right'`.
>
>
> * L'attribut `orientation` prend quant à lui les valeurs `'horizontal'` ou `'vertical'`.

* Importer la classe `ColumnDataSource` contenue dans le sous-module `bokeh.models`.


* Instancier un objet `ColumnDataSource` nommé `source` à partir des listes **``noms``**,**``valeurs``** et **``couleurs``** fournies dans la cellule suivante.


* Instancier une figure de largeur 600 et hauteur 400 telle que l'axe des abscisses représente les catégories contenues dans la liste `noms`.


* Créer un diagramme à barres verticales avec:
    * abscisses : la liste **`noms`** de `source`.
    * ordonnées : la liste **`valeurs`** de `source`.
    * épaisseur : 1,5.
    * couleurs : la liste **`couleurs`** de `source`.
    * légende : la liste **`noms`** de `source`.


* Afficher la légende en haut et au centre de la figure avec une orientation horizontale.


* Afficher la figure.

In [None]:
## Insérez votre code ici:



### Barres groupées

> Bokeh permet aussi de créer des diagrammes à barres groupées. C'est à dire des diagrammes où plusieurs valeurs peuvent être associées à la même modalité.
> Nous allons créer un diagramme à barres groupées verticales.
>
> Tout d'abord, il faut créer une liste de couples telle que :
> * Le **premier indice** du couple correspond à la **modalité**.
> * Le **second indice** du couple correspond à la **valeur dans la modalité**.
>
> Cette liste servira à définir les abscisses de la figure.
>
>
> ```py
    modalites = ['A', 'B']                                      # liste de modalités
    valeurs = ['valeur 1', 'valeur 2', 'valeur 3']              # liste des valeurs
       ```
> ```py
    x = [(i, j) for i in modalites for j in valeurs]    # création de la liste de couples par compréhension
    ```
>
> L'instruction précédente génère la liste:
> ```py
    [('A','valeur 1'), ('A','valeur 2'), ('A','valeur 3'), ('B','valeur 1'), ('B','valeur 2'), ('B','valeur 3')]
        ```
> La définition des ordonnées se fait grâce à une liste où chaque élément est la valeur associée à chaque couple (modalité, valeur) crée dans l'instruction précédente.
>
> ```py
    ordonnees = [2,     # ordonnée de ('A', 'valeur 1')
                 5,     # ordonnée de ('A', 'valeur 2')
                 3,     # ordonnée de ('A', 'valeur 3')
                 1,     # ordonnée de ('B', 'valeur 1')
                 3,     # ordonnée de ('B', 'valeur 2')
                 2]     # ordonnée de ('B', 'valeur 3')
      ```
> Une fois que ces listes ont été créées, il faut préciser à la figure le format que devra prendre l'axe des abscisses. Pour cela, on utilise la classe `FactorRange` contenue dans le sous-module `bokeh.models`.
>
> ```py
    from bokeh.models import FactorRange
    ```
> ```py
    factor_range = FactorRange(factors = x)
      ```
> ```py
    p = figure(x_range = factor_range,
               plot_width = 600, plot_height = 400)
        ```
>
> Nous pouvons maintenant instancier un diagramme à barres verticales:
>
> ```py
    source = ColumnDataSource({
        'x' : x,
        'top' : ordonnees})
        ```
> ```py
    p.vbar(x = 'x',
           top = 'top',
           width = 0.9,
           source = source)
           ```

* A partir des listes `modalites` et `valeurs` fournies dans la cellule suivante, créer par compréhension une liste d'abscisses contenant les couples (modalité, valeur) pour chaque modalité et valeurs qu'elles peuvent prendre.


* A partir des listes `valeur1`, `valeur2` et `valeur3`, créer la liste des ordonnées de chaque couple (modalité, valeur).


* Instancier un `ColumnDataSource` contenant les listes d'abscisses et d'ordonnées créées dans les questions précédentes.

In [None]:
# Listes de données

modalites = ['A', 'B', 'C', 'D', 'E', 'F', 'G'] # modalités
valeurs = ['valeur 1', 'valeur 2', 'valeur 3']  # nom des valeurs prises par chaque modalité

valeur1 = [2, 1, 4, 3, 2, 4, 7]                 # valeur 1 de chaque modalité
valeur2 = [5, 3, 3, 2, 4, 6, 2]                 # valeur 2 de chaque modalité
valeur3 = [3, 2, 4, 4, 5, 3, 4]                 # valeur 3 de chaque modalité

## Insérez votrze code ici:
# Création de la liste de couples par compréhension


* Importer la classe `FactorRange` depuis le sous-module `bokeh.models`.


* Instancier un objet `FactorRange` à l'aide de la liste d'abscisses créée précédemment.


* Instancier une figure de largeur 600 et hauteur 400 en passant l'objet `FactorRange` crée en argument du paramètre `x_range`.


* Instancier un diagramme à barres verticales d'épaisseur 0,9 à l'aide du `ColumnDataSource` défini précédemment.


* Attribuer la valeur `np.pi / 4` au sous-attribut `major_label_orientation` de l'attribut `xaxis` de la figure. Ceci permet d'incliner les labels de l'axe des abscisses de 45° ($\frac{\pi}{4}$ en radian).


* Afficher la figure.

In [None]:
import numpy as np

### Insérez votre code ici


> Une méthode alternative pour obtenir des barres groupées consiste à créer un diagramme à barres pour chaque valeur que peuvent prendre les modalités.
>
>
> En reprenant l'exemple précédent, nous allons d'abord instancier un diagramme à barres verticales avec en abscisse les modalités et en ordonnées la liste `valeur1`, puis un diagramme avec en abscisse les modalités et ordonnées la liste `valeur2` et ainsi de suite.
>
>
> Pour éviter que les diagrammes ne se superposent et obtenir l'effet désiré, il suffira de décaler chaque diagramme sur l'axe des abscisses. Ceci se fait grâce à la fonction `dodge` du sous-module `bokeh.transform` qui permet de générer un dictionnaire d'abscisses catégorielles décalées que nous pourrons passer en argument d'une méthode *glyph*:
>
>
> ```py
    modalites = ['A', 'B', 'C', 'D', 'E', 'F', 'G']
    valeur1 = [2, 1, 4, 3, 2, 4, 7]
    source = ColumnDataSource({
            'x' : modalites,
            'top' : valeur1,    
        })
    ```
> ```py
    p = figure(x_range = modalites)
      ```
> ```py
    from bokeh.transform import dodge
       ```
>
> ```py
    abscisses_1 = dodge(field_name = 'x',    # clé correspondant aux abscisses dans la source
                        value = 0.25,        # valeur du décalage
                        range = p.x_range)   # étendue sur laquelle appliquer le décalage
                            ```
>
> ```py
    p.vbar(x = abscisses_1,    # abscisses
           top = 'top',        # ordonnées
           width = 0.2,        # épaisseur
           source = source)    # source des données
            ```
            
* A partir des listes fournies dans la cellule ci-dessous, instancier un objet `ColumnDataSelector` qui sera la source des données à afficher avec les clés suivantes:
    * `'x' : modalites`.
    * `'valeur 1' : valeur1`.
    * `'valeur 2' : valeur2`.
    * `'valeur 3' : valeur3`.


* Instancier une figure de largeur 600 et hauteur 400 telle que l'axe des abscisses représente les catégories contenues dans la liste `modalites`.


* Importer la fonction `dodge` depuis le sous-module `bokeh.transform`.


* A l'aide de la fonction `dodge`, créer les dictionnaires d'abscisses `abscisses_1`, `abscisses_2` et `abscisses_3` décalées respectivement de `-0.25`, `0` et `0.25`. Chaque appel de cette fonction devra prendre en argument du paramètre `range` l'étendue de l'axe des abscisses de la figure instanciée précédemment et `'x'` en argument du paramètre `field_name`. Ceci permettra à la méthode *glyph* de faire le lien entre la source et le décalage à appliquer.

In [None]:
# Listes de données

modalites = ['A', 'B', 'C', 'D', 'E', 'F', 'G'] # modalités

valeur1 = [2, 1, 4, 3, 2, 4, 7]                 # valeur 1 de chaque modalité
valeur2 = [5, 3, 3, 2, 4, 6, 2]                 # valeur 2 de chaque modalité
valeur3 = [3, 2, 4, 4, 5, 3, 4]                 # valeur 3 de chaque modalité

### Insérez votre code ici



* Instancier un diagramme à barres verticales d'abscisse `abscisses_1` et d'ordonnée `valeur1`, d'épaisseur 0,2, de couleur rouge et de légende `"Valeur 1"`.


* Instancier un diagramme à barres verticales d'abscisse `abscisses_2` et d'ordonnée `valeur2`, d'épaisseur 0,2, de couleur verte et de légende `"Valeur 2"`.


* Instancier un diagramme à barres verticales d'abscisse `abscisses_3` et d'ordonnée `valeur3`, d'épaisseur 0,2, de couleur bleue et de légende `"Valeur 3"`.


* Afficher la légende horizontalement en haut à gauche de la figure.


* Effacer les lignes verticales du graphique en attribuant la valeur `None` au sous-attribut `grid_line_color` de l'attribut `xgrid` de la figure.


* Afficher la figure.

In [None]:
## Insérez votre code ici:



### Barres empilées

> Les méthodes *glyph* `vbar_stack` et `hbar_stack` permettent de produire des diagrammes à barres empilées.
>
> Ces méthodes ont un paramètre `stackers` à la place de `top` et `right` qui prend en argument une liste de clés contenues dans la source et correspond aux valeurs à empiler.

* A partir des listes fournies dans la cellule ci-dessous, instancier un objet `ColumnDataSelector` qui sera la source des données à afficher avec les clés suivantes:
    * `'pays' : pays`.
    * `'fields' : valeur1`.
    * `'nobels' : valeur2`.
    * `'coupes_fifa' : valeur3`.
    
 
* Instancier une figure de largeur 600 et hauteur 400 telle que l'axe des abscisses représente les catégories contenues dans la liste `pays`.


* A l'aide de la méthode *glyph* `vbar_stack`, instancier un diagramme à barres empilées verticalement d'épaisseur 0.9 tel que les valeurs à empiler soient les récompenses obtenues par chaque pays. Vous pourrez configurer les couleurs et la légende du diagramme à l'aide des listes `couleurs` et `legendes` fournies.


* Afficher la légende verticalement en haut à droite de la figure et effacer les lignes verticales de la grille.


* Afficher la figure.

In [None]:
# Listes de données

pays = ['Etats-Unis', 'France', 'Allemagne', 'Royaume-Uni']     # modalités
recompenses = ['fields', 'nobels', 'coupes_fifa']               # noms des valeurs prises par chaque modalité


valeur1 = [14, 12, 2, 7]                # nombre de médailles fields pour chaque pays
valeur2 = [11, 17, 15, 13]              # nombre de prix nobels en littérature pour chaque pays
valeur3 = [0, 2, 4, 1]                  # nombre de coupes du monde FIFA pour chaque pays

couleurs = ['red', 'green', 'blue']     # couleur de chaque diagramme

legendes = ["Médailles Fields", "Prix Nobels de littérature", "Coupes du monde FIFA"]  # légende de chaque diagramme

# Insérez votre code ici


