# Bokeh

#### Bokeh est une bibliothèque de visualisation interactive qui cible les navigateurs Web modernes. Son but est de fournir une construction élégante et concise de graphiques polyvalents. Bokeh peut aider toute personne souhaitant créer rapidement et facilement des graphiques, des tableaux de bord et des applications de données interactifs. 

Il existe de nombreux avantages à travailler avec Bokeh, les principaux étant :

- Visualisation interactive dans les navigateurs modernes
- Documents HTML autonomes ou applications avec serveur
- Graphiques expressifs et polyvalents
- Gestion de données volumineuses, dynamiques ou en continu (streaming)
- Utilisation facile en python (ou Scala, R,...)


In [1]:
from bokeh.plotting import figure
from bokeh.io import  push_notebook,output_notebook, show
output_notebook()  # pour un affichage en ligne

Nous allons travailler avec les Pokémons dans cet exercice. Pokémon a commencé comme jeu de rôle (RPG), mais en raison de sa popularité croissante, ses propriétaires ont fini par produire de nombreuses séries télévisées, mangas, etc., ainsi que d'autres types de jeux vidéo (comme le célèbre Pokémon Go! ). Ce jeu de données est axé sur les les caractéristiques des Pokémon dans les jeux vidéos de la franchise.

In [2]:
import pandas as pd
import numpy as np
df = pd.read_csv('pokemon.csv',index_col=0)
df

Unnamed: 0_level_0,Name,Type 1,Type 2,Total,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
#,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
1,Bulbasaur,Grass,Poison,318,45,49,49,65,65,45,1,False
2,Ivysaur,Grass,Poison,405,60,62,63,80,80,60,1,False
3,Venusaur,Grass,Poison,525,80,82,83,100,100,80,1,False
3,VenusaurMega Venusaur,Grass,Poison,625,80,100,123,122,120,80,1,False
4,Charmander,Fire,,309,39,52,43,60,50,65,1,False
5,Charmeleon,Fire,,405,58,64,58,80,65,80,1,False
6,Charizard,Fire,Flying,534,78,84,78,109,85,100,1,False
6,CharizardMega Charizard X,Fire,Dragon,634,78,130,111,130,85,100,1,False
6,CharizardMega Charizard Y,Fire,Flying,634,78,104,78,159,115,100,1,False
7,Squirtle,Water,,314,44,48,65,50,64,43,1,False


## Figure avec Onglets

Les caractéristiques les plus intéressantes pour prédire l'issue d'un combat de Pokémon sont l'attaque et la défense. Ces caractéristiques présentent de grandes disparités selon si le Pokémon est légendaire ou non, c'est pourquoi nous traiterons ces Pokémon à part. Si vous êtes un fan de Pokémon, vous savez qu'il n'est possible de rencontrer un Pokémon légendaire qu'une fois.

Nous allons tracer la statistique de défense en fonction de la statistique d'attaque de tous les pokémon du jeu de données afin de voir si nous observons une corrélation.

Dans la figure ci-après, vous remarquerez la possibilité de créer des onglets selon que le pokémon soit légendaire ou non.

In [3]:
from bokeh.models.widgets import Panel, Tabs
from bokeh.models import ColumnDataSource
from bokeh.models.tools import HoverTool


source1=ColumnDataSource(df[(df["Legendary"]==True)])
source2=ColumnDataSource(df[(df["Legendary"]==False)])

hover = HoverTool(
        tooltips=[
            ("name", "@Name"),
            ("attack", "@Attack"),
            ("defense", "@Defense")])

 
p1 = figure(plot_width=400, plot_height=400,x_axis_label='Attack', y_axis_label='Defense')
p1.circle(x='Attack',y='Defense',source = source1,color='red',size=15)
p1.add_tools(hover)
tab1 = Panel(child=p1, title="Pokémons legendaires")

p2 = figure(plot_width=400, plot_height=400,x_axis_label='Attack', y_axis_label='Defense')
p2.circle(x='Attack',y='Defense',source = source2,color='blue',size=5)
p2.add_tools(hover)
tab2 = Panel(child=p2, title="Pokémons non legendaires")

tabs = Tabs(tabs=[ tab2, tab1 ])

show(tabs)

## Nuage de point coloré

En plus d'avoir des forces d'attaque et de défense, chaque Pokémon a un type. Nous allons reproduire le graphe précédent tout en ajoutant une coloration selon le type du Pokémon. C'est une visualisation pertinente car elle permet de savoir quels sont les Pokémon avec un profil plutôt offensif ou défensif pour chaque type. Cela permet de construire son équipe au mieux si on joue de manière compétitive.



In [4]:
df=df[(df["Type 1"]=='Dark')|(df["Type 1"]=='Electric')|(df["Type 1"]=='Grass')|
     (df["Type 1"]=='Ice')|(df["Type 1"]=='Rock')|(df["Type 1"]=='Water')|(df["Type 1"]=='Fire')]

def color_(x):
    Type=['Dark','Electric','Fire','Grass','Ice','Rock','Water']
    color=['darkorchid','yellow','darkorange','green','lightcyan','maroon','blue']
    return color[Type.index(x)]

df['color'] = df['Type 1'].apply(color_)

source1 = ColumnDataSource(df[(df["Legendary"]==True)])
source2 = ColumnDataSource(df[(df["Legendary"]==False)])

hover = HoverTool(
        tooltips=[
            ("name", "@Name"),
            ("attack", "@Attack"),
            ("defense", "@Defense")])
 
p1 = figure(plot_width=400, plot_height=400,x_axis_label='Attack', y_axis_label='Defense')
p1.circle(x='Attack',y='Defense',source = source1,color='color',size=15,legend_group='Type 1')
p1.add_tools(hover)
p1.legend.location = "top_left"
tab1 = Panel(child=p1, title="Pokémons légendaires")

p2 = figure(plot_width=400, plot_height=400,x_axis_label='Attack', y_axis_label='Defense')
p2.circle(x='Attack',y='Defense',source = source2,color='color',size=5,legend_group='Type 1')
p2.add_tools(hover)
p2.legend.location = "top_left"
tab2 = Panel(child=p2, title="Pokémons non légendaires")

tabs = Tabs(tabs=[ tab2, tab1 ])


show(tabs)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  if __name__ == '__main__':


## Diagramme en barre

Votre principal objectif en tant qu’apprenti dresseur de Pokémons est de capturer des Pokémons puissants. Pour cela on vise ceux ayant une très bonne attaque, une très bonne défense ou idéalement les deux. Parmi les Pokémons ayant la meilleure attaque, on compte ceux de type roche, eau, ténèbres ou encore feu. Ceux qui ont la meilleure défense sont généralement de type eau.

Nous pouvons également nous intéresser à la distribution des types de Pokémon au sein du jeu. Visualisons ceci à l'aide d'un diagramme en barres.

In [5]:
from bokeh.transform import factor_cmap
count_type = pd.DataFrame(df.groupby('Type 1').size()).reset_index().rename(columns={0: "count"})

source = ColumnDataSource(count_type)
Type_cmap = factor_cmap('Type 1', palette=df['color'].unique(), factors=df['Type 1'].unique())
p = figure(plot_width=400, plot_height=400, x_range=count_type['Type 1'], title="nombre de pokémon par type")
p.vbar(x='Type 1', top='count', width=0.8, source=source,line_color=Type_cmap, fill_color=Type_cmap,legend_group='Type 1',
       hover_line_color="black")
p.add_tools(HoverTool(tooltips=[("count", "@count")]))

p.legend.location="top_left"
show(p)

## Histogramme intéractif

Nous allons maintenant regarder plus en détail la distribution de la statistique d'attaque des Pokémon, en fonction de leur type. Cela peut permettre d'estimer la probabilité d'avoir un Pokémon adverse avec une attaque supérieure à la vôtre, en connaissant son type.

In [6]:
import scipy.special

Type = ['Dark','Electric','Fire','Grass','Ice','Rock','Water']
color = ['darkorchid','yellow','darkorange','green','lightcyan','maroon','blue']

p = figure(title="attack hist per type",background_fill_color="lightcyan")

for i in Type :
    histogram, edges = np.histogram(df[df['Type 1']== i]['Attack'] , density=True, bins=50)
    source = ColumnDataSource(data=dict(histogram=histogram,left = edges[:-1], right = edges[1:]))
    p.quad( top = 'histogram', bottom = 0, left = 'left', right = 'right', 
             fill_color = color[Type.index(i)] , line_color = "black",
           source=source,hover_line_color="white",hover_fill_color='red',legend_label=str(i))
    hover = HoverTool(tooltips = [('valeur ', '@histogram'),
                          ('abscice', '$x')])
    p.add_tools(hover)

p.legend.click_policy="hide"  # légende intéractive
show(p)

## Partage de Graphiques dans une page web

In [7]:
from bokeh.plotting import figure
from bokeh.plotting import output_file
from bokeh.plotting import save

# Précision du fichier où sauvegarder la figure

output_file('figure.html')

# Instanciation d'une figure

p = figure(plot_width = 600, plot_height = 400)

# Listes de coordonnées

x = [1, 2, 3, 4, 5]  # abscisses de chaque point
y = [1, 2, 3, 4, 5]  # ordonnées de chaque point

# Création d'une courbe de type 'line' dans la figure p

p.line(x,    # abscisses
       y)    # ordonnées

# Sauvegarde de la figure p dans le fichier figure.html

save(p)

'/home/yaniv/Data-Viz-Courses/Bokeh/figure.html'

## Widget

Bokeh est muni d'outils qui nous permettent d'exporter facilement ses graphiques au format html, ce qui permet de les ouvrir sur n'importe quel navigateur.

Ainsi, il est possible de les partager avec des collègues ou des managers par exemple. Les graphiques conserveront tous leurs outils interactifs, leurs annotations et leurs paramètres, ce qui facilite leur utilisation par des individus qui normalement n'auraient pas les compétences techniques pour les comprendre au premier coup d'oeil.

Pour exporter les figures au format html, il suffit d'utiliser les fonctions output_file et save du sous-module bokeh.plotting.

La fonction output_file permet de définir le nom du fichier sur lequel sera enregistrée la figure et définir son emplacement si un chemin est renseigné. Elle prend donc en argument une chaîne de caractères.

La fonction save quant à elle s'applique à la place de show et permet de sauvegarder le dessin dans le fichier renseigné en argument de la fonction output_file. Par exemple:

In [8]:
from bokeh.models.widgets import Slider # Importation de la classe Slider
from bokeh.models import Column     # Importation de la fonction widgetbox

# Instanciation d'un Slider

slider = Slider(start = -6,               # valeur minimale
                end = 6,                  # valeur maximale
                value = 0,                # valeur d'initialisation
                step = 0.1,               # pas
                title = 'Premier Slider') # titre

# Instanciation d'une boîte à widgets

box = Column(slider)

# Affichage de la boîte

show(box)