## TD5-Visualisation

Dans ce cours, nous allons employer la librairie Bokeh, qui permet de générer des visualisations intéractives, et qui peuvent être intégrés à des interfaces Flask. Il existe de nombreuses autres librairies de visualisation, comme :
* Plotly
* Dash
* Panel
* Streamlit

In [1]:
!pip install bokeh



In [2]:
from bokeh.plotting import figure, show

## Création d'un simple graphique à ligne

La création de graphique avec Bokeh se résume aux étapes suivantes :

* préparer les données (les listes suffisent, mais d'autres types d'iterables sont acceptés)
* créer le graphique, à l'aide de la méthode figure(), qui spécifie les différents paramètres (taille, nom, légende...)
* ajouter les données et la manière de les présenter (lignes, barres...), en spécifiant leurs paramètres (couleurs, taille...)
* afficher le graphique à l'aide de la méthode show(). Celle-





In [3]:
# quelques données, où l'on donnes les valeurs pour les axes x et y
x = [1, 2, 3, 4, 5]
y = [6, 7, 2, 4, 5]

# on crée l'objet figure, qui contiendra ensuite les données
p = figure(title="Simple line example", x_axis_label='x', y_axis_label='y')

# ici on indique créer une ligne, en précisant les valeurs pour x et y,
# ainsi que d'autres paramètres
# note : dans la documentation de Bokeh, les lignes, barres... sont appelés glyphs
p.line(x, y, legend_label="Temp.", line_width=2)

# la fonction show affiche le graphique dans une page web
show(p)

## Ajouter plusieurs lignes au même graphique

In [4]:
# on prépare les données pour l'axe x 
# ainsi que plusieurs autres valeurs pour l'axe y
x = [1, 2, 3, 4, 5]
y1 = [6, 7, 2, 4, 5]
y2 = [2, 3, 4, 5, 6]
y3 = [4, 5, 5, 7, 2]

# on crée l'objet figure, qui contiendra ensuite les données
p = figure(title="Multiple line example", x_axis_label="x", y_axis_label="y")

# on ajoute les lignes les unes après les autres, en changeant la couleur
p.line(x, y1, legend_label="Temp.", color="blue", line_width=2)
p.line(x, y2, legend_label="Rate", color="red", line_width=2)
p.line(x, y3, legend_label="Objects", color="green", line_width=2)

# on produit le graphique
show(p)

## Produire d'autres types de graphique

Pour voir comment changer les propriétés des glyphes et des graphes : https://docs.bokeh.org/en/latest/docs/first_steps/first_steps_2.html 

In [5]:
# on prépare les données pour l'axe x 
# ainsi que plusieurs autres valeurs pour l'axe y
x = [1, 2, 3, 4, 5]
y1 = [6, 7, 2, 4, 5]
y2 = [2, 3, 4, 5, 6]
y3 = [4, 5, 5, 7, 2]

# on crée l'objet figure, qui contiendra ensuite les données
p = figure(title="Multiple line example", x_axis_label="x", y_axis_label="y")

# on ajoute les lignes les unes après les autres, en changeant la couleur
p.line(x, y1, legend_label="Temp.", color="blue", line_width=2)
p.line(x, y2, legend_label="Rate", color="red", line_width=2)
p.circle(x, y3, legend_label="Objects", color="#bb5566", size=16)

# on produit le graphique
show(p)

In [6]:
# on prépare les données pour l'axe x 
# ainsi que plusieurs autres valeurs pour l'axe y
x = [1, 2, 3, 4, 5]
y1 = [6, 7, 2, 4, 5]
y2 = [2, 3, 4, 5, 6]
y3 = [4, 5, 5, 7, 2]

# on crée l'objet figure, qui contiendra ensuite les données
p = figure(title="Multiple line example", x_axis_label="x", y_axis_label="y")

# on ajoute les lignes les unes après les autres, en changeant la couleur
p.line(x, y1, legend_label="Temp.", color="blue", line_width=2)
p.vbar(x=x, top=y2, legend_label="Rate", width=0.5, bottom=0, color="red")
p.circle(x, y3, legend_label="Objects", color="yellow", size=12)

# on produit le graphique
show(p)

## Ajouter une légende

Pour les options pour mettre en page la légende, ainsi que styliser les annotations : https://docs.bokeh.org/en/latest/docs/first_steps/first_steps_3.html 

In [7]:
from bokeh.plotting import figure, show

# prepare some data
x = [1, 2, 3, 4, 5]
y1 = [4, 5, 5, 7, 2]
y2 = [2, 3, 4, 5, 6]

# create a new plot
p = figure(title="Legend example")

# add circle renderer with legend_label arguments
line = p.line(x, y1, legend_label="Temp.", line_color="blue", line_width=2)
circle = p.circle(
    x,
    y2,
    legend_label="Objects",
    fill_color="red",
    fill_alpha=0.5,
    line_color="blue",
    size=80,
)

# display legend in top left corner (default is top right corner)
p.legend.location = "top_left"

# add a title to your legend
p.legend.title = "Obervations"

# change appearance of legend text
p.legend.label_text_font = "times"
p.legend.label_text_font_style = "italic"
p.legend.label_text_color = "navy"

# change border and background of legend
p.legend.border_line_width = 3
p.legend.border_line_color = "navy"
p.legend.border_line_alpha = 0.8
p.legend.background_fill_color = "navy"
p.legend.background_fill_alpha = 0.2

# show the results
show(p)

## Ajouter des annotations

Les annotations sont des éléments visuels qui facilitent la lecture du graphique 

In [8]:
import random

from bokeh.models import BoxAnnotation
from bokeh.plotting import figure, show

# generate some data (1-50 for x, random values for y)
x = list(range(0, 51))
y = random.sample(range(0, 100), 51)

# create new plot
p = figure(title="Box annotation example")

# add line renderer
line = p.line(x, y, line_color="#000000", line_width=2)

# add box annotations
low_box = BoxAnnotation(top=20, fill_alpha=0.2, fill_color="#F0E442")
mid_box = BoxAnnotation(bottom=20, top=80, fill_alpha=0.2, fill_color="#009E73")
high_box = BoxAnnotation(bottom=80, fill_alpha=0.2, fill_color="#F0E442")

# add boxes to existing figure
p.add_layout(low_box)
p.add_layout(mid_box)
p.add_layout(high_box)

# show the results
show(p)

## Changer la taille du graphique

La taille du graphique se précise à l'aide des arguments width et height ou sizing mode.

In [9]:
from bokeh.plotting import figure, show

# prepare some data
x = [1, 2, 3, 4, 5]
y = [4, 5, 5, 7, 2]

# create a new plot with a specific size
p = figure(
    title="Plot sizing example",
    width=350,
    height=250,
    x_axis_label="x",
    y_axis_label="y",
)

# add circle renderer
circle = p.circle(x, y, fill_color="red", size=15)

# show the results
show(p)

On peut également avoir des graphique responsives, c'est-à-dire qui s'adaptent à la taille d'écran disponible, à l'aide de l'argument sizing mode

In [10]:
from bokeh.plotting import figure, show

# prepare some data
x = [1, 2, 3, 4, 5]
y = [4, 5, 5, 7, 2]

# create a new plot with responsive width
p = figure(
    title="Plot responsive sizing example",
    sizing_mode="stretch_width",
    height=250,
    x_axis_label="x",
    y_axis_label="y",
)

# add circle renderer
circle = p.circle(x, y, fill_color="red", size=15)

# show the results
show(p)

## Changer les outils disponibles

Pour ajouter des outils au graphique, il faut d'abord les importer, puis les ajouter à figure(). Pour une liste des outils disponibles, voir : https://docs.bokeh.org/en/latest/docs/user_guide/interaction/tools.html#ug-interaction-tools

In [11]:
from bokeh.models import BoxZoomTool, PanTool, ResetTool
from bokeh.plotting import figure, show

# prepare some data
x = [1, 2, 3, 4, 5]
y = [4, 5, 5, 7, 2]

# create a plot
p = figure(
    title="Modifying tools example",
    tools=[BoxZoomTool(), ResetTool()],
    sizing_mode="stretch_width",
    max_width=500,
    height=250,
)

# add an additional pan tool
# only vertical panning is allowed
p.add_tools(PanTool(dimensions="width"))

# add a renderer
p.circle(x, y, size=10)

# show the results
show(p)

## Ajouter des informations au graphique

On peut faire en sorte que des informations sur les données apparaissent quand les survole. Pour ça, il faut :
* importer HoverTool
* l'intégrer à l'argument "tools" de figure()
* préciser l'argument "tooltips", en indiquant quel message afficher. Pour employer les variables du graphique, il faut les précéder de @

In [12]:
from bokeh.models import HoverTool
from bokeh.plotting import figure, show

# prepare some data
x = [1, 2, 3, 4, 5]
y = [4, 5, 5, 7, 2]

p = figure(
    y_range=(0, 10),
    toolbar_location=None,
    tools=[HoverTool()],
    tooltips="Data point @x has the value @y",
    sizing_mode="stretch_width",
    max_width=500,
    height=250,
)

# add renderers
p.circle(x, y, size=10)
p.line(x, y, line_width=2)

# show the results
show(p)

## Combiner plusieurs graphiques

On peut combiner plusieurs graphiques en une ligne, colonne, ou selon une grille. Pour plus d'informations sur la mise en page des graphiques, et sur l'option layout(), voir : https://docs.bokeh.org/en/latest/docs/user_guide/basic/layouts.html#ug-basic-layouts


In [15]:
from bokeh.layouts import row, column, gridplot
from bokeh.plotting import figure, show

# prepare some data
x = list(range(11))
y0 = x
y1 = [10 - i for i in x]
y2 = [abs(i - 5) for i in x]

# create three plots with one renderer each
s1 = figure(width=250, height=250, background_fill_color="#fafafa")
s1.circle(x, y0, size=12, color="#53777a", alpha=0.8)

s2 = figure(width=250, height=250, background_fill_color="#fafafa")
s2.triangle(x, y1, size=12, color="#c02942", alpha=0.8)

s3 = figure(width=250, height=250, background_fill_color="#fafafa")
s3.square(x, y2, size=12, color="#d95b43", alpha=0.8)

# put the results in a row that automatically adjusts
# to the browser window's width
# show(row(children=[s1, s2, s3], sizing_mode="scale_width"))

# put the results in a column and show
# show(column(children=[s1, s2, s3], sizing_mode="scale_width"))

# make a grid
show(gridplot([[s1, s2], [None, s3]], width=250, height=250))



Pour plus d'options la stylisation des graphiques : 
* https://docs.bokeh.org/en/latest/docs/first_steps/first_steps_5.html

## Fournir les données

En interne, Bokeh convertit les données dans un format ColumnDataSource. On peut créer ce type de données directement, en fournissant un dictionnaire ou un DataFrame
* https://docs.bokeh.org/en/latest/docs/first_steps/first_steps_8.html
* https://docs.bokeh.org/en/latest/docs/user_guide/basic/data.html#ug-basic-data-cds-pandas-data-frame

In [16]:
from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource

# create dict as basis for ColumnDataSource
data = {'x_values': [1, 2, 3, 4, 5],
        'y_values': [6, 7, 2, 3, 6]}

# create ColumnDataSource based on dict
source = ColumnDataSource(data=data)

# create a plot and renderer with ColumnDataSource data
p = figure(height=250)
p.circle(x='x_values', y='y_values', size=20, source=source)
show(p)


In [15]:
from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource
import pandas as pd 

# create dict as basis for ColumnDataSource
data = {'x_values': [1, 2, 3, 4, 5],
        'y_values': [6, 7, 2, 3, 6]}


df = pd.DataFrame(data)
# create ColumnDataSource based on dict
source = ColumnDataSource(data=df)

# create a plot and renderer with ColumnDataSource data
p = figure(height=250)
p.circle(x='x_values', y='y_values', size=20, source=source)
show(p)


## Filtrer les données

Un avantage à employer ColumnDataSource est que l'on peut employer des filtres, sous la forme de la classe CDSView
* Pour voir les types de filtres existants : https://docs.bokeh.org/en/latest/docs/user_guide/basic/data.html#ug-basic-data-filtering 

In [17]:
from bokeh.layouts import gridplot
from bokeh.models import CDSView, ColumnDataSource, IndexFilter
from bokeh.plotting import figure, show

# create ColumnDataSource from a dict
source = ColumnDataSource(data=dict(x=[1, 2, 3, 4, 5], y=[1, 2, 3, 4, 5]))

# create a view using an IndexFilter with the index positions [0, 2, 4]
view = CDSView(filter=IndexFilter([0, 2, 4]))

# setup tools
tools = ["box_select", "hover", "reset"]

# create a first plot with all data in the ColumnDataSource
p = figure(height=300, width=300, tools=tools)
p.circle(x="x", y="y", size=10, hover_color="red", source=source)

# create a second plot with a subset of ColumnDataSource, based on view
p_filtered = figure(height=300, width=300, tools=tools)
p_filtered.circle(x="x", y="y", size=10, hover_color="red", source=source, view=view)

# show both plots next to each other in a gridplot layout
show(gridplot([[p, p_filtered]]))

## Rendre les graphiques interactifs à l'aide de widget

Un des intérêt de Bokeh est de rendre les graphiques interactifs. Pour plus d'informations sur les widget, voir : 
* https://docs.bokeh.org/en/latest/docs/first_steps/first_steps_9.html
* https://docs.bokeh.org/en/latest/docs/user_guide/interaction/widgets.html#ug-interaction-widgets

In [19]:
from bokeh.layouts import layout
from bokeh.models import Div, RangeSlider, Spinner
from bokeh.plotting import figure, show

# prepare some data
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y = [4, 5, 5, 7, 2, 6, 4, 9, 1, 3]

# create plot with circle glyphs
p = figure(x_range=(1, 9), width=500, height=250)
points = p.circle(x=x, y=y, size=30, fill_color="#21a7df")

# set up textarea (div)
div = Div(
    text="""
          <p>Select the circle's size using this control element:</p>
          """,
    width=200,
    height=30,
)

# set up spinner
spinner = Spinner(
    title="Circle size",
    low=0,
    high=60,
    step=5,
    value=points.glyph.size,
    width=200,
)
# This function uses JavaScript to interactively link two Bokeh models.
#  The first argument you pass to this function is the attribute of your
#  spinner ("value") that you want to link to your circle glyphs. 
# The second attribute is the glyph you want to link to your spinner (points.glyph).
#  The third argument is the property of your glyph that you want to link to your
#  spinner’s value
spinner.js_link("value", points.glyph, "size")

# set up RangeSlider
range_slider = RangeSlider(
    title="Adjust x-axis range",
    start=0,
    end=10,
    step=1,
    value=(p.x_range.start, p.x_range.end),
)
# This time, however, you need to assign two values at once: the beginning of 
# the plot’s x-axis and the end of its x-axis. The RangeSlider returns a tuple 
# of those two values. Therefore, you need to use the attr_selector of the js_link()
#  function to tell Bokeh which part of the Tuple to assign to either the start
#  or the end of the plot’s x-axis
range_slider.js_link("value", p.x_range, "start", attr_selector=0)
range_slider.js_link("value", p.x_range, "end", attr_selector=1)

# create layout
layout = layout(
    [
        [p],
        [div, spinner],
        [range_slider],
        
    ],
)

# show result
show(layout)

## Intégrer Bokeh à Flask

Pour pouvoir intégrer le graphique à Flash, il nous faut une balise **div** contenant le graphique et une autre **script** contenant les données. Pour cela, on emploie la fonction components() de Bokeh. On peut ensuite donner ces balises à la fonction render_template() de Flask, afin qu'elles soient employées dans le template Jinja.

Pour plus de détails sur comment intégrer les graphiques à Flask et aux pages webs : https://docs.bokeh.org/en/latest/docs/user_guide/output/embed.html#standalone-documents 

Créez un dossier "app", créez-y un fichier "hello.py", dans lequel vous copierez le code ci-dessous :

In [None]:
# Importing required functions 
import random 

from flask import Flask, render_template 
from bokeh.embed import components 
from bokeh.plotting import figure 

# Flask constructor 
app = Flask(__name__) 

# Root endpoint 
@app.route('/') 
def homepage(): 

	# First Chart - Scatter Plot 
	p1 = figure(height=350, sizing_mode="stretch_width") 
	p1.circle( 
		[i for i in range(10)], 
		[random.randint(1, 50) for j in range(10)], 
		size=20, 
		color="navy", 
		alpha=0.5
	) 

	# Second Chart - Line Plot 
	language = ['Python', 'JavaScript', 'C++', 'C#', 'Java', 'Golang'] 
	popularity = [85, 91, 63, 58, 80, 77] 

	p2 = figure( 
		x_range=language, 
		height=350, 
		title="Popularity", 
	) 
	p2.vbar(x=language, top=popularity, width=0.5) 
	p2.xgrid.grid_line_color = None
	p2.y_range.start = 0

	# Third Chart - Line Plot 
	p3 = figure(height=350, sizing_mode="stretch_width") 
	p3.line( 
		[i for i in range(10)], 
		[random.randint(1, 50) for j in range(10)], 
		line_width=2, 
		color="olive", 
		alpha=0.5
	) 

	script1, div1 = components(p1) 
	script2, div2 = components(p2) 
	script3, div3 = components(p3) 

	# Return all the charts to the HTML template 
	return render_template( 
		template_name_or_list='charts.html', 
		script=[script1, script2, script3], 
		div=[div1, div2, div3], 
	) 


# Main Driver Function 
if __name__ == '__main__': 
	# Run the application on the local development server 
	app.run() 



Pour employer Bokeh dans les templates Flask, il faut intégrer le script JS suivant dans le header du fichier HTML :

* <script src="https://cdn.bokeh.org/bokeh/release/bokeh-x.y.z.min.js"crossorigin="anonymous"></script>

Les scripts suivants sont optionnels : 

* <script src="https://cdn.bokeh.org/bokeh/release/bokeh-widgets-x.y.z.min.js" crossorigin="anonymous"></script> (widget)

* <script src="https://cdn.bokeh.org/bokeh/release/bokeh-tables-x.y.z.min.js" crossorigin="anonymous"></script> (pour utiler les data tables de Bokeh)

* <script src="https://cdn.bokeh.org/bokeh/release/bokeh-gl-x.y.z.min.js" crossorigin="anonymous"></script> (WebGL)

* <script src="https://cdn.bokeh.org/bokeh/release/bokeh-mathjax-x.y.z.min.js" crossorigin="anonymous"></script> (Mathx)


Créez un dossiez "templates" puis dedans un fichier "charts.html", et copiez-y le code ci-dessous. Remarquez également le "| safe ", qui indique à Jinja qu'il n'est pas nécessaire d'échapper la variable, et qu'on peut l'afficher tel quel :

In [None]:
<!DOCTYPE html> 
<html lang="en"> 

<head> 
	<meta charset="utf-8"> 
	<meta name="viewport" content="width=device-width, initial-scale=1"> 

	<link href="https://cdn.jsdelivr.net/npm/bootstrap@5.2.2/dist/css/bootstrap.min.css" rel="stylesheet"
		integrity="sha384-Zenh87qX5JnK2Jl0vWa8Ck2rdkQ2Bzep5IDxbcnCeuOxjzrPF/et3URy9Bv1WTRi" crossorigin="anonymous"> 

	<!-- <link href="http://cdn.bokeh.org/bokeh/release/bokeh-3.0.1.min.css" rel="stylesheet" type="text/css"> -->
	<script src="https://cdnjs.cloudflare.com/ajax/libs/bokeh/3.2.2/bokeh.min.js"
		integrity="sha512-p7EUyPmeDeOwHiu7fIZNboAcQLxei3sWtXoHoShWWiPNUSRng/Xs5JPcaFPRa4dKy9IuHjyIQuLE4caGCwuewA=="
		crossorigin="anonymous" referrerpolicy="no-referrer"></script> 

	<title>Bokeh Charts</title> 
</head> 

<body> 

	<div class="container"> 
		<h1 class="text-center py-4">Responsive Chart with Bokeh, Flask and Python</h1> 
		<div class="row mb-5"> 
			<div class="col-md-6"> 
				<h4 class="text-center">Scatter Plot</h4> 
				{{ div[0] | safe }} 
				{{ script[0] | safe }} 
			</div> 
			<div class="col-md-6"> 
				<h4 class="text-center">Bar Chart</h4> 
				{{ div[1] | safe }} 
				{{ script[1] | safe }} 
			</div> 
		</div> 
		<div class="row"> 
			<div class="col-md-12"> 
				<h4 class="text-center">Line Chart</h4> 
				{{ div[2] | safe }} 
				{{ script[2] | safe }} 
			</div> 
		</div> 
	</div> 

</body> 

</html>


In [20]:
bokeh.__version__

NameError: name 'bokeh' is not defined