# BOKEH

En Python, una de las librerías más potentes para comunicar e interactuar con los resultados, **Bokeh** destaca por las siguientes características:
* Hace simple la creación de gráficos dinámicos.
* Permite crear widgets en los que mostrar la evolución de un gráfico con diferentes valores.
* Sus gráficos y cuadros de mando pueden ser publicados en páginas web o notebooks.
* Optimizada para trabajar con las librerías más importantes de Python: Pandas, Numpy, Scipy, OpenCV, Scikit-Learn...

Lo primero que realizaremos será importar la librería bokeh con la funcionalidad de mostrar los resultados de las gráficas dentro de notebook.

In [1]:
from bokeh.io import output_notebook, show

Ahora, es importante cerciorarnos de que bokeh puede trabajar correctamente, para ello cargaremos la función <code>**output_notebook**</code>

In [2]:
output_notebook()

Vemos que no arroja ningún mensaje de error, comenzaremos la creación de nuestro primer gráfico dinámico.

El primero elemento que tendremos que configurar es el espacio que ocupará nuestro gráfico, en otras palabras, estaremos inicializando el espacio gráfico. Para ello, utilizamos la función <code>__figure__</code> con los siguientes parámetros **plot_width**, **plot_height**

In [3]:
from bokeh.plotting import figure

In [4]:
p = figure(plot_width=400, plot_height=400)

Lo siguiente, será añadir el tipo de gráfico en sí. Bokeh soporta una gran cantidad de gráficos, comenzaremos por un gráfico lineal, pero se recomienda visualizar todos los tipos de gráficos principles que podemos realizar desde la función figure https://docs.bokeh.org/en/latest/docs/reference/plotting.html#bokeh-plotting

Así mismo, si queremos ver algunas demos de ejemplo sobre Dashboards, están disponibles en el siguiente link: https://docs.bokeh.org/en/latest/docs/gallery.html#gallery

Un gráfico de líneas lo realizaremos a través de la función <code>**line**</code>

In [5]:
p.line([1, 2, 3, 4, 5, 6, 7, 8] ,[20, 3, 12, 28, 15, 6, 19, 11])

Finalmente, para mostrar el gráfico hacemos uso de la función importada de bokeh.io <code>**show**</code>

In [6]:
show(p)

Vemos que aparece nuestro gráfico y a diferencia de otros paquetes de visualización, podemos desplazarnos en el gráfico, hacer zoom, mover con la rueda del ratón y guardar el gráfico de forma muy simple a través del menú de opciones.

Agregamos nuevos parámetros.

In [24]:
p = figure(plot_width=400, plot_height=400)

p.line([1, 2, 3, 4, 5, 6, 7, 8] ,[20, 3, 12, 28, 15, 6, 19, 11], 
       color = 'red', line_width=5, line_alpha = 0.5)
show(p)

Mostramos otro estilo de gráfico, un scatter plot, utilizamos la función <code>**circle**</code>

In [8]:
p = figure(plot_width=500, plot_height=500)

p.circle([1, 2, 3, 4, 5, 6, 7, 8] ,[20, 3, 12, 28, 15, 6, 19, 11], 
       color = 'red', line_width=5, line_alpha = 0.5)
show(p)

Añadimos más opciones y, en esta ocasión en lugar de utilizar listas, vamos a comprobar su integración con arrays.

In [9]:
p = figure(plot_width=500, plot_height=500)

import numpy as np

normal = np.random.rand(100)
square = normal**2

p.circle(normal ,square, 
         fill_color  = 'lightgreen',
         line_alpha = 0.8,
         line_color = 'red',
         radius = 0.01)
show(p)

También es posible combinar dos estilos de gráfico juntos. Probaremos a realizar un scatter plot de dos maneras, a través de círculos <code>**circle**</code> y cuadrados <code>**square**</code>

In [10]:
p = figure(plot_width=500, plot_height=500)

import numpy as np

normal = np.random.rand(100)
square = normal**2
cubic = normal**3
polynomic = normal**4


p.circle(normal ,square, 
         fill_color  = 'lightgreen',
         line_alpha = 0.8,
         line_color = 'red',
         radius = 0.01)

p.square(cubic ,polynomic, 
         fill_color  = 'lightblue',
         line_alpha = 1,
         line_color = 'brown',
         size = 8)
show(p)

Para añadir texto a nuestra visualización, tenemos que acceder a los propios atributos de nuestro objeto **figure**, para añadir texto en los ejes x e y tenemos que acceder a los siguientes atributos:
* **xaxis**
* **yaxis**

Para ambos atributos, dispondremos del atributo **axis_label**, el título de un gráfico podemos añadir a través del parámetro **title** dentro de la función figure cuando inicializamos el gráfico

In [11]:
p = figure(plot_width=500, plot_height=500, title='Transformaciones de distribución normal')

normal = np.random.rand(100)
square = normal**2
cubic = normal**3
polynomic = normal**4

p.circle(normal ,square, 
         fill_color  = 'lightgreen',
         line_alpha = 0.8,
         line_color = 'red',
         radius = 0.01)

p.square(cubic ,polynomic, 
         fill_color  = 'lightblue',
         line_alpha = 1,
         line_color = 'brown',
         size = 8)

p.xaxis.axis_label = 'Valor de distribución X'
p.yaxis.axis_label = 'Valor de distribución Y'

show(p)

También podemos cambiar elementos descriptivos de los ejes

In [12]:
p = figure(plot_width=500, plot_height=500, title='Transformaciones de distribución normal')

normal = np.random.rand(100)
square = normal**2
cubic = normal**3
polynomic = normal**4


p.circle(normal ,square, 
         fill_color  = 'lightgreen',
         line_alpha = 0.8,
         line_color = 'red',
         radius = 0.01)

p.square(cubic ,polynomic, 
         fill_color  = 'lightblue',
         line_alpha = 1,
         line_color = 'brown',
         size = 8)

p.xaxis.axis_label = 'Valor de distribución X'
p.yaxis.axis_label = 'Valor de distribución Y'

p.yaxis.major_label_text_color = "red"
p.yaxis.major_label_orientation = "vertical"

p.xaxis.axis_line_width = 2
p.xaxis.axis_line_color = "blue"
p.xaxis.major_label_text_color = "blue"


show(p)


A continuación, mostraremos cómo generar un diagrama de barras, primero vamos a diseñar un dataframe sencillo.

In [13]:
import pandas as pd
items = ['Naranjas', 'Fresas', 'Manzanas', 'Plátanos', 'Mango']
volumen_venta = np.random.randint(100, 1000, 5)
ingresos_totales = np.random.randint(1000, 25000, 5)

df = pd.DataFrame({
    'Productos': items,
    'Volumen': volumen_venta,
    'Ingresos': ingresos_totales
})

Seguidamente, con <code>**vbar**</code> mostraremos un diagrama de barras sobre el volumen de ventas por producto.

In [14]:
p = figure(x_range=df['Productos'], plot_height=350, 
           title="Volumen de ventas")

p.vbar(x=df['Productos'], top=df['Volumen'], 
       width=0.9, 
       fill_color=['#DF5837', '#A9E915', '#CA09A9', '#1E82A8', '#F9E13A'], 
       fill_alpha=0.6)

# Podemos generar colores en hexadecimal con https://htmlcolorcodes.com/

show(p)

Aunque de una forma algo más compleja que utilizando Seaborn o Ggplot, en Bokeh también podemos generar gradientes de color en función de una variable. Para ello tenemos que tener en cuenta tres funciones:
* <code>__LinearColorMapper__</code>: Pasamos como parámetros **palette**, que toma valor de una paleta de colores que podemos encontrar disponbiles en el siguiente enlace https://docs.bokeh.org/en/latest/docs/reference/palettes.html#bokeh-palettes **low**: Valor mínimo de la variable, **high**: Valor máximo de la variable. Generamos una secuencia de colores en función del rango de nuestra variable.
* <code>**ColorBar**</code>: Dentro de los parámetros que recibe, el más importante es **color_mapper** que recibe un objeto generado previamente LinearColorMapper. Esta función genera una leyenda con los colores de nuestra variable.
* Dentro de la función de nuestro gráfico, en este caso nube de puntos, en el parámetro color utilizaremos la función <code>**transform**</code> a la cuál pasaremos el nombre de la columna y nuestro objeto LinearColorMapper.


In [15]:
from bokeh.models import LinearColorMapper, ColorBar
from bokeh.transform import transform

color_mapper = LinearColorMapper(palette="Viridis256", low=df.Ingresos.min(), 
                                 high=df.Ingresos.max())
color_bar = ColorBar(color_mapper=color_mapper, label_standoff=12, location=(0,0), 
                     title='Ingresos')

p = figure(x_axis_label='Volumen de ventas', # Otra forma de añadir texto en los ejes
           y_axis_label='Ingresos totales', 
           plot_height=400)

p.circle(x='Volumen', y='Ingresos', 
         color=transform('Ingresos', color_mapper), 
         size=20, alpha=0.6, 
         source=df)

p.add_layout(color_bar, 'right') # Posición del gradiente de color

show(p)

Algo que todavía no hemos mostrado es podemos desactivar el panel lateral para gestionar el gráfico añadiendo los siguientes parámetros a la función figure.
* **tools**: Lo dejamos vacío
* **toolbar_location**: Valor None

In [16]:
color_mapper = LinearColorMapper(palette="Viridis256", low=df.Ingresos.min(), high=df.Ingresos.max())
color_bar = ColorBar(color_mapper=color_mapper, label_standoff=12, location=(0,0), title='Ingresos')

p = figure(x_axis_label='Volumen de ventas', # Otra forma de añadir texto en los ejes
           y_axis_label='Ingresos totales', 
           plot_height=400, 
           tools='', toolbar_location=None)

p.circle(x='Volumen', y='Ingresos', 
         color=transform('Ingresos', color_mapper), 
         size=20, alpha=0.6, 
         source=df)

p.add_layout(color_bar, 'right') # Posición del gradiente de color

show(p)

Finalmente, mostraremos cómo añadir elementos dinámicos a un gráfico, es decir, cuando pasemos el cursor por un elemento del gráfico éste nos muestre información. Esto en Bokeh se consigue a través de **HoverTool**, se trata de una función que integra funcionalidades para mostrar diferentes elementos textuales en los datos. Es importante mencionar que para poder utilizar las funciones de HoverTool, también tenemos que pasar nuestros datos a un tipo especial de Bokeh, llamado sources, para ello, utilizaremos **ColumnDataSource**. El funcionamiento por lo tanto es el siguiente.
* Tomaremos el set de datos y lo pasaremos a la función <code>**ColumnDataSource**</code>, sources nos devolverá los tipos de columnas que podemos mostrar en nuestro gráfico, por ejemplo, si pasamos a la función un conjunto de datos previamente agrupado con groupby, nos permitirá acceder a estadísticas básicas como mínimo, máximo, media y cuartiles, pudiendo posteriormente, proyectar esta información en el gráfico.
* Ahora cuando vayamos a definir el tipo de gráfico, no utilizaremos como tal los nombres de las columnas del dataframe, si no las de sources.
* Cuando hayamos definido el tipo de gráfica llamaremos a la función <code>**HoverTool**</code> y, a su atributo **tooltips** en el cuál pasaremos con la siguiente estructura la información a proyectar: 'Nombre que se mostrará': @columna_de_source.

In [17]:
from bokeh.models import ColumnDataSource, HoverTool
from bokeh.transform import factor_cmap
from bokeh.palettes import Spectral5

source = ColumnDataSource(df)
source.column_names

['index', 'Productos', 'Volumen', 'Ingresos']

Mostramos por lado otro ejemplo en el que hubíeramos realizado un groupby.

In [18]:
groups = df.groupby(by=['Productos'])
source_dos = ColumnDataSource(groups)
source_dos.column_names

['Productos',
 'Volumen_count',
 'Volumen_mean',
 'Volumen_std',
 'Volumen_min',
 'Volumen_25%',
 'Volumen_50%',
 'Volumen_75%',
 'Volumen_max',
 'Ingresos_count',
 'Ingresos_mean',
 'Ingresos_std',
 'Ingresos_min',
 'Ingresos_25%',
 'Ingresos_50%',
 'Ingresos_75%',
 'Ingresos_max']

In [19]:
products = source.data['Productos'].tolist()

p = figure(x_range = products,
           plot_height=350, 
           title="Volumen de ventas")

color_map = factor_cmap(field_name='Productos',
                    palette=Spectral5, factors=products)

p.vbar(x='Productos', top='Volumen', source = source,
       width = 0.5, color=color_map)

# Podemos generar colores en hexadecimal con https://htmlcolorcodes.com/

hover = HoverTool()
hover.tooltips=[
    ('Volumen de ventas', '@Volumen'),
    ('Ingresos totales', '@Ingresos')
]

p.add_tools(hover)

# Podemos generar colores en hexadecimal con https://htmlcolorcodes.com/

show(p)

In [20]:
from bokeh.io import output_file, show
from bokeh.plotting import figure
from bokeh.sampledata.periodic_table import elements
from bokeh.transform import dodge, factor_cmap

output_file("periodic.html")

periods = ["I", "II", "III", "IV", "V", "VI", "VII"]
groups = [str(x) for x in range(1, 19)]

df = elements.copy()
df["atomic mass"] = df["atomic mass"].astype(str)
df["group"] = df["group"].astype(str)
df["period"] = [periods[x-1] for x in df.period]
df = df[df.group != "-"]
df = df[df.symbol != "Lr"]
df = df[df.symbol != "Lu"]

cmap = {
    "alkali metal"         : "#a6cee3",
    "alkaline earth metal" : "#1f78b4",
    "metal"                : "#d93b43",
    "halogen"              : "#999d9a",
    "metalloid"            : "#e08d49",
    "noble gas"            : "#eaeaea",
    "nonmetal"             : "#f1d4Af",
    "transition metal"     : "#599d7A",
}

TOOLTIPS = [
    ("Name", "@name"),
    ("Atomic number", "@{atomic number}"),
    ("Atomic mass", "@{atomic mass}"),
    ("Type", "@metal"),
    ("CPK color", "$color[hex, swatch]:CPK"),
    ("Electronic configuration", "@{electronic configuration}"),
]

p = figure(title="Periodic Table (omitting LA and AC Series)", plot_width=1000, plot_height=450,
           x_range=groups, y_range=list(reversed(periods)),
           tools="hover", toolbar_location=None, tooltips=TOOLTIPS)

p.rect("group", "period", 0.95, 0.95, source=df, fill_alpha=0.6, legend="metal",
       color=factor_cmap('metal', palette=list(cmap.values()), factors=list(cmap.keys())))

text_props = {"source": df, "text_align": "left", "text_baseline": "middle"}

x = dodge("group", -0.4, range=p.x_range)

r = p.text(x=x, y="period", text="symbol", **text_props)
r.glyph.text_font_style="bold"

r = p.text(x=x, y=dodge("period", 0.3, range=p.y_range), text="atomic number", **text_props)
r.glyph.text_font_size="8pt"

r = p.text(x=x, y=dodge("period", -0.35, range=p.y_range), text="name", **text_props)
r.glyph.text_font_size="5pt"

r = p.text(x=x, y=dodge("period", -0.2, range=p.y_range), text="atomic mass", **text_props)
r.glyph.text_font_size="5pt"

p.text(x=["3", "3"], y=["VI", "VII"], text=["LA", "AC"], text_align="center", text_baseline="middle")

p.outline_line_color = None
p.grid.grid_line_color = None
p.axis.axis_line_color = None
p.axis.major_tick_line_color = None
p.axis.major_label_standoff = 0
p.legend.orientation = "horizontal"
p.legend.location ="top_center"

show(p)

