In [2]:
from bokeh.plotting import figure, ColumnDataSource
from bokeh.io import output_file, show
import pandas as pd
from bokeh.models import CategoricalColorMapper

# What are glyphs?

En bokeh, las propiedades de las formas son llamadas glyphs. Las propiedades visuales de estos glyphs tales como posición o color, pueden ser asignadas mediante valores simples, por ejemplo, x = 10 o fill_color = 'red'.

# A simple scatter plot

A continuación vamos a proceder a realizar un simple **scatter plot**.

In [11]:
#Cargamos los datos 
df = pd.read_csv('literacy_birth_rate.csv')

#Obtenemos aquellas columnas que queremos representar
literacy = df.loc[:, 'female literacy'].values
fertility = df.loc[:, 'fertility'].values

#Nos creamos nuestra figura p
p = figure(x_axis_label = 'fertility (children per woman)', y_axis_label = 'female literacy (% population)')

#Agregamos un glyph de tipo círculo a nuestra figura 
p.circle(fertility, literacy)

#Guardamos el resultado en un fichero html
output_file('fertility_vs_literacy.html')

#mostramos el resultado
show(p)

# A scatter plot with different shapes

Podemos mostrar múltiples conjuntos de datos en una misma figura. Para esto basta con llamar a múltiples glyphs en una misma figura. Vamos a mostrar lo visto anteriormente pero dos regiones diferentes: África y Latino América.

In [24]:
#Obtenemos los datos que necesitamos
literacy_latinoamerica = df[df.Continent == 'LAT'].loc[:, 'female literacy'].values
fertility_latinoamerica = df[df.Continent == 'LAT'].loc[:, 'fertility'].values

literacy_africa = df[df.Continent == 'AF'].loc[:, 'female literacy'].values
fertility_africa = df[df.Continent == 'AF'].loc[:, 'fertility'].values

#Nos creamos la figura
p = figure(x_axis_label = 'fertility', y_axis_label = 'literacy')

#Agregamos un glyph de tipo círculo
p.circle(fertility_latinoamerica, literacy_latinoamerica)

#Agregamos un glyph de tipo cruz
p.x(fertility_africa, literacy_africa)

#Guardamos el resultado en un archivo html
output_file('fertility_vs_literacy_Africa_vs_Latinoamerica.html')

#Mostramos el resultado
show(p)

# Customizing your scatter plots

Los tres argumentos más importantes a la hora de personalizar nuestros glyphs son: color, tamaño y transparencia. Bokeh acepta colores como strings en hexadecimal, tuplas de valores RGB entre 0 y 255, y cualquiera de los 147 CSS colores.El tamaño viene dado por el tamaño de la pantalla, si toma el valor 100 quiere decir que ocupa toda la pantalla. Finalmente el parámetro alpha controla la transparencia de nuestro glyph, toma valores entre 0 y 1. Siendo 0 totalmente transparente y 1 completamente opaco.

In [25]:
#Nos creamos nuestra figura
p = figure(x_axis_label = 'fertility', y_axis_label = 'literacy')

#Agregamos un glyph de tipo circular de color azul, tamaño 10 y nivel de transparencia 0.8
p.circle(fertility_latinoamerica, literacy_latinoamerica, color = 'blue', size = 10, alpha = 0.8)

#Agregamos un glyph de tipo circular de color rojo, tamaño 10 y nivel de transparencia 0.8
p.circle(fertility_africa, literacy_africa, color = 'red', size = 10, alpha = 0.8)

#Nos creamos nuestro fichero de salida
output_file('fertility_vs_literacy_Africa_vs_Latinoamerica_personalizado.html')

show(p)

# Lines

Bokeh nos permite crear gráficos de línea, para ello dispones del glyph tipo **line()**.

In [31]:
#Cargamos los datos
df = pd.read_csv('aapl.csv', parse_dates = ['date'])

#Nos quedamos con aquellas columnas que nos queremos quedar
date = df.date.values
price = df.adj_close.values

#Nos creamos figura
p = figure(x_axis_type = 'datetime', x_axis_label = 'Date', y_axis_label = 'price')

#Nos creamos nuestro glyph de tipo línea
p.line(date, price)

#Nos generamos nuestro archivo de salida
output_file('line_basic_plot.html')

show(p)

# Lines and markers

Como ya hemos visto en una misma figura podemos mezclar distintos glyphs.

In [34]:
#Noss creamos la figura
p = figure(x_axis_type = 'datetime', x_axis_label = 'Date', y_axis_label = 'price')

#Nos creamos nuestro glyph de tipo línea
p.line(date, price)

#Nos creamos un glyph de tipo circular
p.circle(date, price, fill_color = 'white', size = 4)

#Nos generamos nuestro archivo de salida
output_file('line_plus_circle.html')

show(p)

# Patches

Mediante los glyphs de tipo **patches** podemos crear una gran cantidad de formas. Los **patches** toman como entrada una colección de listas dentro de una lista con valores que especificar los vértices en la direcciones x e y.

In [36]:
#Nos generamos los vérticas de nuestra figura
xs = [[1,5,5,1], [2,4,4,2], [1,3,5]]
ys = [[1,1,5,5], [1,1,3,3], [5,9,5]]

#Nos generamos nuestra figura
plot = figure()

#Nos generamos los glyphs
plot.patches(xs, ys, fill_color = ['red', 'brown', 'black'], line_color = 'white')

#Nos creamos nuestro fichero de salida
output_file('patches_house.html')

#Mostramos el resultado
show(plot)

El principal potencial de los patches es a la hora de crear mapas. Es decir, dadas unas coordenadas geográficas podemos generar un mapa.

# ColumnDataSource

Los objetos **ColumnDataSource** sono objetos tipo tabla que lo que hacen es mapear nombres de columnas en una secuencia de datos. Una cosa que debemos tener muy claro es que todos los elementos de un objeto de tipo **ColumnDataSource** deben tener exactamente la misma longitud.

Podemos crear un objeto de tipo **ColumnDataSource** directamente a partir de un objeto de tipo DataFrame.

In [41]:
#Cargamos los datos
df = pd.read_csv('sprint.csv')

#Nos creamos objeto de tipo ColumnDataSource
source = ColumnDataSource(df)

#Nos creamos la figura
p = figure(x_axis_label = 'Year', y_axis_label = 'Time')

#Nos creamos un glyph de tipo círculo
p.circle(x = 'Year', y = 'Time', color = 'color', size = 8, source = source)

#Nos creamos el fichero de salida
output_file('basic_example_ColumnDataSource.html')

#Vemos el resultado
show(p)

# Selection and non-selection glyphs (box_select and lasso_select)

A continuación vamos a agregar la herramienta **box_select**, esta herramienta nos permite mostrar puntos seleccionados de un determinado color y los puntos no seleccionados de un color diferente. 

In [44]:
#Nos creamos la figura con las herramientas
p = figure(x_axis_label = 'Year', y_axis_label = 'Time', tools = ['box_select', 'lasso_select'])

#Nos creamos el glyph circular
p.circle(x = 'Year', y = 'Time', selection_color = 'red', nonselection_alpha = 0.1, source = source)

#Nos creamos el fichero de salida
output_file('box_select_tool.html')

show(p)

# Hover glyphs

Los glyphs tipo Hover se tratan de inspectores de gráficos. 

In [48]:
from bokeh.models import HoverTool 

#Ejemplo básico de hline
hover = HoverTool(tooltips = None, mode = 'hline')

#Nos creamos la figura y agregamos la herramienta hover
p = figure(tools = [hover, 'crosshair'])

#Nos creamos el glyph tipo círculo
p.circle(x = 'Year', y = 'Time', color = 'color', size = 8, source = source, hover_color = 'red')

#Nos creamos el fichero de salida
output_file('hovertool.html')

show(p)

In [66]:
#Ejemplo en modo vline

#Cargamos los datos
df = pd.read_csv('glucose.csv')
df['indice'] = df.index

#Nos creamos objeti tipo ColumnDataSource
source = ColumnDataSource(df)

#Nos creamos la figura
p = figure(x_axis_label = 'ms', y_axis_label = 'glucose')

#Nos creamos el glyph de tipo círculo
p.circle(x = 'indice', y = 'glucose', size = 10, fill_color = 'grey', alpha = 0.1, line_color = None,
        hover_fill_color = 'firebrick', hover_alpha = 0.5, hover_line_color = 'white', source = source)

#Nos creamos la herramiento hover
hover = HoverTool(tooltips = None, mode = 'vline')

#Agregamos la herramienta a la figura
p.add_tools(hover)

#Nos creamos el fichero de salida
output_file('advanced_hovertool.html')

#Vemos el resultado
show(p)

E-1001 (BAD_COLUMN_NAME): Glyph refers to nonexistent column name: glucose, indice [renderer: GlyphRenderer(id='b1327ab4-a834-4cbd-9544-4b76062ff2f7', ...)]


# Colormapping

**CategoricalColorMapper** nos permite colorear de distintos colores nuestros glyphs, por ejemplo, nos permite colorear en función de un valor categórico.

In [6]:
#Cargamos los datos
df = pd.read_csv('auto-mpg.csv')

#Nos creamos nuestro objeto de tipo ColumnDataSource
source = ColumnDataSource(df)

#Nos creamos la figura
p = figure(x_axis_label = 'weight(lbs)', y_axis_label = 'miler-per-gallon')

#Nos creamos nuestro objeto de tipo ColorMapper
color_mapper = CategoricalColorMapper(factors = ['Europe', 'Asia', 'US'],
                                     palette = ['red', 'green', 'blue'])

#Agregamos nuestro glyph
p.circle(x = 'weight', y = 'mpg',
         color = {'field': 'origin', 'transform':color_mapper},
        legend = 'origin',
        source = source)

#Nos creamos nuestro fichero de salid
output_file('CategoricalColorMapper.html')

#Vemos el resultado
show(p)

E-1001 (BAD_COLUMN_NAME): Glyph refers to nonexistent column name: mpg, origin, weight [renderer: GlyphRenderer(id='26ac19ea-fd15-4aeb-a839-b251ffa47abc', ...)]
E-1001 (BAD_COLUMN_NAME): Glyph refers to nonexistent column name: mpg, origin, weight [renderer: GlyphRenderer(id='2c70bfde-49c6-42ab-8f62-df6a9b180059', ...)]
