<table>
<col width="250">
<col width="750">
<tr>
<td><img src="https://centrocien.wordpress.com/wp-content/uploads/2014/08/sin-tc3adtulo4.jpg?w=300&h=167" align="middle" style="width:250px;height:125px;"/></td>
<td>
Francisco Javier Navarro Barrón <a href="fj.navarro.barron@tec.mx">fj.navarro.barron@tec.mx</a>. <br>
Profesor y coordinador de concentración
<br>
Escuela de Ingeniería y Ciencias
<br>
Instituto Tecnológico y de Estudios Superiores de Monterrey
</td>
</tr>
</table>
<br><center><p style="font-family: Ubuntu; font-size:1.1em;color:#0957a3; font-style:bold">
Unidad de Formación 5 - Visualización de Datos</p></center><br>

<center><h1 style="font-family: Ubuntu; font-size:1.3em;color:#0957a3">Bokeh</h1></center>
<br>
<center><h2 style="font-family: Ubuntu; font-size:1.0em;color:#0957a3; font-style:bold">Una introducción con gráficas básicas</h2></center>

# Bokeh
**Bokeh** es una biblioteca de *Python* para crear visualizaciones **interactivas** para navegadores web modernos. Te puede ayudar a crear gráficos visualmente estéticos, que van desde gráficos simples hasta tableros complejos con conjuntos de datos dinámicos. Con Bokeh, puedes crear visualizaciones basadas en *JavaScript* sin tener que escribir código JavaScript por ti mismo.

## Setup
Con el siguiente comando, se instalará o actualizará la biblioteca Bokeh en tu entorno.

In [None]:
%pip install bokeh --upgrade

Ahora importaremos **bokeh** y verificaremos la versión instalada.

In [3]:
import bokeh
bokeh.__version__

'3.6.1'

## Graficación básica usando Bokeh
**Bokeh** es una biblioteca de visualización de datos interactiva que proporciona una construcción elegante y concisa de lo que inician los gráficos y permite una interactividad de alto rendimiento o trabaja con conjuntos de datos de gran tamaño o en streaming.

1. Primero selecciona entre los componentes básicos de Bokeh para crear una visualización.
2. Personalice estos bloques de construcción para que se ajusten a sus necesidades.

Bokeh tiene dos componentes:
1. Una biblioteca básica para definir el contenido y las funcionalidades interactivas de su visualización.
2. Una biblioteca de *JavaScript* llamada *Bokeh Js* que funciona en segundo plano para mostrar su visualización interactiva en un navegador web.

Por lo tanto, es bueno para la visualización interactiva en navegadores modernos, documentos html independientes o similares, donde proporciona gráficos de estilo expresivo, grandes datos dinámicos y/o de transmisión.

En este **notebook**, vamos a crear gráficas básicas, para empezar, primero importaremos las bibliotecas necesarias.

In [4]:
# Importamos librerias basicas
from bokeh.plotting import figure

# Bokeh.io habilita funciones para desplegar gráficas
from bokeh.io import output_file, output_notebook, save, show

output_notebook() # configurar Bokeh para mostrar graficos en el notebook

In [5]:
# 1. Crear el "contenedor"
f = figure(width=400, height=200, tools='reset, pan')

# 2. Agregar al contenedor el/los gráfico(s)
f.line([10, 20, 30, 40, 50], [60, 70, 85, 15, 32], line_width=10) # x, y

# 3. Mostar la figura
show(f)

## Output methods

Bokeh ofrece una variedad de formas de producir resultados interactivos. Las dos funciones siguientes son las más comunes:

* `output_file()` Genera documentos HTML independientes simples para visualizaciones Bokeh.
* `output_notebook()` Muestra visualizaciones Bokeh en cuadernos Jupyter.

Estas funciones de salida generalmente se usan junto con `show()` o `save()`. Aquí hay un ejemplo que genera un archivo HTML:

In [None]:
output_file('mi_archivo.html')
save(f)

## La interfaz bokeh.plotting
`bokeh.plotting` es la interfaz principal de Bokeh. Esta interfaz de propósito general es similar a las interfaces de trazado de bibliotecas como *Matplotlib* o *Matlab*.

La interfaz `bokeh.plotting` le permite centrarse en relacionar los glifos con los datos. Reúne automáticamente gráficos con elementos predeterminados, como ejes, cuadrículas y herramientas.

La función `figure()` es el núcleo de la interfaz `bokeh.plotting`. Esta función crea un modelo `figure()` que incluye métodos para agregar diferentes tipos de *glifos* a un gráfico. Esta función también se encarga de componer los distintos elementos de su visualización, como ejes, cuadrículas y herramientas.

A continuación se muestra un ejemplo de `bokeh.plotting`, junto con el gráfico resultante:

In [6]:
# 1. Crear el "contenedor"
f = figure(width=500, height=300, tools='save')
# 2. Agregar al contenedor el/los gráfico(s)
f.circle([1, 2, 3, 4, 5], [6, 7, 8, 5, 3], radius=0.2, alpha=0.5) # x, y
f.circle([2, 3, 1, 1.5], [1, 2.5, 3, 6], radius=0.5, color='red', alpha=0.5)
f.title = '2 conjuntos de circulos'
# 3. Mostar la figura
show(f)

Llamar a la función `figure()` es todo lo que se necesita para crear un objeto de graficación básica. Para agregar renderizadores de datos a tu objeto de trazado, llama a un método *glyph* como `figure.circle`. No tienes que preocuparte por los ejes y las cuadrículas (aunque puedes configurarlos si quieres), y sólo necesitas enumerar las herramientas que deseas agregar. Para mostrar su visualización en un navegador, en la mayoría de los casos, todo lo que necesitas hacer es llamar a la función de salida `show()`.

## Graficación usando Glyphs
Puedes combinar múltiples *glyphs* en un solo gráfico llamando a sus métodos en una sola `figure()`.

In [7]:
from bokeh.models import Legend
# 1. Crear el "contenedor"
f = figure(width=500, height=300)
x = [1,2,3,4]
y = [2,3,1,1.5]
# 2. Agregar al contenedor el/los gráfico(s)
f.line(x, y, line_width=2, legend_label='Linea')
f.circle(x, y, radius=0.2, color='red', alpha=0.5, legend_label='Circulos')
# 3. Mostar la figura
show(f)

Para obtener más información sobre los "glifos" de Bokeh, consulta: https://docs.bokeh.org/en/3.0.1/docs/user_guide/basic.html

## Data Sources
Hasta ahora, hemos creado los gráficos de Bokeh utilizando datos de entrada manual mediante listas de Python pero, ¿podemos hacerlo mejor incorporando otras estructuras de datos?

### Numpy Data
De manera similar al uso de listas y arrays de Python, también se puede trabajar con estructuras de datos *NumPy* en Bokeh:

In [8]:
import numpy as np
# Numpy arrays
x = np.arange(0, 10, 0.1)
sin_x = np.sin(x)
cos_x = np.cos(x)

p = figure(width=300, height=300)
p.line(x, sin_x, line_width=2)
p.line(x, cos_x, line_width=3, color='green')

p.title = 'Funciones trigonometricas'

show(p)

### ColumnDataSource
ColumnDataSource (CDS) es el núcleo de la mayoría de los gráficos Bokeh. Se utiliza para proporcionar los datos a los glifos de tu gráfico.

Cuando pasas secuencias como listas de Python o matrices *NumPy* a un renderizador Bokeh, Bokeh crea automáticamente un **ColumnDataSource** con estos datos por ti. Sin embargo, crear un CDS nos da acceso a opciones más avanzadas.

Por ejemplo: La creación de tu propio **ColumnDataSource** te permite compartir datos entre varios gráficos y *widgets*. Si utilizas un único CDS junto con varios renderizadores, estos también comparten información sobre datos seleccionados con una herramienta de selección de la barra de herramientas de Bokeh.

Para crear un objeto CDS básico, necesitas un diccionario de Python para pasarlo al parámetro de datos del objeto:
* Bokeh usa las **llaves** del diccionario como nombres de **columna**.
* Los valores del diccionario se utilizan como valores de datos para el **ColumnDataSource**.

In [11]:
from bokeh.models import ColumnDataSource

diccionario = {'X': [1,2,3,4,5],
               'Y': [4,2,5,3,9]}
# pasamos el diccionario a CDS
cds = ColumnDataSource(data=diccionario)
type(cds)

bokeh.models.sources.ColumnDataSource

### Graficando con un ColumnDataSource
Para usar un `ColumnDataSource` con una función de renderizado, necesitas pasar al menos estos tres argumentos:
*    `x`: el nombre de la columna del ColumnDataSource que contiene los datos para los valores `x` de tu gráfico
*    `y`: el nombre de la columna del ColumnDataSource que contiene los datos para los valores `y` de tu gráfico
*    `source`: el nombre del ColumnDataSource que contiene las columnas que acabas de referenciar para los argumentos `x` e `y`.

Por ejemplo:

In [13]:
p = figure(width=300, height=300)
p.circle(x='X', y='Y', source=cds, radius=0.2, color='red') # Indicar
show(p)

### Dataframes de Pandas
El parámetro de datos también puede ser un DataFrame de pandas o un objeto GroupBy: `source = ColumnDataSource(df)`

Si usas un DataFrame de pandas, el `ColumnDataSource` resultante en Bokeh tendrá columnas que corresponden a las columnas del DataFrame. La nomenclatura de las columnas sigue estas reglas:

* Si el `DataFrame` tiene una columna llamada `index`, el `ColumnDataSource` también tendrá una columna con este nombre.

* Si el nombre del `index` es `None`, el `ColumnDataSource` tendrá un nombre genérico: ya sea `index` (si ese nombre está disponible) o `level_0`.

In [14]:
import pandas as pd

df = pd.DataFrame(diccionario) # Creamos un  DF a partir de un diccionario.
# Puede variar: read_csv(), read_excel(), etc
print(type(df))

pd_cds = ColumnDataSource(df) # Pasamos de DataFrame a CDS
print(type(pd_cds))

<class 'pandas.core.frame.DataFrame'>
<class 'bokeh.models.sources.ColumnDataSource'>


In [15]:
p = figure(width=300, height=300)
p.circle(x='X', y='Y', source=pd_cds, radius=0.2, color='red') # Indicar nombres de variables/columnas en el CDS
show(p)

### Datos de muestra (sampledata)
El módulo `sampledata` se puede utilizar para obtener conjuntos de datos utilizados en ejemplos de Bokeh.

En el siguiente ejemplo importaremos datos de muestra y crearemos un **gráfico de dispersión** del dataset *penguins*. Ademas, mapearemos elementos adicionales como **markers** para ayudarnos a distinguir entre diferentes categorías.

In [None]:
%pip install bokeh_sampledata

In [19]:
from bokeh.sampledata.penguins import data
from bokeh.transform import factor_cmap, factor_mark

SPECIES = data.species.unique() # Valores unicos de especies para el mapeo
MARKERS = ['hex', 'circle_x', 'triangle']

# Crear figura
p = figure(width=500, height=600, title='Penguins')
p.xaxis.axis_label='bill length (mm)'
p.yaxis.axis_label='flipper length (mm)'
p.scatter('bill_length_mm', 'flipper_length_mm', source=data,
          legend_group='species', size=10,
          color=factor_cmap('species', 'Category10_3', SPECIES),
          marker=factor_mark('island', MARKERS, data.island.unique()))
p.legend.location = 'top_left'
show(p)

In [21]:
type(data)

pandas.core.frame.DataFrame

## Gráficos de series temporales
Bokeh puede manejar automáticamente muchos tipos de datos de fecha y hora, por ejemplo, datos `datetime` de *Numpy* y *Pandas*.

In [22]:
from bokeh.sampledata.us_marriages_divorces import data
data.head(3)

Unnamed: 0,Year,Marriages,Divorces,Population,Marriages_per_1000,Divorces_per_1000
0,1867,357000.0,10000.0,36970000,9.7,0.3
1,1868,345000.0,10000.0,37885000,9.1,0.3
2,1869,348000.0,11000.0,38870000,9.0,0.3


Podemos comenzar con lo más básico para graficar series de tiempo...

In [23]:
p = figure(height=300, width=900, title='Matrimonios vs Divorcios')
p.line('Year', 'Marriages', source=data, color='pink', line_width=2, legend_label='Bodorrios')
p.line('Year', 'Divorces', source=data, color='black', line_width=2, legend_label='Divorcios')
p.xaxis.axis_label='Años'
p.yaxis.axis_label='Num. de trámites'
show(p)

También podemos dar un paso más en la mejora de los gráficos...

### Herramienta de rango (Range tool)
A menudo es deseable poder hacer zoom en una región de una serie de tiempo mientras se sigue viendo una vista de la serie completa para tener contexto. Un `RangeTool` se puede usar para definir interactivamente una región en un gráfico que resulta en una vista ampliada en otro gráfico. Esto se demuestra a continuación:

In [24]:
from bokeh.layouts import column # para apilar las graficas en una "columna"
from bokeh.models import RangeTool # para incluir una herramienta que controla el rango

# Generar el CDS
source = ColumnDataSource(data=dict(date=data['Year'], Marriages=data.Marriages_per_1000,
                                     Divorces=data.Divorces_per_1000))
#####################################
p = figure(height=300, width=800, title='Bodorrios vs Divorcios',
           x_range=(data.loc[20, 'Year'], data.loc[60, 'Year'])) # cambiamos el rango por defecto

# Agregar las lineas de tiempo
p.line('date', 'Marriages', source=source, color='red', line_width=2, legend_label='Bodorrios')
p.line('date', 'Divorces', source=source, color='black', line_width=2, legend_label='Divorcios')

p.xaxis.axis_label='Años'
p.yaxis.axis_label='Num. de trámites'
#####################################
# Contenedor del RangeTool
select = figure(title='Arrastra la caja para cambiar el rango',
                y_range=p.y_range, height=120, width=800, y_axis_type=None,
                tools="", toolbar_location=None, background_fill_color="#efefef")
##########################################
range_tool = RangeTool(x_range = p.x_range) # "enlazar" el rango horizontal: años

select.line('date', 'Marriages', source=source)
select.line('date', 'Divorces', source=source)

select.add_tools(range_tool) # agregamos el range tool a su contenedor

show(column(p, select))

<p style="font-family: Ubuntu; font-size:1.5em;color:blue; font-style:bold">ACTIVIDAD</p>

Usando el Dataset de “*stocks*” (disponible en Bokeh), crear 2 gráficas con las comparativas: *Open/Close* y *high/low*

```
from bokeh.sampledata.stocks import AAPL
AAPL.keys()
```

Modalidad: Individual