# Visualización II

## Bokeh

Bokeh es una biblioteca de visualización interactiva de Python que se dirige a navegadores web modernos para su presentación. Su objetivo es proporcionar una construcción elegante y concisa de gráficos novedosos al estilo de D3.js y ampliar esta capacidad con interactividad de alto rendimiento en conjuntos de datos de gran tamaño o de streamming. Bokeh puede ayudar a cualquiera que desee crear trazados interactivos, cuadros de mando y aplicaciones de datos de manera rápida y fácil.


Los pasos básicos para crear gráficos con la interfaz de bokeh.plotting son:

 1. Prepare algunos datos 
 2. Dígale a Bokeh dónde generar la salida (en este caso usando `output_file()`).
 3. Llame a  `figure()`  para crear una gráfica con algunas opciones generales como títulos, herramientas y etiquetas de ejes.
 4. Agregue renderizadores (en este caso, `Figure.line`) para nuestros datos, con personalizaciones visuales como colores, leyendas y anchos para la trama.
 5. Pídale a Bokeh que `show()` o `save()` los resultados.

In [1]:
#!pip install bokeh

## Ejemplo Simple

Aquí hay un primer ejemplo simple. Primero importaremos la función `figure` de `bokeh.plotting`, lo que nos permitirá crear todo tipo de tramas interesantes fácilmente. También importamos las funciones `ouptut_notebook` y `show` de  `bokeh.io`, que nos permiten mostrar nuestros resultados en línea en la notebook.

In [2]:
from bokeh.plotting import figure
from bokeh.io import output_notebook, show, save

A continuación, le diremos a Bokeh que muestre sus gráficos directamente en la notebook. Esto hará que todo el Javascript y los datos sean insertados directamente en el HTML de la computadora portátil. (Bokeh puede mostrar directamente en archivos HTML o usar un servidor).

In [3]:
output_notebook()

Importamos NumPy y generamos algunos datos.

In [4]:
import numpy as np
from numpy import cos, linspace

x = linspace(-6, 6, 100)
y = ( 1 / (2 * np.pi) ** 2 ) * np.exp( - ( x ** 2 ) / 2 )

Ahora llamaremos a la función `figure` de Bokeh para crear un plot  `p`. Luego llamamos al método  `circle()` del plot para representar un círculo rojo en cada uno de los puntos en x e y.

Podemos interactuar de inmediato con el plot:

* haga clic y arrastre alrededor de la trama.
* la rueda del mouse se acercará y alejará (después de habilitarla en la barra de herramientas)

La siguiente barra de herramientas es la predeterminada que está disponible para todos los gráficos. Se puede configurar más a través del keyword argument `tools`.





In [5]:
#output_notebook()
p = figure(width=500, height=500)
p.circle(x, y, size=7, color="firebrick", alpha=0.5)
show(p)
save(p)

'C:\\Users\\catal\\AppData\\Local\\Temp\\tmpxmg27rrw.html'

## Bar Plot 


El modelo de display de Bokeh se basa en la composición de primitivas gráficas que están ligadas a series de datos. Esto es similar en espíritu a Protovis y D3, y diferente de la mayoría de las otras bibliotecas de trazado de Python.

Un ejemplo un poco más sofisticado demuestra esta idea.

Bokeh se envía con un pequeño conjunto de "datos de muestra" interesantes en el paquete  `bokeh.sampledata` . Cargaremos algunos datos históricos de kilometraje del automóvil.

In [6]:
from bokeh.sampledata.autompg import autompg

In [7]:
autompg.head()

Unnamed: 0,mpg,cyl,displ,hp,weight,accel,yr,origin,name
0,18.0,8,307.0,130,3504,12.0,70,1,chevrolet chevelle malibu
1,15.0,8,350.0,165,3693,11.5,70,1,buick skylark 320
2,18.0,8,318.0,150,3436,11.0,70,1,plymouth satellite
3,16.0,8,304.0,150,3433,12.0,70,1,amc rebel sst
4,17.0,8,302.0,140,3449,10.5,70,1,ford torino


In [8]:
autompg[autompg["origin"]==3]

Unnamed: 0,mpg,cyl,displ,hp,weight,accel,yr,origin,name
14,24.0,4,113.0,95,2372,15.0,70,3,toyota corona mark ii
18,27.0,4,97.0,88,2130,14.5,70,3,datsun pl510
29,27.0,4,97.0,88,2130,14.5,71,3,datsun pl510
31,25.0,4,113.0,95,2228,14.0,71,3,toyota corona
52,31.0,4,71.0,65,1773,19.0,71,3,toyota corolla 1200
53,35.0,4,72.0,69,1613,18.0,71,3,datsun 1200
56,24.0,4,113.0,95,2278,15.5,72,3,toyota corona hardtop
70,19.0,3,70.0,97,2330,13.5,72,3,mazda rx2 coupe
80,28.0,4,97.0,92,2288,17.0,72,3,datsun 510 (sw)
81,23.0,4,120.0,97,2506,14.5,72,3,toyouta corona mark ii (sw)


In [9]:
grouped = autompg.groupby("yr")
mpg = grouped["mpg"]
avg = mpg.mean()
std = mpg.std()
years = list(grouped.groups.keys())
american = autompg[autompg["origin"]==1]
japanese = autompg[autompg["origin"]==3]


Para cada año, queremos trazar la distribución de MPG dentro de ese año.

In [10]:
p = figure(title = "MPG by Year (Japan and US)")

p.vbar(x=years, bottom=avg-std, top=avg+std, width=0.8,
       fill_alpha=0.1, line_color=None, legend="MPG 1 stddev")

p.circle(x=japanese["yr"], y=japanese["mpg"], size=10, alpha=0.5,
         color="red", legend="Japanese")

p.triangle(x=american["yr"], y=american["mpg"], size=10, alpha=0.3,
           color="blue", legend="American")

p.legend.location = "bottom_right"
show(p)

## Linked Brushing

Para vincular plots a nivel de datos, podemos envolver de manera explícita los datos en un 
`ColumnDataSource`. Esto nos permite hacer referencia a columnas por nombre.

Podemos usar una herramienta de "selección" para seleccionar puntos en un plota, y los puntos vinculados en las otras plots resaltarán.

In [11]:
from bokeh.models import ColumnDataSource
from bokeh.layouts import gridplot

source = ColumnDataSource(autompg)

options = dict(plot_width=300, plot_height=300,
               tools="pan, wheel_zoom, box_zoom, box_select, lasso_select, reset")

p1 = figure(title="MPG by Year", **options)
p1.circle("yr", "mpg", color="blue", source=source)

p2 = figure(title="HP vs. Displacement", **options)
p2.circle("hp", "displ", color="green", source=source)

p3 = figure(title="MPG vs. Displacement", **options)
p3.circle("mpg", "displ", size="cyl", line_color="red", fill_color=None, source=source)

p = gridplot([[p1, p2, p3]])

show(p)

## Standalone HTML

Además de funcionar bien en la notebook, Bokeh también puede guardar plots en sus propios archivos HTML. Aquí está el ejemplo del diagrama de barra desde arriba, pero guardado en su propio archivo independiente.

Ahora cuando llamamos a `show ()` , también se abre una nueva pestaña del navegador con el gráfico. Si solo quisiéramos guardar el archivo, usaríamos `save ()` en su lugar.

In [12]:
from bokeh.plotting import output_file

output_file("barplot.html")

p = figure(title="MPG by Year (Japan and US)")

p.vbar(x=years, bottom=avg-std, top=avg+std, width=0.8, 
       fill_alpha=0.2, line_color=None, legend="MPG 1 stddev")

p.circle(x=japanese["yr"], y=japanese["mpg"], size=10, alpha=0.3,
         color="red", legend="Japanese")

p.triangle(x=american["yr"], y=american["mpg"], size=10, alpha=0.3,
           color="blue", legend="American")

p.legend.location = "top_left"
show(p)