       
<h1>Visualización 2</h1>        


## Objetivos de la clase

---

- Estudiar las librerias de visualización interactivas:

    - Plotly
    - Bokeh

### Introducción

---

En la clase *Visualización 1* vimos como realizar gráficos estáticos, es decir que no permiten analizarlos en forma dinámica, interactuando con ellos.

Python ofrece librerías que preparan los datos para una visualización donde el usuario sí puede interactuar.

Dos de las librerías más usadas actualmente son **Plotly** y **Bokeh**.

### Introducción

---

<div>
    <div class = "mapa">
        <img src='https://raw.githubusercontent.com/Digital-House-DATA/ds_blend_2021_img/master/M2/CLASE_13_Visualizacion_2/Presentacion/img/M2_CLASE_13_plotly_001.png' alt="logo bokeh" width=50% height=70% align="center">
    </div>
</div>

**Plotly** es una librería de Python que genera gráficos interactivos de *una manera sencilla*.

Basicámente podemos crear todos los gráficos que vimos hasta ahora: diagramas de líneas, de barras, de áreas, histogramas, etc, y otros como diagrama de burbujas. Ademas de disponer de una *grilla de gráficos, hovertool y animaciones*.

Se pueden mostrar usando *Jupyter notebooks*, grabarlos como *archivos html*, y también en una aplicación Web usando la *librería Dash*.

Tiene una versión web, que permite publicar los gráficos. Esa versión *online* se trabaja con el paquete *chart-studio*. No forma parte de esta clase.

### Plotly express

---

**Plotly Express** es una función de Plotly con una interfaz de alto nivel. Opera sobre una variedad de tipos de datos y genera figuras fáciles de trabajar en su estilo.

Todos los gráficos de esta clase los vamos a generar usando *Plotly Express*. 

Las funciones de Plotly Express devuelven un objeto de tipo `graph_objects.Figure` cuyos datos y layout se definen de acuerdo a los argumentos provistos.  Y que se muestra en la notebook con el método `show`.  Con `write_image` se graba en un archivo. 

El **esquema general** para crear gráficos es:

fig = px.chart_type(df, parameters) (*chart_type:* bar, scatter, etc. *df:* dataframe)

fig.update_layout(layout_parameters or add annotations)

fig.update_traces(further graph parameters)

fig.update_xaxis() # or update_yaxis

fig.show()

In [None]:
import numpy as np
import pandas as pd
import plotly.express as px
import plotly as pl
import matplotlib.pyplot as plt

In [None]:
df_tips = px.data.tips()
df_tips

In [None]:
# ploteos con matplotlib

df_tips.hist()

In [None]:
plt.figure(figsize=[10,5])
plt.plot(df_tips.tip,df_tips.total_bill,'o')
plt.xlabel('tip')
plt.ylabel('total_bill')
plt.grid(True)

# Scatter en plotly

In [None]:
px.scatter(df_tips,x='tip',y='total_bill')

### Diagrama de Barras

---
Con  `px.bar`, cada fila de un Dataframe se representa con una barra.

Podemos hacer diagramas de barras (bar), barras apiladas (stacked bar), y agrupadas por una variable categórica.

En este ejemplo, a partir del Dataframe df_tips, usamos las variables categóricas sex y time (en qué momento del día), para clasificar las barras por el total de propinas recibidas.

In [None]:
df_tips = px.data.tips()
df_tips.sample(3)

Con `px.bar` definimos los datos y ajustes generales. Con el parámetro `color` indicamos la tercera variable.

Con el método `update_layout` incorporamos otra información de estilo.

Pasando el mouse, observamos los valores de cada fila.

In [None]:
df_tips = px.data.tips() # Dataset de propinas

fig = px.bar(data_frame=df_tips, x="sex", y="total_bill", color='time', 
             width=700, height=350)

fig.update_layout(
    title='Propinas por sexo y tiempo',
    xaxis_tickfont_size=10,
    yaxis=dict(title='Total Propinas',titlefont_size=14,tickfont_size=10))

fig.show()

### Diagrama de burbujas

---
**Bubble chart** o diagrama de burbujas, es simplemente un diagrama *scatter o de dispersión*, donde el tamaño de cada punto representa el valor de una columna del dataframe.

Lo representamos con el parámetro `size`.

En este ejemplo, tenemos datos sobre la expectativa de vida (lifeExp), el producto interno bruto per cápita (gdpPercap) y la población (pop), por año, continente y país.

La burbuja o tamaño de cada punto, representa el valor de la variable pop.

In [None]:
data_gap = pd.read_csv('https://github.com/plotly/datasets/raw/master/gapminderDataFiveYear.csv', sep=',')

data_gap.sample(5)

### Bubble chart

---
Creamos un gráfico con los siguientes lineamientos:

* Scatter plot de expectativa de vida (lifeExp) versus PIB per cápita (gdpPercap), para el año 2007, para todos los países.

* El tamaño de los marcadores (burbujas) es creciente en función del tamaño de la población (pop).

* Cada continente (continent) se representa con un color distinto.

* El texto que se muestra al pasar el mouse, hover, tiene que tener como título el país (country).

* Creamos una barra para seleccionar el rango del eje x que queremos ver `fig.update_xaxes(rangeslider_visible=True)`

In [None]:
# El año 2007 para todos los países
data_year_mask = data_gap['year'] == 2007
data_year = data_gap.loc[data_year_mask, :] 
data_year.head(3)

In [None]:
fig = px.scatter(data_frame = data_year, x = "gdpPercap", y = "lifeExp",
                 size = "pop", color = "continent", opacity = 0.6,
                 hover_name="country", width=700, height=500)

fig.update_xaxes(rangeslider_visible=True)

fig.show()

### Facet

---
**Facet** es la facilidad que brinda *Plotly* para generar múltiple gráficos vinculados, similar a *gridplot* en Bokeh.

El valor del argumento `facet_col` (o `facet_row`) crea los gráficos vinculados, donde las distintas columnas de la grilla de gráficos corresponden a los diferentes valores de la columna indicada por el argumento.

El valor de `facet_col_wrap` indica el máximo número de columnas que tendrá el gráfico.

En este ejemplo, la columna year indica que cada columna de la grilla corresponde a un año. 

In [None]:
fig = px.scatter(data_gap, x = 'gdpPercap', y = 'lifeExp',
                color = 'continent', size = 'pop',
                facet_col = 'year', facet_col_wrap = 3)
fig.show()

### Animaciones

---
Las animaciones son gráficos que muestran un "movimiento" de acuerdo a los valores de alguna columna.

El valor del argumento `animation_frame` indica la columna sobre la cual el gráfico evoluciona, o dicho de otra forma, el que define cada cuadro (frame) de la animación. Generalmente es una variable de tiempo.

El valor del argumento `animation_group` indica la columna que provee la consistencia entre los frames; los registros que coinciden en el valor de animation_group representan el mismo objeto en todos los frames. En el ejemplo, la columna country indica que todos los registros de un país se consideran relacionados en todos los frames.

`range_x` y `range_y` definen el rango de valores de los ejes x e y respectivamente. Si el valor del argumento `log_x` (`log_y`) es True, la escala del eje x (eje y) es logarítmica. Los rangos deben asegurar que todos los datos sean visibles, que no salgan de los rangos. 

Generemos ahora una animación sobre los años usando como base el bubble chart que generamos anteriormente.

In [None]:
fig = px.scatter(data_gap, 
           x = "gdpPercap", y = "lifeExp", 
           animation_frame = "year", animation_group = "country",
           size = "pop", color = "continent", hover_name="country",
           log_x=True, size_max=55, range_x=[100,100000], range_y=[25,90])
fig.show()

# Geovisualizacion sin geopandas, es posible?

Alternativas para plotear puntos y polygonos

In [None]:
data=pd.read_csv('https://raw.githubusercontent.com/carabedo/labs/master/data/properati_caba.csv',delimiter='\t')

In [None]:
data

In [None]:
df=data.sample(300)


fig = px.scatter_mapbox(df, lat="lat", lon="lon", zoom=5, height=600)
fig.update_layout(mapbox_style="white-bg")
fig.show()

# Estilos de mapa:

* "white-bg" yields an empty white canvas which results in no external HTTP requests
* "open-street-map", "carto-positron", "carto-darkmatter", "stamen-terrain", "stamen-toner" or "stamen-watercolor" yield maps composed of raster tiles from various public tile servers which do not require signups or access tokens
* "basic", "streets", "outdoors", "light", "dark", "satellite", or "satellite-streets" yield maps composed of vector tiles from the Mapbox service, and do require a Mapbox Access Token or an on-premise Mapbox installation.
* A Mapbox service style URL, which requires a Mapbox Access Token or an on-premise Mapbox installation.
* A Mapbox Style object as defined at https://docs.mapbox.com/mapbox-gl-js/style-spec/

In [None]:


fig = px.scatter_mapbox(df, lat="lat", lon="lon", zoom=9, height=600)
fig.update_layout(mapbox_style="carto-positron")

fig.show()

In [None]:
df.columns

In [None]:
df=data.sample(1000)
fig = px.scatter_mapbox(df, lat="lat", lon="lon", zoom=9, height=600, color='price')
fig.update_layout(mapbox_style="carto-positron")
fig.update_layout(margin={"r":0,"t":0,"l":0,"b":0})
fig.show()

In [None]:
df=data.sample(1000)
df['pm2']=np.log(df['price']/df.surface_total_in_m2)

In [None]:
fig = px.scatter_mapbox(df, lat="lat", lon="lon", zoom=9, height=600, color='pm2')
fig.update_layout(mapbox_style="carto-positron")
fig.update_layout(margin={"r":0,"t":0,"l":0,"b":0})
fig.show()

# Polygonos en un mapa


Se acuerdan de los wkt? Era la syntaxis en la que estaban descriptos los poligonos, puntos, lineas, por ejemplo: los barrios de capital

https://raw.githubusercontent.com/francodegio/DigitalHouse/master/barrios.csv


plotly no lee directamente este formato, usa otra syntasis llamada GeoJson, necesitamos una libreria que nos convierta wkt a geojson


`conda install -c conda-forge geomet`




In [None]:
polys=pd.read_csv('https://raw.githubusercontent.com/francodegio/DigitalHouse/master/barrios.csv',encoding='latin1')

In [None]:
polys.head()

In [None]:
polys.WKT.iloc[0]


In [None]:
# para que plotly grafique poligonos, se lo tenemos que pasar en el formato GEOjson
# esta libreria convierte strings wkt en GEOJSON

from geomet import wkt
gjson=wkt.loads(poly)
gjson

## Mapa de coropletas


<img src='https://external-preview.redd.it/hMTGaxDhWqQTOj__wr36QF6ntTlDBZ7ebgbacrfX-PA.jpg?auto=webp&s=5607a02cda185c9f01c17eabad81cc33536e7bba' width=400 >


In a Mapbox choropleth map, each row of data_frame is represented by a colored region on a Mapbox map.

Parameters:
    
+ data_frame (DataFrame or array-like or dict) – This argument needs to be passed for column names (and not keyword names) to be used. Array-like and dict are tranformed internally to a pandas DataFrame. Optional: if missing, a DataFrame gets constructed under the hood using the other arguments.

+ geojson (GeoJSON-formatted dict) – Must contain a Polygon feature collection, with IDs, which are references from locations.

+ locations (str or int or Series or array-like) – Either a name of a column in data_frame, or a pandas Series or array_like object. Values from this column or array_like are to be interpreted according to locationmode and mapped to longitude/latitude.

+ color (str or int or Series or array-like) – Either a name of a column in data_frame, or a pandas Series or array_like object. Values from this column or array_like are used to assign color to marks.







<div class='alert alert-warning'>
Necesitamos pasar las geometrias en este formato:
    
    
**geojson** (GeoJSON-formatted dict) – Must contain a Polygon feature collection, with IDs, which are references from locations.
    
    
el input es un GEOJSON, un diccionario del tipo feature collection, en la llave features esta la lista de las shapes, con su geometria y su id
</div>

## Ejemplo con Chacarita

In [None]:
lista_polygonos=[ {'geometry': gjson ,
                   'id' : 'CHACARITA' }
                ]

In [None]:
#un dict con esta llave general y una lista de 'features' que son los gjson que tira el geomet de cada poligono

geojson_chacarita={ 'type': 'FeatureCollection' ,
                    'features' : lista_polygonos
                  }

In [None]:
polys.head()

In [None]:
# polys es el df comun y corriente de pandas
# gd es un diccionario con las geometrias en geojson
# con locations le digo en que columna del df esta las ID de los poligonos del dict GD


fig = px.choropleth_mapbox(polys,
                           
                           geojson=geojson_chacarita, 
                           
                           locations='BARRIO',
                           
                           mapbox_style="carto-positron",
                           center = {"lat": -34.6, "lon": -58.35}, 
                           opacity=0.5, zoom= 10, height=500)
fig.show()

## Ejemplo con todo capital

In [None]:
# Nesecito la lista de diccionarios con la geo y el id de las shapes, 
# uso el mismo del dataframe para generar esta lista, itero por fila convierto el WKT y saco el ID
# el iterrows tira indice y la serie fila, por eso el for i,x, pero solo uso el x

lista_polygonos=[ {'geometry': wkt.loads(x.WKT),'id' : x.BARRIO } for i,x in polys.iterrows()] 



In [None]:
len(lista_polygonos)

In [None]:
# ahora armo el diccionario GeoJSON con esta lista:

geojson_capital= {'type': 'FeatureCollection' ,
                  'features' : lista_polygonos }

In [None]:
fig = px.choropleth_mapbox(polys,
                           
                           geojson=geojson_capital, 
                           
                           locations='BARRIO',
                           
                           mapbox_style="carto-positron",
                           center = {"lat": -34.6, "lon": -58.35}, 
                           opacity=0.5, zoom= 10, height=500)
fig.show()

In [None]:
fig = px.choropleth_mapbox(polys,
                           
                           geojson=geojson_capital, 
                           
                           locations='BARRIO',
                           
                           color='PERIMETRO',
                           
                           mapbox_style="carto-positron",
                           center = {"lat": -34.6, "lon": -58.35}, 
                           opacity=0.5, zoom= 10, height=500)
fig.show()

## Ejemplo COVID

In [None]:
df_barrios_1w=pd.read_csv('covid_barrios.csv',index_col=0)
df_barrios_1w

In [None]:
df_barrios_1w.groupby('BARRIO').sum()

In [None]:
polys.head()

In [None]:
df_covid=pd.merge(polys,df_barrios_1w.groupby('BARRIO').sum(),on='BARRIO')
df_covid

In [None]:
fig = px.choropleth_mapbox(df_covid,
                           
                           geojson=geojson_capital, 
                           
                           locations='BARRIO',
                           
                           color='clasificacion',
                           
                           mapbox_style="carto-positron",
                           center = {"lat": -34.6, "lon": -58.35}, 
                           opacity=0.5, zoom= 10, height=500)
fig.show()

## Animacion

In [None]:
# voy a armar una columna de strings con el tiempo, por que la animacion de plotly no acepta la columna de datetime

df_barrios_1w['dt']=df_barrios_1w.index

In [None]:
fig = px.choropleth_mapbox(df_barrios_1w,geojson=geojson_capital, 
                           locations='BARRIO', color='clasificacion' ,
                           mapbox_style="white-bg",
                           center = {"lat": -34.6, "lon": -58.35},  
                           opacity=0.5, zoom= 10, height=800 ,width=800, 
                           color_continuous_scale="Viridis"
                           ,animation_frame='dt',range_color=(0,1000)
                        )

In [None]:
fig.show()

# Timestamps

https://colab.research.google.com/drive/1LlltLti_WvzaXhJwvML9HHmDD3OWc6al?usp=sharing



### Bokeh

---

<div>
    <div class = "mapa">
        <img src='https://raw.githubusercontent.com/Digital-House-DATA/ds_blend_2021_img/master/M2/CLASE_13_Visualizacion_2/Presentacion/img/M2_CLASE_13_bokeh_001.png' alt="logo bokeh" width=50% height=70% align="center">
    </div>
</div>


**Bokeh**, del japonés ぼけ (boke), significa 'desenfoque'. De un modo más gráfico y práctico se puede entender como la clásica imagen en la que el elemento principal es lo único que aparece enfocado y el resto de los elementos "desaparecen", totalmente desenfocados.

Para entender *Bokeh*, podemos compararlo con *Matplotlib*, ya que ambos generan gráficos, pero tienen un uso bastante diferente. Matplotlib crea gráficos estáticos útiles para una rápida y simple visualización. Bokeh crea visualizaciones para mostrar en la web, y son altamente interactivas. 

**Bokeh** entonces es una librería de visualización interactiva. Proporciona una construcción concisa de gráficos en forma versátil, ofreciendo interactividad de alto rendimiento sobre grandes volúmenes de datos o streaming. 

### Bokeh.plotting

---

`bokeh.plotting` provee los elementos para crear los gráficos interactivos. Para usarlo adecuadamente, conviene seguir unos pasos básicos.

1. Preparar el *dataset*. Una simple lista, tipos de datos de Numpy y Pandas.

2. Informar *donde* se genera la salida del gráfico.
Se usa generalmente las funciones: `output_file`: genera archivos html para las visualizaciones Bokeh.  `output_notebook`: las muestra como celdas de jupyter notebooks. Se debe realizar solo una vez salvo que se quiere modificar posteriormente la salida.

3. Llamar a la función `figure()`. Similar a Matplotlib, es el contenedor donde se definen el estilo general, los títulos, grillas, labels de los ejes y además los **tools** (la barra con los botones para actuar en forma interactiva).

4. Agregar los **Glyphs** (glifos). El término *glyph* en Bokeh se refiere a los puntos, líneas, áreas y otras figuras geométricas que representan a los datos.

    Estos dos últimos pasos los podemos repetir para mostrar varios gráficos juntos.

5. Informar a Bokeh como mostramos los resultados. `show()` muestra en el browser el gráfico. `save()` lo graba en el file definido anteriormente.

### Ejemplo

---

In [None]:
from bokeh.plotting import figure, output_notebook, show
from bokeh.io import output_notebook
from bokeh.resources import INLINE

# Dataset
circle_x = [1, 2.5, 3, 2]; circle_y = [2, 3, 1, 1.5]
triangle_x = [1, 3, 2]; triangle_y = [3, 1, 1.5]

# Salida del gráfico
output_notebook(INLINE)

# Figure
p = figure(plot_width=700, plot_height=350, tools="pan,reset,save")

# Glyphs
p.triangle(x=triangle_x, y=triangle_y, color='red', size=20)
p.circle(x=circle_x, y=circle_y, radius=0.3, alpha=0.5)

show(p) # Mostrar los resultados

### Datasets

---

Bokeh ofrece datasets de ejemplo, que se pueden bajar en C:\Users\xxxxx\.bokeh\data (Windows):

<code>import bokeh.sampledata
bokeh.sampledata.download()</code>

También se puede importar:

In [None]:
from bokeh.sampledata.gapminder import fertility, life_expectancy, population, regions

anios = ['1970','1980','1990','2000','2010']

s_argentina = life_expectancy.loc['Argentina',anios]
s_zambia = life_expectancy.loc['Zambia',anios]
s_suecia = life_expectancy.loc['Sweden',anios]
s_china = life_expectancy.loc['China',anios]
s_usa = life_expectancy.loc['United States',anios]

life_expectancy.sample(2)

### Figure

---
En este ejemplo, en `Figure` agregamos el título, etiquetas de los ejes, el tamaño del gráfico.

Además con el parámetro `tools` se describen las acciones interactivas permitidas. Se agrupan por:

- *drag tools* (arrastrando el mouse). Por ejemplo, `box_select` (un rectángulo);  (selecciona rectángulo donde hacer zoom); `lasso_select` (con un lazo), `pan` (genera una panorámica, sosteniendo el click y moviendo el mouse).

- *click tools* (con un click). `tap` (selecciona un punto), entre otros.

- *scroll tools* (scrolling). `wheel_zoom` (zoom con la ruedita del mouse),`box_zoom`.

- Acciones. `reset` (vuelve a los valores originales);  `save` (graba el gráfico como un archivo PNG)

https://docs.bokeh.org/en/latest/docs/reference/plotting.html?highlight=figure#bokeh.plotting.figure.Figure

### Figure

---

In [None]:
# Dataset
anios = ['1970','1980','1990','2000','2010']

output_notebook(INLINE)

# Figure
fig = figure(title="Expectativa de vida", x_axis_label='Años',y_axis_label='Años de vida',
             tools="box_select,box_zoom,lasso_select,tap,wheel_zoom,pan,reset,save",
             toolbar_location="above", plot_width=400, plot_height=250)

# Tres Glyphs.
fig.circle(x=anios, y=s_argentina, color='red', size=4)
fig.triangle(x=anios, y=s_suecia, color='aquamarine', size=8)
fig.circle_x(x=anios, y=s_zambia, size=10, alpha=0.5)
show(fig) # Mostrar los resultados

### Palette

---
Bokeh provee una colección de paletas predefinidas que podemos ver en 

https://docs.bokeh.org/en/latest/docs/reference/palettes.html

Useremos colores de **Set2** para colorear las barras del siguiente gráfico. Observar que tenemos que informar cuantos colores vamos a usar. En este ejemplo, son cinco.

In [None]:
from bokeh.palettes import Set2
colors = Set2[5]

In [None]:
colors[1]

### Barras

---
Se grafican tanto barras verticales, como horizontales. Y también barras apiladas.

Para las barras verticales `vbar()` necesitamos el rango de valores para el eje x `x=`, los valores del eje y que se indican con `top=`. También se puede agregar un valor `bottom=`. El proceso es similar para las barras horizontales.

En el proximo ejemplo vamos a generar barras de varias variables. Como en Matplotlib, luego de definir la primera barra, las siguientes deben tener un offset para que no se superpongan.

Para que la leyenda con los nombres de los países quede afuera del gráfico, usamos el método `p.add_layout`.

Nota: se debe agregar en la función `Figure`, el parámetro *x_range=anios* para que admita valores categóricos en el eje x.

In [None]:
import numpy as np
from bokeh.models import Legend

p = figure(x_range=anios, plot_width=600, plot_height=230
           , title='Comparacion de paises', x_axis_label='Años',y_axis_label='Años de vida')

r0 = p.vbar(x=anios, top=s_zambia, width=0.1, bottom=0, color=colors[0])
offsets = [0.1, 0.1, 0.1, 0.1, 0.1]
anios_off = list(zip(anios, offsets))
r1 = p.vbar(x=anios_off, top=s_suecia, width=0.1, bottom=0, color=colors[1])
anios_off = list(zip(anios, np.array(offsets)*2))
r2 = p.vbar(x=anios_off, top=s_argentina, width=0.1, bottom=0, color=colors[2])
anios_off = list(zip(anios, np.array(offsets)*3))
r3 = p.vbar(x=anios_off, top=s_usa, width=0.1, bottom=0, color=colors[3])
anios_off = list(zip(anios, np.array(offsets)*4))
r4 = p.vbar(x=anios_off, top=s_china, width=0.1, bottom=0, color=colors[4])

legend = Legend(items=[("Zambia", [r0]), ("Suecia", [r1]), ("Argentina", [r2]),
    ("USA", [r3]), ("China", [r4])], location="center")

p.add_layout(legend, 'right')
show(p)

### Areas

---
Las áreas se grafican pintando la región entre dos series que compartan un eje x o índice común.

En el ejemplo, dibujamos el área bajo la curva de los Estados Unidos.

In [None]:
output_notebook(INLINE)

# Figure
fig = figure(title = "Expectativa de vida", x_axis_label = 'Años', y_axis_label = 'Años de vida',
             tools = "pan,reset,save,wheel_zoom", toolbar_location = "below",
             x_range = anios, plot_width = 400, plot_height = 250)
# Area
fig.varea(x = anios, y1 = 0, y2 = s_usa , fill_color = 'blueviolet', alpha = 0.3);

show(fig)


### Rectángulos, elipses y polígonos

---
Se pueden graficar rectángulos, elipses y polígonos con Bokeh.

`rect()` y `square()` generan rectángulos y cuadrados basado en las coordenadas del centro de la figura. Las dimensiones, `rect()` las define con el ancho y largo y `square()` con el parámetro `size`.

`ellipse()` crea glyphs con las coordenadas x, y, y el ancho y el largo.

In [None]:
# Salida del gráfico
output_notebook(INLINE)
# Figure
fig = figure(plot_width=300, plot_height=150)
# Glyphs
fig.rect(x=10,y=10,width=100, height=50, color='green',width_units='screen', height_units='screen')
fig.square(x=2,y=3,size=80, color='red')
fig.ellipse(x=7,y=6, width=30, height=10, fill_color=None, line_width=2)
fig.ellipse(x=15,y=6,width=2, height=1, angle=-0.4)
show(fig)

### ColumnDataSource - Gridplot

---
**`ColumnDataSource`** es muy usado en los gráficos de Bokeh; permite fácilmente compartir datos entre múltiples gráficos. 

Cuando se utiliza el mismo objeto `ColumnDataSource` como *origen de datos* de múltiples gráficos, la selección del origen de datos también se comparte. Es decir, que con una herramienta de selección aplicada en un gráfico, se reflejan los puntos seleccionados en los otros gráficos.

**`gridplot`** crea una grilla de plots, y construye una *única toolbar* compartida entre todos los plots de la grilla.


Observar que cada gráfico debe tener su `Figure` y su glyph; luego se unen con `gridplot`.

In [None]:
from bokeh.models import ColumnDataSource
from bokeh.layouts import gridplot
# datos de autos
from bokeh.sampledata.autompg import autompg as data_cars

In [None]:
data_bokeh = ColumnDataSource(data_cars)
options = {'plot_width': 300,'plot_height': 150,'tools': 'pan, box_select, lasso_select, reset'}

p1 = figure(title="MPG por Año", x_axis_label = "MPG", y_axis_label = "Año", **options)
p1.circle("yr", "mpg", color = "blue", source = data_bokeh)

p2 = figure(title="HP vs. Desplazamiento", x_axis_label = "HP",y_axis_label = "Desp", **options)
p2.cross("hp", "displ", color = "green", source = data_bokeh)

p3 = figure(title="MPG vs. Desplazamiento", x_axis_label = "MPG", y_axis_label = "Desp", **options)
p3.diamond("mpg", "displ", size = "cyl", line_color="red", fill_color = None
           , source = data_bokeh)

p4 = figure(title="Aceleración vs. Desplazamiento", x_axis_label = "Aceleración", y_axis_label = "Desp",  **options)
p4.triangle("accel", "displ", color = "yellow", source = data_bokeh)

p = gridplot([[p1, p2], [p3, p4]] , toolbar_location="right")
show(p)

### HoverTool

---
Es una herramienta de inspección pasiva, que permite asociar a cada dato que se visualiza en el gráfico, con una tabla de valores que lo complementa. En el próximo ejemplo, cuando pasemos el mouse por un círculo, veremos una tabla con las coordenadas de ese punto y una descripción.

La función `Hovertool` nos permite crearlo. Podemos asociar un etiqueta a cada dato:

`hover = HoverTool(tooltips=[("index", "$index"), ("(x,y)", "($x, $y)"),("desc", "@desc")])`

Las etiquetas y los valores se asignan en una lista de tuplas *(etiqueta, valor)*.

1. Los nombres de campo que comienzan con **'$'** son "campos especiales". A menudo son valores intrínsecos del gráfico, como las coordenadas del mouse en pantalla. Ejemplos:

    - `$index`: indíce del punto seleccionado en el dataset. Un ID.
    - `$x`: coordenada x del cursor en el espacio de datos
    - `$y`: coordenada y del cursor en el espacio de datos

2. Los nombres de campo que comienzan con **'@'** están asociados con columnas definidas en `ColumnDataSource`. 

In [None]:
from bokeh.plotting import ColumnDataSource, figure, output_file, show
from bokeh.models import HoverTool
output_notebook(INLINE)

# Dataset
source = ColumnDataSource(data=dict(
    x=[1, 2, 3, 4, 5],
    y=[2, 5, 8, 2, 7],
    desc=['A', 'b', 'C', 'd', 'E'],
))
# Figure
p = figure(plot_width=400, plot_height=200, tools = ['pan', 'box_zoom', 'reset'],title="Mouse over the dots")
p.circle('x', 'y', size=20, source=source,hover_color="pink", hover_alpha=0.6)

# Tooltips indica que valores muestra al pasar el mouse por los puntos
hover = HoverTool(tooltips=[("index", "$index"), ("(x,y)", "($x, $y)"),("desc", "@desc")])
p.add_tools(hover)
show(p)

### Archivos HTML

---
Bokeh también permite guardar plots en archivos HTML. Para eso usamos la función `output_file` y `save`, en lugar de `output_notebook()` y `show`.

También podemos usar la combinación `output_file` y `show` que abre en una nueva pestaña el gráfico guardado.

Guardemos el último gráfico generado, que está asignado a la variable `p` 

In [None]:
from bokeh.plotting import output_file, save
output_file("test_save_plot.html", mode='inline')
save(p);

Para resetear los settings de output usamos `reset_output`

In [None]:
from bokeh.plotting import reset_output
reset_output()

<div class="div-dhds-fondo-1"> Hands-on
<img src="https://raw.githubusercontent.com/Digital-House-DATA/ds_blend_2021_img/master/M1/CLASE_05_Pandas1/Presentacion/img/M1_CLASE_05_separador.png" align="center"></img>    
</div>

### Bokeh

A partir de los datos de los autos que vimos anteriormente, generar un gráfico de barras `vbar` que muestre la cantidad de autos por año.

Las barras deben medir 0.1 y tienen que tener el color rojo.

Ayuda: 
- se debe usar groupby.
`df_autos_anio = data_cars.groupby("xxx")["yyy"].count()`

- df_autos_anio es una Pandas Serie, no un DataFrame.

In [None]:
# datos de autos
from bokeh.sampledata.autompg import autompg as data_cars
data_cars.sample(3)

### Plotly

Hacer el ejercicio anterior con Plotly.

A partir de los datos de los autos que vimos anteriormente, generar un gráfico de barras que muestre la cantidad de autos por año.

Las barras deben medir 0.1 y tienen que tener el color rojo.

Ayuda: 
- se debe usar groupby.
`df_autos_anio = data_cars.groupby("xxx")["yyy"].count()`

- df_autos_anio es una Pandas Serie, no un DataFrame.

### Solución

----

### Bokeh

A partir de los datos de los autos que vimos anteriormente, generar un gráfico de barras `vbar` que muestre la cantidad de autos por año.

Las barras deben medir 0.1 y tienen que tener el color rojo.

Ayuda: 
- se debe usar groupby.
`df_autos_anio = data_cars.groupby("xxx")["yyy"].count()`

- df_autos_anio es una Pandas Serie, no un DataFrame.

In [None]:
# datos de autos
from bokeh.sampledata.autompg import autompg as data_cars
data_cars.sample(3)

In [None]:
df_autos_anio = data_cars.groupby("yr")["name"].count()
type(df_autos_anio)

In [None]:
df_autos_anio.head(3)

In [None]:
df_autos_anio.index

In [None]:
output_notebook(INLINE)

options = {'plot_width': 500,'plot_height': 300,'tools': 'pan, box_select, lasso_select, reset'}
p = figure(title="Autos por Año", x_axis_label = "Años", y_axis_label = "Total Autos", **options)

p.vbar(x=df_autos_anio.index, top=df_autos_anio, color = "red",width=0.1)
show(p)

### Plotly

Hacer el ejercicio anterior con Plotly.

A partir de los datos de los autos que vimos anteriormente, generar un gráfico de barras que muestre la cantidad de autos por año.

Las barras deben medir 0.1 y tienen que tener el color rojo.

Ayuda: 
- se debe usar groupby.
`df_autos_anio = data_cars.groupby("xxx")["yyy"].count()`

- df_autos_anio es una Pandas Serie, no un DataFrame.

In [None]:
df_autos_anio.head(3)

In [None]:
fig = px.bar(x=df_autos_anio.index, y=df_autos_anio, width=600, height=400)

fig.update_layout(
    title='Autos por Año',
    xaxis_tickfont_size=10,
    xaxis=dict(title='Años',titlefont_size=14,tickfont_size=10),
    yaxis=dict(title='Total Autos',titlefont_size=14,tickfont_size=10))

fig.update_traces(marker_color='red',  width=0.1)

fig.show()

<div class="div-dhds-fondo-1"> Referencias y Material Adicional
<img src="https://raw.githubusercontent.com/Digital-House-DATA/ds_blend_2021_img/master/M1/CLASE_05_Pandas1/Presentacion/img/M1_CLASE_05_separador.png" align="center"></img>    
</div>

### Referencias y Material Adicional

---

<a href="https://bokeh.org/" target="_blank" >Bokeh Presentación</a>


<a href="https://www.tutorialspoint.com/bokeh/bokeh_tutorial.pdf" target="_blank" >Bokeh Tutorial</a>

<a href="https://docs.bokeh.org/en/latest/index.html#" target="_blank" >Bokeh Documentacion</a>

<a href="https://programminghistorian.org/en/lessons/visualizing-with-bokeh" target="_blank" >VisualiBokeh Documentacion</a>

<a href="https://pypi.org/project/plotly/" target="_blank" >Plotly Documentacion</a>

<a href="https://plotly.com/python/" target="_blank" >Plotly Python Open Source Graphing Library</a>

<a href="https://towardsdatascience.com/visualization-with-plotly-express-comprehensive-guide-eb5ee4b50b57" target="_blank" >Visualization with plotly express comprehensive guide</a>