# GIS Dashboards with Bokeh

![esri_es](img/esri.png)

Miguel Ángel Serrano Bejarano
+ [LinkedIn](https://www.linkedin.com/in/serranobejarano/)
+ [GitHub](https://github.com/serranobejarano)

## Importación de Módulos
- [Pandas](https://pandas.pydata.org/): Pandas es una de las librerías más usadas y fáciles para el uso de estructuras de datos en Python
- [HoloViews](http://holoviews.org/): Librería diseñada para que el análisis y la visualización de datos sea transparente y simple. Con HoloViews, generalmente se puede expresar lo que se quiere hacer en muy pocas líneas de código, lo que permite concentrarse en lo que está tratando de explorar y transmitir, no en el proceso de visualizarlo.

## Importación de Módulos
- [GeoViews](https://github.com/ioam/geoviews): Librería que facilita la exploración y visualización de cualquier dato que incluya componentes geográficas. Cuenta con un soporte particularmente poderoso para los conjuntos de datos meteorológicos y oceanográficos multidimensionales, como los que se utilizan en la investigación del clima, el clima y la teledetección, pero es útil para casi cualquier cosa que desee trazar en un mapa. Está basado en Cartopy.
- [Bokeh](https://bokeh.pydata.org/): Librería de visualización interactiva que se dirige a los navegadores web modernos para hacer presentaciones. Su objetivo es proporcionar una construcción elegante y concisa de gráficos versátiles, y extender esta capacidad con interactividad de alto rendimiento en conjuntos de datos muy grandes o de transmisión por secuencias.

## Importación de Módulos
- [XArray](http://xarray.pydata.org/en/stable/): Xarray (anteriormente xray) es un proyecto de código abierto y un paquete de Python que tiene como objetivo llevar el poder de los datos etiquetados de Pandas a las ciencias físicas, proporcionando variantes N-dimensionales de las estructuras de datos centrales de Pandas.
- [CartoPy](https://github.com/SciTools/cartopy): Paquete Python diseñado para facilitar el dibujo de mapas para el análisis y visualización de datos.

In [1]:
import xarray as xr
import numpy as np
import pandas as pd
import holoviews as hv
import geoviews as gv
import geoviews.feature as gf
import geopandas as gpd

import cartopy
from cartopy import crs as ccrs

from bokeh.tile_providers import STAMEN_TONER
from bokeh.models import WMTSTileSource

hv.notebook_extension('bokeh')

## Importar Dataset

In [2]:
india_earthquakes = pd.read_csv('data/IndiaEarthquakes.csv')
in_earthquake_ds = gv.Dataset(india_earthquakes, kdims=['year', 'longitude','latitude']).sort()
india_earthquakes.tail()

Unnamed: 0,year,latitude,longitude,depth,mag
14693,2010,36.041,70.893,104.7,4.6
14694,2010,29.744,80.557,35.0,4.7
14695,2010,14.243,93.505,66.4,4.0
14696,2010,32.384,85.273,54.1,4.9
14697,2010,30.646,83.791,10.0,5.2


## Visualizaciones

#### Diferentes Basemaps

In [3]:
gv.extension('bokeh', 'matplotlib')

tiles = {'OpenMap': WMTSTileSource(url='http://c.tile.openstreetmap.org/{Z}/{X}/{Y}.png'),
         'ESRI': WMTSTileSource(url='https://server.arcgisonline.com/ArcGIS/rest/services/World_Imagery/MapServer/tile/{Z}/{Y}/{X}.jpg'),
         'Wikipedia': WMTSTileSource(url='https://maps.wikimedia.org/osm-intl/{Z}/{X}/{Y}@2x.png'),
         'Stamen Toner': STAMEN_TONER}

In [4]:
%%opts WMTS [width=450 height=250 xaxis=None yaxis=None]
hv.NdLayout({name: gv.WMTS(wmts, extents=(0, -90, 360, 90), crs=ccrs.PlateCarree())
            for name, wmts in tiles.items()}, kdims=['Source']).cols(2)

### Visualización con Bokeh

In [5]:
%%opts Points [width=600 height=550 tools=['hover'] color_index='mag' size_index='mag']
%%opts Points [colorbar=True size_fn=np.exp] (line_color='black')
eq_points = in_earthquake_ds.to(gv.Points, groupby='year', dynamic=True).redim.range(mag=(0, 10))
gv.WMTS(tiles['ESRI']) * eq_points

### Visualización con Matplotlib

In [6]:
%%output backend='matplotlib' size=300
%%opts Points [xaxis=None yaxis=None tools=['hover'] color_index='mag' size_index='mag']
%%opts Points [colorbar=True size_fn=np.exp projection=ccrs.Robinson()]
gf.ocean * gf.land * gf.coastline * eq_points

# Dashboard con Appmode

+ [Appmode](https://github.com/oschuett/appmode): Una extensión de Jupyter que convierte los Notebooks en aplicaciones web.

+ [Comparador de imágenes Landsat con Appmode](LandsatDashboard.ipynb) 
+ Para ejecutar como aplicación, instalar el paquete Appmode clicar el botón correspondiente en el menú de Jupyter Notebook


# Crear un Dashboard con Bokeh

### Workflow a seguir
1. Cargar y limpiar el Dataset
2. Explorar y visualizar
3. Identificar las variables importantes y crear widgets interactivos
4. Conectar los widgets a la visualización

### 1. Cargar y limpiar el Dataset

Link de descarga del Dataset: [Dataset Taxis NY](http://s3.amazonaws.com/datashader-data/nyc_taxi.zip)

En lugar de descargar el dataset, también se puede importar de la siguiente manera:
```python
import pandas as pd
import urllib.request
import zipfile

link = 'http://s3.amazonaws.com/datashader-data/nyc_taxi.zip'

%time urllib.request.urlretrieve(link, "nyc_taxi.zip")
compressed_file = zipfile.ZipFile('nyc_taxi.zip')
csv_file = compressed_file.open('nyc_taxi.csv')

import pandas as pd
%time nyc_taxi = pd.read_csv(csv_file, usecols= \
                       ['pickup_x', 'pickup_y', 'dropoff_x','dropoff_y', 'passenger_count',
                        'tpep_pickup_datetime'])
nyc_taxi.tail()
```
De este modo, tardará más tiempo en cargar el dataset, sin embargo, como el dataset pesa mucho, no tengo que subirlo al repositorio :)

In [7]:
%time nyc_taxi = pd.read_csv('data/nyc_taxi.csv', usecols= \
                       ['pickup_x', 'pickup_y', 'dropoff_x','dropoff_y', 'passenger_count','tpep_pickup_datetime'])
len(nyc_taxi)

CPU times: user 12.7 s, sys: 712 ms, total: 13.5 s
Wall time: 13.2 s


10679307

In [8]:
nyc_taxi.head()

Unnamed: 0,tpep_pickup_datetime,passenger_count,pickup_x,pickup_y,dropoff_x,dropoff_y
0,2015-01-15 19:05:39,1,-8236963.0,4975553.0,-8234835.0,4975627.0
1,2015-01-10 20:33:38,1,-8237826.0,4971752.0,-8237021.0,4976875.0
2,2015-01-10 20:33:39,1,-8238654.0,4970221.0,-8238124.0,4971127.0
3,2015-01-10 20:33:39,1,-8234434.0,4977363.0,-8238108.0,4974457.0
4,2015-01-10 20:33:39,1,-8235781.0,4972012.0,-8236804.0,4975483.0


### 2. Explorar y Visualizar

#### Tratando grandes volúmenes de datos: [Datashader](https://github.com/pyviz/datashader)

+ Datashader es un paquete de rasterización de datos para automatizar el proceso de creación de representacionesde datos significativamente grandes.

+ [Datashader Example](DatashaderExample.ipynb) 


In [9]:
import datashader as ds
from holoviews.operation.datashader import datashade
from datashader.colors import colormap_select, Greys9, Hot, inferno

In [10]:
points = hv.Points(nyc_taxi, kdims=['pickup_x', 'pickup_y'], vdims=['passenger_count'])
options = dict(width=800, height=475, xaxis=None, yaxis=None)
taxi_trips = datashade(points, x_sampling=1, y_sampling=1, cmap=inferno).opts(plot=options)

In [11]:
gv.WMTS(tiles['ESRI']) * taxi_trips

### 3. Identificar las variables importantes y crear widgets interactivos

In [12]:
import param

class NYCTaxiExplorer(hv.streams.Stream):
    alpha      = param.Magnitude(default=0.75, doc='Alpha value for the map opacity')
    plot       = param.ObjectSelector(default='pickup', objects=['pickup','dropoff'])
    passengers = param.Range(default=(0, 10), bounds=(0, 10), doc='Filter for Taxi Trips by Number of Passengers')

In [13]:
import parambokeh

parambokeh.Widgets(NYCTaxiExplorer)

### 4. Conectar los widgets a la visualización

In [None]:
import datashader as ds
from holoviews.operation.datashader import datashade

In [14]:
class NYCTaxiExplorer(hv.streams.Stream):
    alpha      = param.Magnitude(default=1, doc='Alpha value for the map opacity')
    plot       = param.ObjectSelector(default='pickup', objects=['pickup','dropoff'])
    passengers = param.Range(default=(0, 10), bounds=(0, 10), doc='Filter for Taxi Trips by Number of Passengers')
    
    def make_view(self, x_range=None, y_range=None, **kwargs):
        options = dict(width=800, height=475, xaxis=None, yaxis=None)
        map_tiles = gv.WMTS(tiles['ESRI']).opts(style=dict(alpha=self.alpha), plot=options)
        
        points = hv.Points(nyc_taxi, kdims=[self.plot+'_x', self.plot+'_y'], vdims=['passenger_count'])
        selected = points.select(passenger_count=self.passengers)
        taxi_trips = datashade(selected, x_sampling=1, y_sampling=1, width=800, height=475, 
                               cmap=inferno, dynamic=False)
        
        return map_tiles * taxi_trips

In [15]:
explorer = NYCTaxiExplorer()
parambokeh.Widgets(explorer, callback=explorer.event)
hv.DynamicMap(explorer.make_view, streams=[explorer])

### Servir Aplicación en Bokeh Server

+ Para ejecutar una aplicación en el servidor de Bokeh, es necesario reescribir el código generado arriba, es decir, mapa y widgets en un fichero ```.py```. 

+ Además, hay que añadir en los widgets el parámetro:
```python
mode ='server'
```
+ También hay que indicarle al servidor que debemostrar el mapa, mediante el siguiente código, insertado al definir la clase NYCTaxiExplorer:
```python
output = parambokeh.view.Plot()
```
+ Una vez se han hecho estas correcciones al código, desde la terminal, vamos al directorio donde tenemos el archivo y ejecutamos la aplicación:```$ bokeh serve --show gis_dashboard.py```, donde gis_dashboard.py es el nombre que yo he dado a mi aplicación.
