First off, we import the necessary libraries.

In [16]:
import plotly.plotly as py # Cloud Interaction with Plotly
import plotly.graph_objs as go # Graph objects like tables and plots
import plotly.figure_factory as ff # For creating nice looking tables
import pandas as pd # For handling our data frames
#import numpy as np # For stadistic functions
import requests # For making requests to our API

Now, we retrieve our data by making calls to our API.

In [7]:
reports_r = requests.get('https://peridash.ml/api/reports')
measurements_r = requests.get('https://peridash.ml/api/measurements')
epsas_r = requests.get('https://peridash.ml/api/epsas')

With our data retrieved in a JSON format, we can build our Pandas dataframes.

In [8]:
reports_df = pd.read_json(reports_r.text)
measurements_df = pd.read_json(measurements_r.text)
epsas_df = pd.read_json(epsas_r.text)

In [36]:
variables_r = requests.get('https://peridash.ml/api/variables')
indicators_r = requests.get('https://peridash.ml/api/indicators')

variables_df = pd.read_json(variables_r.text)
indicators_df = pd.read_json(indicators_r.text)

The tables need to be merged based on key columns.

In [9]:
complete_reports_df = pd.merge(reports_df, epsas_df, left_on='epsa', right_on='url')
complete_measurements_df = pd.merge(measurements_df, epsas_df, left_on='epsa', right_on='url')

Now we can build the final dataframes for display by:
- choosing the fields to be displayed
- setting their order in the table
- filtering the rows based on their values
- replacing column values for readability
- changing the column names

We will also append a row calculating the standard deviation of the variable/indicator values among all rows.

In [10]:
state_map = {
    'LP': 'La Paz',
    'SC': 'Santa Cruz',
    'PO': 'Potosí',
    'BE': 'Beni',
    'TA': 'Tarija',
    'CH': 'Chuquisaca',
    'CO': 'Cochabamba',
    'OR': 'Oruro',
    'PA': 'Pando',
}

r_df_cols1 = ['code', 'category', 'state', 'year', 'v1', 'v2', 'v3']
r_df_cols2 = ['sigla', 'categoría', 'departamento', 'año', 'v1', 'v2', 'v3']

r_df = complete_reports_df.filter(items=r_df_cols1)
r_df = r_df[(r_df.category == 'B') & (r_df.year == 2016)]
r_df['state'] = r_df['state'].map(state_map)

r_avg_row = ['PROMEDIO', '-', '-', 0, r_df.v1.mean(), r_df.v2.mean(), r_df.v3.mean()]
r_std_row = ['DESVIACIÓN ESTÁNDAR', '-', '-', 0, r_df.v1.std(), r_df.v2.std(), r_df.v3.std()]
r_extra_rows = pd.DataFrame([r_avg_row, r_std_row], columns=r_df_cols1)
r_df = r_df.append(r_extra_rows)
r_df.columns = r_df_cols2


m_df_cols1 = ['code', 'category', 'state', 'year', 'ind1', 'ind2', 'ind3']
m_df_cols2 = ['sigla', 'categoría', 'departamento', 'año', 'ind1', 'ind2', 'ind3']

m_df = complete_measurements_df.filter(items=m_df_cols1)
m_df = m_df[(m_df.state == 'SC') & (m_df.year == 2016)]
m_df['state'] = m_df['state'].map(state_map)

m_avg_row = ['PROMEDIO', '-', '-', 0, m_df.ind1.mean(), m_df.ind2.mean(), m_df.ind3.mean()]
m_std_row = ['DESVIACÍON ESTÁNDAR', '-', '-', 0, m_df.ind1.std(), m_df.ind2.std(), m_df.ind3.std()]
m_extra_rows = pd.DataFrame([m_avg_row, m_std_row], columns=m_df_cols1)
m_df = m_df.append(m_extra_rows)
m_df.columns = m_df_cols2

Finally we can create our tables using figure factory.

In [11]:
reports_table = ff.create_table(r_df)
measurements_table = ff.create_table(m_df)

And pass them to plotly for rendering.

In [12]:
py.iplot(reports_table, filename='reports_table')

In [13]:
py.iplot(measurements_table, filename='measurements_table')

$$ 
\begin{equation} \label{eq1}
\begin{split}
ind1 &= \frac{V_1}{V_8} \cdot 365 \cdot 24 \cdot 100 \\
ind2 &= \frac{V_6}{V_1} \cdot 100 \\
ind3 &= \frac{V_{12}}{V_{13}} \cdot 100 \\
ind4 &= \frac{V_{14}}{V_{15}} \cdot 100 \\
ind5 &= \frac{V_4 \cdot 1000}{V_{18} \cdot V_{21} \cdot 365} \\
ind6 &= (1-\frac{V_{28}}{V_{27}\cdot V_{18}}) \cdot 24\\
ind7 &= (1-\frac{V_{29}}{V_{27}\cdot V_{18}}) \cdot 100\\
ind8 &= \frac{V_{18}\cdot V_{21}}{V_{23}} \cdot 100 \\
ind9 &= \frac{V_{19}\cdot V_{22}}{V_{23}} \cdot 100 \\
ind10 &= \frac{V_{20}}{V_{18}} \cdot 100\\
ind11 &= \frac{V_3}{V_9 \cdot 24 \cdot 365} \cdot 100 \\
ind12 &= \frac{V_7 \cdot 10}{V_6 \cdot 8} \cdot 100 \\
ind13 &= \frac{V_{16}}{V_{17}} \cdot 100 \\
ind14 &= \frac{V_5}{V_{10} \cdot 24 \cdot 365} \cdot 100 \\
ind15 &= \frac{V_7}{V_{11} \cdot 24 \cdot 365} \cdot 100 \\
ind16 &= \frac{V_{45}}{V_{46}} \cdot 100 \\
ind17 &= (1 - \frac{V_4}{V_1}) \cdot 100 \\
ind18 &= (1 - \frac{V_6}{V_4}) \cdot 100 \\
ind19 &= \frac{V_{47}}{V_{49}} * 100 \\
ind20 &= \frac{V_{48}}{V_{18}} \cdot 1000 \\
ind21 &= \frac{V_{50}}{V_{52}} \cdot 100 \\
ind22 &= \frac{V_{51}}{V_{19}} \cdot 1000 \\
ind23 &= \frac{V_{37}}{V_{35}} \cdot 100 \\
ind24 &= \frac{V_{30}}{V_{33}} \\
ind25 &= (1 - \frac{V_{32}}{V_{37}}) \cdot 100 \\
ind26 &=  \frac{V_{33}+V_{34}}{V_3} \cdot 100 \\
ind27 &= \frac{V_{36}}{V_6} \\
ind28 &= \frac{V_{38}}{V_6} \\
ind29 &= \frac{V_{39}}{V_{40}} \cdot 100 \\
ind30 &= \frac{V_{41}}{V_{42}} \cdot 100 \\
ind31 &= \frac{V_{42}}{V_{18}} \cdot 1000 \\
ind32 &= \frac{V_{43}}{V_{44}} * 100 \\
\end{split}
\end{equation}
$$

Let's try to use plotly tables instead of figure factory tables.
These tables have the advantage of allowing for user interaction like switching columns.
They also allow for more configuration.

In [31]:
r_trace = go.Table(
    header=dict(values=list(r_df.columns),
                line = dict(color='#8C8E8F'),
                fill = dict(color='#a1c3d1'),
                align = ['left'] * 5),
    cells=dict(values=[r_df['sigla'],r_df['categoría'], r_df['departamento'], r_df['año'], r_df['v1'], r_df['v2'], r_df['v3']],
               line = dict(color='#7D7F80'),
               fill = dict(color='#EDFAFF'),
               align = ['left'] * 5))

r_data = [r_trace] 

m_trace = go.Table(
    header=dict(values=list(m_df.columns),
                line = dict(color='#8C8E8F'),
                fill = dict(color='#a1c3d1'),
                align = ['left'] * 5),
    cells=dict(values=[m_df['sigla'],m_df['categoría'], m_df['departamento'], m_df['año'], m_df['ind1'], m_df['ind2'], m_df['ind3']],
               line = dict(color='#7D7F80'),
               fill = dict(color='#EDFAFF'),
               align = ['left'] * 5))

m_data = [m_trace] 

In [30]:
py.iplot(r_data, filename = 'reports_py_table')

In [32]:
py.iplot(m_data, filename = 'measurements_py_table')

Let's try to recreate the plots from <a href="https://peridash.ml/">the live dash site</a>.

Like the scatter plot:

In [142]:
year_df = complete_reports_df[complete_reports_df.year == 2016]
#year_df2 = complete_measurements_df[complete_measurements_df.year == 2016]

traces = []

first_var_id = 3
second_var_id = 22

for category in ['A', 'B', 'C', 'D']:
    cat_df = year_df[year_df.category == category]
    #cat_df2 = year_df2[year_df2.category == category]
    
    x_list = cat_df['v' + str(first_var_id)]
    x_label = vdf[vdf.var_id == first_var_id]['name'].values[0]
    x_unit = vdf[vdf.var_id == first_var_id]['unit'].values[0]
    
    y_list = cat_df['v' + str(second_var_id)]
    y_label = vdf[vdf.var_id == second_var_id]['name'].values[0]
    y_unit = vdf[vdf.var_id == second_var_id]['unit'].values[0]

    scatter = go.Scatter(
        x=x_list, y=y_list,
        text=cat_df.code,
        mode='markers',
        marker=dict(
            size=15,
            line=dict(width=0.5, color='white')
        ),
        opacity=0.7,
        name=f'Categoría {category}'
    )
    
    traces.append(scatter)
    
data=go.Data(traces)
layout = go.Layout(
    xaxis=dict(
        title=f'Volumen de Agua Potable Producido (m3/periodo)',
        autorange=True
    ),
    yaxis=dict(
        title=f'Población Toal (hab)',
        autorange=True
    ),
    legend=dict(x=0, y=1),
#             margin={'l': 60, 'b': 40, 't': 40, 'r': 10},
#     dragmode='lasso',
)
    
figure=go.Figure(data=data,layout=layout)
py.iplot(figure, filename='variables_scatter_plot')


plotly.graph_objs.Data is deprecated.
Please replace it with a list or tuple of instances of the following types
  - plotly.graph_objs.Scatter
  - plotly.graph_objs.Bar
  - plotly.graph_objs.Area
  - plotly.graph_objs.Histogram
  - etc.




or the bar diagram:

In [95]:
selected_epsa =  epsas_df.code

crdf = complete_reports_df
cmdf = complete_measurements_df

ydf14 = crdf[(crdf.year == 2014) & (crdf.category == 'B')]
ydf15 = crdf[(crdf.year == 2015) & (crdf.category == 'B')]
ydf16 = crdf[(crdf.year == 2016) & (crdf.category == 'B')]

ydf214 = cmdf[(cmdf.year == 2014) & (cmdf.category == 'B')]
ydf215 = cmdf[(cmdf.year == 2015) & (cmdf.category == 'B')]
ydf216 = cmdf[(cmdf.year == 2016) & (cmdf.category == 'B')]

selected_vars = ['v1']
selected_inds = ['ind1']

def get_var_name(var):
    return vdf[vdf.var_id == int(var[1:])]['name'].values[0]

def get_var_unit(var):
    return vdf[vdf.var_id == int(var[1:])]['unit'].values[0]

def get_ind_name(ind):
    return ind_names[int(ind[3:])]

def get_ind_unit(ind):
    return ind_units[int(ind[3:])]

ind_names = [
    'Rendimiento actual de la fuente', 'Uso eficiente del recurso',
    'Cobertura de muestras de agua potable',
    'Conformidad de los análisis de agua potable realizados',
    'Dotación', 'Continuidad por racionamiento', 'Continuidad por corte',
    'Cobertura del servicio de agua potable',
    'Cobertura del servicio de alcantarillado sanitario',
    'Cobertura de micromedición',
    'Incidencia extracción de agua cruda subterránea ',
    'Índice de tratamiento de agua residual', 'Control de agua residual',
    'Capacidad instalada de planta de tratamiento de agua potable',
    'Capacidad instalada de planta de tratamiento de agua residual ',
    'Presión del servicio de agua potable',
    'Índice de agua no contabilizada en producción',
    'Índice de agua no contabilizada en la red',
    'Densidad de fallas en tuberías de agua potable',
    'Densidad de fallas en conexiones de agua potable',
    'Densidad de fallas en tuberías de agua residual',
    'Densidad de fallas en conexiones de agua residual',
    'Índice de operación eficiente', 'Prueba ácida',
    'Eficiencia de recaudación', 'Índice de endeudamiento total', 'Tarifa media',
    'Costo unitario de operación', 'Índice de ejecución de inversiones',
    'Personal calificado', 'Número de empleados por cada 1000 conexiones',
    'Atención de reclamos'
]
ind_units = ['%', '%', '%', '%', 'l/hab/día', 'hr/día', '%', '%', '%', '%',
             '%', '%', '%', '%', '%', '%', '%', '%', 'fallas/100km',
             'fallas/1000conex.', 'fallas/100km', 'fallas/1000conex.', '%', '-',
             '%', '%', '%CUO(Bs.)', '%TM(Bs.)', '%', '%', 'empleados/1000conex.', '%']


data=[
    go.Bar(
        x=selected_epsa,
        y=ydf214[ydf214.code.isin(selected_epsa)]['ind1'],
        text='ind1',
        #name=f'{get_ind_name("ind1")} ({get_ind_unit("ind1")})',
        name='2014',
        opacity=0.8
    )
] + [
    go.Bar(
        x=selected_epsa,
        y=ydf215[ydf215.code.isin(selected_epsa)]['ind1'],
        text='ind1',
        #name=f'{get_ind_name("ind1")} ({get_ind_unit("ind1")})',
        name='2015',
        opacity=0.8,
    )
] + [
    go.Bar(
        x=selected_epsa,
        y=ydf216[ydf216.code.isin(selected_epsa)]['ind1'],
        text='ind1',
        #name=f'{get_ind_name("ind1")} ({get_ind_unit("idn1")})',
        name='2016',
        opacity=0.8,
    )
]


py.iplot(data, filename='bar_plot')

In [73]:
crdf[crdf.code=='SAGUAPAC'].v1

156   NaN
157   NaN
158   NaN
Name: v1, dtype: float64

Now we can create a plotly dashboard programmatically and publish it to the cloud.

In [9]:
import plotly.dashboard_objs as dashboard
import plotly.plotly as py

import IPython.display
from IPython.display import Image

my_dboard = dashboard.Dashboard()

my_dboard['settings']['title'] = 'Muestrario AAPS'
my_dboard['settings']['logoUrl'] = 'https://images.plot.ly/language-icons/api-home/python-logo.png'

general_text = """
## Paneles de Control

Este es un panel de control. Usa el mismo estilo de herramientas usadas para generar diagramas interactivos en la pagina
[Peridash](https://peridash.ml), y nos permite mostrar información seleccionada en forma gráficas/tablas acompañadas
de texto. Podemos armar la estructura de la página poscicionando cajas de texto, diagramas/tablas e inclusive otras páginas web.
Si bien los diagramas y tablas son interacivos de manera individual, estos no pueden interactuar entre ellos como en la página principal,
ya que esto requiere de una lógica más compleja y de un mayor control que sólo un servidor dedicado nos puede ofrecer.
El objetivo de los paneles de control es la presentación rápida y guiada de resultados y datos recaudados. Esta página
recoge los datos ofrecidos por la aplicación Peridash a través de su interfaz programática (API) para generar las visualizaciones.
"""

bar_text = '''
## Diagramas de Barra 

En el panel de control podemos mostrar diagramas de barras. Como fue propuesto durante la presentación,
es posible mostrar los valores de variables/indicadores de una o varias EPSA a lo largo de los años.

#### Selección de EPSA
Podemos escoger las EPSA de manera arbitraria, una a una o de acuerdo a su categoría, departamento, etc. 

#### Selección de Variables/Indicadores
Podemos escoger uno o varios variable/indicadores para mostrar y/o comparar sus valores.

En el ejemplo de la derecha vemos los valores del indicador "Uso eficiente del recurso (%)" de las EPSA de categoría B
a lo largo de los años.
'''

scatter_text = '''
## Diagramas de Dispersión

Otra opción para la presentación de datos son los diagramas de dispersión. Estos tienen la ventaja de aprovechar el espacio
de manera más eficiente y por tanto permiten la visualización de varias dimensiones simultáneamente. Es por esto que 
los diagramas de dispersión son útiles para cruzar variables. En el ejemplo de abajo vemos los valores de todas las EPSA
del año 2016 con respecto a las variables 3 (Volumen de agua potable producido) y 22 (Población Total).
'''

table_text = '''
## Tablas

También podemos mostrar la información recogida de la aplicación Peridash en forma de tablas. Este tipo de tablas también cuentan
con cierto nivel de interacción. Por ejemplo, las columnas pueden ser reordenadas a gusto arrastrandolas hacia los lados desde la 
cabeza de cada columna.
'''

animated_text = '''
### Diagramas Animados

En el siguiente diagrama añadimos una dimensión de información extra expresada en el tamaño de los puntos de cada EPSA. Su tamaño corresponde
a la población total del área de servicio autorizado (variable 22). Además incluimos un slider de los años junto con una ligera animación de 
transición para poder seguir el progreso de las variables/indicadores a través de los años.
'''

general_text_box = {
    'type': 'box',
    'boxType': 'text',
    'text': general_text,
    'title': 'Información General'
}

bar_text_box = {
    'type': 'box',
    'boxType': 'text',
    'text': bar_text,
    'title': 'Información acerca de Diagramas de Barra'
}

bar_plot_box = {
    'type': 'box',
    'boxType': 'plot',
    'fileId': 'sergiochumacero:24',
    'shareKey': None,
    'title': 'Diagrama de Barra'
}

scatter_text_box = {
    'type': 'box',
    'boxType': 'text',
    'text': scatter_text,
    'title': 'Información acerca de Diagramas de Dispersión'
}

var_scatter_box = {
    'type': 'box',
    'boxType': 'plot',
    'fileId': 'sergiochumacero:22',
    'shareKey': None,
    'title': 'Diagrama de Dispersión'
}

table_text_box = {
    'type': 'box',
    'boxType': 'text',
    'text': table_text,
    'title': 'Información acerca de Tablas'
}

reports_table_box = {
    'type': 'box',
    'boxType': 'plot',
    'fileId': 'sergiochumacero:18',
    'shareKey': None,
    'title': 'Tabla de Variables'
}

measurements_table_box = {
    'type': 'box',
    'boxType': 'plot',
    'fileId': 'sergiochumacero:20',
    'shareKey': None,
    'title': 'Tabla de Indicadores'
}

animated_plot_box = {
    'type': 'box',
    'boxType': 'plot',
    'fileId': 'sergiochumacero:46',
    'shareKey': None,
    'title': 'Diagrama Animado'
}

animated_text_box = {
    'type':  'box',
    'boxType': 'text',
    'text': animated_text,
    'title': 'Información acerca de diagramas animados.'
}


my_dboard.insert(general_text_box)
my_dboard.insert(animated_text_box, 'below', 1, fill_percent=80)
my_dboard.insert(animated_plot_box, 'below', 2, fill_percent=80)
my_dboard.insert(bar_plot_box, 'below', 3, fill_percent=80)
my_dboard.insert(scatter_text_box, 'below',4, fill_percent=80)
my_dboard.insert(var_scatter_box, 'below', 5, fill_percent=80)
my_dboard.insert(reports_table_box, 'below', 6, fill_percent=80)
my_dboard.insert(measurements_table_box, 'below',7, fill_percent=60)

my_dboard.insert(table_text_box, 'right', 7, fill_percent=30)
my_dboard.insert(bar_text_box, 'left', 4, fill_percent=35)


my_dboard['settings']['links'] = []
my_dboard['settings']['links'].append({'title': 'Link al portal Peridash', 'url': 'https://peridash.ml/'})
my_dboard['settings']['links'].append({'title': 'Link al portal de la AAPS ', 'url': 'http://http://www.aaps.gob.bo/'})

# my_dboard['settings']['foregroundColor'] = '#000000'
# my_dboard['settings']['backgroundColor'] = '#adcaea'
# my_dboard['settings']['headerForegroundColor'] = '#ffffff'
# my_dboard['settings']['headerBackgroundColor'] = '#D232C8'
# my_dboard['settings']['boxBackgroundColor'] = '#ffffff'
# my_dboard['settings']['boxBorderColor'] = '#000000'
# my_dboard['settings']['boxHeaderBackgroundColor'] = '#ffffff'

# my_dboard.get_preview()
py.dashboard_ops.upload(my_dboard, 'My First Dashboard with Python')

'https://plot.ly/~sergiochumacero/17/muestrario-aaps/'

Alright, that's a start. Now let's get explorative and expand our horizon a bit. The next challenge is to create an animation with slider. The idea is to add a slider for the years to the scatter plot as well as 'stop/start' buttons together with smooth transitions of the dots resulting in a powerful animation showing the development of the EPSA over the years with respect to two indicators/variables. In the process we may add a third dimension in the form of the size of the dots corresponding to a different meassurement. Let's also don't forget the color of the dots will correspond to the category of the EPSA.

First, let's create a grid.

In [188]:
from plotly.grid_objs import Grid, Column
import time

years = ['2014', '2015', '2016',]
categories = ['A', 'B', 'C', 'D']
variables = ['v3', 'v7', 'v22']

df = complete_reports_df

columns = []

for year in years:
    for category in categories:
        filtered_df = df[(df.year == int(year)) & (df.category == category)]
        
        for var in variables:
            column_name = f'{year}_{category}_{var}'
            column_data = list(filtered_df[var])
            column = Column(column_data, column_name)
            columns.append(column)
        
grid = Grid(columns)

py.grid_ops.upload(grid, 'var_animation_grid'+str(time.time))

KeyboardInterrupt: 

Now let's create the figure based on the grid.

In [190]:
categories = ['A', 'B', 'C', 'D']
years = ['2014', '2015', '2016']

custom_colors = {
    'A': 'rgb(171, 99, 250)',
    'B': 'rgb(230, 99, 250)',
    'C': 'rgb(99, 110, 250)',
    'D': 'rgb(25, 211, 243)',
#     'Oceania': 'rgb(50, 170, 255)'
}

figure = {
    'data': [],
    'layout': {'title': 'Variables a través de los años',
#                'xaxis': {'range': [0, 2], 'autorange': False},
#                'yaxis': {'range': [0, 2], 'autorange': False},
               'updatemenus': [{
                   'buttons': [
                       {
                        'args': [None],
                        'label': 'Play',
                        'method': 'animate'
                       }, 
               ],
#                'pad': {'r': 10, 't': 87},
               'showactive': False,
               'type': 'buttons'
                }]},
    'frames': [],
}

for category in categories:
    data_dict = {
        'xsrc': grid.get_column_reference(f'2014_{category}_v3'),
        'ysrc': grid.get_column_reference(f'2014_{category}_v7'),
        'mode': 'markers',
#         'marker': {
#             'sizemode': 'area',
#             'sizeref': 200000,
#             'sizesrc': grid.get_column_reference(f'2014_{category}_v22'),
            'color': custom_colors[category]
#         },
    }
    figure['data'].append(data_dict)
    
def create_frame(year):
    frame_dict = {
        'data': []
    }
    for category in categories:
        year_cat_dict = {
            'xsrc': grid.get_column_reference(f'{year}_{category}_v3'),
            'ysrc': grid.get_column_reference(f'{year}_{category}_v7'),
            'mode': 'markers',
        }
        frame_dict['data'].append(year_cat_dict)
        
    return frame_dict

figure['frames'] = [create_frame(year) for year in ['2014', '2015', '2016']]

py.icreate_animations(figure, 'var_animation')

KeyboardInterrupt: 