In [2]:
import pandas as pd

import holoviews as hv
import hvplot.pandas
hv.extension('bokeh')

In [9]:
trx = pd.read_csv('data/posiciones_colectivos/trx_april21_09_12.csv',sep=';') #Leemos datos con pandas

In [10]:
trx.head()

Unnamed: 0,ID,RAMAL_DESC,BUS_NUMBER,GPRS_SIGNAL_LEVEL,SENIAL,DATE_CREATED,RECORD_DATE,LONGITUDE,LATITUDE,SPEED,OPERADOR_TELEF,OFFSET
0,7519171216,343A,100,0,OK,2020-04-21 09:00:16.385,2020-04-21 08:59:56,-58.54664,-34.62794,0,PERSONAL,20.385
1,7519171217,264H,188,0,OK,2020-04-21 09:00:16.399,2020-04-21 09:00:12,-58.69229,-34.59123,0,PERSONAL,4.399
2,7519171219,202G,75,0,OK,2020-04-21 09:00:16.424,2020-04-21 09:00:04,-57.94496,-34.93537,22,PERSONAL,12.424
3,7519171221,247R2,40,99,OK,2020-04-21 09:00:16.436,2020-04-21 09:00:02,-58.32846,-34.71345,22,PERSONAL,14.436
4,7519172023,097A,152,31,OK,2020-04-21 09:00:16.438,2020-04-21 08:59:51,-58.40291,-34.62651,0,CLARO,25.438


In [11]:
trx.shape

(2356651, 12)

### Exploración inicial de los datos

Podemos dibujar 

In [21]:
trx.DATE_CREATED = pd.to_datetime(trx.DATE_CREATED, format="%Y-%m-%d %H:%M:%S.%f")
trx.RECORD_DATE = pd.to_datetime(trx.RECORD_DATE, format="%Y-%m-%d %H:%M:%S.%f")
trx.OFFSET = pd.to_numeric(trx.OFFSET)

In [31]:
trx.loc[:,'MINUTES'] = trx.DATE_CREATED.dt.hour * 60 + trx.DATE_CREATED.dt.minute - 9*60

#### Exploracion inicial de los datos

In [45]:
offset_mean = trx.groupby('MINUTES')['OFFSET'].mean().hvplot.line(y='OFFSET',x='MINUTES',width=800, height=500,
                                                    xlabel='Minutos despues de las 9')

In [46]:
offset_mean 

In [286]:
trx.hvplot.box(y='OFFSET',by='OPERADOR_TELEF',ylim=[0,150], height=500, width=800)

In [None]:
trx_time_operador = trx.groupby(['MINUTES','OPERADOR_TELEF'])['OFFSET']

#### En holoviz la multiplicación superpone elementos

In [285]:
area_offset = trx_time_operador.median().hvplot.area(y='OFFSET',x='MINUTES',by='OPERADOR_TELEF',
                                                            width=800, height=500,xlabel='Minutos despues de las 9',stacked=False,
                                                            color=['orange','red'])
line_offset = trx_time_operador.mean().hvplot.line(y='OFFSET',x='MINUTES',by='OPERADOR_TELEF',width=800,height=500,color=['orange','red'],
                                                        title='Media y mediana del offset según operadpor', ylabel='Offset')
(area_offset * line_offset)

## Mapas!!

In [287]:
import geopandas as gpd
import geoviews as gv

In [288]:
geo_trx = gpd.GeoDataFrame(trx, 
                            geometry=gpd.points_from_xy(trx.LONGITUDE, trx.LATITUDE))

### Tile sources: Podemos poner fondos de mapas para referencia

In [289]:
mapa_opts = hv.opts(height=500, width=800,xaxis=None,yaxis=None)
carto_light = gv.tile_sources.CartoLight().opts(mapa_opts)
carto_dark = gv.tile_sources.CartoDark().opts(mapa_opts)
carto_light

### Si queremos plotear millones de puntos --> datashader

Tenemos más de 2 millones de puntos. Si queremos plotearlos la única manera es con datashader. Sin datashader te va a consumir demasiada memoria y no vas a llegar a verlo nunca.

In [74]:
from holoviews.operation.datashader import datashade #Importamos datashade

In [75]:
from matplotlib import cm #Importamos colormaps de matplotlib

In [360]:
geo_trx[geo_trx['OFFSET'] <= 30].shape 
# Vamos a representar un total de 2 millones 700 mil puntos en total

(2240903, 15)

In [89]:
geo_trx[geo_trx['OFFSET'] > 30].shape

(115748, 15)

In [319]:
good_ones = datashade(gv.Points(geo_trx[geo_trx['OFFSET'] <= 30]),cmap=cm.Blues,precompute=True,) # En azul las trx sin demora
bad_ones = datashade(gv.Points(geo_trx[geo_trx['OFFSET'] > 30]),cmap=cm.Reds,precompute=True) # En rojo las trx con demora
# draw = gv.Points(geo_trx) # Esto sin datashade no lo recomiendo! Si lo pruebas atento al Administrador de Tareas!!!!

In [320]:
key_points = carto_light * bad_ones * good_ones

In [361]:
# key_points

### Pasamos los puntos a zonas

Tenemos un dataset con parte de esta información traspasada a cuadrados de 120 x 600 m

In [96]:
trx_zonas = gpd.read_file(r"data\posiciones_colectivos\trx_zonas.shp")

In [102]:
trx_zonas.head()

Unnamed: 0,ID,MEAN_OFFSE,MEAN_OFF_1,MEAN_OFF_2,MEAN_SPEED,MAX_OFFSET,MAX_OFFS_1,MAX_OFFS_2,MAX_SPEED,TRX,BAD_TRX,geometry
0,0,13.543883,9.842129,14.150575,13.015165,169.734,25.771,169.734,60.0,2308.0,25.0,"POLYGON ((-58.44727 -34.59045, -58.44727 -34.5..."
1,1,13.676275,12.382245,14.090665,15.906784,159.208,40.903,159.208,63.0,2049.0,69.0,"POLYGON ((-58.38135 -34.60693, -58.38135 -34.6..."
2,2,13.900093,12.254232,16.695201,20.342652,664.849,33.003,664.849,80.0,4042.0,55.0,"POLYGON ((-58.43628 -34.57947, -58.43628 -34.5..."
3,3,13.260904,11.450267,14.305624,16.48405,250.44,38.779,250.44,60.0,3605.0,67.0,"POLYGON ((-58.46924 -34.63440, -58.46924 -34.6..."
4,4,17.0035,13.847594,17.800063,11.471529,430.189,67.081,430.189,57.0,1563.0,129.0,"POLYGON ((-58.51318 -34.60693, -58.51318 -34.6..."


MEAN_OFFSE_1 ES EL OFFSET MEDIO DE PERSONAL Y MEAN_OFFSE_2 ES DE CLARO

In [153]:
trx_zonas.rename(columns={'MEAN_OFF_1': 'OFFSET_PERSONAL', 'MEAN_OFF_2' : 'OFFSET_CLARO'}, inplace=True)

In [129]:
trx_zonas.loc[:,'PCT_BAD_TRX'] = (trx_zonas['BAD_TRX'] / trx_zonas['TRX']) * 100

In [127]:
trx_zonas.head()

Unnamed: 0,ID,MEAN_OFFSE,MEAN_OFF_1,MEAN_OFF_2,MEAN_SPEED,MAX_OFFSET,MAX_OFFS_1,MAX_OFFS_2,MAX_SPEED,TRX,BAD_TRX,geometry,PCT_BAD_TRX
0,0,13.543883,9.842129,14.150575,13.015165,169.734,25.771,169.734,60.0,2308.0,25.0,"POLYGON ((-58.44727 -34.59045, -58.44727 -34.5...",1.083189
1,1,13.676275,12.382245,14.090665,15.906784,159.208,40.903,159.208,63.0,2049.0,69.0,"POLYGON ((-58.38135 -34.60693, -58.38135 -34.6...",3.367496
2,2,13.900093,12.254232,16.695201,20.342652,664.849,33.003,664.849,80.0,4042.0,55.0,"POLYGON ((-58.43628 -34.57947, -58.43628 -34.5...",1.360713
3,3,13.260904,11.450267,14.305624,16.48405,250.44,38.779,250.44,60.0,3605.0,67.0,"POLYGON ((-58.46924 -34.63440, -58.46924 -34.6...",1.85853
4,4,17.0035,13.847594,17.800063,11.471529,430.189,67.081,430.189,57.0,1563.0,129.0,"POLYGON ((-58.51318 -34.60693, -58.51318 -34.6...",8.253359


In [122]:
trx_zonas.set_geometry('geometry',inplace=True)
trx_zonas['MEAN_OFFSE']

0      13.543883
1      13.676275
2      13.900093
3      13.260904
4      17.003500
         ...    
274    14.038851
275    12.934015
276    34.784258
277    14.303303
278    13.800852
Name: MEAN_OFFSE, Length: 279, dtype: float64

### Podemos guardar toda la información en un objeto

In [293]:
zonas_info = gv.Polygons(trx_zonas, vdims=['ID','MEAN_OFFSE', 'PCT_BAD_TRX', 'TRX', 'OFFSET_CLARO', 
                                           'OFFSET_PERSONAL','MAX_SPEED']).opts(tools=['hover'],  title="Zonas")
carto_light * zonas_info

In [370]:
carto_light * zonas.opts(color='TRX',cmap='Reds',colorbar=True, title='Cantidad de TRX por zona', fill_alpha=0.5)

Se nota la autovía 25 de Mayo al mapear la velocidad máxima

In [151]:
carto_dark * zonas.opts(color='MAX_SPEED',cmap='Blues',colorbar=True, title='Zonas por velocidad máxima',fill_alpha=0.5 )

## Paneles interactivos con Panel

In [362]:
import panel as pn
pn.extension()

##### Podemos hacer paneles interactivos. Así cuando alguien más los mire podrá responderse algunas preguntas sobre como interactúan los diferentes campos de los datos entre sí

#### Creamos los controles

In [383]:
controles_title = pn.panel('### Controlador del mapa')
company_selector = pn.widgets.Select(name='Compañía', options=['PERSONAL', 'CLARO', 'AMBOS'])
speed_range = pn.widgets.IntRangeSlider(name='Velocidad entre ',start=0,end=150)
trx_min = pn.widgets.IntSlider(start=0,end=int(trx_zonas.TRX.max()), name='Mínimo de TRX')
load_button = pn.widgets.Button(name='Cargar Mapa',button_type='primary')
descriptor = pn.panel('### Descripcion del mapa:\n')
controles = pn.Column(controles_title, company_selector, speed_range, trx_min, load_button,pn.Row(),descriptor) #Metemos los controles en una columna

#### Creamos la parte donde saldrá el mapa

In [384]:
panel_mapa = pn.panel((carto_light + carto_light).cols(1)) #Inicializamos con cartolight

In [385]:
def read_widgets():
    ''' Para leer los valores actuales de los controles'''
    company = company_selector.value #Valor de la compañía seleccionada
    speeds = speed_range.value # Rango de velocidades
    min_trx = trx_min.value #Mínimo de transacciones
    return company, speeds, min_trx

#### Hacemos una función que devuelva el mapa leyendo los parámetros

In [386]:

parameter_dict = {'AMBOS':'MEAN_OFFSE', 'PERSONAL': 'OFFSET_PERSONAL','CLARO':'OFFSET_CLARO'}
def update_map(event):
    company, speeds, min_trx = read_widgets()
    gdf = trx_zonas
    speed_cond = (gdf['MAX_SPEED'] > speeds[0]) & (gdf['MAX_SPEED'] <= speeds[1]) #condicion de velocidad
    min_trx_cond = gdf['TRX'] >= min_trx #condicion de min trx
    parameter = parameter_dict[company]
    offset_map_opts = hv.opts(color=parameter, cmap='Reds', colorbar=True, title='Offset medio por zona', tools=['hover'])
    zonas_offset = gv.Polygons(gdf[speed_cond & min_trx_cond],vdims=[parameter]).opts(offset_map_opts)
    delayed_pct_opts = hv.opts(color='PCT_BAD_TRX',cmap='Blues',
                          colorbar=True, title='Porcentaje trx con retraso ( más de 30 secs )',
                           tools=['hover'])
    zonas_pct_delayed_trx = gv.Polygons(gdf[speed_cond & min_trx_cond],vdims=['PCT_BAD_TRX']).opts(delayed_pct_opts)
    zonas = (carto_light * zonas_offset + carto_light * zonas_pct_delayed_trx).cols(1)
    panel_mapa.object = zonas
    descriptor.object = f"### Descripción del mapa:<br> Velocidades entre *{speeds}* <br>Mínimo de trx: *{min_trx}*<br>\
    compañía: *{company}*"

        
    
    
    

#### Linkamos el botón de Carga a la función de arriba

In [387]:
#Linkamos el boton a la funcion de arriba
load_button.on_click(update_map)

#### Creamos el panel completo

In [388]:
panel = pn.Row(controles,pn.Column(panel_mapa))

In [389]:
pn.serve(panel) #Con esto se abre una ventana nueva.

Launching server at http://localhost:61887


<bokeh.server.server.Server at 0x2befa577508>