<img src="logo.png" align="right" style="float" width="400">
<font color="#EF4123"><h1 align="right">Dude, where's my shared car?</h1></font>

**Jupyter 01 - Mapas y censo de Madrid**
----------------
-----------------------------------------------------------------------
Este código de Python se basa en *geopandas* para cargar mapas geométricos de Madrid y *bokeh* para hacer representaciones interactivas. Cuenta con la siguiente información:
- Mapa topográfico (por vértices/puntos).
- Mapas poligonales de distritos y barrios.
- Información del censo a fecha 1 de Enero de 2018.

In [1]:
from distributed import Client
client = Client(processes=False)
#print(client)

import geopandas as gpd
import numpy as np
import pandas as pd

Failed to start diagnostics server on port 8787. [WinError 10048] Solo se permite un uso de cada dirección de socket (protocolo/dirección de red/puerto)


Configuraciones previas: ¿dónde muestro los mapas?

In [2]:
plotear_en_notebook = False # en caso de False, en un html externo

Datos Geográficos
--------------
Cargamos los ficheros de Vértices, Distritos y Barrios

In [3]:
vertices = gpd.read_file('Datos/datos_vertices_etrs89/datos_vertices_etrs89.shp')
distritos = gpd.read_file('Datos/DISTRITOS_ETRS89/SHP_ETRS89/DISTRITOS.shx')
barrios = gpd.read_file('Datos/BARRIOS_ETRS89/SHP_ETRS89/BARRIOS.shx')

lista_distritos = ['Centro','Arganzuela','Retiro','Salamanca','Chamartín','Tetuán','Chamberí','Fuencarral - El Pardo','Moncloa - Aravaca','Latina','Carabanchel','Usera','Puente de Vallecas','Moratalaz','Ciudad Lineal','Hortaleza','Villaverde','Villa de Vallecas','Vicálvaro','San Blas - Canillejas','Barajas']

#print(barrios.head())
#print(distritos.head())
#print(vertices.head())

Datos del Censo
---------------
Cargamos el censo de 2018

In [4]:
datos_censo_2018 = pd.read_excel('Datos/censo_2018_barrios.xlsx', decimal = ',')
#print(datos_censo_2018.head())
datos_pob_barrios = pd.read_excel('Datos/estadistica_pob.xls', decimal = '.')
#print(datos_pob_barrios.head())

censo_Madrid_2018 = datos_censo_2018[datos_censo_2018['NOMBRE']=='Ciudad de Madrid']
censo_2018 = datos_censo_2018[datos_censo_2018['NOMBRE']!='Ciudad de Madrid']
censo_distritos = censo_2018[censo_2018['NOMBRE'].isin(lista_distritos)]
censo_barrios = censo_2018[~censo_2018['NOMBRE'].isin(lista_distritos)]

#print(censo_Madrid_2018)
#print(censo_distritos.describe())
#print(censo_barrios.describe())
#print(censo_distritos.describe())

Unión de las tablas

In [5]:
barrios = barrios.merge(censo_barrios, on='NOMBRE')
barrios = barrios.merge(datos_pob_barrios, on='NOMBRE')
#print(barrios.head())
#print(barrios.columns.tolist())

distritos = distritos.merge(censo_distritos, on='NOMBRE')
#print(distritos.head())

Datos del Tiempo
---------------
Cargamos datos del tiempo a nivel local en periodos de una semana o en las próximas 24 horas desde la web de AEMET OpenData. 

Previamente a cualquier consulta, se requiere solicitar una api-key personal a través del siguiente enlace: https://opendata.aemet.es/centrodedescargas/altaUsuario?. Por otra parte, los métodos de consulta están documentados en https://opendata.aemet.es/dist/index.html?.

In [6]:
# read api-key
apy_key = pd.read_csv('Datos/api-key.csv')
apykey = pd.DataFrame(apy_key, columns=['site','key']).ix[0,'key']
#print(apykey)

.ix is deprecated. Please use
.loc for label based indexing or
.iloc for positional indexing

See the documentation here:
http://pandas.pydata.org/pandas-docs/stable/indexing.html#ix-indexer-is-deprecated
  This is separate from the ipykernel package so we can avoid doing imports until


In [7]:
import http.client
import urllib.request, json 
from pandas.io.json import json_normalize

# configuraciones previas
localidad = "28079" #"26036", Calahorra; "28079", Madrid 
periodo = "horaria"  #"horaria"; "diaria", 1 semana
query_semana = ['uvMax','fecha','humedadRelativa.maxima','humedadRelativa.minima','sensTermica.minima','sensTermica.maxima','temperatura.maxima','temperatura.minima']
API = "prediccion/especifica/municipio"

# consulta AEMET
conn = http.client.HTTPSConnection("opendata.aemet.es")
headers = {'cache-control': "no-cache"}
request = "https://opendata.aemet.es/opendata/api/" + API + "/" + periodo + "/" + localidad + "/" + "?api_key=" + apykey
conn.request("GET", request, headers=headers)
res = conn.getresponse()
aux = res.read()

if (periodo == "diaria"):
    data = aux.decode("utf-8")
else:
    data = aux.decode("ANSI")
#print(data)

json_data = json.loads(data)
URL_datos = json_data['datos']
URL_metadatos = json_data['metadatos']

# Decodifica el JSON
if (json_data['estado']==200):
    #print(URL_datos)
    data = urllib.request.urlopen(URL_datos)#.read()
    json_url = data.read()
    L = len(json_url)
    json_aemet = json_url[2:L-1].decode('ANSI')
    #print(json_aemet)
    message = json.loads(json_aemet)
    
    # decodifica: 7 dias ó 72 horas 
    if (periodo == "diaria"):
        precipitacion = message['prediccion']
        dia = json_normalize(precipitacion['dia'])
        #print(dia[query_semana])
    else:
        precipitacion = message['prediccion']
        dia = json_normalize(precipitacion['dia'])
        hoy = dia.iloc[0]
        manhana= dia.iloc[1]
        #print(hoy)
        
        # 4 periodos de 6h: 01-07, 07-13, 13-19, 19-01
        hoy_prob_precipitacion = json_normalize(hoy['probPrecipitacion'])        
        hoy_prob_tormenta = json_normalize(hoy['probTormenta'])
        hoy_prob_nieve = json_normalize(hoy['probNieve'])
        hoy_prob_precipitacion.columns = ['periodo','probPrecip']
        hoy_prob_tormenta.columns = ['periodo','probTormen']
        hoy_prob_nieve.columns = ['periodo','probNieve']
        resumen_hoy_6h = pd.merge(hoy_prob_precipitacion,hoy_prob_tormenta)
        resumen_hoy_6h = pd.merge(resumen_hoy_6h,hoy_prob_nieve)
        print(resumen_hoy_6h)
 
        # 16 periodos horarios 07-23
        hoy_estado_cielo = json_normalize(hoy['estadoCielo'])        
        hoy_precipitacion = json_normalize(hoy['precipitacion'])     
        hoy_humedad_relativa = json_normalize(hoy['humedadRelativa'])  
        hoy_temperatura = json_normalize(hoy['temperatura'])  
        hoy_nieve = json_normalize(hoy['nieve'])  
        hoy_sensacion_termica = json_normalize(hoy['sensTermica'])  
        hoy_viento_racha_max = json_normalize(hoy['vientoAndRachaMax']) 
        hoy_racha_max = hoy_viento_racha_max[['periodo','direccion','velocidad']]
        hoy_racha_max = hoy_racha_max[0::2]
        hoy_viento = hoy_viento_racha_max[['periodo','value']]
        hoy_viento = hoy_viento[1::2]
        hoy_nieve.columns = ['periodo','nieve']
        hoy_temperatura.columns = ['periodo','temperatura']
        hoy_sensacion_termica.columns = ['periodo','sensacion_termica']
        hoy_humedad_relativa.columns = ['periodo','humedad_relativa']
        hoy_precipitacion.columns = ['periodo','precipitacion']
        hoy_estado_cielo.columns = ['descripcion','periodo','estado_cielo']
        hoy_racha_max.columns = ['periodo','direccion','velocidad']
        hoy_viento.columns = ['periodo','viento']

        resumen_hoy_1h = pd.merge(hoy_precipitacion,hoy_nieve)
        resumen_hoy_1h = pd.merge(resumen_hoy_1h,hoy_humedad_relativa)
        resumen_hoy_1h = pd.merge(resumen_hoy_1h,hoy_estado_cielo)
        resumen_hoy_1h = pd.merge(resumen_hoy_1h,hoy_sensacion_termica)
        resumen_hoy_1h = pd.merge(resumen_hoy_1h,hoy_temperatura)
        #resumen_hoy_1h = pd.merge(resumen_hoy_1h,hoy_racha_max)
        resumen_hoy_1h = pd.merge(resumen_hoy_1h,hoy_viento)
        print(resumen_hoy_1h)



  periodo probPrecip probTormen probNieve
0    0107                                
1    0713          0          0         0
2    1319          0          0         0
3    1901          0          0         0
   periodo precipitacion nieve humedad_relativa  descripcion estado_cielo  \
0       07             0     0               77  Nubes altas          17n   
1       08             0     0               74  Nubes altas          17n   
2       09             0     0               71  Nubes altas           17   
3       10             0     0               63  Nubes altas           17   
4       11             0     0               56  Nubes altas           17   
5       12             0     0               50  Nubes altas           17   
6       13             0     0               49  Nubes altas           17   
7       14             0     0               47  Nubes altas           17   
8       15             0     0               46  Nubes altas           17   
9       16          

Generación de datos de Demanda
------------------------------

Generamos series de datos "de juguete" para la demo

In [8]:
nrow, ncol = barrios.shape
#print(nrow)
barrios['DEMANDA'] = np.round(np.abs(np.random.randn(nrow))*254)

my_array = barrios['DEMANDA']
total_demanda = my_array.sum()
#print(total_demanda)

#print(barrios.head())

In [9]:
import matplotlib.pyplot as plt

plt.hist(my_array, bins=21)  # arguments are passed to np.histogram
plt.title("Histograma de Demanda")
plt.show()

<Figure size 640x480 with 1 Axes>

In [10]:
distritos['DEMANDA_AGREGADA'] = np.nan
nrow, ncol = distritos.shape
#print(nrow)

for l in lista_distritos:
    barrio_aux = barrios.loc[barrios['NOMDIS'] == l]
    indices_aux = distritos.loc[distritos['NOMBRE'] == l].index.values
    for i in indices_aux:
        distritos.loc[i,'DEMANDA_AGREGADA']=barrio_aux['DEMANDA'].sum()
    
#print(distritos.head())

Bokeh
------

Usaremos el paquete *Bokeh* para tener representaciones interactivas

In [11]:
from bokeh.palettes import viridis,inferno,grey, cividis, plasma, magma
from bokeh.io import output_notebook
from bokeh.models import GeoJSONDataSource, HoverTool, CategoricalColorMapper, LinearColorMapper
from bokeh.plotting import figure, show
from bokeh.io import output_file, show
from bokeh.models import ColorBar
from bokeh.models import ColumnDataSource
from bokeh.models.widgets import CheckboxGroup

In [12]:
color_mapperLinear = LinearColorMapper(viridis(256))

color_bar = ColorBar(color_mapper=color_mapperLinear,
                     location=(0, 0),
                     label_standoff=12)

*Representación de puntos:* 
nos puede servir para la demo de la localización de la flota

In [13]:
geo_source_puntos = GeoJSONDataSource(geojson=vertices.to_json())

In [14]:
# etiquetas
hover_puntos = HoverTool(point_policy='follow_mouse')
hover_puntos.tooltips = [('Vértices', '@Vertice'), ('Situación', '@Situacion')]

# plot
puntos = figure(plot_width=750, plot_height=750,background_fill_color="lightgrey")
puntos.circle(x='x', y='y', size=4, alpha=0.7, source=geo_source_puntos)
puntos.add_tools(hover_puntos)
puntos.title.text = "Madrid: puntos"
puntos.xaxis.visible = False
puntos.yaxis.visible = False
puntos.grid.visible = False
#puntos.add_layout(color_bar, 'right')

# mostrar en notebook o en html
if (plotear_en_notebook):
    output_notebook()
else:
    output_file("mapa_Madrid_puntos.html")
    
show(puntos)

*Representación de polígonos-barrios:* 
nos puede servir para la demo de la localización de la población en Madrid

In [15]:
geo_source_barrios = GeoJSONDataSource(geojson=barrios.to_json())

In [16]:
# lista de Distritos
carrier_selection = CheckboxGroup(labels=lista_distritos, active = [0, 1])

# etiquetas
hover_barrios = HoverTool(point_policy='follow_mouse')
hover_barrios.tooltips = [('Barrio', '@NOMBRE'), ('Distrito', '@NOMDIS'), ('Densidad', '@densidad')]

# plot
barrios = figure(plot_width=750, plot_height=750,background_fill_color="lightgrey")
barrios.patches(xs='xs', ys='ys', alpha=0.7, source=geo_source_barrios, color={'field': 'densidad', 'transform': color_mapperLinear})
barrios.add_tools(hover_barrios)
barrios.title.text = "Madrid: densidad por barrios (Habitantes/Ha.)"
barrios.xaxis.visible = False
barrios.yaxis.visible = False
barrios.grid.visible = False
barrios.add_layout(color_bar, 'right')

# mostrar en notebook o en html
if (plotear_en_notebook):
    output_notebook()
else:
    output_file("mapa_Madrid_barrios.html")
    
show(barrios)

*Representación de polígonos-distritos de la Comunidad:* 
nos puede servir para la demo de la localización de la población fuera de Madrid Capital

In [17]:
geo_source_dist = GeoJSONDataSource(geojson=distritos.to_json())

In [18]:
color_bar = ColorBar(color_mapper=color_mapperLinear,
                     location=(0, 0),
                     label_standoff=12)

In [19]:
# etiquetas
hover_distritos = HoverTool(point_policy='follow_mouse')
hover_distritos.tooltips = [('Distrito', '@NOMBRE'), ('Densidad', '@densidad')]

# plot
distritos = figure(plot_width=750, plot_height=750,background_fill_color="lightgrey")
distritos.patches(xs='xs', ys='ys', alpha=0.7, source=geo_source_dist, color={'field': 'densidad', 'transform': color_mapperLinear})
distritos.add_tools(hover_distritos)
distritos.title.text = "Madrid: densidad por distritos (Habitantes/Ha.)"
distritos.xaxis.visible = False
distritos.yaxis.visible = False
distritos.grid.visible = False
distritos.add_layout(color_bar, 'right')

# mostrar en notebook o en html
if (plotear_en_notebook):
    output_notebook()
else:
    output_file("mapa_Madrid_distritos.html")
show(distritos)