# Datos geográficos del gobierno boliviano

> Inventario de datos geográficos publicados por entidades de gobierno en Bolivia

In [1]:
import xmltodict
import requests
import datetime as dt
from requests.adapters import HTTPAdapter
import pandas as pd
from IPython.display import display, Markdown
from itables import show, init_notebook_mode
init_notebook_mode()

pd.options.display.max_columns = 500
pd.options.display.max_colwidth = 500

<IPython.core.display.Javascript object>

In [2]:
def create_session(retries):
    s = requests.Session()
    s.mount('http://', HTTPAdapter(max_retries=retries))
    s.mount('https://', HTTPAdapter(max_retries=retries))
    return s

def decode_columns(capas):
    for column in ['nombre', 'titulo', 'abstract']:
        capas[column] = capas[column].apply(lambda x: x.encode("iso-8859-1").decode('utf-8') if type(x) == str else x)
    capas['keywords'] = capas['keywords'].apply(lambda keys: [k.encode("iso-8859-1").decode('utf-8') for k in keys])
    return capas

def download_wms(geoserver_domain, geoserver_name, decode=True, encodeuri=False):
    
    columns = ['Name', 'Title', 'Abstract', 'CRS', 'EX_GeographicBoundingBox.westBoundLongitude', 'EX_GeographicBoundingBox.eastBoundLongitude', 'EX_GeographicBoundingBox.southBoundLatitude', 'EX_GeographicBoundingBox.northBoundLatitude', 'KeywordList.Keyword']
    column_names = ['nombre', 'titulo', 'abstract', 'crs', 'limite_oeste', 'limite_este', 'limite_sur', 'limite_norte', 'keywords']
    url = 'http://{}/geoserver/ows?service=wms&request=GetCapabilities'.format(geoserver_domain)
    print(url)
    try:
        response = s.get(url, timeout=30)
        capabilities = xmltodict.parse(response.text)
        capas = pd.json_normalize(capabilities['WMS_Capabilities']['Capability']['Layer']['Layer'])
        capas = capas[columns]
        capas.columns = column_names
        return capas
    except Exception as e:
        print(e)
        return pd.DataFrame()

def download_wfs(geoserver_domain, geoserver_name, decode=True, encodeuri=False):
    
    columns = ['Name', 'Title', 'Abstract', 'SRS', 'LatLongBoundingBox.@minx', 'LatLongBoundingBox.@maxx', 'LatLongBoundingBox.@miny', 'LatLongBoundingBox.@maxy', 'Keywords']
    column_names = ['nombre', 'titulo', 'abstract', 'crs', 'limite_oeste', 'limite_este', 'limite_sur', 'limite_norte', 'keywords']
    if encodeuri:
        url = 'http://{}/geoserver/ows?service=wfs%26version=1.0.0%26request=GetCapabilities'.format(geoserver_domain)
    else:
        url = 'http://{}/geoserver/ows?service=wfs&version=1.0.0&request=GetCapabilities'.format(geoserver_domain)
    print(url)
    try:
        response = s.get(url, timeout=30)
        capabilities = xmltodict.parse(response.text)
        capas = pd.json_normalize(capabilities['WFS_Capabilities']['FeatureTypeList']['FeatureType'])
        capas = capas[columns]
        capas.columns = column_names
        return capas
    except Exception as e:
        print(e)
        return pd.DataFrame()
    

def format_download(geoserver_domain, nombre, file_format, encodeuri=False):
    if encodeuri:
        return 'http://{}/geoserver/ows?service=WFS%26request=GetFeature%26typeName={}%26outputFormat={}'.format(geoserver_domain, nombre, file_format)
    else:
        return 'http://{}/geoserver/ows?service=WFS&request=GetFeature&typeName={}&outputFormat={}'.format(geoserver_domain, nombre, file_format)
        

def get_capas(geoserver_domain, geoserver_name, service, decode=True, encodeuri=False):
    
    capas = pd.DataFrame()
    if service == 'wms':
        capas = download_wms(geoserver_domain, geoserver_name, decode=True, encodeuri=encodeuri)
    elif service == 'wfs':
        capas = download_wfs(geoserver_domain, geoserver_name, decode=True, encodeuri=encodeuri)
    if 'nombre' in capas.columns:
        print(len(capas))
        capas['geojson'] = capas.nombre.apply(lambda nombre: format_download(geoserver_domain, nombre, 'application/json', encodeuri))
        capas['csv'] = capas.nombre.apply(lambda nombre: format_download(geoserver_domain, nombre, 'csv', encodeuri))
        capas['keywords'] = capas['keywords'].fillna('').apply(lambda keys: [k for k in keys if type(k) == str] if type(keys) == list else keys)
        capas.insert(0, 'sistema', geoserver_name)
        if decode:
            capas = decode_columns(capas)
    return capas
    
def update(geoserver_domains):
    geodata = []
    for entry in geoserver_domains:
        capas = get_capas(geoserver_domain=entry['domain'], geoserver_name=entry['short_name'], service=entry['service'], decode=entry['decode'], encodeuri=entry['encodeuri'])
        geodata.append(capas)
    return pd.concat(geodata)

geoserver_domains = [
    dict(domain='geoserver.oopp.gob.bo', decode=True, name='Ministerio de Obras Públicas, Servicios y Vivienda', short_name='MOPSV', service='wms', encodeuri=False), 
    dict(domain='geo.gob.bo', decode=False, name='GeoBolivia', short_name='GeoBolivia', service='wfs', encodeuri=False), 
    dict(domain='sig01.mmaya.gob.bo', decode=True, name='Ministerio de Medio Ambiente y Agua', short_name='MMAYA', service='wms', encodeuri=False),
    dict(domain='siip.produccion.gob.bo:8080', decode=True, name='Sistema Integrado de Información Productiva', short_name='SIIP', service='wms', encodeuri=False),
    dict(domain='sitservicios.lapaz.bo', decode=True, name='Sistema de Información Territorial del Gobierno Autónomo Municipal de La Paz', short_name='SIT La Paz', service='wms', encodeuri=False),
    dict(domain='geosunit.vicetierras.gob.bo', decode=True, name='GeoSUNIT del Viceministerio de Tierras', short_name='GeoSunit', service='wms', encodeuri=False),
    dict(domain='incendios.fan-bo.org:8080', decode=True, name='Sistema de monitoreo y alerta temprana de riesgos de incendios forestales', short_name='FAN', service='wms', encodeuri=False),
    dict(domain='seie.minedu.gob.bo:8080', decode=True, name='Sistema de Estadísticas e Indicadores Educativos', short_name='SEIE', service='wms', encodeuri=False),
    # dict(domain='geo03.siarh.gob.bo', decode=True, name='GeoSIARH Sistema de Información Ambiental y de Recursos Hídricos', short_name='GeoSIARH'),
    # dict(domain='geonode.fonadin.gob.bo', decode=True, name='Fondo Nacional de Desarrollo Integral', short_name='FONADIN'),
    dict(domain='sigvmeea.hidrocarburos.gob.bo', decode=True, name='Sistema de Información Geográfica en Línea para Electricidad y Energías Alternativas', short_name='Sigvmeea', service='wms', encodeuri=False),
    # dict(domain='geoportal.ypfb.gob.bo', decode=True, name='Infraestructura de Datos Espaciales de Hidrocarburos', short_name='YPFB'),
    dict(domain='sigedv2.ine.gob.bo', decode=True, name='Sistema de Información Geográfica Estadística para el Desarrollo', short_name='SIGED', service='wms', encodeuri=False),
    dict(domain="190.181.15.211:8085", decode=True, name='Observatorio Agroambiental y Productivo', short_name="Observatorio Agro", service='wms', encodeuri=False),
    dict(domain="maps.abe.bo:8081", decode=False, name='Agencia Boliviana Espacial', short_name='ABE', service='wfs', encodeuri=False),
    dict(domain="bolivia.dewetra.cimafoundation.org", decode=True, name='Dewetra', short_name='Dewetra', service='wms', encodeuri=False),
    dict(domain="sitservicios.lapaz.bo/proxy2.jsp?url=http://gmlpsr0038:8080", decode=False, name="SIT La Paz 2", short_name="SIT La Paz 2", service="wfs", encodeuri=True)
]

s = create_session(5)
data = update(geoserver_domains)
data.to_csv('geodatos.csv', index=False)

http://geoserver.oopp.gob.bo/geoserver/ows?service=wms&request=GetCapabilities
51
http://geo.gob.bo/geoserver/ows?service=wfs&version=1.0.0&request=GetCapabilities
syntax error: line 1, column 49
http://sig01.mmaya.gob.bo/geoserver/ows?service=wms&request=GetCapabilities
220
http://siip.produccion.gob.bo:8080/geoserver/ows?service=wms&request=GetCapabilities
81
http://sitservicios.lapaz.bo/geoserver/ows?service=wms&request=GetCapabilities
275
http://geosunit.vicetierras.gob.bo/geoserver/ows?service=wms&request=GetCapabilities




HTTPConnectionPool(host='geosunit.vicetierras.gob.bo', port=80): Max retries exceeded with url: /geoserver/ows?service=wms&request=GetCapabilities (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7fa362971f60>: Failed to establish a new connection: [Errno 111] Connection refused',))
http://incendios.fan-bo.org:8080/geoserver/ows?service=wms&request=GetCapabilities
'WMS_Capabilities'
http://seie.minedu.gob.bo:8080/geoserver/ows?service=wms&request=GetCapabilities
26
http://sigvmeea.hidrocarburos.gob.bo/geoserver/ows?service=wms&request=GetCapabilities
194
http://sigedv2.ine.gob.bo/geoserver/ows?service=wms&request=GetCapabilities
293
http://190.181.15.211:8085/geoserver/ows?service=wms&request=GetCapabilities
116
http://maps.abe.bo:8081/geoserver/ows?service=wfs&version=1.0.0&request=GetCapabilities
199
http://bolivia.dewetra.cimafoundation.org/geoserver/ows?service=wms&request=GetCapabilities
1355
http://sitservicios.lapaz.bo/proxy2.jsp?url=http://gmlpsr003

In [3]:
def resumen_sistemas():
    sistemas = {g['short_name']:g['name'] for g in geoserver_domains}
    dfi = data.sistema.value_counts().reset_index()
    dfi.columns = ['Abreviación', 'Número de capas']
    dfi.insert(1, 'Sistema', dfi.Abreviación.map(sistemas))
    return dfi

display(Markdown('**Número de capas por sistema geográfico consultado:**'))
display(resumen_sistemas())

**Número de capas por sistema geográfico consultado:**

Unnamed: 0,Abreviación,Sistema,Número de capas
0,Dewetra,Dewetra,1355
1,SIGED,Sistema de Información Geográfica Estadística para el Desarrollo,293
2,SIT La Paz 2,SIT La Paz 2,286
3,SIT La Paz,Sistema de Información Territorial del Gobierno Autónomo Municipal de La Paz,275
4,MMAYA,Ministerio de Medio Ambiente y Agua,220
5,ABE,Agencia Boliviana Espacial,199
6,Sigvmeea,Sistema de Información Geográfica en Línea para Electricidad y Energías Alternativas,194
7,Observatorio Agro,Observatorio Agroambiental y Productivo,116
8,SIIP,Sistema Integrado de Información Productiva,81
9,MOPSV,"Ministerio de Obras Públicas, Servicios y Vivienda",51


In [4]:
def draw_table(df):
    
    dfi = df[['sistema', 'titulo', 'abstract', 'geojson', 'csv']].copy()
    dfi = dfi.drop_duplicates(subset=['titulo'])
    dfi['titulo'] = dfi['titulo'].apply(lambda n: '<b>{}</b>'.format(n))
    dfi['geojson'] = dfi['geojson'].apply(lambda url: '<a href="{}">{}</a>'.format(url, "geojson"))
    dfi['csv'] = dfi['csv'].apply(lambda url: '<a href="{}">{}</a>'.format(url, "csv"))
    dfi['abstract'] = dfi['abstract'].fillna('')
    # dfi['keywords'] = dfi['keywords'].fillna('').apply(lambda keys: ', '.join([str(k) for k in keys if k not in ['features']]) if type(keys) == list else str(keys))
    dfi.columns = ['Sistema', 'Nombre', 'Descripción', '', ' ']
    dfi = dfi.set_index('Nombre').sort_index(ascending=True)

    show(dfi, 
         order = [],
         hover = True,
         compact=True,
         scrollY="900px", 
         lengthMenu=[50,100],
         scrollCollapse=True,
         search={"caseInsensitive": True},
         paging=True,
         language={
             'lengthMenu': 'Mostrar _MENU_ filas',
             'search': '&#x1F50E;&#xFE0E;', 
             'processing': 'creando tabla ...', 
             'info': '', 
             'infoEmpty': '', 
             'infoFiltered':'_TOTAL_ documentos',
             'paginate': {
                'first': "Primero",
                'previous': "Anterior",
                'next': "Siguiente",
                'last': "Último"
            },
         }, 
         maxBytes=0,
         columnDefs=[
             {"width": "5px", "targets": [3, 4]},
             {"width": "20px", "targets": [1]},
             {"width": "100px", "targets": [0,2]}
         ]
        )

draw_table(data)

Unnamed: 0,Sistema,Descripción,Unnamed: 3,Unnamed: 4
Loading... (need help?),,,,


In [5]:
display(Markdown("- Datos actualizados en {}.\n- [Más información sobre cada capa](https://flatgithub.com/mauforonda/geodatos?filename=geodatos.csv&filters=&sort=titulo%2Casc&stickyColumnName=titulo).\n- [Historial de cambios](https://github.com/mauforonda/geodatos/commits/master/geodatos.csv).\n- Nuevos servicios y datos serán probablemente agregados en el futuro.".format(dt.datetime.now().strftime('**%Y-%m-%d**'))))

- Datos actualizados en **2022-09-21**.
- [Más información sobre cada capa](https://flatgithub.com/mauforonda/geodatos?filename=geodatos.csv&filters=&sort=titulo%2Casc&stickyColumnName=titulo).
- [Historial de cambios](https://github.com/mauforonda/geodatos/commits/master/geodatos.csv).
- Nuevos servicios y datos serán probablemente agregados en el futuro.