# GeoPandas

[GeoPandas](http://geopandas.org/) es un proyecto de software libre que extiende los tipos de datos de [Pandas](http://pandas.pydata.org/) para incorporar objetos geométricos (puntos, líneas, polígonos, etc). GeoPandas se apoya en las bibliotecas [Shapely](https://pypi.org/project/Shapely/) para realizar las operaciones geométricas, [Fiona](https://github.com/Toblerity/Fiona) para acceder a los datos (ej. en archivos) y [Descartes](https://bitbucket.org/sgillies/descartes/src/default/) y [Matplotlib](https://matplotlib.org/) para graficación.

El objetivo de GeoPandas es facilitar el trabajo con datos geoespaciales en el lenguaje Python, lo que se logra a través de la implementación de estructuras que permiten manejar simultáneamente grandes cantidades de datos. Las dos estructuras principales de GeoPandas son:

- [GeoSeries](http://geopandas.org/data_structures.html#geoseries): es un vector en el que cada elemento es un conjunto de una o varias geometrías correspondientes a una observación. Por ejemplo, el polígono (o multipolígono) que representa una provincia.
- [GeoDataFrame](http://geopandas.org/data_structures.html#geodataframe): es una estructura tabular (i.e. con filas y columnas) de datos geométricos y no geométricos (ej. textos, números). El conjunto de geometrías se implementa a través de GeoSeries.

Con estas estructuras, es posible realizar desde Python operaciones "masivas" de datos, las cuales de otra forma requerirían de una base de datos geoespacial (ej. [PostgreSQL/PostGIS](https://postgis.net/)).

## Instalación

Para instalar el paquete mediante **conda**, debe ejecutarse la siguiente instrucción desde la línea de comandos de Anaconda:

```
conda install geopandas
```

## Importación

In [None]:
%matplotlib inline

import pandas as pd
import geopandas

from shapely.geometry import Point, Polygon

# Cantidad máxima de registros que se despliegan en un GeoDataFrame
pd.options.display.max_rows = 10

## Ejemplos

Para los siguientes ejemplos, se utilizará el _shapefile_ de países de [Natural Earth](https://www.naturalearthdata.com/), disponible en [http://www.naturalearthdata.com/downloads/110m-cultural-vectors/110m-admin-0-countries/](http://www.naturalearthdata.com/downloads/110m-cultural-vectors/110m-admin-0-countries/). El enlace anterior brinda acceso a un archivo ZIP que debe colocarse en el directorio de datos (/datos). Una vez hecho esto, se procede a almacenar los datos en un GeoDataFrame, a través de la función **read_file()**.

In [None]:
paises = geopandas.read_file("zip://./datos/ne_110m_admin_0_countries.zip")
# si se descomprimió el archivo, debe usarse el comando:
# paises = geopandas.read_file("datos/ne_110m_admin_0_countries/ne_110m_admin_0_countries.shp")

In [None]:
# paises es una variable del tipo GeoDataFrame
type(paises)

### Visualización de datos tabulares

Los datos de un GeoDataFrame pueden inspeccionarse con la función **head()**, la cual retorna los primeros registros de un GeoDataFrame. Nótese la columna con el tipo de datos geométricos.

In [None]:
paises.head()

In [None]:
# Despliegue de las geometrías
paises.geometry

In [None]:
# paises.geometry es una variable del tipo GeoSeries
type(paises.geometry)

In [None]:
# Despliegue de la lista de columnas
paises.columns

In [None]:
# Despliegue de un subconjunto de columnas
paises[['NAME_ES','CONTINENT','ECONOMY']]

**Funciones en columnas**

In [None]:
# Promedio
paises['POP_EST'].mean()

In [None]:
# Máximo
paises['POP_EST'].max()

In [None]:
# Mínimo
paises['POP_EST'].min()

**Filtrado**

In [None]:
paises[paises['CONTINENT'] == 'Africa']

In [None]:
paises[paises['POP_EST'] <= 100000]

### Visualización de datos geoespaciales

La función [plot()](http://geopandas.org/reference.html#geopandas.GeoDataFrame.plot) proporciona una manera sencilla de visualizar los datos en un mapa.

In [None]:
paises.plot()

In [None]:
paises_asia = paises[paises['CONTINENT'] == 'Asia']
paises_asia.plot()

In [None]:
# Cambio de tamaño del mapa
paises_asia.plot(figsize=(15, 10))

**Colores**

In [None]:
paises_asia.plot(figsize=(15, 10), cmap="rainbow")

In [None]:
# Colores asignados con base en una columna
paises_asia.plot(figsize=(15, 10), cmap="YlOrRd", column="POP_EST")

Para más opciones de colores, puede consultarse [https://matplotlib.org/users/colormaps.html](https://matplotlib.org/users/colormaps.html).

#### Visualización de múltiples capas

Para los siguientes ejemplos, deben descargarse los siguientes _shapefiles_ comprimidos en formato ZIP:

- **Ciudades**: [http://www.naturalearthdata.com/downloads/110m-cultural-vectors/110m-populated-places/](http://www.naturalearthdata.com/downloads/110m-cultural-vectors/110m-populated-places/)
- **Ríos**: [http://www.naturalearthdata.com/downloads/50m-physical-vectors/50m-rivers-lake-centerlines/](http://www.naturalearthdata.com/downloads/50m-physical-vectors/50m-rivers-lake-centerlines/)

Ambas capas deben copiarse en el directorio de datos. Seguidamente, su contenido se almacena en dos GeoDataFrames:

In [None]:
ciudades = geopandas.read_file("zip://./datos/ne_110m_populated_places.zip")
rios = geopandas.read_file("zip://./datos/ne_50m_rivers_lake_centerlines.zip")

Se crea un subconjunto de datos para el continente africano:

In [None]:
paises_africa = paises[paises['CONTINENT'] == 'Africa']

In [None]:
ax = paises.plot(edgecolor='black', facecolor='none', figsize=(15, 10))
rios.plot(ax=ax, color='blue')
ciudades.plot(ax=ax, color='red')
ax.set(xlim=(-20, 60), ylim=(-40, 40))

<div class="alert alert-success">
 <strong>Ejercicio</strong>:

Descargue del SNIT las capas de:
* Límite provincial [(http://www.snitcr.go.cr/servicios_ogc_lista_capas?k=bm9kbzo6MjY=&nombre=IGN%20Cartograf%C3%ADa%201:5mil)](http://www.snitcr.go.cr/servicios_ogc_lista_capas?k=bm9kbzo6MjY=&nombre=IGN%20Cartograf%C3%ADa%201:5mil)
* Aeródromos y red vial [(http://www.snitcr.go.cr/servicios_ogc_lista_capas?k=bm9kbzo6MjY=&nombre=IGN%20Cartograf%C3%ADa%201:5mil)](http://www.snitcr.go.cr/servicios_ogc_lista_capas?k=bm9kbzo6MjY=&nombre=IGN%20Cartograf%C3%ADa%201:5mil)

Despliegue las tres capas en un solo mapa.

</div>

**Datos geoespaciales en archivos de texto**

En estos casos, puede crearse un DataFrame convencional a partir del archivo de texto y un conjunto de geometrías a partir de las columnas correspondientes (ej. longitud, latitud). Posteriormente, se crea un GeoDataFrame combinando el DataFrame y las geometrías. A continuación, se presenta un ejemplo.

Para comenzar, descargue el archivo de datos de presencia en Costa Rica del género de aves [Trogon](https://en.wikipedia.org/wiki/Trogon_(genus)) de [http://api.gbif.org/v1/occurrence/download/request/0021444-190621201848488.zip](http://api.gbif.org/v1/occurrence/download/request/0021444-190621201848488.zip) y descomprímalo.

In [None]:
# Carga de los datos en un DataFrame
trogones_df = pd.read_csv("datos/0021444-190621201848488.csv", sep='\t')

In [None]:
trogones_df.head()

In [None]:
# Despliegue de un subconjunto de columnas
trogones_df[['species', 'decimalLongitude', 'decimalLatitude', 'eventDate']]

In [None]:
# Se crea una lista de geometrías de puntos
puntos = [Point(xy) for xy in zip(trogones_df["decimalLongitude"], trogones_df["decimalLatitude"])]
puntos[:5]

In [None]:
# Se combina el DataFrame y las geometrías en un GeoDataFrame, junto con un sistema de coordenadas
trogones=geopandas.GeoDataFrame(trogones_df, crs={"init": "epsg:4326"}, geometry=puntos)

In [None]:
trogones.head()

In [None]:
# Mapa de los registros de presencia de trogones
trogones.plot(figsize=(15, 10), color="red", markersize=5)

<div class="alert alert-success">
 <strong>Ejercicio</strong>:

Despliegue los registros de presencia de trogones sobre la capa de provincias del SNIT.

</div>

In [None]:
provincias = geopandas.read_file("datos/cr_provincias_wgs84_snit_ign_2019.shp")

ax = provincias.plot(edgecolor='black', facecolor='none', figsize=(15, 10))
trogones.plot(ax=ax, color='red', markersize=5)
ax.set(xlim=(-86.5, -82), ylim=(8, 11.25))