# Herramientas para el manejo de datos geoespaciales

En este trabajo se explicara el funcionamiento de la herramienta de muestreo de puntos en mapas interactivos de geopandas. Para esta actividad se utilizará el archivo de municipios de Puebla (proveniente del INEGI) utilizado en la actividad introductoria a QGIS.

In [26]:
!pip install geopandas
!pip install folium matplotlib mapclassify
!pip install pointpats

Collecting pointpats
  Downloading pointpats-2.5.1-py3-none-any.whl.metadata (4.7 kB)
Collecting libpysal>=4.8 (from pointpats)
  Downloading libpysal-4.12.1-py3-none-any.whl.metadata (4.8 kB)
Downloading pointpats-2.5.1-py3-none-any.whl (59 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m59.2/59.2 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading libpysal-4.12.1-py3-none-any.whl (2.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.8/2.8 MB[0m [31m33.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: libpysal, pointpats
Successfully installed libpysal-4.12.1 pointpats-2.5.1


In [8]:
import geopandas
from IPython import get_ipython
from IPython.display import display
import folium
import matplotlib.pyplot as plt
import mapclassify

In [9]:
# Cargamos el archivo
archivo = 'Municipios.gpkg'

puebla = geopandas.read_file(archivo)

# Simplificamos la geometría para reducir consumo computacional
puebla.geometry = puebla.simplify(200)

In [10]:
# Imprimimos el mapa interactivo
puebla.explore()

## Muestreo aleatorio

In [13]:
# Tomamos una muestra aleatoria de 50 municipios
muestra_50 = puebla.sample(50)
mapa = puebla.explore()
muestra_50.explore(m=mapa, color='red')

Veamos la geometría de frontera de un municipio en particular

In [17]:
municipio_partes = puebla.iloc[[3]].explode(ignore_index=True)
municipio = municipio_partes.iloc[[0]]
municipio.boundary.explore()

In [18]:
# Tomemos puntos aleatorios de esta frontera con el metodo sample_points()
municipio_puntos = municipio.boundary.sample_points(200)
m = municipio.explore()
municipio_puntos.explore(m=m, color='red')

In [19]:
# Visualicemoslos numéricamente...
municipio_puntos

Unnamed: 0,sampled_points
0,"MULTIPOINT (2959261.627 900773.925, 2959303.50..."


In [20]:
# Podemos ver cada uno de los puntos individualmente
municipio_puntos.explode()

Unnamed: 0,sampled_points
0,POINT (2959261.627 900773.925)
0,POINT (2959303.508 900784.04)
0,POINT (2959385.983 900339.795)
0,POINT (2959389.137 900328.785)
0,POINT (2959397.582 900299.305)
...,...
0,POINT (2964435.27 903447.709)
0,POINT (2964452.229 903482.952)
0,POINT (2964467.531 903514.75)
0,POINT (2964468.613 903755.354)


También podemos muestrear diferentes cantidades de puntos en diferentes municipios,
si pasamos un array especificando el tamaño de la muestra por municipio

In [24]:
# En este caso tenemos que especificar para cada uno de los 217 municipios,
# entonces se utilizarán números aleatoriamente generados
variable = puebla.sample_points([32, 18, 47, 9, 26, 41, 3, 38, 14, 29,
  7, 43, 21, 36, 11, 49, 2, 27, 15, 33,
  32, 18, 47, 9, 26, 41, 3,
  5, 46, 22, 39, 8, 31, 19, 44, 13, 25,
  37, 4, 28, 16, 42, 10, 35, 23, 48, 6,
  30, 17, 45, 12, 24, 40, 1, 34, 20, 50,
  0, 29, 16, 43, 7, 32, 20, 47, 11, 38,
  3, 25, 14, 41, 9, 35, 21, 49, 5, 30,
  17, 44, 8, 33, 22, 46, 13, 27, 19, 39,
  2, 28, 15, 42, 10, 36, 24, 50, 6, 31,
  18, 45, 12, 37, 4, 26, 23, 47, 1, 34,
  9, 43, 16, 29, 7, 32, 20, 48, 14, 38,
  5, 25, 11, 41, 2, 35, 19, 44, 8, 30,
  23, 46, 13, 28, 17, 39, 3, 36, 21, 49,
  10, 27, 15, 40, 6, 31, 24, 50, 12, 33,
  18, 45, 0, 37, 22, 42, 4, 29, 16, 47,
  9, 34, 21, 43, 7, 26, 13, 38, 1, 32,
  19, 48, 11, 35, 25, 40, 5, 30, 17, 44,
  8, 27, 22, 46, 14, 39, 3, 31, 15, 42,
  10, 36, 20, 49, 6, 28, 18, 45, 2, 33,
  24, 41, 12, 37, 0, 23, 16, 50, 7, 29,
  15, 45, 3, 27, 11, 36, 19, 48, 0, 500])
m = puebla.explore()
variable.explore(m=m, color='red')

En estos casos, la distribucion de probabilidad se mantiene uniforme para todos los puntos. Podemos cambiar la distrubición para patrones más complejos

In [33]:
sample_t = puebla.sample_points(method='cluster_poisson', size=50, n_seeds=5, cluster_radius=750)
m = puebla.explore()
sample_t.explore(m=m, color='red')

Aqui se puede ver como los puntos están más densos en ciertas zonas.