# **Ajustar puntos a la geometría más cercana**

## **1. Introducción**

En el análisis geoespacial, asegurar la coherencia topológica entre distintas capas de
información es fundamental para garantizar la precisión y confiabilidad de los datos.
En entornos urbanos, es común que las direcciones no se alineen exactamente con los
límites de sus respectivas manzanas debido a errores de captura o a la integración de
datos provenientes de distintas fuentes. Estas discrepancias pueden impactar los análisis
espaciales y las visualizaciones, por lo que es necesario aplicar técnicas de ajuste
geométrico que corrijan estas inconsistencias y preserven la integridad topológica de la
información.

## **2. Objetivo**

Implementar un procedimiento para ajustar la ubicación de las direcciones a su manzana 
correspondiente, garantizando la coherencia topológica y mejorando la precisión de los 
datos espaciales.

## **3. Alcance**
            
En este artículo se trabajará con datos de direcciones y manzanas, representados como 
geometrías de puntos y polígonos, respectivamente. Cada entidad cuenta con un código 
que establece la relación entre ambas (código de manzana). El ajuste se aplicará únicamente 
a los puntos cuyo código de manzana coincida con el de la manzana correspondiente. Si los 
datos de direcciones no incluyen este código, se recomienda realizar una unión espacial 
con la manzana más cercana para asignarlo; sin embargo, este procedimiento queda fuera del 
alcance de este artículo.

## **4. Datos Utilizados**

Para este proceso, utilizaremos dos capas geoespaciales:

* **Capa de direcciones**: Representa ubicaciones de direcciones con un código de manzana asociado.
* **Capa de manzanas**: Contiene los polígonos de las manzanas con su respectivo código.

El código de manzana en ambas capas es clave para garantizar que el ajuste se realice correctamente.

## **5. Herramientas para el Proceso**

Para realizar el ajuste de los puntos, utilizaremos los siguientes módulos de Python:

* **GeoPandas**: Para manejar datos espaciales en formato vectorial.
* **Shapely**: Para encontrar el punto más cercano entre dos geometría.

A continuación, importamos los módulos:

In [None]:
import geopandas as gpd
from shapely.ops import nearest_points

## **6. Preprocesamiento de Datos**

### **Inspeccionar archivos de entrada**

Los datos se almacenan en un GeoPackage llamado `sample_data`. Para identificar el nombre de cada capa, primero inspeccionaremos el archivo utilizando el comando gdalinfo de la suite GDAL.

In [None]:
!ogrinfo ../data/sample_data.gpkg

### **Lectura de datos Geoespaciales**

Una vez verificado los datos, procederemos a lectura de los datos geoespaciales utilizando para esto geopandas y su método **[read_file](https://geopandas.org/en/stable/docs/reference/api/geopandas.read_file.html)**

In [None]:
blocks = gpd.read_file(filename='../data/sample_data.gpkg', layer='blocks')
apts = gpd.read_file(filename='../data/sample_data.gpkg', layer='address_points')

### **Filtrar columnas de interes**

A continuación, analizamos las columnas de ambos GeoDataFrames para identificar los campos relevantes para el proceso.

In [None]:
blocks.columns.values

In [None]:
apts.columns.values

Para la capa de Manzanas, seleccionaremos los campos de "CODIGOMANZANA" y "geometry". Para las direcciones, los campos de "OBJECTID", "CODIGOMANZANA" y "geometry"

In [None]:
blocks = blocks[['CODIGOMANZANA','geometry']]
blocks.head(1)

In [None]:
apts = apts[['OBJECTID','CODIGOMANZANA','geometry']]
apts.head(1)

### **Verificar el campo "CODIGOMANZANA"**

El campo "CODIGOMANZANA" es el vínculo que relaciona las direcciones con las manzanas. Para unir ambas capas correctamente, este campo debe tener el mismo tipo de dato en ambas tablas. Verifiquemos que se cumpla esta condición

In [None]:
blocks.dtypes

In [None]:
apts.dtypes

Observamos que el campo "CODIGOMANZANA" en la capa de direcciones es de tipo float, mientras que en la capa de manzanas es de tipo integer. Para asegurar la compatibilidad entre ambas, convertiremos el campo en la capa de direcciones de float a integer.

In [None]:
# Convertir de float a entero
apts['CODIGOMANZANA'] = apts['CODIGOMANZANA'].astype('int64')
# Consultar el tipo de dato de los campos
apts.dtypes

### **Verificar el sistema de referencia espacial**

Para realizar el proceso de ajuste espacial, ambas capas deben estar en el mismo Sistema de Referencia. Evaluamos si ambas presentan el mismo CRS

In [None]:
blocks.crs == apts.crs

Ambas capas poseen el mismo CRS, veamos cual es:

In [None]:
blocks.crs

Ambas capas se encuentran en el CRS WGS 84 / UTM zone 18S (EPS: 32178)

### **Calcular el anillo exterior para la manzanas**

Para realizar el Snap al borde de la manzana necesitamos que la geometría sea de tipo lineal. Para esto, calcularemos el anillo exterior de los polígonos

In [None]:
# Convertir de Multipolygon a Polygon
blocks = blocks.explode()

#Crear un campo con la geometría del anillo exterior
blocks['exterior'] = blocks.exterior

# Visualizar el primer registro
blocks[['CODIGOMANZANA','geometry','exterior']].head(1)

## **7. Ajuste Espacial**

Para realizar proceso de ajuste espacial utilizaremos la función **[nearest_points](https://shapely.readthedocs.io/en/2.0.4/manual.html#nearest-points)**  que se utiliza para encontrar los puntos más cercanos entre dos geometrías.

**Descripción:**

**`nearest_points(geom1, geom2)`** devuelve un par de puntos:

* El primer punto pertenece a geom1 y es el más cercano a geom2.
* El segundo punto pertenece a geom2 y es el más cercano a geom1.

Para garantizar que cada dirección se ajuste correctamente a su manzana correspondiente, primero alinearemos ambas capas utilizando el campo "CODIGOMANZANA". Dado que cada punto debe asociarse con la manzana que comparte el mismo código, primero incorporaremos la geometría de los polígonos al GeoDataFrame de las direcciones. Luego, utilizaremos **`apply`** para calcular el punto de ajuste de manera eficiente, optimizando el proceso al reducir comparaciones innecesarias.

Por lo tanto, el primer paso será alinear las manzanas con el siguiente código:

In [None]:
aptsMerge = apts.merge(blocks[['CODIGOMANZANA','exterior']],
                       on='CODIGOMANZANA', 
                       how='left')

Visualicemos el resultado:

In [None]:
aptsMerge[['OBJECTID','CODIGOMANZANA','geometry','exterior']].head(3)

El siguiente código ajusta espacialmente cada punto a su manzana correspondiente, utilizando ambas geometrías.

In [None]:
# Ajuste Espacial
aptsMerge["snap"] = aptsMerge.apply(lambda row: nearest_points(row["geometry"],
                                                                row["exterior"])[1],
                                     axis=1)

Como resultado, se agrega una nueva columna llamada "snap" al GeoDataFrame **`aptsMerge`**, donde cada fila almacena el punto más cercano en la geometría de referencia (el "exterior" de cada manzana).


>_**NOTA**: En versiones recientes de GeoPandas, es posible utilizar la función directamente, no obstante, se recomienda el uso de `apply` para garantizar compatibilidad con versiones anteriores:_<br>
> `aptsMerge['geom_snapp'] = list(nearest_points(aptsMerge['geometry'], aptsMerge['exterior']))[1]`

Luego, asignaremos la nueva geometría a la capa, estableceremos el CRS y eliminaremos las geometrías anteriores.

In [None]:
# Actualizar la capa con la geometría ajustada
aptsMerge = aptsMerge.set_geometry('snap')
aptsMerge = aptsMerge.set_crs('32718')

# Eliminar geometrías anteriores:
del aptsMerge['exterior']
del aptsMerge['geometry']

Finalmente, exportaremos los resultados como GeoJSON

In [None]:
aptsMerge.to_file('../data/apts_adj.gjson', driver='GeoJSON')

## 8. Visualización de Resultados

Para evaluar el ajuste, se comparan las ubicaciones antes y después del proceso utilizando Mapas interactivos con Folium que Facilitan la exploración de los datos ajustados en un entorno dinámico, permitiendo alternar entre la vista original y la corregida.

## 9. Recomendaciones Finales

Para asegurar un ajuste preciso y confiable, se deben considerar los siguientes puntos:

* Siempre verificar la coherencia de los códigos de manzana antes de aplicar el ajuste.
* Si los datos provienen de fuentes diferentes, realizar una validación previa antes de asignar puntos a manzanas.
* Visualizar los resultados antes y después, para asegurarse de que el ajuste ha sido exitoso.

## 10. Conclusión

El uso de Snap To Geometry en Python permite corregir la ubicación de direcciones respetando la relación punto-manzana mediante un código común. Gracias a herramientas como GeoPandas y Shapely, podemos automatizar este proceso y mejorar la calidad de nuestros datos espaciales.