# Bases de datos espaciales: PostGIS y su integración con Python

```{admonition} Guía para el docente
:class: danger
- Incluye ejemplos prácticos en SQL y Python, utilizando tanto `psycopg2` como `SQLAlchemy`.
- El objetivo es facilitar la enseñanza de conceptos espaciales mediante actividades guiadas.
```

```{admonition} Recursos
:class: note

- Capa vectorial (Shapefile de muestras de cobertura): [📥 Muestras_Ejemplo](https://igacoffice365-my.sharepoint.com/:f:/r/personal/juans_hernandez_igac_gov_co/Documents/Recursos_BDE_PostGIS_Diplomado/Muestras_Ejemplo?csf=1&web=1&e=x8juEL)

- Imagen satelital recortada (formato `.tif`): [📥 Imagen_Ejemplo](https://igacoffice365-my.sharepoint.com/:f:/r/personal/juans_hernandez_igac_gov_co/Documents/Recursos_BDE_PostGIS_Diplomado/Imagen_Ejemplo?csf=1&web=1&e=5ZURPK)

Es importante la descarga de los recursos para el desarrollo de la sesión.
```

### Definiciones preliminares

**Base de datos**

"...Una base de datos es una recopilación organizada de información o datos estructurados, que normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una base de datos está controlada por un sistema de gestión de bases de datos (DBMS). En conjunto, los datos y el DBMS, junto con las aplicaciones asociadas a ellos, reciben el nombre de sistema de bases de datos, abreviado normalmente a simplemente base de datos...."

**Lenguaje de consulta estructurada (SQL)**
"...El SQL es un lenguaje de programación que utilizan casi todas las bases de datos relacionales para consultar, manipular y definir los datos, y para proporcionar control de acceso...."

**Software de base de datos**
"...El software de base de datos se utiliza para crear, editar y mantener archivos y registros de bases de datos, lo que facilita la creación de archivos y registros, la entrada de datos, la edición de datos, la actualización y la creación de informes. El software también maneja el almacenamiento de datos, las copias de seguridad y la creación de informes, así como el control de acceso múltiple y la seguridad...."

**Sistema de gestión de bases de datos**
"...Normalmente, una base de datos requiere un programa de software de bases de datos completo, conocido como sistema de gestión de bases de datos (DBMS). Un DBMS sirve como interfaz entre la base de datos y sus programas o usuarios finales, lo que permite a los usuarios recuperar, actualizar y gestionar cómo se organiza y se optimiza la información. Un DBMS también facilita la supervisión y el control de las bases de datos, lo que permite una variedad de operaciones administrativas como la supervisión del rendimiento, el ajuste, la copia de seguridad y la recuperación.
Algunos ejemplos de software de bases de datos o DBMS populares incluyen MySQL, Microsoft Access, Microsoft SQL Server, FileMaker Pro, Oracle Database y dBASE..."

Oracle (https://www.oracle.com/co/database/what-is-database/)

**PostgreSQL**
"...PostgreSQL es un sistema de gestión de bases de datos relacionales de objetos ( ORDBMS ) basado en POSTGRES, versión 4.2 , desarrollado en el Departamento de Informática de la Universidad de California en Berkeley. POSTGRES fue pionero en muchos conceptos que solo estuvieron disponibles en algunos sistemas de bases de datos comerciales mucho más tarde...."

PostgreSQL (https://www.postgresql.org/docs/current/intro-whatis.html)

### El lenguaje SQL

"...El lenguaje de consulta estructurada (SQL) es un lenguaje estándar para la creación y manipulación de bases de datos..."

AWS (https://aws.amazon.com/es/what-is/sql/#:~:text=El%20lenguaje%20de%20consulta%20estructurada%20(SQL)%20es%20un%20lenguaje%20est%C3%A1ndar,relacional%20que%20utiliza%20consultas%20SQL.)

#### Crear y eliminar tablas
Primero se define la estructura de la tabla `clima`, con los campos necesarios:
```sql
CREATE TABLE clima (
    ciudad           VARCHAR(80),  -- Nombre de la ciudad
    temperatura_min  INT,          -- Temperatura mínima (°C)
    temperatura_max  INT,          -- Temperatura máxima (°C)
    precipitacion    REAL,         -- Precipitación (mm)
    fecha_registro   DATE          -- Fecha del registro
);
```
Para eliminarla cuando ya no se necesite:
```sql
DROP TABLE clima;
```

#### - Inserción de datos
Podemos insertar un nuevo registro:
```sql
INSERT INTO clima VALUES ('Bogotá', 7, 18, 2.5, '2023-06-15');
```
O especificar las columnas explícitamente:
```sql
INSERT INTO clima (ciudad, temperatura_min, temperatura_max, precipitacion, fecha_registro)
    VALUES ('Medellín', 18, 27, 0.0, '2023-06-15');
```

#### - Consultas básicas con `SELECT`
Obtener todos los registros:
```sql
SELECT * FROM clima;
```
Seleccionar columnas específicas:
```sql
SELECT ciudad, precipitacion, fecha_registro FROM clima;
```
Calcular la temperatura promedio:
```sql
SELECT ciudad, (temperatura_max + temperatura_min) / 2 AS temperatura_promedio, fecha_registro FROM clima;
```
Filtrar registros por condiciones (ej. días con lluvia en Bogotá):
```sql
SELECT * FROM clima
    WHERE ciudad = 'Bogotá' AND precipitacion > 0.0;
```
Ordenar resultados por ciudad:
```sql
SELECT * FROM clima ORDER BY ciudad;
```
Ordenar por ciudad y temperatura mínima:
```sql
SELECT * FROM clima ORDER BY ciudad, temperatura_min;

#### - Eliminación de duplicados con `DISTINCT`
Obtener una lista única de ciudades registradas:
```sql
SELECT DISTINCT ciudad FROM clima;
```
Ordenar alfabéticamente:
```sql
SELECT DISTINCT ciudad FROM clima ORDER BY ciudad;
```

#### - Uso de `JOIN` para combinar tablas
Si tenemos otra tabla llamada ciudades con datos geográficos, podemos unirla con clima:
```sql
SELECT * FROM clima JOIN ciudades ON clima.ciudad = ciudades.nombre;
```
Seleccionar solo columnas relevantes:
```sql
SELECT clima.ciudad, clima.temperatura_min, clima.temperatura_max, clima.precipitacion, clima.fecha_registro, ciudades.ubicacion
    FROM clima JOIN ciudades ON clima.ciudad = ciudades.nombre;
```
También podemos hacer una unión externa (LEFT JOIN):
```sql
SELECT * FROM clima LEFT JOIN ciudades ON clima.ciudad = ciudades.nombre;
```

#### - Subconsultas
Obtener la temperatura mínima más alta registrada:
```sql
SELECT MAX(temperatura_min) FROM clima;
```
Y la ciudad correspondiente:
```sql
SELECT ciudad FROM clima
    WHERE temperatura_min = (SELECT MAX(temperatura_min) FROM clima);
```

#### - Uso de `GROUP BY` y `HAVING`
Contar registros por ciudad y mostrar la temperatura mínima más alta:
```sql
SELECT ciudad, COUNT(*), MAX(temperatura_min)
    FROM clima
    GROUP BY ciudad;
```
Filtrar los grupos donde la temperatura mínima fue menor a 10 °C:
```sql
SELECT ciudad, COUNT(*), MAX(temperatura_min)
    FROM clima
    GROUP BY ciudad
    HAVING MAX(temperatura_min) < 10;
```
Filtrar dentro de una función agregada:
```sql
SELECT ciudad, COUNT(*) FILTER (WHERE temperatura_min < 15), MAX(temperatura_min)
    FROM clima
    GROUP BY ciudad;
```

#### - Actualización y eliminación de datos
Modificar los valores de temperatura:
```sql
UPDATE clima
SET temperatura_max = temperatura_max - 2,
    temperatura_min = temperatura_min - 2
WHERE fecha_registro > '2023-06-14';
```
#### - Eliminar registros
Eliminar los datos de una ciudad específica:
```sql
DELETE FROM clima WHERE ciudad = 'Cartagena';
```

Además de consultar e insertar datos, SQL permite construir estructuras más complejas que ayudan a organizar, proteger y mantener la integridad de la información. A continuación se explican tres conceptos clave: **vistas**, **llaves foráneas** y **transacciones**.

#### - Vistas
Una **vista** es una "tabla virtual" que guarda una **consulta** y permite reutilizarla como si fuera una tabla real. No almacena los datos, sino que se actualiza automáticamente cada vez que se accede a ella.
Por ejemplo, si queremos unir información de dos tablas (`clima` y `ciudades`), podemos crear una vista:

```sql
CREATE VIEW vista_clima_ciudades AS
    SELECT nombre_ciudad, temperatura_min, temperatura_max, precipitacion, fecha_registro, ubicacion
        FROM clima, ciudades
        WHERE clima.ciudad = ciudades.nombre_ciudad;
```

#### - Llaves foráneas
Una **llave foránea** establece una relación entre dos tablas. Garantiza que los valores en una columna (como una ciudad en clima) existan previamente en otra tabla (como
ciudades). Esto ayuda a mantener la integridad de los datos.
Primero, creamos la tabla de ciudades:
```sql
CREATE TABLE ciudades (
    nombre_ciudad VARCHAR(80) PRIMARY KEY,
    ubicacion     POINT
);
CREATE TABLE clima (
    ciudad           VARCHAR(80) REFERENCES ciudades(nombre_ciudad),
    temperatura_min  INT,
    temperatura_max  INT,
    precipitacion    REAL,
    fecha_registro   DATE
);
```
Si intentamos insertar un registro con una ciudad que no existe en la tabla ciudades, obtendremos un error:
```sql
INSERT INTO clima VALUES ('Tunja', 6, 18, 1.2, '2023-06-15');
ERROR:  insert or update on table "clima" violates foreign key constraint "clima_ciudad_fkey"
DETAIL:  Key (ciudad)=(Tunja) is not present in table "ciudades".
```

#### - Transacciones
Una **transacción** permite agrupar varias operaciones para que se ejecuten como una sola unidad. Si alguna falla, se puede **revertir** todo, asegurando que los datos no queden en un estado incompleto.
Ejemplo con una tabla de cuentas:

```sql
BEGIN;
-- Restar dinero a una cuenta
UPDATE cuentas SET saldo = saldo - 100.00
    WHERE titular = 'Alicia';
-- Crear un punto de guardado
SAVEPOINT punto_intermedio;
-- Intentar sumar dinero a otra cuenta
UPDATE cuentas SET saldo = saldo + 100.00
    WHERE titular = 'Bob';
-- Ups... no era Bob, revertimos al punto anterior
ROLLBACK TO punto_intermedio;
-- Ahora sumamos a la cuenta correcta
UPDATE cuentas SET saldo = saldo + 100.00
    WHERE titular = 'Walter';
-- Confirmamos todo
COMMIT;
```

Entre otros... (https://www.postgresql.org/docs/current/)

### PostgreSQL
"...PostgreSQL es un sistema de gestión de bases de datos relacionales de objetos (ORDBMS), desarrollado en el Departamento de Informática de la Universidad de California en Berkeley. PostgreSQL fue pionero en muchos conceptos que solo estuvieron disponibles en algunos sistemas de bases de datos comerciales mucho más tarde...Y gracias a la licencia liberal, PostgreSQL puede ser utilizado, modificado y distribuido por cualquier persona de forma gratuita y para cualquier propósito, ya sea privado, comercial o académico"
PostgreSQL (https://www.postgresql.org/docs/current/intro-whatis.html)

### PostGIS
"...PostGIS amplía las capacidades de la base de datos relacional PostgreSQL al agregar soporte para almacenar, indexar y consultar datos geoespaciales...."
Las características de PostGIS incluyen:
- **Almacenamiento de datos espaciales:** almacene diferentes tipos de datos espaciales, como puntos, líneas, polígonos y multigeometrías, tanto en datos 2D como 3D.
- **Indexación espacial:** busque y recupere rápidamente datos espaciales en función de su ubicación.
- **Funciones espaciales:** una amplia gama de funciones espaciales que le permiten filtrar y analizar datos espaciales, medir distancias y áreas , intersecar geometrías, crear búferes y más.
- **Procesamiento de geometría:** herramientas para procesar y manipular datos geométricos, como simplificación , conversión y generalización.
- **Soporte de datos ráster:** almacenamiento y procesamiento de datos ráster , como datos de elevación y datos meteorológicos.
- **Geocodificación y geocodificación inversa:** Funciones para geocodificación y geocodificación inversa.
- **Integración:** acceda y trabaje con PostGIS utilizando herramientas de terceros como QGIS , GeoServer , MapServer , ArcGIS, Tableau.

PostGIS (https://postgis.net/)

### Administración PostGIS
#### Modelo de datos espacial

**OGC Geometry**
- **Point.** Geometría de 0 dimensiones que representa una única ubicación en el espacio de coordenadas.
```sql
POINT (1 2)
POINT Z (1 2 3)
POINT ZM (1 2 3 4)
```
- **LineString.** Línea unidimensional formada por una secuencia contigua de segmentos. 
```sql
LINESTRING (1 2, 3 4, 5 6)
```
- **LinearRing.** Cadena Lineal cerrada y simple. El primer y el último punto deben ser iguales, y la línea no debe autointersecarse.
```sql
LINEARRING (0 0 0, 4 0 0, 4 4 0, 0 4 0, 0 0 0)
```
- **Polygon.** Región plana bidimensional, delimitada por un límite exterior (la capa) y ninguno o más límites interiores (agujeros).
```sql
POLYGON ((0 0 0,4 0 0,4 4 0,0 4 0,0 0 0),(1 1 0,2 1 0,2 2 0,1 2 0,1 1 0))
```
- **MultiPoint.** Colección de Puntos.
```sql
MULTIPOINT ( (0 0), (1 2) )
```
- **MultiLineString.** Colección de LineStrings.
```sql
MULTILINESTRING ( (0 0,1 1,1 2), (2 3,3 2,5 4) )
```
- **MultiPolygon.** Conjunto de polígonos no superpuestos ni adyacentes. Los polígonos del conjunto solo pueden tocarse en un número finito de puntos.
```sql
MULTIPOLYGON (((1 5, 5 5, 5 1, 1 1, 1 5)), ((6 5, 9 1, 6 1, 6 5)))
```
- **GeometryCollection.** Colección heterogénea (mixta) de geometrías.
```sql
GEOMETRYCOLLECTION ( POINT(2 3), LINESTRING(2 3, 3 4))
```
- **PolyhedralSurface.** Colección contigua de parches o facetas que comparten algunas aristas. Cada parche es un polígono plano. Si las coordenadas del polígono tienen coordenadas Z, la superficie es tridimensional.
```sql
POLYHEDRALSURFACE Z (
  ((0 0 0, 0 0 1, 0 1 1, 0 1 0, 0 0 0)),
  ((0 0 0, 0 1 0, 1 1 0, 1 0 0, 0 0 0)),
  ((0 0 0, 1 0 0, 1 0 1, 0 0 1, 0 0 0)),
  ((1 1 0, 1 1 1, 1 0 1, 1 0 0, 1 1 0)),
  ((0 1 0, 0 1 1, 1 1 1, 1 1 0, 0 1 0)),
  ((0 0 1, 1 0 1, 1 1 1, 0 1 1, 0 0 1)) )
```
- **Triangle.** Polígono definido por tres vértices distintos no colineales. Al ser un polígono, se define mediante cuatro coordenadas, siendo la primera y la cuarta iguales.
```sql
TRIANGLE ((0 0, 0 9, 9 0, 0 0))
```
- **TIN.** Colección de triángulos no superpuestos que representan una red irregular triangulada.
```sql
TIN Z ( ((0 0 0, 0 0 1, 0 1 0, 0 0 0)), ((0 0 0, 0 1 0, 1 1 0, 0 0 0)) )
```

#### Tipos de datos geográficos
**Geographic**
"...El tipo de datos PostGIS geography proporciona compatibilidad nativa con entidades espaciales representadas en coordenadas geográficas (o "lat/lon"). Las coordenadas geográficas son coordenadas esféricas expresadas en unidades angulares (grados)..."

**Geometry**
"...La base del tipo de datos geométricos de PostGIS es un plano...."

#### Cálculo de atributos geométricos
El camino más corto entre dos puntos en el plano es una línea recta. Esto significa que las funciones geométricas (áreas, distancias, longitudes, intersecciones, etc.) se calculan utilizando vectores de línea recta y matemáticas cartesianas. Esto facilita su implementación y agiliza su ejecución, pero también las hace imprecisas para datos sobre la superficie esferoidal de la Tierra.

El tipo de datos geográficos de PostGIS se basa en un modelo esférico. El camino más corto entre dos puntos de la esfera es un arco de círculo máximo. Las funciones sobre geografías (áreas, distancias, longitudes, intersecciones, etc.) se calculan utilizando arcos de la esfera. Al considerar la forma esferoidal del mundo, las funciones proporcionan resultados más precisos.

Creación de tablas de geografía
```sql
CREATE TABLE global_points (
    id SERIAL PRIMARY KEY,
    name VARCHAR(64),
    location geography(POINT, 4326)
  );
```
Utilizando tablas de geografía
```sql
INSERT INTO global_points (name, location) VALUES ('Town', 'SRID=4326;POINT(-110 30)');
INSERT INTO global_points (name, location) VALUES ('Forest', 'SRID=4326;POINT(-109 29)');
INSERT INTO global_points (name, location) VALUES ('London', 'SRID=4326;POINT(0 49)');
```
Consulta de una distancia utilizando una tolerancia de 1000km
```sql
SELECT name FROM global_points WHERE ST_DWithin(location, 'SRID=4326;POINT(-110 29)'::geography, 1000000);
```
**¿Cuándo utilizar el tipo de datos geografía?**
El tipo de datos geografía le permite almacenar datos en coordenadas de longitud/latitud, pero a un costo: hay menos funciones definidas en GEOGRAPHY que en GEOMETRY; las funciones que están definidas toman más tiempo de CPU para ejecutarse.
El tipo de datos que elija debe determinarse según el área de trabajo prevista de la aplicación que esté desarrollando. ¿Sus datos abarcarán todo el mundo, una gran área continental, o son locales, de un estado, condado o municipio?
- Si sus datos están contenidos en un área pequeña, es posible que elegir una proyección adecuada y utilizar GEOMETRÍA sea la mejor solución, en términos de rendimiento y funcionalidad disponibles.
- Si sus datos son globales o cubren una región continental, GEOGRAPHY le permitirá crear un sistema sin preocuparse por los detalles de proyección. Almacene sus datos en longitud/latitud y utilice las funciones definidas en GEOGRAPHY.
- Si no entiendes las proyecciones, no quieres aprender sobre ellas y estás dispuesto a aceptar las limitaciones de funcionalidad de GEOGRAPHY, quizás te resulte más fácil usar GEOGRAPHY que GEOMETRY. Simplemente carga tus datos como longitud/latitud y empieza desde ahí.


#### Sistemas de referencia espacial
Un **Sistema de Referencia Espacial (SRE)** (también llamado **Sistema de Referencia de Coordenadas (SRC)**) define cómo se referencia la geometría a ubicaciones en la superficie terrestre. Existen tres tipos de SRE:
- Un **SRS geodésico** utiliza coordenadas angulares (longitud y latitud) que se asignan directamente a la superficie de la tierra.
- Un **SRS proyectado** utiliza una transformación matemática de proyección para aplanar la superficie de la Tierra esferoidal sobre un plano. Asigna coordenadas de ubicación que permiten la medición directa de magnitudes como la distancia, el área y el ángulo. El sistema de coordenadas es cartesiano, lo que significa que tiene un punto de origen definido y dos ejes perpendiculares (generalmente orientados al norte y al este). Cada SRS proyectado utiliza una unidad de longitud establecida (generalmente metros o pies). Un SRS proyectado puede tener un área de aplicación limitada para evitar distorsiones y ajustarse a los límites de coordenadas definidos.
- Un **SRS local** es un sistema de coordenadas cartesiano que no está referenciado a la superficie terrestre. En PostGIS, esto se especifica mediante un valor SRID de 0.

Tabla **SPATIAL_REF_SYS**
```sql
CREATE TABLE spatial_ref_sys (
  srid       INTEGER NOT NULL PRIMARY KEY,
  auth_name  VARCHAR(256),
  auth_srid  INTEGER,
  srtext     VARCHAR(2048),
  proj4text  VARCHAR(2048)
)
```
srtext
```sql
PROJCS["NAD83 / UTM Zone 10N",
  GEOGCS["NAD83",
	DATUM["North_American_Datum_1983",
	  SPHEROID["GRS 1980",6378137,298.257222101]
	],
	PRIMEM["Greenwich",0],
	UNIT["degree",0.0174532925199433]
  ],
  PROJECTION["Transverse_Mercator"],
  PARAMETER["latitude_of_origin",0],
  PARAMETER["central_meridian",-123],
  PARAMETER["scale_factor",0.9996],
  PARAMETER["false_easting",500000],
  PARAMETER["false_northing",0],
  UNIT["metre",1]
]
```
Sistemas de referencia espacial definidos por el usuario
```sql
INSERT INTO spatial_ref_sys (srid, proj4text)
VALUES ( 990000,
  '+proj=lcc  +lon_0=-95 +lat_0=25 +lat_1=25 +lat_2=25 +x_0=0 +y_0=0 +datum=WGS84 +units=m +no_defs'
);
```

#### Cargar datos espaciales utilizando SQL
##### - Datos vectoriales
PostGIS permite cargar datos espaciales directamente usando comandos SQL, especialmente si estos datos están representados en formato de texto como **WKT** (Well-Known Text) o **WKB** (Well-Known Binary).
Este método es útil para cargar información de forma rápida desde archivos de texto o secuencias de comandos SQL, sin depender de herramientas externas como QGIS o `ogr2ogr`.
En este ejemplo, vamos a insertar datos de líneas (calles o carreteras) utilizando geometrías en formato `LINESTRING`. Supongamos que ya existe una tabla llamada `vias` con los
siguientes campos:
- `id_via` → identificador único de la vía
- `geometria` → columna espacial con tipo `LINESTRING`
- `nombre_via` → nombre de la vía
Los registros se insertan de forma masiva dentro de una transacción:
```sql
BEGIN;
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (1, 'LINESTRING(191232 243118,191108 243242)', 'Calle Jeff');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (2, 'LINESTRING(189141 244158,189265 244817)', 'Calle Geordie');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (3, 'LINESTRING(192783 228138,192612 229814)', 'Calle Paul');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (4, 'LINESTRING(189412 252431,189631 259122)', 'Avenida Graeme');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (5, 'LINESTRING(190131 224148,190871 228134)', 'Terraza Phil');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (6, 'LINESTRING(198231 263418,198213 268322)', 'Callejón Dave');
COMMIT;
```

✅ Recomendación: Asegúrate de que la columna geometria esté definida con el tipo espacial adecuado, por ejemplo:
```sql
SELECT AddGeometryColumn('vias', 'geometria', 4326, 'LINESTRING', 2);
```

📌 Nota: Este método es ideal para volúmenes pequeños o cuando se trabaja con scripts personalizados. Para cargas masivas desde shapefiles o geojson, es preferible usar herramientas como shp2pgsql, ogr2ogr o directamente desde QGIS.

#### Utilizando el Shapefile Loader
El `shp2pgsql` cargador de datos convierte los shapefiles a SQL, aptos para su inserción en bases de datos PostGIS/PostgreSQL, ya sea en formato geométrico o geográfico. El cargador dispone de varios modos de funcionamiento que se seleccionan mediante indicadores de línea de comandos.

`-c`. Crea una nueva tabla y la rellena desde el shapefile. Este es el modo predeterminado.<br>
`-a`. Añade datos del shapefile a la tabla de la base de datos. Tenga en cuenta que para usar esta opción y cargar varios archivos, estos deben tener los mismos atributos y tipos de datos.<br>
`-d`. Elimina la tabla de base de datos antes de crear una nueva tabla con los datos en el Shapefile.<br>
`-p`. Solo genera el código SQL de creación de tablas, sin añadir datos. Esto se puede usar si necesita separar completamente los pasos de creación de tablas y carga de datos.<br>
`-s`. [<FROM_SRID>:]<SRID> Crea y rellena las tablas de geometría con el SRID especificado. Opcionalmente, especifica que el shapefile de entrada utilice el FROM_SRID dado, en cuyo caso las geometrías se reproyectarán al SRID de destino.<br>
`-i`. Convierte todos los números enteros en números enteros estándar de 32 bits, no crea bigints de 64 bits, incluso si la firma del encabezado DBF parece justificarlo.<br>
`-I`. Crea un índice GiST en la columna de geometría.

En la línea de comandos
```sh
shp2pgsql -c -s 4269 -i -I shaperoads.shp myschema.roadstable > carreteras.sql 
psql -d carreterasdb -f carreteras.sql
```

También podría hacerse por medio de la interfaz gráfica. Buscando "PostGIS PostGIS Bundle 1 for PostgreSQL x64 16 Shapefile and DBF Loader Exporter"
- Realizar la conexión a la base de datos
```{image} Imagenes/PostGIS_Connection.PNG
:width: 250px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> <strong>Fig. 1. Conexión a PostGIS </strong></p>

- Verificar las opciones de importación según las necesidades del usuario
```{image} Imagenes/Options_Import_PostGIS.PNG
:width: 300px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> <strong>Fig. 2. Opciones de importación - PostGIS </strong></p>

- Buscar y cargar el archivo Shapefile verificando el nombre con el cual se guardará la tabla y el SRID
```{image} Imagenes/Load_Shp_PostGIS.PNG
:width: 300px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> <strong>Fig. 3. Cargar datos desde Shapefile </strong></p>

Consultar más parámetros: https://postgis.net/docs/manual-3.5/using_postgis_dbmanagement.html#loading-data

#### Extrayendo datos espaciales vectoriales
Una de las formas más directas de **extraer información geoespacial** desde PostGIS es utilizando consultas `SELECT` que devuelvan tanto los atributos como la geometría en un 
formato legible.
📌 Nota: Esto es útil cuando se desea exportar los datos a archivos `.csv` o `.txt` o integrarlos en otros procesos de análisis fuera de la base de datos.
```sql
SELECT id_via, ST_AsText(geometria) AS geometria_wkt, nombre_via
    FROM vias;
```
Si deseamos filtrar solamente aquellas vías que intersectan con una geometría (por ejemplo, un polígono de interés), podemos usar la función **ST_Intersects**:
```sql
SELECT id_via, nombre_via
    FROM vias
    WHERE ST_Intersects(geometria, 'SRID=4326;POLYGON((...))');
```

```{image} Imagenes/Functions_PostGIS.PNG
:width: 300px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 4. Ejemplos de funciones de PostGIS – PostGIS. https://postgis.net/docs/manual-1.5/ch08.html</strong>
</p>

💡 Nota: Asegúrate de que la geometría proporcionada tenga el mismo SRID (sistema de referencia espacial) que la columna geometria. En este ejemplo, se usa SRID=4326.

##### - Datos raster
#### Utilizando el Rasters Loader
`raster2pgsql` es un ejecutable de carga de ráster que carga formatos ráster compatibles con GDAL en SQL, aptos para su carga en una tabla ráster PostGIS. Permite cargar carpetas de archivos ráster y crear vistas generales de rásteres. Dado que raster2pgsql se compila generalmente como parte de PostGIS (a menos que compile su propia biblioteca GDAL), los tipos de ráster compatibles con el ejecutable serán los mismos que los compilados en la biblioteca de dependencias de GDAL. 

En la línea de comandos

`-s`. SRID <br>
`-I`. Índice espacial<br>
`-C`. Utilizar restricciones ráster estándar.<br>
`-M`. Análisis de vacíos después de la carga<br>
`-F`. Incluye una columna de nombre de archivo en la tabla ráster.<br>
`-t`. Divide la salida en mosaicos de 100x100.<br>

* *.tif carga todos estos archivos
* public.demelevation cargar en esta tabla
* -d conectarse a esta base de datos
* -f lee este archivo después de conectarse

```sh
raster2pgsql -s 4326 -I -C -M -F -t 100x100 *.tif público.demelevation > elev.sql
psql -d gisdb -f elev.sql
```
```{image} Imagenes/Formats_Raster.PNG
:width: 500px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 5. Ejemplos de formatos de ráster de PostGIS – PostGIS. https://postgis.net/docs/using_raster_dataman.html</strong>
</p>

Para mayor información (https://postgis.net/docs/using_raster_dataman.html)

#### Extrayendo datos espaciales ráster
PostGIS no solo permite trabajar con datos vectoriales (puntos, líneas, polígonos), sino que también es capaz de **almacenar y consultar datos ráster** de forma eficiente. Estos datos pueden representar información continua como imágenes satelitales, modelos de elevación digital, mapas de temperatura, entre otros.
A continuación, se presentan ejemplos de cómo extraer información de una tabla que contiene un campo ráster utilizando funciones especializadas de PostGIS.
##### Obtener metadatos del ráster
La función `ST_Metadata` permite consultar propiedades como **número de bandas**, **resolución**, **extensión espacial**, etc.
```sql
SELECT id_raster, ST_Metadata(raster)
    FROM capa_raster;
```
Para saber qué valor tiene el ráster en un punto determinado (por ejemplo, coordenadas X=1000, Y=2000):
```sql
SELECT ST_Value(raster, ST_SetSRID(ST_Point(1000, 2000), 4326))
    FROM capa_raster;
```
Esta consulta devuelve los rásteres que se superponen con una geometría dada (por ejemplo, un polígono de una zona de estudio):
```sql
SELECT id_raster, raster
    FROM capa_raster
    WHERE ST_Intersects(raster, ST_GeomFromText('POLÍGONO((...))', 4326));
```
La función ST_SummaryStats calcula estadísticas básicas (mínimo, máximo, media, etc.) para los valores del ráster dentro de un área específica:
```sql
SELECT ST_SummaryStats(raster)
    FROM capa_raster
    WHERE ST_Intersects(raster, ST_GeomFromText('POLÍGONO((...))', 4326));
```

### Integración PostGIS / Python

En esta sección se muestra cómo cargar información espacial desde un archivo Shapefile (.shp) a una base de datos PostGIS utilizando dos enfoques:
1. Usando `psycopg2` (conexión directa SQL)

In [1]:
# GeoPandas: Extensión de Pandas para manejar datos geoespaciales (puntos, líneas, polígonos).
# Permite leer, escribir y analizar datos espaciales en formatos como Shapefile, GeoJSON, etc.
import geopandas as gpd
# Psycopg2: Biblioteca para conectar Python con bases de datos PostgreSQL.
# Se usa para ejecutar consultas SQL, manejar transacciones y trabajar con datos espaciales en PostGIS.
import psycopg2
# Shapely: Biblioteca para la manipulación y análisis de geometrías espaciales.
# 'wkt' (Well-Known Text) permite convertir entre texto y objetos geométricos.
from shapely import wkt

Leer los datos espaciales con ayuda de Geopandas

In [3]:
shapefile_path = "./Samples/Samples_Point.shp"      # Ruta del archivo .shp con datos geoespaciales (Cambiar según sea necesario)
gdf = gpd.read_file(shapefile_path)                 # Cargar el archivo en un GeoDataFrame
gdf.head()                                          # Mostrar las primeras filas del GeoDataFrame para inspección

Unnamed: 0,Shape_Leng,Shape_Area,class,ORIG_FID,geometry
0,0.0,0.0,Bosque,0,POINT (333600.852 710803.978)
1,0.0,0.0,Bosque,0,POINT (333797.268 710693.129)
2,0.0,0.0,Bosque,0,POINT (333865.332 710844.816)
3,0.0,0.0,Bosque,0,POINT (334120.089 710615.341)
4,0.0,0.0,Bosque,0,POINT (334166.762 710842.872)


📌 Nota: Los nombres de las columnas pueden variar dependiendo del archivo .shp que estés utilizando.
Verifica las columnas disponibles usando gdf.columns y ajusta el código en consecuencia (por ejemplo: class, geometry, etc.).

📌 Nota: Este método es ideal para volúmenes pequeños o cuando se trabaja con scripts personalizados.
Para cargas masivas desde archivos Shapefile o GeoJSON, es preferible utilizar herramientas como shp2pgsql.

Crear la conexión con la base de datos espacial

In [4]:
DB_CONFIG = {
    "dbname": "postgis_34_sample",      # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contraseña del usuario
    "host": "localhost",                # Dirección del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG)    # Establecer conexión con la base de datos PostgreSQL
cur = conn.cursor()                     # Crear un cursor para ejecutar comandos SQL

Creación de tabla con columnas a cargar

In [5]:
# Crear una tabla en PostGIS si no existe
create_table_query = """
CREATE TABLE IF NOT EXISTS training_sample (
    id SERIAL PRIMARY KEY,              -- Identificador único autoincremental
    class TEXT,                         -- Columna para almacenar la clase del punto
    geom GEOMETRY(Geometry, 32619)      -- Columna geométrica con proyección EPSG:32619 (UTM Zona 19N)
);
"""
cur.execute(create_table_query)     # Ejecutar la consulta SQL para crear la tabla
conn.commit()                       # Confirmar la creación de la tabla en la base de datos

```{image} Imagenes/Table_Training_Sample.PNG
:width: 200px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 6. Tabla creada "training_sample" en base de datos </strong>
</p>

Insertar los datos

In [6]:
conn.rollback()  # Realizar un rollback por seguridad antes de insertar datos (opcional)
insert_query = "INSERT INTO training_sample (class, geom) VALUES (%s, ST_GeomFromText(%s, 32619))"
# Iterar sobre cada fila del GeoDataFrame y cargar los datos en la base de datos
for _, row in gdf.iterrows():
    class_ = row["class"]                       # Extraer el valor de la columna 'class' (ajustar según los nombres de columnas)
    geom = row["geometry"].wkt                  # Convertir la geometría a formato WKT (Well-Known Text)    
    cur.execute(insert_query, (class_, geom))   # Ejecutar la consulta SQL con los valores extraídos
conn.commit()                                   # Confirmar la inserción de datos en la base de datos
cur.close()                                     # Cerrar el cursor y la conexión con la base de datos
conn.close()

2. Usando `SQLAlchemy` (ORM con integración SQL expresiva)

In [10]:
import geopandas as gpd
from shapely import wkt
from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
from geoalchemy2 import Geometry

In [None]:
shapefile_path = "./Samples/Samples_Point.shp"                                  # Ruta del archivo .shp con datos geoespaciales (Cambiar según sea necesario)
gdf = gpd.read_file(shapefile_path)                                             # Cargar el archivo en un GeoDataFrame       
DB_URL = "postgresql://postgres:postgres@localhost:5432/postgis_34_sample"      # Crear conexión con SQLAlchemy
engine = create_engine(DB_URL)

In [None]:
Base = declarative_base()                                                       # Crear una clase base para definir el modelo de la tabla       
class TrainingSample(Base):
    __tablename__ = 'training_sample_sqlalchemy'                                # Nombre de la tabla en la base de datos
    id = Column(Integer, primary_key = True, autoincrement = True)              # id SERIAL PRIMARY KEY 
    class_ = Column("class", String)                                            # class TEXT - Nota: 'class' es palabra reservada en Python, por eso usamos 'class_'
    geom = Column(Geometry(geometry_type = 'POINT', srid = 32619))              # geom GEOMETRY(Geometry, 32619) - EPSG:32619 = UTM zona 19N
Base.metadata.create_all(engine)                                                # Crear la tabla en la base de datos si no existe

In [15]:
Session = sessionmaker(bind=engine)         # Crear una clase de sesión para interactuar con la base de datos
session = Session()
for _, row in gdf.iterrows():
    muestra = TrainingSample(
        class_ = row["class"],
        geom = row["geometry"].wkt          # GeoAlchemy acepta geometría como WKT o WKB
    )
    session.add(muestra)
session.commit()                            # Confirmar la inserción de datos en la base de datos
session.close()                             # Cerrar la sesión

### Comparación entre `psycopg2` y `SQLAlchemy` para la carga de datos espaciales

| Aspecto                        | `psycopg2` (consulta SQL directa)            | `SQLAlchemy` + `GeoAlchemy2` (ORM)                |
|-------------------------------|----------------------------------------------|---------------------------------------------------|
| Inserción de datos            | Manual, con sentencias `INSERT` en SQL       | Basada en clases Python (`add`, `commit`)         |
| Mantenimiento del código      | Mayor cantidad de código, menos legible      | Más limpio, estructurado y fácil de mantener      |
| Validación del esquema        | Depende del control manual con SQL           | Definido por clases y validado automáticamente     |
| Conversión de geometría       | Requiere `ST_GeomFromText(...)`              | Se puede insertar directamente como `WKT`         |
| Creación de la tabla          | Manual con SQL (`CREATE TABLE`)              | Automática con `Base.metadata.create_all()`       |
| Escalabilidad del proyecto    | Adecuado para scripts simples o rápidos      | Ideal para aplicaciones más grandes y robustas    |
| Lectura del modelo            | Menos intuitiva (estructura definida en SQL) | Más clara: el modelo es una clase con atributos   |

* Cargar datos desde archivo .tif con librerías de python `subprocess` y `psycopg2`

In [16]:
import psycopg2     # psycopg2: Librería para conectar Python con bases de datos PostgreSQL. Permite ejecutar consultas SQL, manipular datos y gestionar transacciones.
import subprocess   # subprocess: Módulo para ejecutar comandos del sistema desde Python. Se usa para llamar programas externos como psql, raster2pgsql, etc.
import os

In [None]:
DB_CONFIG = {
    "dbname": "postgis_34_sample",      # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contraseña del usuario
    "host": "localhost",                # Dirección del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG) 
cur = conn.cursor()
# Abrir el archivo raster (.tif)
notebook_dir = os.getcwd()                                                  # Ruta donde se ejecuta el notebook
raster_path = os.path.join(notebook_dir, "Image_raster", "temp_raster.tif") # Ruta del archivo .tif  (Cambiar según sea necesario)
os.environ["PGPASSWORD"] = DB_CONFIG["password"]
'''
¿Por qué usar PGPASSWORD?
- Evita que psql solicite la contraseña cada vez que se ejecuta un comando.
- Facilita la automatización de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.
- Es más seguro que escribir la contraseña directamente en el comando, pero aún es recomendable eliminarla después de su uso.'
'''

"\n¿Por qué usar PGPASSWORD?\n- Evita que psql solicite la contraseña cada vez que se ejecuta un comando.\n- Facilita la automatización de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.\n- Es más seguro que escribir la contraseña directamente en el comando, pero aún es recomendable eliminarla después de su uso.'\n"

In [None]:
# Ruta a la carpeta donde están raster2pgsql y psql
pg_bin_path = r"C:\Program Files\PostgreSQL\16\bin"         # Cambiar según la instalación de PostgreSQL
sql_output_path = r"C:\Shp_Example\prueba.sql"              # Ruta de salida para el archivo SQL (Cambiar según sea necesario)
# Construir el comando con la ruta completa de raster2pgsql y psql
cmd = fr'"{pg_bin_path}\raster2pgsql.exe" -s 32619 -I -C "{raster_path}" >  {sql_output_path}'
# Ejecutar el comando en la terminal
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)

In [21]:
cmd = fr'"{pg_bin_path}\psql.exe" -d {DB_CONFIG["dbname"]} -U {DB_CONFIG["user"]} -h {DB_CONFIG["host"]} -p {DB_CONFIG["port"]} -f "{sql_output_path}"'
# Ejecutar el comando
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)
# Limpiar la variable de entorno después de ejecutar el comando
del os.environ["PGPASSWORD"]

Resultado del cargue del archivo raster

In [22]:
print(process.stdout)

BEGIN
CREATE TABLE
INSERT 0 1
CREATE INDEX
ANALYZE
 addrasterconstraints 
----------------------
 t
(1 fila)

COMMIT



```{admonition} Actividad 
:class: important
- **Este recuadro está destinado a preguntas y actividades para los estudiantes.**

🔍 **Reto 1: Consulta espacial con condiciones múltiples**

Usando la tabla `clima` en PostgreSQL/PostGIS, crea una consulta que devuelva:

- Las ciudades donde la temperatura mínima fue inferior a 10 °C
- Y donde hubo alguna precipitación (`precipitacion > 0`)

🧭 **Reto 2: Reflexión — ¿Vector o ráster?**

Reflexiona y responde:

- ¿Qué ventajas ofrece el modelo ráster frente al vectorial en análisis de cobertura del suelo?
- ¿Cuándo conviene usar uno u otro?

Justifica tu respuesta con base en los ejercicios desarrollados en esta guía.

⚙️ **Reto 3: Automatiza tu propio cargue vectorial**

Desarrolla un script en Python que:

1. Lea un archivo Shapefile proporcionado por el usuario
2. Detecte automáticamente las columnas del archivo
3. Cree una tabla correspondiente en PostGIS
4. Inserte todos los datos usando `GeoAlchemy2`

> 💡 Tip: Usa `gdf.columns` para explorar la estructura del archivo.

🌱 **Reto 4: Interpretación de datos ráster**

Usando una imagen `.tif` previamente cargada en PostGIS:

- Calcula el valor mínimo, máximo y promedio dentro de un polígono definido
- Interpreta qué podrían representar estos valores en el contexto de cobertura vegetal o uso del suelo

Realiza la consulta utilizando `ST_SummaryStats` desde Python con `psycopg2`.
```

### Referencias y Recursos

#### 🗃️ Bases de datos y SQL
- [¿Qué es una base de datos? — Oracle](https://www.oracle.com/co/database/what-is-database/)
- [Introducción a PostgreSQL](https://www.postgresql.org/docs/current/intro-whatis.html)
- [Documentación oficial de PostgreSQL](https://www.postgresql.org/docs/current/)
- [Lenguaje SQL en PostgreSQL — Comandos y estructura](https://www.postgresql.org/docs/current/sql.html)

---

#### 🌐 PostGIS y funciones espaciales
- [Sitio oficial de PostGIS](https://postgis.net/)
- [Funciones espaciales en PostGIS — Manual 1.5 (imagen usada)](https://postgis.net/docs/manual-1.5/ch08.html)
- [Carga de datos vectoriales en PostGIS](https://postgis.net/docs/manual-3.5/using_postgis_dbmanagement.html#loading-data)
- [Manejo de datos ráster en PostGIS](https://postgis.net/docs/using_raster_dataman)

---

#### 🐍 Python + PostgreSQL/PostGIS
- [GeoPandas — Documentación oficial](https://geopandas.org/en/stable/)
- [Shapely — Documentación oficial](https://shapely.readthedocs.io/en/stable/)
- [Psycopg2 — PostgreSQL adapter para Python](https://www.psycopg.org/docs/)
- [SQLAlchemy — Documentación oficial](https://docs.sqlalchemy.org/en/20/)
- [GeoAlchemy2 — Extensión espacial para SQLAlchemy](https://geoalchemy-2.readthedocs.io/en/latest/)

---

#### 💻 Herramientas y entornos de desarrollo
- [JupyterBook — Documentación oficial](https://jupyterbook.org/en/stable/)
- [Jupyter Notebook — Sitio oficial](https://jupyter.org/)
- [Extensión oficial de Python para VS Code](https://marketplace.visualstudio.com/items?itemName=ms-python.python)
