# Bases de datos espaciales: PostGIS y su integraci√≥n con Python

```{admonition} Gu√≠a para el docente
:class: danger
- Incluye ejemplos pr√°cticos en SQL y Python, utilizando tanto `psycopg2` como `SQLAlchemy`.
- El objetivo es facilitar la ense√±anza de conceptos espaciales mediante actividades guiadas.
```

```{admonition} Recursos
:class: note

- Capa vectorial (Shapefile de muestras de cobertura): [üì• Muestras_Ejemplo](https://igacoffice365-my.sharepoint.com/:f:/r/personal/juans_hernandez_igac_gov_co/Documents/Recursos_BDE_PostGIS_Diplomado/Muestras_Ejemplo?csf=1&web=1&e=x8juEL)

- Imagen satelital recortada (formato `.tif`): [üì• Imagen_Ejemplo](https://igacoffice365-my.sharepoint.com/:f:/r/personal/juans_hernandez_igac_gov_co/Documents/Recursos_BDE_PostGIS_Diplomado/Imagen_Ejemplo?csf=1&web=1&e=5ZURPK)

Es importante la descarga de los recursos para el desarrollo de la sesi√≥n.
```

### Definiciones preliminares

**Base de datos**

"...Una base de datos es una recopilaci√≥n organizada de informaci√≥n o datos estructurados, que normalmente se almacena de forma electr√≥nica en un sistema inform√°tico. Normalmente, una base de datos est√° controlada por un sistema de gesti√≥n de bases de datos (DBMS). En conjunto, los datos y el DBMS, junto con las aplicaciones asociadas a ellos, reciben el nombre de sistema de bases de datos, abreviado normalmente a simplemente base de datos...."

**Lenguaje de consulta estructurada (SQL)**
"...El SQL es un lenguaje de programaci√≥n que utilizan casi todas las bases de datos relacionales para consultar, manipular y definir los datos, y para proporcionar control de acceso...."

**Software de base de datos**
"...El software de base de datos se utiliza para crear, editar y mantener archivos y registros de bases de datos, lo que facilita la creaci√≥n de archivos y registros, la entrada de datos, la edici√≥n de datos, la actualizaci√≥n y la creaci√≥n de informes. El software tambi√©n maneja el almacenamiento de datos, las copias de seguridad y la creaci√≥n de informes, as√≠ como el control de acceso m√∫ltiple y la seguridad...."

**Sistema de gesti√≥n de bases de datos**
"...Normalmente, una base de datos requiere un programa de software de bases de datos completo, conocido como sistema de gesti√≥n de bases de datos (DBMS). Un DBMS sirve como interfaz entre la base de datos y sus programas o usuarios finales, lo que permite a los usuarios recuperar, actualizar y gestionar c√≥mo se organiza y se optimiza la informaci√≥n. Un DBMS tambi√©n facilita la supervisi√≥n y el control de las bases de datos, lo que permite una variedad de operaciones administrativas como la supervisi√≥n del rendimiento, el ajuste, la copia de seguridad y la recuperaci√≥n.
Algunos ejemplos de software de bases de datos o DBMS populares incluyen MySQL, Microsoft Access, Microsoft SQL Server, FileMaker Pro, Oracle Database y dBASE..."

Oracle (https://www.oracle.com/co/database/what-is-database/)

**PostgreSQL**
"...PostgreSQL es un sistema de gesti√≥n de bases de datos relacionales de objetos ( ORDBMS ) basado en POSTGRES, versi√≥n 4.2 , desarrollado en el Departamento de Inform√°tica de la Universidad de California en Berkeley. POSTGRES fue pionero en muchos conceptos que solo estuvieron disponibles en algunos sistemas de bases de datos comerciales mucho m√°s tarde...."

PostgreSQL (https://www.postgresql.org/docs/current/intro-whatis.html)

### El lenguaje SQL

"...El lenguaje de consulta estructurada (SQL) es un lenguaje est√°ndar para la creaci√≥n y manipulaci√≥n de bases de datos..."

AWS (https://aws.amazon.com/es/what-is/sql/#:~:text=El%20lenguaje%20de%20consulta%20estructurada%20(SQL)%20es%20un%20lenguaje%20est%C3%A1ndar,relacional%20que%20utiliza%20consultas%20SQL.)

#### Crear y eliminar tablas
Primero se define la estructura de la tabla `clima`, con los campos necesarios:
```sql
CREATE TABLE clima (
    ciudad           VARCHAR(80),  -- Nombre de la ciudad
    temperatura_min  INT,          -- Temperatura m√≠nima (¬∞C)
    temperatura_max  INT,          -- Temperatura m√°xima (¬∞C)
    precipitacion    REAL,         -- Precipitaci√≥n (mm)
    fecha_registro   DATE          -- Fecha del registro
);
```
Para eliminarla cuando ya no se necesite:
```sql
DROP TABLE clima;
```

#### - Inserci√≥n de datos
Podemos insertar un nuevo registro:
```sql
INSERT INTO clima VALUES ('Bogot√°', 7, 18, 2.5, '2023-06-15');
```
O especificar las columnas expl√≠citamente:
```sql
INSERT INTO clima (ciudad, temperatura_min, temperatura_max, precipitacion, fecha_registro)
    VALUES ('Medell√≠n', 18, 27, 0.0, '2023-06-15');
```

#### - Consultas b√°sicas con `SELECT`
Obtener todos los registros:
```sql
SELECT * FROM clima;
```
Seleccionar columnas espec√≠ficas:
```sql
SELECT ciudad, precipitacion, fecha_registro FROM clima;
```
Calcular la temperatura promedio:
```sql
SELECT ciudad, (temperatura_max + temperatura_min) / 2 AS temperatura_promedio, fecha_registro FROM clima;
```
Filtrar registros por condiciones (ej. d√≠as con lluvia en Bogot√°):
```sql
SELECT * FROM clima
    WHERE ciudad = 'Bogot√°' AND precipitacion > 0.0;
```
Ordenar resultados por ciudad:
```sql
SELECT * FROM clima ORDER BY ciudad;
```
Ordenar por ciudad y temperatura m√≠nima:
```sql
SELECT * FROM clima ORDER BY ciudad, temperatura_min;

#### - Eliminaci√≥n de duplicados con `DISTINCT`
Obtener una lista √∫nica de ciudades registradas:
```sql
SELECT DISTINCT ciudad FROM clima;
```
Ordenar alfab√©ticamente:
```sql
SELECT DISTINCT ciudad FROM clima ORDER BY ciudad;
```

#### - Uso de `JOIN` para combinar tablas
Si tenemos otra tabla llamada ciudades con datos geogr√°ficos, podemos unirla con clima:
```sql
SELECT * FROM clima JOIN ciudades ON clima.ciudad = ciudades.nombre;
```
Seleccionar solo columnas relevantes:
```sql
SELECT clima.ciudad, clima.temperatura_min, clima.temperatura_max, clima.precipitacion, clima.fecha_registro, ciudades.ubicacion
    FROM clima JOIN ciudades ON clima.ciudad = ciudades.nombre;
```
Tambi√©n podemos hacer una uni√≥n externa (LEFT JOIN):
```sql
SELECT * FROM clima LEFT JOIN ciudades ON clima.ciudad = ciudades.nombre;
```

#### - Subconsultas
Obtener la temperatura m√≠nima m√°s alta registrada:
```sql
SELECT MAX(temperatura_min) FROM clima;
```
Y la ciudad correspondiente:
```sql
SELECT ciudad FROM clima
    WHERE temperatura_min = (SELECT MAX(temperatura_min) FROM clima);
```

#### - Uso de `GROUP BY` y `HAVING`
Contar registros por ciudad y mostrar la temperatura m√≠nima m√°s alta:
```sql
SELECT ciudad, COUNT(*), MAX(temperatura_min)
    FROM clima
    GROUP BY ciudad;
```
Filtrar los grupos donde la temperatura m√≠nima fue menor a 10 ¬∞C:
```sql
SELECT ciudad, COUNT(*), MAX(temperatura_min)
    FROM clima
    GROUP BY ciudad
    HAVING MAX(temperatura_min) < 10;
```
Filtrar dentro de una funci√≥n agregada:
```sql
SELECT ciudad, COUNT(*) FILTER (WHERE temperatura_min < 15), MAX(temperatura_min)
    FROM clima
    GROUP BY ciudad;
```

#### - Actualizaci√≥n y eliminaci√≥n de datos
Modificar los valores de temperatura:
```sql
UPDATE clima
SET temperatura_max = temperatura_max - 2,
    temperatura_min = temperatura_min - 2
WHERE fecha_registro > '2023-06-14';
```
#### - Eliminar registros
Eliminar los datos de una ciudad espec√≠fica:
```sql
DELETE FROM clima WHERE ciudad = 'Cartagena';
```

Adem√°s de consultar e insertar datos, SQL permite construir estructuras m√°s complejas que ayudan a organizar, proteger y mantener la integridad de la informaci√≥n. A continuaci√≥n se explican tres conceptos clave: **vistas**, **llaves for√°neas** y **transacciones**.

#### - Vistas
Una **vista** es una "tabla virtual" que guarda una **consulta** y permite reutilizarla como si fuera una tabla real. No almacena los datos, sino que se actualiza autom√°ticamente cada vez que se accede a ella.
Por ejemplo, si queremos unir informaci√≥n de dos tablas (`clima` y `ciudades`), podemos crear una vista:

```sql
CREATE VIEW vista_clima_ciudades AS
    SELECT nombre_ciudad, temperatura_min, temperatura_max, precipitacion, fecha_registro, ubicacion
        FROM clima, ciudades
        WHERE clima.ciudad = ciudades.nombre_ciudad;
```

#### - Llaves for√°neas
Una **llave for√°nea** establece una relaci√≥n entre dos tablas. Garantiza que los valores en una columna (como una ciudad en clima) existan previamente en otra tabla (como
ciudades). Esto ayuda a mantener la integridad de los datos.
Primero, creamos la tabla de ciudades:
```sql
CREATE TABLE ciudades (
    nombre_ciudad VARCHAR(80) PRIMARY KEY,
    ubicacion     POINT
);
CREATE TABLE clima (
    ciudad           VARCHAR(80) REFERENCES ciudades(nombre_ciudad),
    temperatura_min  INT,
    temperatura_max  INT,
    precipitacion    REAL,
    fecha_registro   DATE
);
```
Si intentamos insertar un registro con una ciudad que no existe en la tabla ciudades, obtendremos un error:
```sql
INSERT INTO clima VALUES ('Tunja', 6, 18, 1.2, '2023-06-15');
ERROR:  insert or update on table "clima" violates foreign key constraint "clima_ciudad_fkey"
DETAIL:  Key (ciudad)=(Tunja) is not present in table "ciudades".
```

#### - Transacciones
Una **transacci√≥n** permite agrupar varias operaciones para que se ejecuten como una sola unidad. Si alguna falla, se puede **revertir** todo, asegurando que los datos no queden en un estado incompleto.
Ejemplo con una tabla de cuentas:

```sql
BEGIN;
-- Restar dinero a una cuenta
UPDATE cuentas SET saldo = saldo - 100.00
    WHERE titular = 'Alicia';
-- Crear un punto de guardado
SAVEPOINT punto_intermedio;
-- Intentar sumar dinero a otra cuenta
UPDATE cuentas SET saldo = saldo + 100.00
    WHERE titular = 'Bob';
-- Ups... no era Bob, revertimos al punto anterior
ROLLBACK TO punto_intermedio;
-- Ahora sumamos a la cuenta correcta
UPDATE cuentas SET saldo = saldo + 100.00
    WHERE titular = 'Walter';
-- Confirmamos todo
COMMIT;
```

Entre otros... (https://www.postgresql.org/docs/current/)

### PostgreSQL
"...PostgreSQL es un sistema de gesti√≥n de bases de datos relacionales de objetos (ORDBMS), desarrollado en el Departamento de Inform√°tica de la Universidad de California en Berkeley. PostgreSQL fue pionero en muchos conceptos que solo estuvieron disponibles en algunos sistemas de bases de datos comerciales mucho m√°s tarde...Y gracias a la licencia liberal, PostgreSQL puede ser utilizado, modificado y distribuido por cualquier persona de forma gratuita y para cualquier prop√≥sito, ya sea privado, comercial o acad√©mico"
PostgreSQL (https://www.postgresql.org/docs/current/intro-whatis.html)

### PostGIS
"...PostGIS ampl√≠a las capacidades de la base de datos relacional PostgreSQL al agregar soporte para almacenar, indexar y consultar datos geoespaciales...."
Las caracter√≠sticas de PostGIS incluyen:
- **Almacenamiento de datos espaciales:** almacene diferentes tipos de datos espaciales, como puntos, l√≠neas, pol√≠gonos y multigeometr√≠as, tanto en datos 2D como 3D.
- **Indexaci√≥n espacial:** busque y recupere r√°pidamente datos espaciales en funci√≥n de su ubicaci√≥n.
- **Funciones espaciales:** una amplia gama de funciones espaciales que le permiten filtrar y analizar datos espaciales, medir distancias y √°reas , intersecar geometr√≠as, crear b√∫feres y m√°s.
- **Procesamiento de geometr√≠a:** herramientas para procesar y manipular datos geom√©tricos, como simplificaci√≥n , conversi√≥n y generalizaci√≥n.
- **Soporte de datos r√°ster:** almacenamiento y procesamiento de datos r√°ster , como datos de elevaci√≥n y datos meteorol√≥gicos.
- **Geocodificaci√≥n y geocodificaci√≥n inversa:** Funciones para geocodificaci√≥n y geocodificaci√≥n inversa.
- **Integraci√≥n:** acceda y trabaje con PostGIS utilizando herramientas de terceros como QGIS , GeoServer , MapServer , ArcGIS, Tableau.

PostGIS (https://postgis.net/)

### Administraci√≥n PostGIS
#### Modelo de datos espacial

**OGC Geometry**
- **Point.** Geometr√≠a de 0 dimensiones que representa una √∫nica ubicaci√≥n en el espacio de coordenadas.
```sql
POINT (1 2)
POINT Z (1 2 3)
POINT ZM (1 2 3 4)
```
- **LineString.** L√≠nea unidimensional formada por una secuencia contigua de segmentos. 
```sql
LINESTRING (1 2, 3 4, 5 6)
```
- **LinearRing.** Cadena Lineal cerrada y simple. El primer y el √∫ltimo punto deben ser iguales, y la l√≠nea no debe autointersecarse.
```sql
LINEARRING (0 0 0, 4 0 0, 4 4 0, 0 4 0, 0 0 0)
```
- **Polygon.** Regi√≥n plana bidimensional, delimitada por un l√≠mite exterior (la capa) y ninguno o m√°s l√≠mites interiores (agujeros).
```sql
POLYGON ((0 0 0,4 0 0,4 4 0,0 4 0,0 0 0),(1 1 0,2 1 0,2 2 0,1 2 0,1 1 0))
```
- **MultiPoint.** Colecci√≥n de Puntos.
```sql
MULTIPOINT ( (0 0), (1 2) )
```
- **MultiLineString.** Colecci√≥n de LineStrings.
```sql
MULTILINESTRING ( (0 0,1 1,1 2), (2 3,3 2,5 4) )
```
- **MultiPolygon.** Conjunto de pol√≠gonos no superpuestos ni adyacentes. Los pol√≠gonos del conjunto solo pueden tocarse en un n√∫mero finito de puntos.
```sql
MULTIPOLYGON (((1 5, 5 5, 5 1, 1 1, 1 5)), ((6 5, 9 1, 6 1, 6 5)))
```
- **GeometryCollection.** Colecci√≥n heterog√©nea (mixta) de geometr√≠as.
```sql
GEOMETRYCOLLECTION ( POINT(2 3), LINESTRING(2 3, 3 4))
```
- **PolyhedralSurface.** Colecci√≥n contigua de parches o facetas que comparten algunas aristas. Cada parche es un pol√≠gono plano. Si las coordenadas del pol√≠gono tienen coordenadas Z, la superficie es tridimensional.
```sql
POLYHEDRALSURFACE Z (
  ((0 0 0, 0 0 1, 0 1 1, 0 1 0, 0 0 0)),
  ((0 0 0, 0 1 0, 1 1 0, 1 0 0, 0 0 0)),
  ((0 0 0, 1 0 0, 1 0 1, 0 0 1, 0 0 0)),
  ((1 1 0, 1 1 1, 1 0 1, 1 0 0, 1 1 0)),
  ((0 1 0, 0 1 1, 1 1 1, 1 1 0, 0 1 0)),
  ((0 0 1, 1 0 1, 1 1 1, 0 1 1, 0 0 1)) )
```
- **Triangle.** Pol√≠gono definido por tres v√©rtices distintos no colineales. Al ser un pol√≠gono, se define mediante cuatro coordenadas, siendo la primera y la cuarta iguales.
```sql
TRIANGLE ((0 0, 0 9, 9 0, 0 0))
```
- **TIN.** Colecci√≥n de tri√°ngulos no superpuestos que representan una red irregular triangulada.
```sql
TIN Z ( ((0 0 0, 0 0 1, 0 1 0, 0 0 0)), ((0 0 0, 0 1 0, 1 1 0, 0 0 0)) )
```

#### Tipos de datos geogr√°ficos
**Geographic**
"...El tipo de datos PostGIS geography proporciona compatibilidad nativa con entidades espaciales representadas en coordenadas geogr√°ficas (o "lat/lon"). Las coordenadas geogr√°ficas son coordenadas esf√©ricas expresadas en unidades angulares (grados)..."

**Geometry**
"...La base del tipo de datos geom√©tricos de PostGIS es un plano...."

#### C√°lculo de atributos geom√©tricos
El camino m√°s corto entre dos puntos en el plano es una l√≠nea recta. Esto significa que las funciones geom√©tricas (√°reas, distancias, longitudes, intersecciones, etc.) se calculan utilizando vectores de l√≠nea recta y matem√°ticas cartesianas. Esto facilita su implementaci√≥n y agiliza su ejecuci√≥n, pero tambi√©n las hace imprecisas para datos sobre la superficie esferoidal de la Tierra.

El tipo de datos geogr√°ficos de PostGIS se basa en un modelo esf√©rico. El camino m√°s corto entre dos puntos de la esfera es un arco de c√≠rculo m√°ximo. Las funciones sobre geograf√≠as (√°reas, distancias, longitudes, intersecciones, etc.) se calculan utilizando arcos de la esfera. Al considerar la forma esferoidal del mundo, las funciones proporcionan resultados m√°s precisos.

Creaci√≥n de tablas de geograf√≠a
```sql
CREATE TABLE global_points (
    id SERIAL PRIMARY KEY,
    name VARCHAR(64),
    location geography(POINT, 4326)
  );
```
Utilizando tablas de geograf√≠a
```sql
INSERT INTO global_points (name, location) VALUES ('Town', 'SRID=4326;POINT(-110 30)');
INSERT INTO global_points (name, location) VALUES ('Forest', 'SRID=4326;POINT(-109 29)');
INSERT INTO global_points (name, location) VALUES ('London', 'SRID=4326;POINT(0 49)');
```
Consulta de una distancia utilizando una tolerancia de 1000km
```sql
SELECT name FROM global_points WHERE ST_DWithin(location, 'SRID=4326;POINT(-110 29)'::geography, 1000000);
```
**¬øCu√°ndo utilizar el tipo de datos geograf√≠a?**
El tipo de datos geograf√≠a le permite almacenar datos en coordenadas de longitud/latitud, pero a un costo: hay menos funciones definidas en GEOGRAPHY que en GEOMETRY; las funciones que est√°n definidas toman m√°s tiempo de CPU para ejecutarse.
El tipo de datos que elija debe determinarse seg√∫n el √°rea de trabajo prevista de la aplicaci√≥n que est√© desarrollando. ¬øSus datos abarcar√°n todo el mundo, una gran √°rea continental, o son locales, de un estado, condado o municipio?
- Si sus datos est√°n contenidos en un √°rea peque√±a, es posible que elegir una proyecci√≥n adecuada y utilizar GEOMETR√çA sea la mejor soluci√≥n, en t√©rminos de rendimiento y funcionalidad disponibles.
- Si sus datos son globales o cubren una regi√≥n continental, GEOGRAPHY le permitir√° crear un sistema sin preocuparse por los detalles de proyecci√≥n. Almacene sus datos en longitud/latitud y utilice las funciones definidas en GEOGRAPHY.
- Si no entiendes las proyecciones, no quieres aprender sobre ellas y est√°s dispuesto a aceptar las limitaciones de funcionalidad de GEOGRAPHY, quiz√°s te resulte m√°s f√°cil usar GEOGRAPHY que GEOMETRY. Simplemente carga tus datos como longitud/latitud y empieza desde ah√≠.


#### Sistemas de referencia espacial
Un **Sistema de Referencia Espacial (SRE)** (tambi√©n llamado **Sistema de Referencia de Coordenadas (SRC)**) define c√≥mo se referencia la geometr√≠a a ubicaciones en la superficie terrestre. Existen tres tipos de SRE:
- Un **SRS geod√©sico** utiliza coordenadas angulares (longitud y latitud) que se asignan directamente a la superficie de la tierra.
- Un **SRS proyectado** utiliza una transformaci√≥n matem√°tica de proyecci√≥n para aplanar la superficie de la Tierra esferoidal sobre un plano. Asigna coordenadas de ubicaci√≥n que permiten la medici√≥n directa de magnitudes como la distancia, el √°rea y el √°ngulo. El sistema de coordenadas es cartesiano, lo que significa que tiene un punto de origen definido y dos ejes perpendiculares (generalmente orientados al norte y al este). Cada SRS proyectado utiliza una unidad de longitud establecida (generalmente metros o pies). Un SRS proyectado puede tener un √°rea de aplicaci√≥n limitada para evitar distorsiones y ajustarse a los l√≠mites de coordenadas definidos.
- Un **SRS local** es un sistema de coordenadas cartesiano que no est√° referenciado a la superficie terrestre. En PostGIS, esto se especifica mediante un valor SRID de 0.

Tabla **SPATIAL_REF_SYS**
```sql
CREATE TABLE spatial_ref_sys (
  srid       INTEGER NOT NULL PRIMARY KEY,
  auth_name  VARCHAR(256),
  auth_srid  INTEGER,
  srtext     VARCHAR(2048),
  proj4text  VARCHAR(2048)
)
```
srtext
```sql
PROJCS["NAD83 / UTM Zone 10N",
  GEOGCS["NAD83",
	DATUM["North_American_Datum_1983",
	  SPHEROID["GRS 1980",6378137,298.257222101]
	],
	PRIMEM["Greenwich",0],
	UNIT["degree",0.0174532925199433]
  ],
  PROJECTION["Transverse_Mercator"],
  PARAMETER["latitude_of_origin",0],
  PARAMETER["central_meridian",-123],
  PARAMETER["scale_factor",0.9996],
  PARAMETER["false_easting",500000],
  PARAMETER["false_northing",0],
  UNIT["metre",1]
]
```
Sistemas de referencia espacial definidos por el usuario
```sql
INSERT INTO spatial_ref_sys (srid, proj4text)
VALUES ( 990000,
  '+proj=lcc  +lon_0=-95 +lat_0=25 +lat_1=25 +lat_2=25 +x_0=0 +y_0=0 +datum=WGS84 +units=m +no_defs'
);
```

#### Cargar datos espaciales utilizando SQL
##### - Datos vectoriales
PostGIS permite cargar datos espaciales directamente usando comandos SQL, especialmente si estos datos est√°n representados en formato de texto como **WKT** (Well-Known Text) o **WKB** (Well-Known Binary).
Este m√©todo es √∫til para cargar informaci√≥n de forma r√°pida desde archivos de texto o secuencias de comandos SQL, sin depender de herramientas externas como QGIS o `ogr2ogr`.
En este ejemplo, vamos a insertar datos de l√≠neas (calles o carreteras) utilizando geometr√≠as en formato `LINESTRING`. Supongamos que ya existe una tabla llamada `vias` con los
siguientes campos:
- `id_via` ‚Üí identificador √∫nico de la v√≠a
- `geometria` ‚Üí columna espacial con tipo `LINESTRING`
- `nombre_via` ‚Üí nombre de la v√≠a
Los registros se insertan de forma masiva dentro de una transacci√≥n:
```sql
BEGIN;
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (1, 'LINESTRING(191232 243118,191108 243242)', 'Calle Jeff');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (2, 'LINESTRING(189141 244158,189265 244817)', 'Calle Geordie');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (3, 'LINESTRING(192783 228138,192612 229814)', 'Calle Paul');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (4, 'LINESTRING(189412 252431,189631 259122)', 'Avenida Graeme');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (5, 'LINESTRING(190131 224148,190871 228134)', 'Terraza Phil');
INSERT INTO vias (id_via, geometria, nombre_via)
VALUES (6, 'LINESTRING(198231 263418,198213 268322)', 'Callej√≥n Dave');
COMMIT;
```

‚úÖ Recomendaci√≥n: Aseg√∫rate de que la columna geometria est√© definida con el tipo espacial adecuado, por ejemplo:
```sql
SELECT AddGeometryColumn('vias', 'geometria', 4326, 'LINESTRING', 2);
```

üìå Nota: Este m√©todo es ideal para vol√∫menes peque√±os o cuando se trabaja con scripts personalizados. Para cargas masivas desde shapefiles o geojson, es preferible usar herramientas como shp2pgsql, ogr2ogr o directamente desde QGIS.

#### Utilizando el Shapefile Loader
El `shp2pgsql` cargador de datos convierte los shapefiles a SQL, aptos para su inserci√≥n en bases de datos PostGIS/PostgreSQL, ya sea en formato geom√©trico o geogr√°fico. El cargador dispone de varios modos de funcionamiento que se seleccionan mediante indicadores de l√≠nea de comandos.

`-c`. Crea una nueva tabla y la rellena desde el shapefile. Este es el modo predeterminado.<br>
`-a`. A√±ade datos del shapefile a la tabla de la base de datos. Tenga en cuenta que para usar esta opci√≥n y cargar varios archivos, estos deben tener los mismos atributos y tipos de datos.<br>
`-d`. Elimina la tabla de base de datos antes de crear una nueva tabla con los datos en el Shapefile.<br>
`-p`. Solo genera el c√≥digo SQL de creaci√≥n de tablas, sin a√±adir datos. Esto se puede usar si necesita separar completamente los pasos de creaci√≥n de tablas y carga de datos.<br>
`-s`. [<FROM_SRID>:]<SRID> Crea y rellena las tablas de geometr√≠a con el SRID especificado. Opcionalmente, especifica que el shapefile de entrada utilice el FROM_SRID dado, en cuyo caso las geometr√≠as se reproyectar√°n al SRID de destino.<br>
`-i`. Convierte todos los n√∫meros enteros en n√∫meros enteros est√°ndar de 32 bits, no crea bigints de 64 bits, incluso si la firma del encabezado DBF parece justificarlo.<br>
`-I`. Crea un √≠ndice GiST en la columna de geometr√≠a.

En la l√≠nea de comandos
```sh
shp2pgsql -c -s 4269 -i -I shaperoads.shp myschema.roadstable > carreteras.sql 
psql -d carreterasdb -f carreteras.sql
```

Tambi√©n podr√≠a hacerse por medio de la interfaz gr√°fica. Buscando "PostGIS PostGIS Bundle 1 for PostgreSQL x64 16 Shapefile and DBF Loader Exporter"
- Realizar la conexi√≥n a la base de datos
```{image} Imagenes/PostGIS_Connection.PNG
:width: 250px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> <strong>Fig. 1. Conexi√≥n a PostGIS </strong></p>

- Verificar las opciones de importaci√≥n seg√∫n las necesidades del usuario
```{image} Imagenes/Options_Import_PostGIS.PNG
:width: 300px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> <strong>Fig. 2. Opciones de importaci√≥n - PostGIS </strong></p>

- Buscar y cargar el archivo Shapefile verificando el nombre con el cual se guardar√° la tabla y el SRID
```{image} Imagenes/Load_Shp_PostGIS.PNG
:width: 300px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> <strong>Fig. 3. Cargar datos desde Shapefile </strong></p>

Consultar m√°s par√°metros: https://postgis.net/docs/manual-3.5/using_postgis_dbmanagement.html#loading-data

#### Extrayendo datos espaciales vectoriales
Una de las formas m√°s directas de **extraer informaci√≥n geoespacial** desde PostGIS es utilizando consultas `SELECT` que devuelvan tanto los atributos como la geometr√≠a en un 
formato legible.
üìå Nota: Esto es √∫til cuando se desea exportar los datos a archivos `.csv` o `.txt` o integrarlos en otros procesos de an√°lisis fuera de la base de datos.
```sql
SELECT id_via, ST_AsText(geometria) AS geometria_wkt, nombre_via
    FROM vias;
```
Si deseamos filtrar solamente aquellas v√≠as que intersectan con una geometr√≠a (por ejemplo, un pol√≠gono de inter√©s), podemos usar la funci√≥n **ST_Intersects**:
```sql
SELECT id_via, nombre_via
    FROM vias
    WHERE ST_Intersects(geometria, 'SRID=4326;POLYGON((...))');
```

```{image} Imagenes/Functions_PostGIS.PNG
:width: 300px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 4. Ejemplos de funciones de PostGIS ‚Äì PostGIS. https://postgis.net/docs/manual-1.5/ch08.html</strong>
</p>

üí° Nota: Aseg√∫rate de que la geometr√≠a proporcionada tenga el mismo SRID (sistema de referencia espacial) que la columna geometria. En este ejemplo, se usa SRID=4326.

##### - Datos raster
#### Utilizando el Rasters Loader
`raster2pgsql` es un ejecutable de carga de r√°ster que carga formatos r√°ster compatibles con GDAL en SQL, aptos para su carga en una tabla r√°ster PostGIS. Permite cargar carpetas de archivos r√°ster y crear vistas generales de r√°steres. Dado que raster2pgsql se compila generalmente como parte de PostGIS (a menos que compile su propia biblioteca GDAL), los tipos de r√°ster compatibles con el ejecutable ser√°n los mismos que los compilados en la biblioteca de dependencias de GDAL. 

En la l√≠nea de comandos

`-s`. SRID <br>
`-I`. √çndice espacial<br>
`-C`. Utilizar restricciones r√°ster est√°ndar.<br>
`-M`. An√°lisis de vac√≠os despu√©s de la carga<br>
`-F`. Incluye una columna de nombre de archivo en la tabla r√°ster.<br>
`-t`. Divide la salida en mosaicos de 100x100.<br>

* *.tif carga todos estos archivos
* public.demelevation cargar en esta tabla
* -d conectarse a esta base de datos
* -f lee este archivo despu√©s de conectarse

```sh
raster2pgsql -s 4326 -I -C -M -F -t 100x100 *.tif p√∫blico.demelevation > elev.sql
psql -d gisdb -f elev.sql
```
```{image} Imagenes/Formats_Raster.PNG
:width: 500px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 5. Ejemplos de formatos de r√°ster de PostGIS ‚Äì PostGIS. https://postgis.net/docs/using_raster_dataman.html</strong>
</p>

Para mayor informaci√≥n (https://postgis.net/docs/using_raster_dataman.html)

#### Extrayendo datos espaciales r√°ster
PostGIS no solo permite trabajar con datos vectoriales (puntos, l√≠neas, pol√≠gonos), sino que tambi√©n es capaz de **almacenar y consultar datos r√°ster** de forma eficiente. Estos datos pueden representar informaci√≥n continua como im√°genes satelitales, modelos de elevaci√≥n digital, mapas de temperatura, entre otros.
A continuaci√≥n, se presentan ejemplos de c√≥mo extraer informaci√≥n de una tabla que contiene un campo r√°ster utilizando funciones especializadas de PostGIS.
##### Obtener metadatos del r√°ster
La funci√≥n `ST_Metadata` permite consultar propiedades como **n√∫mero de bandas**, **resoluci√≥n**, **extensi√≥n espacial**, etc.
```sql
SELECT id_raster, ST_Metadata(raster)
    FROM capa_raster;
```
Para saber qu√© valor tiene el r√°ster en un punto determinado (por ejemplo, coordenadas X=1000, Y=2000):
```sql
SELECT ST_Value(raster, ST_SetSRID(ST_Point(1000, 2000), 4326))
    FROM capa_raster;
```
Esta consulta devuelve los r√°steres que se superponen con una geometr√≠a dada (por ejemplo, un pol√≠gono de una zona de estudio):
```sql
SELECT id_raster, raster
    FROM capa_raster
    WHERE ST_Intersects(raster, ST_GeomFromText('POL√çGONO((...))', 4326));
```
La funci√≥n ST_SummaryStats calcula estad√≠sticas b√°sicas (m√≠nimo, m√°ximo, media, etc.) para los valores del r√°ster dentro de un √°rea espec√≠fica:
```sql
SELECT ST_SummaryStats(raster)
    FROM capa_raster
    WHERE ST_Intersects(raster, ST_GeomFromText('POL√çGONO((...))', 4326));
```

### Integraci√≥n PostGIS / Python

En esta secci√≥n se muestra c√≥mo cargar informaci√≥n espacial desde un archivo Shapefile (.shp) a una base de datos PostGIS utilizando dos enfoques:
1. Usando `psycopg2` (conexi√≥n directa SQL)

In [1]:
# GeoPandas: Extensi√≥n de Pandas para manejar datos geoespaciales (puntos, l√≠neas, pol√≠gonos).
# Permite leer, escribir y analizar datos espaciales en formatos como Shapefile, GeoJSON, etc.
import geopandas as gpd
# Psycopg2: Biblioteca para conectar Python con bases de datos PostgreSQL.
# Se usa para ejecutar consultas SQL, manejar transacciones y trabajar con datos espaciales en PostGIS.
import psycopg2
# Shapely: Biblioteca para la manipulaci√≥n y an√°lisis de geometr√≠as espaciales.
# 'wkt' (Well-Known Text) permite convertir entre texto y objetos geom√©tricos.
from shapely import wkt

Leer los datos espaciales con ayuda de Geopandas

In [3]:
shapefile_path = "./Samples/Samples_Point.shp"      # Ruta del archivo .shp con datos geoespaciales (Cambiar seg√∫n sea necesario)
gdf = gpd.read_file(shapefile_path)                 # Cargar el archivo en un GeoDataFrame
gdf.head()                                          # Mostrar las primeras filas del GeoDataFrame para inspecci√≥n

Unnamed: 0,Shape_Leng,Shape_Area,class,ORIG_FID,geometry
0,0.0,0.0,Bosque,0,POINT (333600.852 710803.978)
1,0.0,0.0,Bosque,0,POINT (333797.268 710693.129)
2,0.0,0.0,Bosque,0,POINT (333865.332 710844.816)
3,0.0,0.0,Bosque,0,POINT (334120.089 710615.341)
4,0.0,0.0,Bosque,0,POINT (334166.762 710842.872)


üìå Nota: Los nombres de las columnas pueden variar dependiendo del archivo .shp que est√©s utilizando.
Verifica las columnas disponibles usando gdf.columns y ajusta el c√≥digo en consecuencia (por ejemplo: class, geometry, etc.).

üìå Nota: Este m√©todo es ideal para vol√∫menes peque√±os o cuando se trabaja con scripts personalizados.
Para cargas masivas desde archivos Shapefile o GeoJSON, es preferible utilizar herramientas como shp2pgsql.

Crear la conexi√≥n con la base de datos espacial

In [4]:
DB_CONFIG = {
    "dbname": "postgis_34_sample",      # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contrase√±a del usuario
    "host": "localhost",                # Direcci√≥n del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG)    # Establecer conexi√≥n con la base de datos PostgreSQL
cur = conn.cursor()                     # Crear un cursor para ejecutar comandos SQL

Creaci√≥n de tabla con columnas a cargar

In [5]:
# Crear una tabla en PostGIS si no existe
create_table_query = """
CREATE TABLE IF NOT EXISTS training_sample (
    id SERIAL PRIMARY KEY,              -- Identificador √∫nico autoincremental
    class TEXT,                         -- Columna para almacenar la clase del punto
    geom GEOMETRY(Geometry, 32619)      -- Columna geom√©trica con proyecci√≥n EPSG:32619 (UTM Zona 19N)
);
"""
cur.execute(create_table_query)     # Ejecutar la consulta SQL para crear la tabla
conn.commit()                       # Confirmar la creaci√≥n de la tabla en la base de datos

```{image} Imagenes/Table_Training_Sample.PNG
:width: 200px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 6. Tabla creada "training_sample" en base de datos </strong>
</p>

Insertar los datos

In [6]:
conn.rollback()  # Realizar un rollback por seguridad antes de insertar datos (opcional)
insert_query = "INSERT INTO training_sample (class, geom) VALUES (%s, ST_GeomFromText(%s, 32619))"
# Iterar sobre cada fila del GeoDataFrame y cargar los datos en la base de datos
for _, row in gdf.iterrows():
    class_ = row["class"]                       # Extraer el valor de la columna 'class' (ajustar seg√∫n los nombres de columnas)
    geom = row["geometry"].wkt                  # Convertir la geometr√≠a a formato WKT (Well-Known Text)    
    cur.execute(insert_query, (class_, geom))   # Ejecutar la consulta SQL con los valores extra√≠dos
conn.commit()                                   # Confirmar la inserci√≥n de datos en la base de datos
cur.close()                                     # Cerrar el cursor y la conexi√≥n con la base de datos
conn.close()

2. Usando `SQLAlchemy` (ORM con integraci√≥n SQL expresiva)

In [10]:
import geopandas as gpd
from shapely import wkt
from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
from geoalchemy2 import Geometry

In [None]:
shapefile_path = "./Samples/Samples_Point.shp"                                  # Ruta del archivo .shp con datos geoespaciales (Cambiar seg√∫n sea necesario)
gdf = gpd.read_file(shapefile_path)                                             # Cargar el archivo en un GeoDataFrame       
DB_URL = "postgresql://postgres:postgres@localhost:5432/postgis_34_sample"      # Crear conexi√≥n con SQLAlchemy
engine = create_engine(DB_URL)

In [None]:
Base = declarative_base()                                                       # Crear una clase base para definir el modelo de la tabla       
class TrainingSample(Base):
    __tablename__ = 'training_sample_sqlalchemy'                                # Nombre de la tabla en la base de datos
    id = Column(Integer, primary_key = True, autoincrement = True)              # id SERIAL PRIMARY KEY 
    class_ = Column("class", String)                                            # class TEXT - Nota: 'class' es palabra reservada en Python, por eso usamos 'class_'
    geom = Column(Geometry(geometry_type = 'POINT', srid = 32619))              # geom GEOMETRY(Geometry, 32619) - EPSG:32619 = UTM zona 19N
Base.metadata.create_all(engine)                                                # Crear la tabla en la base de datos si no existe

In [15]:
Session = sessionmaker(bind=engine)         # Crear una clase de sesi√≥n para interactuar con la base de datos
session = Session()
for _, row in gdf.iterrows():
    muestra = TrainingSample(
        class_ = row["class"],
        geom = row["geometry"].wkt          # GeoAlchemy acepta geometr√≠a como WKT o WKB
    )
    session.add(muestra)
session.commit()                            # Confirmar la inserci√≥n de datos en la base de datos
session.close()                             # Cerrar la sesi√≥n

### Comparaci√≥n entre `psycopg2` y `SQLAlchemy` para la carga de datos espaciales

| Aspecto                        | `psycopg2` (consulta SQL directa)            | `SQLAlchemy` + `GeoAlchemy2` (ORM)                |
|-------------------------------|----------------------------------------------|---------------------------------------------------|
| Inserci√≥n de datos            | Manual, con sentencias `INSERT` en SQL       | Basada en clases Python (`add`, `commit`)         |
| Mantenimiento del c√≥digo      | Mayor cantidad de c√≥digo, menos legible      | M√°s limpio, estructurado y f√°cil de mantener      |
| Validaci√≥n del esquema        | Depende del control manual con SQL           | Definido por clases y validado autom√°ticamente     |
| Conversi√≥n de geometr√≠a       | Requiere `ST_GeomFromText(...)`              | Se puede insertar directamente como `WKT`         |
| Creaci√≥n de la tabla          | Manual con SQL (`CREATE TABLE`)              | Autom√°tica con `Base.metadata.create_all()`       |
| Escalabilidad del proyecto    | Adecuado para scripts simples o r√°pidos      | Ideal para aplicaciones m√°s grandes y robustas    |
| Lectura del modelo            | Menos intuitiva (estructura definida en SQL) | M√°s clara: el modelo es una clase con atributos   |

* Cargar datos desde archivo .tif con librer√≠as de python `subprocess` y `psycopg2`

In [16]:
import psycopg2     # psycopg2: Librer√≠a para conectar Python con bases de datos PostgreSQL. Permite ejecutar consultas SQL, manipular datos y gestionar transacciones.
import subprocess   # subprocess: M√≥dulo para ejecutar comandos del sistema desde Python. Se usa para llamar programas externos como psql, raster2pgsql, etc.
import os

In [None]:
DB_CONFIG = {
    "dbname": "postgis_34_sample",      # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contrase√±a del usuario
    "host": "localhost",                # Direcci√≥n del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG) 
cur = conn.cursor()
# Abrir el archivo raster (.tif)
notebook_dir = os.getcwd()                                                  # Ruta donde se ejecuta el notebook
raster_path = os.path.join(notebook_dir, "Image_raster", "temp_raster.tif") # Ruta del archivo .tif  (Cambiar seg√∫n sea necesario)
os.environ["PGPASSWORD"] = DB_CONFIG["password"]
'''
¬øPor qu√© usar PGPASSWORD?
- Evita que psql solicite la contrase√±a cada vez que se ejecuta un comando.
- Facilita la automatizaci√≥n de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.
- Es m√°s seguro que escribir la contrase√±a directamente en el comando, pero a√∫n es recomendable eliminarla despu√©s de su uso.'
'''

"\n¬øPor qu√© usar PGPASSWORD?\n- Evita que psql solicite la contrase√±a cada vez que se ejecuta un comando.\n- Facilita la automatizaci√≥n de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.\n- Es m√°s seguro que escribir la contrase√±a directamente en el comando, pero a√∫n es recomendable eliminarla despu√©s de su uso.'\n"

In [None]:
# Ruta a la carpeta donde est√°n raster2pgsql y psql
pg_bin_path = r"C:\Program Files\PostgreSQL\16\bin"         # Cambiar seg√∫n la instalaci√≥n de PostgreSQL
sql_output_path = r"C:\Shp_Example\prueba.sql"              # Ruta de salida para el archivo SQL (Cambiar seg√∫n sea necesario)
# Construir el comando con la ruta completa de raster2pgsql y psql
cmd = fr'"{pg_bin_path}\raster2pgsql.exe" -s 32619 -I -C "{raster_path}" >  {sql_output_path}'
# Ejecutar el comando en la terminal
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)

In [21]:
cmd = fr'"{pg_bin_path}\psql.exe" -d {DB_CONFIG["dbname"]} -U {DB_CONFIG["user"]} -h {DB_CONFIG["host"]} -p {DB_CONFIG["port"]} -f "{sql_output_path}"'
# Ejecutar el comando
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)
# Limpiar la variable de entorno despu√©s de ejecutar el comando
del os.environ["PGPASSWORD"]

Resultado del cargue del archivo raster

In [22]:
print(process.stdout)

BEGIN
CREATE TABLE
INSERT 0 1
CREATE INDEX
ANALYZE
 addrasterconstraints 
----------------------
 t
(1 fila)

COMMIT



```{admonition} Actividad 
:class: important
- **Este recuadro est√° destinado a preguntas y actividades para los estudiantes.**

üîç **Reto 1: Consulta espacial con condiciones m√∫ltiples**

Usando la tabla `clima` en PostgreSQL/PostGIS, crea una consulta que devuelva:

- Las ciudades donde la temperatura m√≠nima fue inferior a 10‚ÄØ¬∞C
- Y donde hubo alguna precipitaci√≥n (`precipitacion > 0`)

üß≠ **Reto 2: Reflexi√≥n ‚Äî ¬øVector o r√°ster?**

Reflexiona y responde:

- ¬øQu√© ventajas ofrece el modelo r√°ster frente al vectorial en an√°lisis de cobertura del suelo?
- ¬øCu√°ndo conviene usar uno u otro?

Justifica tu respuesta con base en los ejercicios desarrollados en esta gu√≠a.

‚öôÔ∏è **Reto 3: Automatiza tu propio cargue vectorial**

Desarrolla un script en Python que:

1. Lea un archivo Shapefile proporcionado por el usuario
2. Detecte autom√°ticamente las columnas del archivo
3. Cree una tabla correspondiente en PostGIS
4. Inserte todos los datos usando `GeoAlchemy2`

> üí° Tip: Usa `gdf.columns` para explorar la estructura del archivo.

üå± **Reto 4: Interpretaci√≥n de datos r√°ster**

Usando una imagen `.tif` previamente cargada en PostGIS:

- Calcula el valor m√≠nimo, m√°ximo y promedio dentro de un pol√≠gono definido
- Interpreta qu√© podr√≠an representar estos valores en el contexto de cobertura vegetal o uso del suelo

Realiza la consulta utilizando `ST_SummaryStats` desde Python con `psycopg2`.
```

### Referencias y Recursos

#### üóÉÔ∏è Bases de datos y SQL
- [¬øQu√© es una base de datos? ‚Äî Oracle](https://www.oracle.com/co/database/what-is-database/)
- [Introducci√≥n a PostgreSQL](https://www.postgresql.org/docs/current/intro-whatis.html)
- [Documentaci√≥n oficial de PostgreSQL](https://www.postgresql.org/docs/current/)
- [Lenguaje SQL en PostgreSQL ‚Äî Comandos y estructura](https://www.postgresql.org/docs/current/sql.html)

---

#### üåê PostGIS y funciones espaciales
- [Sitio oficial de PostGIS](https://postgis.net/)
- [Funciones espaciales en PostGIS ‚Äî Manual 1.5 (imagen usada)](https://postgis.net/docs/manual-1.5/ch08.html)
- [Carga de datos vectoriales en PostGIS](https://postgis.net/docs/manual-3.5/using_postgis_dbmanagement.html#loading-data)
- [Manejo de datos r√°ster en PostGIS](https://postgis.net/docs/using_raster_dataman)

---

#### üêç Python + PostgreSQL/PostGIS
- [GeoPandas ‚Äî Documentaci√≥n oficial](https://geopandas.org/en/stable/)
- [Shapely ‚Äî Documentaci√≥n oficial](https://shapely.readthedocs.io/en/stable/)
- [Psycopg2 ‚Äî PostgreSQL adapter para Python](https://www.psycopg.org/docs/)
- [SQLAlchemy ‚Äî Documentaci√≥n oficial](https://docs.sqlalchemy.org/en/20/)
- [GeoAlchemy2 ‚Äî Extensi√≥n espacial para SQLAlchemy](https://geoalchemy-2.readthedocs.io/en/latest/)

---

#### üíª Herramientas y entornos de desarrollo
- [JupyterBook ‚Äî Documentaci√≥n oficial](https://jupyterbook.org/en/stable/)
- [Jupyter Notebook ‚Äî Sitio oficial](https://jupyter.org/)
- [Extensi√≥n oficial de Python para VS Code](https://marketplace.visualstudio.com/items?itemName=ms-python.python)
