# Bases de datos espaciales: PostGIS y su integración con Python (Ejemplo de uso)

## Bases de datos espaciales

## Tabla de contenido
1. Definiciones preliminares
2. El lenguaje SQL<br>
    2.1. Creación y eliminación de tablas<br>
    2.2. Inserción de datos<br>
    2.3. Consultas básicas con SELECT<br>
    2.4. Eliminación de duplicados con DISTINCT<br>
    2.5. Uso de JOIN para combinar tablas<br>
    2.6. Subconsultas<br>
    2.7. Uso de GROUP BY y HAVING<br>
    2.8. Actualización de datos<br>
    2.9. Eliminar registros<br>
    2.10. Vistas<br>
    2.11. Llaves foráneas<br>
    2.12. Transacciones<br>
3. PostgreSQL<br>
    3.1. Instalación
4. PostGIS<br>
    4.1. Instalación<br>
    4.2. Administración PostGIS<br>
        4.2.1. Modelo de datos espacial<br>
        4.2.2. Tipos de datos geográficos<br>
        4.2.3. Cálculo de atributos geométricos<br>
        4.2.4. Sistemas de referencia espacial<br>
    4.3. Cargar datos espaciales utilizando SQL<br>
        4.3.1. Datos vectoriales<br>
        4.3.2. Extrayendo datos espaciales vectoriales<br>
        4.3.3. Datos ráster<br>
        4.3.4. Extrayendo datos espaciales ráster<br>
5. Integración PostGIS / Python
6. Caso de estudio: Administración de datos para generación de modelo clasificador de Bosque / No Bosque por medio de PostGIS y Python
7. Referencias y recursos


### Definiciones preliminares

**Base de datos**

"...Una base de datos es una recopilación organizada de información o datos estructurados, que normalmente se almacena de forma electrónica en un sistema informático. Normalmente, una base de datos está controlada por un sistema de gestión de bases de datos (DBMS). En conjunto, los datos y el DBMS, junto con las aplicaciones asociadas a ellos, reciben el nombre de sistema de bases de datos, abreviado normalmente a simplemente base de datos...."

**Lenguaje de consulta estructurada (SQL)**
"...El SQL es un lenguaje de programación que utilizan casi todas las bases de datos relacionales para consultar, manipular y definir los datos, y para proporcionar control de acceso...."

**Software de base de datos**
"...El software de base de datos se utiliza para crear, editar y mantener archivos y registros de bases de datos, lo que facilita la creación de archivos y registros, la entrada de datos, la edición de datos, la actualización y la creación de informes. El software también maneja el almacenamiento de datos, las copias de seguridad y la creación de informes, así como el control de acceso múltiple y la seguridad...."

**Sistema de gestión de bases de datos**
"...Normalmente, una base de datos requiere un programa de software de bases de datos completo, conocido como sistema de gestión de bases de datos (DBMS). Un DBMS sirve como interfaz entre la base de datos y sus programas o usuarios finales, lo que permite a los usuarios recuperar, actualizar y gestionar cómo se organiza y se optimiza la información. Un DBMS también facilita la supervisión y el control de las bases de datos, lo que permite una variedad de operaciones administrativas como la supervisión del rendimiento, el ajuste, la copia de seguridad y la recuperación.
Algunos ejemplos de software de bases de datos o DBMS populares incluyen MySQL, Microsoft Access, Microsoft SQL Server, FileMaker Pro, Oracle Database y dBASE..."

Oracle (https://www.oracle.com/co/database/what-is-database/)

**PostgreSQL**
"...PostgreSQL es un sistema de gestión de bases de datos relacionales de objetos ( ORDBMS ) basado en POSTGRES, versión 4.2 , desarrollado en el Departamento de Informática de la Universidad de California en Berkeley. POSTGRES fue pionero en muchos conceptos que solo estuvieron disponibles en algunos sistemas de bases de datos comerciales mucho más tarde...."

PostgreSQL (https://www.postgresql.org/docs/current/intro-whatis.html)

### El lenguaje SQL

"...El lenguaje de consulta estructurada (SQL) es un lenguaje estándar para la creación y manipulación de bases de datos..."

AWS (https://aws.amazon.com/es/what-is/sql/#:~:text=El%20lenguaje%20de%20consulta%20estructurada%20(SQL)%20es%20un%20lenguaje%20est%C3%A1ndar,relacional%20que%20utiliza%20consultas%20SQL.)

### PostgreSQL
"...PostgreSQL es un sistema de gestión de bases de datos relacionales de objetos (ORDBMS), desarrollado en el Departamento de Informática de la Universidad de California en Berkeley. POSTGRES fue pionero en muchos conceptos que solo estuvieron disponibles en algunos sistemas de bases de datos comerciales mucho más tarde...Y gracias a la licencia liberal, PostgreSQL puede ser utilizado, modificado y distribuido por cualquier persona de forma gratuita y para cualquier propósito, ya sea privado, comercial o académico"
PostgreSQL (https://www.postgresql.org/docs/current/intro-whatis.html)

### PostGIS
"...PostGIS amplía las capacidades de la base de datos relacional PostgreSQL al agregar soporte para almacenar, indexar y consultar datos geoespaciales...."
Las características de PostGIS incluyen:
- **Almacenamiento de datos espaciales:** almacene diferentes tipos de datos espaciales, como puntos, líneas, polígonos y multigeometrías, tanto en datos 2D como 3D.
- **Indexación espacial:** busque y recupere rápidamente datos espaciales en función de su ubicación.
- **Funciones espaciales:** una amplia gama de funciones espaciales que le permiten filtrar y analizar datos espaciales, medir distancias y áreas , intersecar geometrías, crear búferes y más.
- **Procesamiento de geometría:** herramientas para procesar y manipular datos geométricos, como simplificación , conversión y generalización.
- **Soporte de datos ráster:** almacenamiento y procesamiento de datos ráster , como datos de elevación y datos meteorológicos.
- **Geocodificación y geocodificación inversa:** Funciones para geocodificación y geocodificación inversa.
- **Integración:** acceda y trabaje con PostGIS utilizando herramientas de terceros como QGIS , GeoServer , MapServer , ArcGIS, Tableau.

PostGIS (https://postgis.net/)


### Integración PostGIS / Python

* Cargar datos desde Shapefile con librerías de python `Geopandas`, `Shapely` y `psycopg2`

In [1]:
# GeoPandas: Extensión de Pandas para manejar datos geoespaciales (puntos, líneas, polígonos).
# Permite leer, escribir y analizar datos espaciales en formatos como Shapefile, GeoJSON, etc.
import geopandas as gpd
# Psycopg2: Biblioteca para conectar Python con bases de datos PostgreSQL.
# Se usa para ejecutar consultas SQL, manejar transacciones y trabajar con datos espaciales en PostGIS.
import psycopg2
# Shapely: Biblioteca para la manipulación y análisis de geometrías espaciales.
# 'wkt' (Well-Known Text) permite convertir entre texto y objetos geométricos.
from shapely import wkt

Leer los datos espaciales con ayuda de Geopandas

In [2]:
shapefile_path = "./Samples/Samples_Point.shp"  # Ruta del archivo .shp con datos geoespaciales
gdf = gpd.read_file(shapefile_path)  # Cargar el archivo en un GeoDataFrame
gdf.head()  # Mostrar las primeras filas del GeoDataFrame para inspección

Unnamed: 0,Shape_Leng,Shape_Area,class,ORIG_FID,geometry
0,0.0,0.0,Bosque,0,POINT (333600.852 710803.978)
1,0.0,0.0,Bosque,0,POINT (333797.268 710693.129)
2,0.0,0.0,Bosque,0,POINT (333865.332 710844.816)
3,0.0,0.0,Bosque,0,POINT (334120.089 710615.341)
4,0.0,0.0,Bosque,0,POINT (334166.762 710842.872)


Crear la conexión con la base de datos espacial

In [2]:
DB_CONFIG = {
    "dbname": "DB_GIS",                 # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contraseña del usuario
    "host": "localhost",                # Dirección del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG)    # Establecer conexión con la base de datos PostgreSQL
cur = conn.cursor()                     # Crear un cursor para ejecutar comandos SQL

Creación de tabla con columnas a cargar

In [4]:
# Crear una tabla en PostGIS si no existe
create_table_query = """
CREATE TABLE IF NOT EXISTS training_sample (
    id SERIAL PRIMARY KEY,              -- Identificador único autoincremental
    class TEXT,                         -- Columna para almacenar la clase del punto
    geom GEOMETRY(Geometry, 32619)      -- Columna geométrica con proyección EPSG:32619 (UTM Zona 19N)
);
"""
cur.execute(create_table_query)     # Ejecutar la consulta SQL para crear la tabla
conn.commit()                       # Confirmar la creación de la tabla en la base de datos

```{image} Imagenes/Table_Training_Sample.PNG
:width: 500px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 1. Tabla creada "training_sample" en base de datos </strong>
</p>

Insertar los datos

In [5]:
conn.rollback()  # Realizar un rollback por seguridad antes de insertar datos (opcional)
insert_query = "INSERT INTO training_sample (class, geom) VALUES (%s, ST_GeomFromText(%s, 32619))"
# Iterar sobre cada fila del GeoDataFrame y cargar los datos en la base de datos
for _, row in gdf.iterrows():
    class_ = row["class"]                       # Extraer el valor de la columna 'class' (ajustar según los nombres de columnas)
    geom = row["geometry"].wkt                  # Convertir la geometría a formato WKT (Well-Known Text)    
    cur.execute(insert_query, (class_, geom))   # Ejecutar la consulta SQL con los valores extraídos
conn.commit()                                   # Confirmar la inserción de datos en la base de datos
cur.close()                                     # Cerrar el cursor y la conexión con la base de datos
conn.close()

* Cargar datos desde archivo .tif con librerías de python `subprocess` y `psycopg2`

In [4]:
import psycopg2     # psycopg2: Librería para conectar Python con bases de datos PostgreSQL. Permite ejecutar consultas SQL, manipular datos y gestionar transacciones.
import subprocess   # subprocess: Módulo para ejecutar comandos del sistema desde Python. Se usa para llamar programas externos como psql, raster2pgsql, etc.
import os

In [5]:
DB_CONFIG = {
    "dbname": "DB_GIS",                 # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contraseña del usuario
    "host": "localhost",                # Dirección del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG) 
cur = conn.cursor()
# Abrir el archivo raster (.tif)
raster_path = r'C:\Users\JHERNANDEZ\OneDrive - Esri NOSA\Documentos\GitHub\PostGIS_Python\PostGIS_Python\temp_raster.tif'
os.environ["PGPASSWORD"] = DB_CONFIG["password"]
'''
¿Por qué usar PGPASSWORD?
- Evita que psql solicite la contraseña cada vez que se ejecuta un comando.
- Facilita la automatización de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.
- Es más seguro que escribir la contraseña directamente en el comando, pero aún es recomendable eliminarla después de su uso.'
'''


"\n¿Por qué usar PGPASSWORD?\n- Evita que psql solicite la contraseña cada vez que se ejecuta un comando.\n- Facilita la automatización de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.\n- Es más seguro que escribir la contraseña directamente en el comando, pero aún es recomendable eliminarla después de su uso.'\n"

In [6]:
# Ruta a la carpeta donde están raster2pgsql y psql
pg_bin_path = r"C:\Program Files\PostgreSQL\16\bin"
sql_output_path = r"C:\Shp_Example\prueba.sql"
# Construir el comando con la ruta completa de raster2pgsql y psql
cmd = fr'"{pg_bin_path}\raster2pgsql.exe" -s 32619 -I -C "{raster_path}" >  {sql_output_path}'
# Ejecutar el comando en la terminal
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)

In [7]:
cmd = fr'"{pg_bin_path}\psql.exe" -d {DB_CONFIG["dbname"]} -U {DB_CONFIG["user"]} -h {DB_CONFIG["host"]} -p {DB_CONFIG["port"]} -f "{sql_output_path}"'
# Ejecutar el comando
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)
# Limpiar la variable de entorno después de ejecutar el comando
del os.environ["PGPASSWORD"]

In [8]:
print(process.stdout)

BEGIN
CREATE TABLE
INSERT 0 1
CREATE INDEX
ANALYZE
 addrasterconstraints 
----------------------
 t
(1 fila)

COMMIT



### Caso de estudio: Administración de datos para generación de modelo clasificador de Bosque / No Bosque por medio de PostGIS y Python

El caso de estudio **"Bosque - No Bosque"** consiste en la clasificación de áreas geográficas en dos categorías: regiones con cobertura boscosa y regiones sin cobertura boscosa. Este análisis es fundamental para la gestión ambiental, la planificación territorial y el monitoreo del cambio climático. Para lograr esta clasificación, se integran **datos ráster y vectoriales** almacenados en una base de datos PostgreSQL, combinados con técnicas de Machine Learning en Python.

El proceso comienza con la extracción de datos ráster almacenados en PostGIS, los cuales contienen información multiespectral de imágenes satelitales. Luego, se combinan con muestras de entrenamiento vectoriales que indican la cobertura real de la tierra, permitiendo entrenar un modelo de clasificación basado en **Random Forest**. Este modelo aprende a diferenciar áreas boscosas y no boscosas a partir de las firmas espectrales de los píxeles.

La **integración de PostGIS y Python** es clave para procesar datos espaciales de manera eficiente. PostGIS permite realizar consultas geoespaciales avanzadas y gestionar datos ráster y vectoriales en una base de datos optimizada, mientras que Python proporciona herramientas avanzadas para el análisis de datos y el entrenamiento de modelos de aprendizaje automático. La combinación de ambas tecnologías permite automatizar la extracción de datos, la clasificación y la visualización de los resultados en mapas interpretables.

Este enfoque facilita la toma de decisiones basadas en datos espaciales, permitiendo la identificación de patrones de deforestación, el monitoreo de la salud de los bosques y la generación de políticas ambientales más efectivas.

Cargar imagen a base de datos espacial

```sh
raster2pgsql.exe -s 32619 -I -C C:\PostGIS_Python\nir_aoi.tif > C:\PostGIS_Python\load_nir_img.sql

psql -d postgis_34_sample -f C:\PostGIS_Python\load_nir_img.sql
```

Importas las liberías necesarias para el caso de uso

In [17]:
import psycopg2                                                                     # Conectar a la base de datos PostgreSQL con PostGIS
import numpy as np                                                                  # Manipulación de arrays numéricos y operaciones matemáticas
import rasterio                                                                     # Manejo y procesamiento de datos ráster
import pandas as pd                                                                 # Manejo de datos tabulares y consultas SQL
from sklearn.model_selection import train_test_split                                # División de datos en entrenamiento y prueba
from sklearn.ensemble import RandomForestClassifier                                 # Algoritmo de clasificación de bosques aleatorios
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report # Evaluación del modelo
import matplotlib.pyplot as plt                                                     # Generación de gráficos
import seaborn as sns                                                               # Visualización de datos con gráficos estadísticos
import matplotlib.colors as mcolors                                                 # Manejo de colores en visualizaciones
from skimage.transform import resize                                                # Redimensionamiento de imágenes


Configuración de parámetros para conexión con base de datos local

In [None]:
# Configuración de conexión a la base de datos PostgreSQL con PostGIS
DB_CONFIG = {
    "dbname": "postgis_34_sample",      # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contraseña del usuario
    "host": "localhost",                # Dirección del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}

def conectar_postgis():
    """
    Establece una conexión a la base de datos PostgreSQL con soporte PostGIS.
    Retorna:
        conn (psycopg2.connection): Objeto de conexión a la base de datos.
    """
    conn = psycopg2.connect(**DB_CONFIG)  # Conectar a la base de datos usando la configuración definida
    return conn

Extraer el ráster almacenado en la base de datos espacial

In [None]:
# Establece la conexión con la base de datos PostgreSQL con PostGIS
conn = conectar_postgis()
# Crea un cursor para ejecutar consultas SQL
cur = conn.cursor()
# Ejecuta una consulta SQL para obtener un ráster desde la base de datos en formato GDAL (GeoTIFF)
cur.execute("SELECT ST_AsGDALRaster(rast, 'GTiff') FROM nir_aoi LIMIT 1;")
# Recupera el resultado de la consulta (raster_bin contiene los datos del ráster en formato binario)
raster_bin = cur.fetchone()[0]
# Guarda temporalmente la imagen ráster en un archivo local (GeoTIFF)
with open("temp_raster.tif", "wb") as f:
    f.write(raster_bin)
# Abre la imagen ráster utilizando rasterio
with rasterio.open("temp_raster.tif") as src:
    raster_array = src.read()   # Carga el contenido del ráster como un array NumPy
    transform = src.transform   # Obtiene la transformación del ráster (ubicación y resolución espacial)
# Cierra el cursor y la conexión a la base de datos para liberar recursos
cur.close()
conn.close()

Extraer los datos de muestras (Geometría punto. Bosque - No Bosque)

In [None]:
# Establece la conexión con la base de datos PostgreSQL con PostGIS
conn = conectar_postgis()
# Consulta SQL para extraer coordenadas y etiquetas de clasificación desde la tabla de muestras de entrenamiento
query = """
SELECT ST_X(geom) AS lon, ST_Y(geom) AS lat, class FROM training_sample;
"""
# Ejecuta la consulta y almacena los resultados en un DataFrame de pandas
df = pd.read_sql(query, conn)
# Cierra la conexión con la base de datos para liberar recursos
conn.close()
df

Extraer los valores de píxel de cada banda del ráster para cada muestra

In [None]:
# Listas para almacenar los valores de los píxeles extraídos y sus respectivas etiquetas
valores_pixeles = []
etiquetas = []
# Iteramos sobre cada fila del DataFrame que contiene las muestras de entrenamiento
for _, row in df.iterrows():
    lon, lat, label = row['lon'], row['lat'], row['class']                              # Extraemos las coordenadas y la clase de la muestra    
    # Convertimos coordenadas geográficas (lon, lat) a índices de píxel en la imagen ráster
    row_idx, col_idx = ~transform * (lon, lat)                                          # Aplicamos la transformación inversa
    row_idx, col_idx = int(row_idx), int(col_idx)                                       # Convertimos a enteros para obtener la posición en la matriz ráster
    # Verificamos que las coordenadas convertidas estén dentro de los límites del ráster
    if 0 <= row_idx < raster_array.shape[1] and 0 <= col_idx < raster_array.shape[2]:
        # Extraemos los valores de las bandas del píxel correspondiente y los almacenamos en la lista
        valores_pixeles.append([
            raster_array[0, row_idx, col_idx],  # Banda 1 (Ej. Rojo)
            raster_array[1, row_idx, col_idx],  # Banda 2 (Ej. Verde)
            raster_array[2, row_idx, col_idx]   # Banda 3 (Ej. Azul)
        ])
        etiquetas.append(label)                                                         # Almacenamos la etiqueta de la muestra en la lista
# Convertimos las listas a arreglos NumPy para su uso en el modelo de Machine Learning
X, y = np.array(valores_pixeles), np.array(etiquetas)


Dividir el universo de muestras en grupos de entrenamiento y validación

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

Entrenamiento del modelo de clasificación

In [None]:
# Inicialización del modelo de clasificación Random Forest
modelo = RandomForestClassifier(
    n_estimators=1000,      # Número de árboles en el bosque
    max_depth=10,           # Profundidad máxima de cada árbol para evitar sobreajuste
    max_features="sqrt",    # Número máximo de características consideradas en cada división (raíz cuadrada del total)
    random_state=42,        # Fijamos una semilla para asegurar reproducibilidad de resultados
    n_jobs=-1               # Utiliza todos los núcleos de la CPU disponibles para acelerar el entrenamiento
)
# Entrenamiento del modelo con los datos de entrenamiento
modelo.fit(X_train, y_train)
# Realización de predicciones sobre el conjunto de prueba
y_pred = modelo.predict(X_test)


Evaluación del rendimiento del modelo

In [None]:
# Cálculo de la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print("Precisión:", accuracy)  # Imprime la precisión global del modelo
# Cálculo de la exactitud del modelo con formato de 4 decimales
exactitud = accuracy_score(y_test, y_pred)
print(f"Exactitud del modelo: {exactitud:.4f}")
# Cálculo de la matriz de confusión
conf_matrix = confusion_matrix(y_test, y_pred)
# Visualización de la matriz de confusión con Seaborn
sns.heatmap(conf_matrix, annot=True, fmt="d", cmap="Blues", 
            xticklabels=["No Bosque", "Bosque"], 
            yticklabels=["No Bosque", "Bosque"])
# Etiquetas para los ejes
plt.xlabel("Predicción")            # Etiqueta del eje X
plt.ylabel("Real")                  # Etiqueta del eje Y
plt.title("Matriz de Confusión")    # Título del gráfico
plt.show()                          # Mostrar la matriz de confusión
# Generación del informe de clasificación con métricas detalladas
print(classification_report(y_test, y_pred, target_names=["No Bosque", "Bosque"]))

Aplicación del modelo para predecir la clase de cada píxel en la imagen ráster

In [None]:
filas, columnas = raster_array.shape[1], raster_array.shape[2]  # Extraemos el número de filas y columnas del ráster
# Reestructuramos la imagen ráster en una matriz donde cada fila es un píxel y las columnas son las bandas espectrales
raster_reshaped = raster_array.reshape(3, -1).T                 # Convertimos a formato (N, 3), donde N es el número total de píxeles
predicciones = modelo.predict(raster_reshaped)                  # Aplicamos el modelo entrenado para predecir la clase de cada píxel en la imagen ráster
predict_ = predicciones.reshape(filas, columnas)                # Reformateamos las predicciones en la misma estructura de la imagen original (filas, columnas)

In [None]:
mapa_clases = {"No_Bosque": 0, "Bosque": 1}                         # Diccionario de mapeo de clases: Asigna valores numéricos a las etiquetas de clasificación
predict_numeric = np.vectorize(mapa_clases.get)(predict_)           # Convierte la matriz de predicciones categóricas a valores numéricos usando el diccionario de mapeo
filas, columnas = raster_array.shape[1], raster_array.shape[2]      # Extraemos las dimensiones de la imagen original
# Redimensionamos la imagen predicha para ajustarla a la resolución original del ráster
predict_resized = resize(
    predict_numeric, (filas, columnas), 
    order=0,                                                        # Mantiene valores discretos sin interpolación
    anti_aliasing=False,                                            # Evita suavizar los bordes para mantener las clases bien definidas
    preserve_range=True                                             # Mantiene los valores originales sin normalización
)
cmap = mcolors.ListedColormap(["green", "white"])                   # Definimos un mapa de colores para visualizar la clasificación. "Bosque" será verde, "No Bosque" será blanco
bounds = [0, 0.5, 1]                                                # Definimos los límites de cada clase en el mapa de colores
norm = mcolors.BoundaryNorm(bounds, cmap.N)
fig, axs = plt.subplots(1, 2, figsize=(14, 7))                      # Creamos una figura con 2 subgráficos (1 fila, 2 columnas)
# Construimos una imagen en color RGB a partir de las bandas del ráster original
raster_rgb = np.stack([
    raster_array[0],  # Banda Roja
    raster_array[1],  # Banda Verde
    raster_array[2]   # Banda Azul
], axis=-1)
raster_rgb = raster_rgb.astype(np.float32)                          # Normalizamos los valores del ráster RGB para mejorar la visualización
raster_rgb /= raster_rgb.max()
axs[0].imshow(raster_rgb)                                           # Mostramos la imagen original en la primera columna
axs[0].set_title("Imagen Original (RGB)")
axs[0].axis("off")                                                  # Oculta los ejes para mejorar la visualización
img = axs[1].imshow(predict_resized, cmap=cmap, norm=norm)          # Mostramos la clasificación "Bosque / No Bosque" en la segunda columna
axs[1].set_title("Clasificación Bosque / No Bosque")
axs[1].axis("off")
plt.tight_layout()                                                  # Ajusta el diseño de la figura para evitar solapamientos
plt.show()                                                          # Muestra la figura con las dos imágenes

In [None]:
output_raster_path = "clasificacion_bosque.tif"
transform = rasterio.open("temp_raster.tif").transform  # Extrae la transformación del raster original
# Guardar el resultado en un nuevo raster GeoTIFF
with rasterio.open(
    output_raster_path, "w",
    driver="GTiff",
    height=predict_resized.shape[0], 
    width=predict_resized.shape[1],
    count=1,  # Una sola banda (clasificación)
    dtype=rasterio.uint8,  # Tipo de datos para la clasificación (0 y 1)
    crs="EPSG:32619",  # Asegurar que tenga el mismo CRS que la imagen original
    transform=transform
) as dst:
    dst.write(predict_resized.astype(rasterio.uint8), 1)

In [None]:
import psycopg2     # psycopg2: Librería para conectar Python con bases de datos PostgreSQL. Permite ejecutar consultas SQL, manipular datos y gestionar transacciones.
import subprocess   # subprocess: Módulo para ejecutar comandos del sistema desde Python. Se usa para llamar programas externos como psql, raster2pgsql, etc.
import os

DB_CONFIG = {
    "dbname": "postgis_34_sample",      # Nombre de la base de datos
    "user": "postgres",                 # Usuario de la base de datos
    "password": "postgres",             # Contraseña del usuario
    "host": "localhost",                # Dirección del servidor (localhost si es local)
    "port": "5432"                      # Puerto predeterminado de PostgreSQL
}
conn = psycopg2.connect(**DB_CONFIG) 
cur = conn.cursor()
# Abrir el archivo raster (.tif)
raster_path = r'C:\Users\ingju\OneDrive\Escritorio\Repositorios\Tools_ArcGIS\PostGIS_Python\PostGIS_Python\clasificacion_bosque.tif'
os.environ["PGPASSWORD"] = DB_CONFIG["password"]
'''
¿Por qué usar PGPASSWORD?
- Evita que psql solicite la contraseña cada vez que se ejecuta un comando.
- Facilita la automatización de tareas en PostgreSQL, como importar datos o ejecutar scripts SQL.
- Es más seguro que escribir la contraseña directamente en el comando, pero aún es recomendable eliminarla después de su uso.'
'''

# Ruta a la carpeta donde están raster2pgsql y psql
pg_bin_path = r"C:\Program Files\PostgreSQL\16\bin"
sql_output_path = r"C:\Shp_Example\classify_raster.sql"
# Construir el comando con la ruta completa de raster2pgsql y psql
cmd = fr'"{pg_bin_path}\raster2pgsql.exe" -s 32619 -I -C "{raster_path}" >  {sql_output_path}'
# Ejecutar el comando en la terminal
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)

cmd = fr'"{pg_bin_path}\psql.exe" -d {DB_CONFIG["dbname"]} -U {DB_CONFIG["user"]} -h {DB_CONFIG["host"]} -p {DB_CONFIG["port"]} -f "{sql_output_path}"'
# Ejecutar el comando
process = subprocess.run(cmd, shell=True, capture_output=True, text=True)
# Limpiar la variable de entorno después de ejecutar el comando
del os.environ["PGPASSWORD"]
print(process.stdout)

```{image} Imagenes/Load_Classify.png
:width: 500px
:align: center
:alt: unidad
```
<p style="text-align: center; font-size: 12px;"> 
<strong>Fig. 2. Conexión a base de datos espacial desde QGIS para visualización de resultados </strong>
</p>

### Referencias y Recursos

##### Bases de Datos
- **Oracle** - [¿Qué es una base de datos?](https://www.oracle.com/co/database/what-is-database/)
- **PostgreSQL** - [Introducción a PostgreSQL](https://www.postgresql.org/docs/current/intro-whatis.html)
- **PostgreSQL - Documentación** - [PostgreSQL Docs](https://www.postgresql.org/docs/current/)

##### SQL
- **SQL en AWS** - [¿Qué es SQL?](https://aws.amazon.com/es/what-is/sql/#:~:text=El%20lenguaje%20de%20consulta%20estructurada%20(SQL)%20es%20un%20lenguaje%20est%C3%A1ndar,relacional%20que%20utiliza%20consultas%20SQL.)
- **Acciones SQL en PostgreSQL** - [Documentación Oficial](https://www.postgresql.org/docs/current/)

##### PostGIS
- **Sitio Oficial de PostGIS** - [PostGIS.net](https://postgis.net/)
- **Carga de datos vectoriales en PostGIS** - [Gestión de datos en PostGIS](https://postgis.net/docs/manual-3.5/using_postgis_dbmanagement.html#loading-data)
- **Formatos Ráster en PostGIS** - [Uso de datos ráster en PostGIS](https://postgis.net/docs/using_raster_dataman)

##### Python y Librerías Científicas
1. **NumPy** - [Sitio Oficial](https://numpy.org/)
2. **Pandas** - [Documentación Oficial](https://pandas.pydata.org/docs/)
3. **GeoPandas** - [Documentación Oficial](https://geopandas.org/en/stable/)
4. **Scikit-Image** - [Documentación Oficial](https://scikit-image.org/docs/stable/)
5. **Scikit-Learn** - [Sitio Oficial](https://scikit-learn.org/stable/)
6. **Rasterio** - [Documentación Oficial](https://rasterio.readthedocs.io/en/latest/)
7. **Shapely** - [Documentación Oficial](https://shapely.readthedocs.io/en/stable/)
8. **Matplotlib** - [Documentación Oficial](https://matplotlib.org/stable/contents.html)

##### Jupyter y Entornos de Desarrollo
- **JupyterBook** - [Documentación Oficial](https://jupyterbook.org/en/stable/content/index.html)
- **Jupyter Notebook** - [Guía Oficial](https://jupyter.org/documentation)
- **VS Code para Python** - [Extensión Oficial](https://marketplace.visualstudio.com/items?itemName=ms-python.python)