<a href="https://colab.research.google.com/github/abxda/UP_Python_2025/blob/main/Semana_03_01_Miercoles_UP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# GeoPandas Básico en Python

En este ejemplo aprenderemos a trabajar con **GeoPandas**, una poderosa librería de Python para el manejo y análisis de datos geoespaciales. Veremos cómo crear un **GeoDataFrame** a partir de datos de ciudades y sus coordenadas, asignar un sistema de referencia de coordenadas (CRS) y realizar una visualización interactiva simple.

## Introducción y Objetivos

**Propósito del ejemplo:**
- Introducir los conceptos básicos de **GeoPandas** y cómo se utiliza para trabajar con datos geoespaciales.
- Mostrar cómo crear un **GeoDataFrame** con geometrías (en este caso, puntos que representan ciudades).
- Explicar la importancia del **CRS** (Sistema de Referencia de Coordenadas) para garantizar que los datos se interpreten correctamente en mapas y análisis espaciales.
- Realizar una visualización simple e interactiva del **GeoDataFrame**.

**Conceptos clave:**
- **Geometrías geoespaciales:** Representación de entidades espaciales (por ejemplo, puntos, líneas, polígonos).
- **CRS (Sistema de Referencia de Coordenadas):** Define cómo se interpretan las coordenadas geográficas; en este ejemplo, se utiliza `EPSG:4326`, que corresponde a coordenadas en grados decimales.
- **GeoDataFrame:** Una estructura de datos similar a un DataFrame de pandas, pero con una columna especial para almacenar datos geoespaciales.

**Librerías utilizadas:**
- **`geopandas`**: Facilita el manejo y análisis de datos espaciales.
- **`shapely.geometry.Point`**: Permite crear objetos geométricos que representan puntos en un espacio geográfico.

## Código Listo para Google Colab




In [None]:
pip install folium matplotlib mapclassify

In [None]:
import geopandas as gpd
from shapely.geometry import Point
# Crear GeoDataFrame
data = {
    'ciudad': ['CDMX', 'Monterrey'],
    'tot_pop': [21581000, 5253000],
    'geometry': [Point(-99.1332, 19.4326), Point(-100.3181, 25.6866)]
}

In [None]:
data

In [None]:
gdf = gpd.GeoDataFrame(data, crs="EPSG:4326")

# Mostrar información básica
print("GeoDataFrame:")
print(gdf)
print("\nCRS:", gdf.crs)

# Visualización simple
gdf.explore()


In [None]:
gdf.to_file("puntos_mx_pop.geojson" , driver='GeoJSON')


## Explicación Paso a Paso del Código

Globo terráqueo : https://famousandfaded.com/showcase/latitude-longitude-visualised/

### 1. Importación de las Librerías

```python
import geopandas as gpd
from shapely.geometry import Point
```

- **`import geopandas as gpd`**: Importa GeoPandas, que nos ayudará a crear y manipular el GeoDataFrame.
- **`from shapely.geometry import Point`**: Importa la clase `Point` de Shapely, la cual se utiliza para definir coordenadas (latitud y longitud) que representan ubicaciones geográficas.

### 2. Creación del GeoDataFrame

```python
# Crear GeoDataFrame
data = {
    'ciudad': ['CDMX', 'Monterrey'],
    'geometry': [Point(-99.1332, 19.4326), Point(-100.3181, 25.6866)]
}

gdf = gpd.GeoDataFrame(data, crs="EPSG:4326")
```

- **Definición de los datos:**
  - Se crea un diccionario `data` con dos claves: `ciudad` (nombre de la ciudad) y `geometry` (coordenadas de la ciudad como objetos `Point`).
  - Las coordenadas para **CDMX** y **Monterrey** se definen utilizando la función `Point`, donde el primer valor es la longitud y el segundo es la latitud.
- **Creación del GeoDataFrame:**
  - Se crea el `GeoDataFrame` pasando el diccionario `data` y especificando el CRS `EPSG:4326` (un estándar global para coordenadas en grados decimales).

### 3. Visualización de Información Básica

```python
# Mostrar información básica
print("GeoDataFrame:")
print(gdf)
print("\nCRS:", gdf.crs)
```

- **Visualización del GeoDataFrame:**
  - Se imprime el contenido del `GeoDataFrame` para mostrar los datos y las geometrías.
- **Visualización del CRS:**
  - Se muestra el CRS asignado al `GeoDataFrame` para confirmar que los datos están referenciados correctamente.

### 4. Visualización Interactiva Simple

```python
# Visualización simple
gdf.explore()
```

- **`gdf.explore()`**:
  - Este método de GeoPandas abre una visualización interactiva en el navegador, permitiendo explorar geográficamente los puntos definidos. Es una forma rápida y sencilla de ver cómo se distribuyen los datos espaciales en un mapa.

## Conclusión

En este ejemplo hemos aprendido a:
- Crear un **GeoDataFrame** a partir de un conjunto de datos que incluye nombres de ciudades y sus coordenadas geoespaciales.
- Asignar un sistema de referencia de coordenadas (CRS) a los datos para asegurar su correcta interpretación en mapas.
- Visualizar de manera interactiva los datos geoespaciales utilizando el método `explore()` de GeoPandas.

Estos conocimientos son fundamentales para trabajar con datos geoespaciales en Python y pueden aplicarse en proyectos de análisis geográfico, visualización de datos, y sistemas de información geográfica (GIS). Como mejoras adicionales, podrías explorar:
- La creación y manejo de otros tipos de geometrías (líneas y polígonos).
- Integrar capas adicionales de datos y realizar análisis espaciales más complejos.
- Exportar e importar datos geoespaciales en formatos como Shapefile o GeoJSON.

# Ejemplo: Unión de Datos de Censo y Geometrías con DuckDB y Spatial

## Introducción y Objetivos

Este ejemplo demuestra cómo unir datos tabulares (información de censo) con datos geoespaciales (geometrías de polígonos) usando DuckDB y su extensión `spatial`.  El objetivo principal es aprender a combinar información de diferentes fuentes basándose en una columna común (en este caso, el nombre de la ciudad).  Al final, tendremos un conjunto de datos que incluye tanto la población como la representación geométrica de cada ciudad.

**Conceptos Clave:**

*   **Bases de Datos Espaciales:** Son bases de datos optimizadas para almacenar y consultar datos que representan objetos definidos en un espacio geométrico (puntos, líneas, polígonos, etc.).
*   **DuckDB:** Una base de datos SQL en proceso, rápida y embebida, ideal para análisis de datos localmente sin necesidad de un servidor de base de datos separado. Es similar a SQLite, pero optimizada para operaciones analíticas (OLAP).
*   **Extensión Spatial:** Una extensión de DuckDB que le añade capacidades de manejo de datos geoespaciales, incluyendo funciones para crear, manipular y consultar geometrías.
*   **WKT (Well-Known Text):**  Un formato de texto estándar para representar geometrías vectoriales (puntos, líneas, polígonos, etc.). Es una forma legible de describir formas geométricas.
*   **JOIN (Unión):** Una operación SQL que combina filas de dos o más tablas basándose en una columna relacionada entre ellas.  En este caso, usaremos un `LEFT JOIN` para asegurar que todas las filas de la tabla `censo` se incluyan en el resultado, incluso si no hay una geometría correspondiente en la tabla `geometrias`.

**Librerías y Herramientas:**

*   **`duckdb`:**  La librería principal para interactuar con la base de datos DuckDB.
*   **`geopandas`:** Se utiliza al final para mostrar los resultados en un DataFrame de GeoPandas, lo que facilita la visualización.
*   **`shapely.geometry`:**  Aunque se importa `Polygon`, DuckDB maneja las geometrías internamente a través de WKT y su extensión `spatial`.  No usamos `Polygon` directamente en el código.
* **`spatial`**: Extensión espacial de DuckDB, que se instala y carga en el script

**Importancia:**

*   **DuckDB:** Permite realizar análisis de datos geoespaciales de manera eficiente sin necesidad de configurar un servidor de base de datos complejo. Su naturaleza "en proceso" y velocidad lo hacen ideal para prototipado y análisis exploratorio.
*   **Extensión `spatial`:**  Proporciona las funciones necesarias para trabajar con geometrías (creación, manipulación, consultas espaciales) dentro de DuckDB.
*    **GeoPandas:** Simplifica el trabajo with dataframes espaciales, y en este ejemplo se usa para imprimir el resultado final.



# **¿Qué es un WKT?**  
El **WKT (Well-Known Text)** es un formato de texto estandarizado utilizado para representar objetos geométricos en sistemas de información geográfica (GIS) y bases de datos espaciales. Su principal función es describir formas geométricas (como puntos, líneas o polígonos) y sistemas de coordenadas de manera clara y estructurada, facilitando el intercambio de datos entre aplicaciones.  

#### **Estructura básica del WKT**  
El WKT define geometrías mediante palabras clave seguidas de coordenadas numéricas. Por ejemplo:  
- **Punto (POINT):** `POINT (longitud latitud)`  
- **Línea (LINESTRING):** `LINESTRING (x1 y1, x2 y2, ...)`  
- **Polígono (POLYGON):** `POLYGON ((x1 y1, x2 y2, ..., x1 y1))`  

---

### **Importancia del WKT en sistemas geográficos**  
1. **Precisión en la representación:**  
   - El orden de las coordenadas **longitud antes que latitud** es clave (eje X, luego eje Y). Un error aquí ubicaría el punto en otro país.  
   - Por ejemplo, invertir los valores (`POINT (19.4326 -99.1332)`) situaría el punto en el Océano Índico, cerca de Madagascar.  

2. **Compatibilidad global:**  
   - El WKT es universalmente reconocido en herramientas como Google Maps, ArcGIS, y bases de datos espaciales, lo que facilita proyectos transfronterizos o colaboraciones internacionales.  

---

### **Convenciones críticas en WKT**  
- **Negativo vs. Positivo:**  

| Coordenada | Valor negativo | Valor positivo |  
|------------|----------------|----------------|  
| Longitud   | Oeste          | Este           |  
| Latitud    | Sur            | Norte          |  

- **Sistema de referencia (EPSG):**  
  - El ejemplo usa **EPSG:4326 (WGS84)**, estándar para GPS y mapas web. En México, también se usa **EPSG:6372** (coordenadas oficiales del INEGI), que requiere ajustes en el WKT.  


## EJEMPLOS

https://wktmap.com/

### **1. Punto (`POINT`)**  
**Descripción:** Representa una ubicación exacta con una sola coordenada.  
**Uso típico:** Marcadores de ciudades, monumentos, o sitios de interés.  

**Ejemplo (Monumento a la Revolución, CDMX):**  
```wkt
POINT (-99.1547 19.4366)
```  
**Estructura:**  
- `POINT`: Palabra clave.  
- Coordenadas entre paréntesis: **longitud primero**, luego latitud.  

**Nota:** En México, las longitudes siempre serán negativas (por estar al oeste de Greenwich).

---

### **2. Línea (`LINESTRING`)**  
**Descripción:** Secuencia de puntos conectados que forman una trayectoria.  
**Uso típico:** Carreteras, ríos, o rutas de transporte.  

**Ejemplo (Carretera CDMX-Cuernavaca):**  
```wkt
LINESTRING (
  -99.1332 19.4326,  // Ciudad de México
  -99.2309 18.9356,  // Xochimilco
  -99.2500 18.8500   // Cuernavaca
)
```  
**Estructura:**  
- `LINESTRING`: Palabra clave.  
- Pares de coordenadas separados por comas.  
- Mínimo **2 puntos** para formar una línea.  

---

### **3. Polígono (`POLYGON`)**  
**Descripción:** Figura cerrada formada por una secuencia de puntos que definen un área.  
**Uso típico:** Delimitar estados, municipios, o parques naturales.  

**Ejemplo (Polígono del Zócalo de la CDMX):**  
```wkt
POLYGON ((
  -99.1332 19.4326,  // Esquina noroeste
  -99.1328 19.4326,  // Esquina noreste
  -99.1328 19.4322,  // Esquina sureste
  -99.1332 19.4322,  // Esquina suroeste
  -99.1332 19.4326   // Cierre del polígono
))
```  
**Reglas clave:**  
- El primer y último punto deben ser iguales para "cerrar" el polígono.  
- Los polígonos con huecos usan múltiples anillos (ej: un lago dentro de un parque).  

---

### **4. MultiPunto (`MULTIPOINT`)**  
**Descripción:** Colección de puntos independientes.  
**Uso típico:** Mapear sucursales de una empresa, estaciones de metro, o sitios arqueológicos.  

**Ejemplo (Ciudades de México):**  
```wkt
MULTIPOINT (
  (-99.1332 19.4326),  // CDMX
  (-100.3181 25.6866), // Monterrey
  (-89.6233 20.9754)   // Mérida
)
```  
**Estructura:**  
- Cada punto va entre paréntesis individuales.  

---

### **5. MultiPolígono (`MULTIPOLYGON`)**  
**Descripción:** Colección de polígonos separados.  
**Uso típico:** Representar archipiélagos, zonas metropolitanas, o áreas no contiguas.  

**Ejemplo (Islas de México):**  
```wkt
MULTIPOLYGON (
  ((  
    -86.7167 21.1667,  // Isla Cozumel
    -86.7000 21.1500,
    -86.7500 21.1333,
    -86.7167 21.1667
  )),
  ((  
    -110.9833 18.7333,  // Isla Socorro (Revillagigedo)
    -111.0000 18.7500,
    -110.9667 18.7667,
    -110.9833 18.7333
  ))
)
```  
**Nota:** Cada polígono se encierra entre dobles paréntesis `((...))`.

---

### **6. Geometría Colectiva (`GEOMETRYCOLLECTION`)**  
**Descripción:** Agrupa diferentes tipos de geometrías en un solo objeto.  
**Uso típico:** Mapas temáticos complejos (ej: un parque nacional con senderos, lagos y miradores).  

**Ejemplo (Bosque de Chapultepec, CDMX):**  
```wkt
GEOMETRYCOLLECTION (
  POLYGON ((  // Área del bosque
    -99.2000 19.4200,
    -99.1900 19.4200,
    -99.1900 19.4100,
    -99.2000 19.4100,
    -99.2000 19.4200
  )),
  LINESTRING (  // Sendero principal
    -99.1950 19.4150,
    -99.1925 19.4175
  ),
  POINT (-99.1933 19.4167)  // Monumento a los Niños Héroes
)
```  

---

### **Reglas Generales para Construir WKT**  
1. **Orden de coordenadas:** Siempre `longitud latitud` (eje X, luego eje Y).  
2. **Signos:**  
   - Longitud negativa = Oeste (México usa valores entre -86° y -118°).  
   - Latitud positiva = Norte (México está entre 14° y 33° N).  
3. **Sistemas de referencia:** Especificar el EPSG (ej: `SRID=4326;POINT (...)`) si no se usa el estándar WGS84.  
4. **Sintaxis:**  
   - No comas antes de paréntesis.  
   - Puntos decimales con `.`, no `,`.  

---

### **Errores Comunes en WKT (y cómo evitarlos)**  
| **Error**                       | **Ejemplo Incorrecto**         | **Corrección**                 |  
|----------------------------------|---------------------------------|--------------------------------|  
| Invertir latitud y longitud      | `POINT (19.4326 -99.1332)`     | `POINT (-99.1332 19.4326)`     |  
| Olvidar cerrar un polígono       | `POLYGON ((-90 20, -91 21))`   | `POLYGON ((-90 20, -91 21, -90 20))` |  
| Usar comas incorrectamente       | `LINESTRING (-99, 19, -100 20)`| `LINESTRING (-99 19, -100 20)` |  

---


## Código Listo para Google Colab

In [None]:
import duckdb
import geopandas as gpd

In [None]:
# Crear una nueva conexión a un archivo persistente
con = duckdb.connect(database='censo_geo.duckdb', read_only=False)
# Instalar la extensión spatial (si no la tienes ya)
con.execute("INSTALL spatial;")
# Cargar la extensión spatial
con.execute("LOAD spatial;")
# Eliminar las tablas si existen (para evitar errores si el script se ejecuta varias veces)
con.execute("DROP TABLE IF EXISTS censo;")
con.execute("DROP TABLE IF EXISTS geometrias;")
con.execute("DROP TABLE IF EXISTS censo_geo;")
# Crear tabla censo con nombres de columnas explícitos
con.execute("""
    CREATE TABLE censo AS
    SELECT *
    FROM (
        VALUES
        ('CDMX', 21581000),
        ('Guadalajara', 5253000)
    ) AS t(ciudad, poblacion)
""")

# Crear tabla geometrias con nombres de columnas explícitos
#  Usar ST_GeomFromText para convertir WKT a geometría
con.execute("""
    CREATE TABLE geometrias AS
    SELECT *
    FROM (
        VALUES
        ('CDMX', ST_GeomFromText('POLYGON((-99.28 19.53, -99.05 19.53, -99.05 19.35,
        -99.28 19.35, -99.28 19.53))')),
        ('Guadalajara', ST_GeomFromText('POLYGON((-103.43 20.73, -103.28 20.73,
        -103.28 20.58, -103.43 20.58, -103.43 20.73))'))
    ) AS t(ciudad, geometry)
""")

# Crear la tabla censo_geo con el resultado del JOIN, asegurando EPSG:4326
con.execute("""
    CREATE TABLE censo_geo AS
    SELECT
        c.*,
        g.geometry
    FROM censo c
    JOIN geometrias g
    ON c.ciudad = g.ciudad;
""")

print("Tabla 'censo_geo' creada con EPSG:4326.")

# Verificar que los datos están correctamente almacenados
resultado = con.query("SELECT * FROM censo_geo").fetchdf()
print(resultado)

# Cerrar la conexión (buena práctica)
con.close()

In [None]:
resultado

## Explicación Paso a Paso del Código

1. **Importar Librerías:**

    ```python
    import duckdb
    import geopandas as gpd
    ```
    
    - Se importan las librerías necesarias:  
      - `duckdb` para crear y gestionar la base de datos.  
      - `geopandas` para manipular datos geoespaciales (aunque en este script solo se utiliza para mostrar el resultado como un DataFrame).

2. **Crear Conexión:**

    ```python
    con = duckdb.connect(database='censo_geo.duckdb', read_only=False)
    ```
    
    - A diferencia de la versión anterior que creaba una base de datos en memoria (`:memory:`), aquí se crea una conexión a un archivo persistente `censo_geo.duckdb`.  
    - `read_only=False` permite crear y modificar tablas dentro de este archivo.

3. **Instalar y Cargar la Extensión Spatial:**

    ```python
    con.execute("INSTALL spatial;")
    con.execute("LOAD spatial;")
    ```
    
    - `INSTALL spatial;`: Instala la extensión **spatial** en DuckDB (solo la primera vez que se necesita).  
    - `LOAD spatial;`: Carga la extensión **spatial** en la sesión actual de DuckDB, habilitando las funciones geoespaciales (ej. `ST_GeomFromText`).

4. **Eliminar Tablas Existentes (Opcional, pero Recomendado):**

    ```python
    con.execute("DROP TABLE IF EXISTS censo;")
    con.execute("DROP TABLE IF EXISTS geometrias;")
    ```
    
    - Estas sentencias eliminan las tablas `censo` y `geometrias` si existen.  
    - Con `IF EXISTS` se evita el error si dichas tablas no están creadas.

5. **Crear Tabla `censo`:**

    ```python
    con.execute("""
        CREATE TABLE censo AS
        SELECT *
        FROM (
            VALUES
            ('CDMX', 21581000),
            ('Guadalajara', 5253000)
        ) AS t(ciudad, poblacion)
    """)
    ```
    
    - Crea una tabla `censo` con dos columnas: `ciudad` (tipo texto) y `poblacion` (tipo numérico).  
    - Se usan datos de ejemplo (CDMX y Guadalajara) mediante la cláusula `VALUES`.

6. **Crear Tabla `geometrias`:**

    ```python
    con.execute("""
        CREATE TABLE geometrias AS
        SELECT *
        FROM (
            VALUES
            ('CDMX', ST_GeomFromText('POLYGON((-99.28 19.53, -99.05 19.53, -99.05 19.35, -99.28 19.35, -99.28 19.53))')),
            ('Guadalajara', ST_GeomFromText('POLYGON((-103.43 20.73, -103.28 20.73, -103.28 20.58, -103.43 20.58, -103.43 20.73))'))
        ) AS t(ciudad, geometry)
    """)
    ```
    
    - Crea una tabla `geometrias` con dos columnas: `ciudad` y `geometry`.  
    - Se utiliza `ST_GeomFromText(...)` para convertir la geometría en formato WKT (Well-Known Text) a un objeto geoespacial entendible por DuckDB.  
    - Cada `POLYGON((...))` especifica un polígono con coordenadas (longitud, latitud).

7. **Crear la Tabla `censo_geo` con el Resultado del JOIN (Asegurando EPSG:4326):**

    ```python
    con.execute("""
        CREATE TABLE censo_geo AS
        SELECT
            *
        FROM censo c
        LEFT JOIN geometrias g
        ON c.ciudad = g.ciudad;
    """)
    
    print("Tabla 'censo_geo' creada con EPSG:4326.")
    ```
    
    - Se crea una nueva tabla `censo_geo` que une los datos de `censo` y `geometrias` usando `LEFT JOIN` en la columna `ciudad`.  
    - El resultado final almacena tanto la población como la geometría para cada ciudad.  
    - Se asume que las coordenadas están en **EPSG:4326** (latitud y longitud), que es el estándar WGS84.

8. **Verificar que los Datos Están Correctamente Almacenados:**

    ```python
    resultado = con.query("SELECT * FROM censo_geo").fetchdf()
    print(resultado)
    ```
    
    - Se realiza una consulta para verificar el contenido de la tabla `censo_geo`.  
    - `fetchdf()` retorna el resultado como un DataFrame de pandas, mostrándonos tanto la información tabular como la columna de geometría.

9. **Cerrar la Conexión:**

    ```python
    con.close()
    ```
    
    - Cierra la conexión a la base de datos DuckDB, liberando recursos. Es una buena práctica para finalizar correctamente.

---

## Conclusión

En este ejemplo se muestra cómo:

1. Conectar a una base de datos DuckDB de forma persistente (archivo `censo_geo.duckdb`).  
2. Instalar y cargar la extensión `spatial`.  
3. Crear tablas con columnas de tipo texto, numéricas y geométricas.  
4. Convertir geometrías en formato WKT a objetos geoespaciales usando `ST_GeomFromText`.  
5. Unir información de diferentes tablas (JOIN) y crear una tabla final (`censo_geo`).  
6. Verificar los resultados y observar la información combinada en un DataFrame de Pandas (con la geometría incluida).  
7. Cerrar la conexión para terminar correctamente el proceso.

In [None]:
import duckdb
import geopandas as gpd

# Crear nueva conexión a base de datos espacial
con = duckdb.connect(database='analisis_geo.duckdb', read_only=False)

# Instalar y cargar extensión spatial
con.execute("INSTALL spatial;")
con.execute("LOAD spatial;")

# Eliminar tablas existentes (para pruebas)
con.execute("DROP TABLE IF EXISTS Negocios;")
con.execute("DROP TABLE IF EXISTS Poligono_Interes;")
con.execute("DROP TABLE IF EXISTS Negocios_En_Poligono;")

# Crear tabla de negocios con puntos geográficos
con.execute("""
    CREATE TABLE Negocios AS
    SELECT *
    FROM (
        VALUES
        ('Tienda A', ST_GeomFromText('POINT(-99.18 19.42)')),
        ('Restaurante B', ST_GeomFromText('POINT(-99.16 19.40)')),
        ('Farmacia C', ST_GeomFromText('POINT(-103.35 20.65)'))  -- Este estará fuera del polígono
    ) AS t(nombre, ubicacion)
""")

# Crear tabla de polígono de interés (simulando un municipio)
con.execute("""
    CREATE TABLE Poligono_Interes AS
    SELECT *
    FROM (
        VALUES
        ('Zona Centro CDMX',
         ST_GeomFromText('POLYGON((-99.20 19.44, -99.15 19.44, -99.15 19.38, -99.20 19.38, -99.20 19.44))'))
    ) AS t(nombre_poligono, geometry)
""")

# Crear nueva tabla con negocios contenidos en el polígono usando ST_Contains
con.execute("""
    CREATE TABLE Negocios_En_Poligono AS
    SELECT
        n.nombre,
        n.ubicacion,
        p.nombre_poligono
    FROM Negocios n
    CROSS JOIN Poligono_Interes p
    WHERE ST_Contains(p.geometry, n.ubicacion)
""")

print("\nNegocios dentro del polígono:")
resultado = con.query("SELECT * FROM Negocios_En_Poligono").fetchdf()
print(resultado)

# Opcional: Visualización con GeoPandas
print("\nVisualización GeoPandas:")
gdf = con.query("""
    SELECT
        nombre AS negocio,
        ubicacion,
        'EPSG:4326'::VARCHAR AS crs
    FROM Negocios_En_Poligono
""").fetchdf()


# Cerrar conexión
con.close()

In [None]:
import duckdb
import geopandas as gpd
from shapely import wkt

# Reconectar a la base de datos (modo solo lectura)
con = duckdb.connect(database='analisis_geo.duckdb', read_only=True)

# Instalar y cargar extensión spatial
con.execute("INSTALL spatial;")
con.execute("LOAD spatial;")

# Extraer datos de la tabla Negocios_En_Poligono usando ST_AsText para obtener la geometría en formato WKT
df = con.query("SELECT nombre, ST_AsText(ubicacion) AS ubicacion FROM Negocios_En_Poligono").fetchdf()


In [None]:
df

In [None]:

# Convertir la columna 'ubicacion' a geometría
df['geometry'] = df['ubicacion'].apply(wkt.loads)

In [None]:
df

In [None]:


# Crear un GeoDataFrame con CRS EPSG:4326
gdf = gpd.GeoDataFrame(df, geometry='geometry', crs="EPSG:4326")

# Exportar el GeoDataFrame a Shapefile
gdf.to_file("Negocios_En_Poligono.shp", driver="ESRI Shapefile")
print("Shapefile generado: Negocios_En_Poligono.shp")

# Cerrar conexión
con.close()



In [None]:
con = duckdb.connect(database='analisis_geo.duckdb', read_only=True)
con.execute("INSTALL spatial;")
con.execute("LOAD spatial;")


In [None]:
resultado = con.query("SHOW TABLES").fetchdf()
print(resultado)

In [None]:
resultado = con.query("DESCRIBE Negocios_En_Poligono").fetchdf()
print(resultado)

In [None]:
resultado = con.query("SELECT ST_SRID(ubicacion) as srid from Negocios_En_Poligono LIMIT 1; ").fetchdf()
print(resultado)

In [None]:
con.close()