# 07 - Carga a PostGIS

**Objetivo:** Cargar datos procesados a PostgreSQL/PostGIS para an√°lisis espacial y backend de Streamlit

**Entradas:**
- CSV: `parroquias_con_petroleo.csv` (tabla final integrada)
- Shapefiles: parroquias, pozos, contaminaci√≥n

**Salidas:**
- Base de datos PostgreSQL/PostGIS con:
  - Tabla `parroquias` (con geometr√≠a)
  - Tabla `pozos_petroleros`
  - Tabla `sitios_contaminacion`
  - √çndices espaciales

---

## 1. Setup e Imports

In [3]:
# Celda 0: Verificar e instalar dependencias
import sys
print(f"üêç Python usado por el kernel: {sys.executable}")
print(f"üì¶ Instalando librer√≠as en este Python...\n")

!{sys.executable} -m pip install sqlalchemy psycopg2-binary geoalchemy2

üêç Python usado por el kernel: /opt/homebrew/opt/python@3.10/bin/python3.10
üì¶ Instalando librer√≠as en este Python...

Collecting sqlalchemy
  Downloading sqlalchemy-2.0.44-cp310-cp310-macosx_11_0_arm64.whl.metadata (9.5 kB)
Collecting psycopg2-binary
  Downloading psycopg2_binary-2.9.11-cp310-cp310-macosx_11_0_arm64.whl.metadata (4.9 kB)
Collecting geoalchemy2
  Downloading geoalchemy2-0.18.1-py3-none-any.whl.metadata (2.3 kB)
Downloading sqlalchemy-2.0.44-cp310-cp310-macosx_11_0_arm64.whl (2.1 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m2.1/2.1 MB[0m [31m8.9 MB/s[0m eta [36m0:00:00[0m-:--:--[0m
[?25hDownloading psycopg2_binary-2.9.11-cp310-cp310-macosx_11_0_arm64.whl (3.9 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m3.9/3.9 MB[0m [31m35.2 MB/s[0m eta [36m0:00:00[0m
[

In [1]:
# Imports
import pandas as pd
import geopandas as gpd
from sqlalchemy import create_engine, text
from pathlib import Path
import warnings

warnings.filterwarnings('ignore')

print("‚úÖ Librer√≠as cargadas")

‚úÖ Librer√≠as cargadas


---
## 2. Configuraci√≥n de Conexi√≥n PostgreSQL

In [2]:
# Configuraci√≥n de conexi√≥n (AJUSTAR seg√∫n tu setup)
DB_CONFIG = {
    'host': 'localhost',
    'port': 5434,
    'database': 'prototipo_salud',
    'user': 'postgres',
    'password': 'password'  # ‚Üê CAMBIAR ESTO
}

# Crear connection string
conn_string = f"postgresql://{DB_CONFIG['user']}:{DB_CONFIG['password']}@{DB_CONFIG['host']}:{DB_CONFIG['port']}/{DB_CONFIG['database']}"

print("üîß Configuraci√≥n de conexi√≥n:")
print(f"   Host: {DB_CONFIG['host']}")
print(f"   Puerto: {DB_CONFIG['port']}")
print(f"   Database: {DB_CONFIG['database']}")
print(f"   Usuario: {DB_CONFIG['user']}")

üîß Configuraci√≥n de conexi√≥n:
   Host: localhost
   Puerto: 5434
   Database: prototipo_salud
   Usuario: postgres


In [3]:
# Crear engine de SQLAlchemy
try:
    engine = create_engine(conn_string)
    
    # Test de conexi√≥n
    with engine.connect() as conn:
        result = conn.execute(text("SELECT version();"))
        version = result.fetchone()[0]
        print("\n‚úÖ CONEXI√ìN EXITOSA")
        print(f"   PostgreSQL: {version.split(',')[0]}")
        
        # Verificar PostGIS
        result = conn.execute(text("SELECT PostGIS_Version();"))
        postgis_version = result.fetchone()[0]
        print(f"   PostGIS: {postgis_version}")
        
except Exception as e:
    print(f"\n‚ùå ERROR DE CONEXI√ìN: {e}")
    print("\nüí° SOLUCIONES:")
    print("   1. Verifica que el contenedor Docker est√© corriendo: docker ps")
    print("   2. Verifica el password en DB_CONFIG")
    print("   3. Verifica el puerto (5432 por defecto)")


‚úÖ CONEXI√ìN EXITOSA
   PostgreSQL: PostgreSQL 15.4 (Debian 15.4-1.pgdg110+1) on x86_64-pc-linux-gnu
   PostGIS: 3.3 USE_GEOS=1 USE_PROJ=1 USE_STATS=1


---
## 3. Rutas de Datos

In [4]:
# Rutas
BASE_DIR = Path('../data')
PROCESSED_DIR = BASE_DIR / 'processed'
RAW_CONALI = BASE_DIR / 'raw' / 'conali_limites'
RAW_PETROLEO = BASE_DIR / 'raw' / 'maate_petroleo'

# Archivos
CSV_PARROQUIAS = PROCESSED_DIR / 'parroquias_con_petroleo.csv'
SHP_PARROQUIAS = RAW_CONALI / 'LIMITE_PARROQUIAL_CONALI_CNE_2022.shp'
SHP_POZOS = RAW_PETROLEO / 'Pozos.shp'
SHP_CONTAMINACION = RAW_PETROLEO / 'v_aa011_contaminacion_hidrocarburo_pMPoint.shp'

print("üìÅ Rutas configuradas:")
print(f"   CSV parroquias: {CSV_PARROQUIAS.exists()}")
print(f"   SHP parroquias: {SHP_PARROQUIAS.exists()}")
print(f"   SHP pozos: {SHP_POZOS.exists()}")
print(f"   SHP contaminaci√≥n: {SHP_CONTAMINACION.exists()}")

üìÅ Rutas configuradas:
   CSV parroquias: True
   SHP parroquias: True
   SHP pozos: True
   SHP contaminaci√≥n: True


---
## 4. Cargar Datos

In [5]:
# 1. Cargar CSV con datos procesados
print("üìÇ CARGANDO DATOS PROCESADOS\n")

df_parroquias = pd.read_csv(CSV_PARROQUIAS)
print(f"‚úÖ CSV parroquias: {len(df_parroquias)} registros")
print(f"   Columnas: {len(df_parroquias.columns)}")

üìÇ CARGANDO DATOS PROCESADOS

‚úÖ CSV parroquias: 1236 registros
   Columnas: 18


In [6]:
# 2. Cargar shapefile de parroquias (para geometr√≠as)
gdf_parroquias_geom = gpd.read_file(SHP_PARROQUIAS)
print(f"\n‚úÖ SHP parroquias (geometr√≠a): {len(gdf_parroquias_geom)} registros")
print(f"   CRS: {gdf_parroquias_geom.crs}")
print(f"   Columna c√≥digo: DPA_PARROQ")


‚úÖ SHP parroquias (geometr√≠a): 1236 registros
   CRS: EPSG:32717
   Columna c√≥digo: DPA_PARROQ


In [7]:
# 3. Cargar shapefiles de petr√≥leo
gdf_pozos = gpd.read_file(SHP_POZOS)
print(f"\n‚úÖ SHP pozos: {len(gdf_pozos)} registros")

gdf_contaminacion = gpd.read_file(SHP_CONTAMINACION)
print(f"‚úÖ SHP contaminaci√≥n: {len(gdf_contaminacion)} registros")


‚úÖ SHP pozos: 6287 registros
‚úÖ SHP contaminaci√≥n: 7850 registros


---
## 5. Preparar Tabla de Parroquias (CSV + Geometr√≠a)

In [8]:
# Merge CSV (datos procesados) con SHP (geometr√≠as)
print("üîó INTEGRANDO CSV CON GEOMETR√çAS\n")

# Seleccionar solo geometr√≠a del shapefile
geometrias = gdf_parroquias_geom[['CODPAR', 'geometry']].copy()

# üîß CONVERSI√ìN DE TIPOS (FIX)
print("üîß Convirtiendo tipos de datos...")
df_parroquias['codigo_dpa'] = df_parroquias['codigo_dpa'].astype(str).str.zfill(6)
geometrias['CODPAR'] = geometrias['CODPAR'].astype(str).str.zfill(6)

print(f"   CSV codigo_dpa tipo: {df_parroquias['codigo_dpa'].dtype}")
print(f"   SHP CODPAR tipo: {geometrias['CODPAR'].dtype}")
print(f"   Ejemplo CSV: {df_parroquias['codigo_dpa'].iloc[0]}")
print(f"   Ejemplo SHP: {geometrias['CODPAR'].iloc[0]}\n")

# Merge con CSV
gdf_parroquias_final = df_parroquias.merge(
    geometrias,
    left_on='codigo_dpa',
    right_on='CODPAR',
    how='left'
)

# Convertir a GeoDataFrame
gdf_parroquias_final = gpd.GeoDataFrame(
    gdf_parroquias_final,
    geometry='geometry',
    crs=gdf_parroquias_geom.crs
)

# Limpiar columna redundante
gdf_parroquias_final.drop('CODPAR', axis=1, inplace=True, errors='ignore')

print(f"‚úÖ GeoDataFrame final: {len(gdf_parroquias_final)} registros")
print(f"   Columnas: {len(gdf_parroquias_final.columns)}")
print(f"   Con geometr√≠a: {gdf_parroquias_final['geometry'].notna().sum()}")
print(f"   Sin geometr√≠a: {gdf_parroquias_final['geometry'].isna().sum()}")
print(f"   CRS: {gdf_parroquias_final.crs}")

üîó INTEGRANDO CSV CON GEOMETR√çAS

üîß Convirtiendo tipos de datos...
   CSV codigo_dpa tipo: object
   SHP CODPAR tipo: object
   Ejemplo CSV: 000285
   Ejemplo SHP: 000285

‚úÖ GeoDataFrame final: 1236 registros
   Columnas: 19
   Con geometr√≠a: 1236
   Sin geometr√≠a: 0
   CRS: EPSG:32717


---
## 6. Reprojectar a EPSG:4326 (WGS84)

Est√°ndar para web mapping y Streamlit

In [9]:
print("üåç REPROYECTANDO A WGS84 (EPSG:4326)\n")

# Reprojectar parroquias
if gdf_parroquias_final.crs != 'EPSG:4326':
    gdf_parroquias_final = gdf_parroquias_final.to_crs('EPSG:4326')
    print(f"‚úÖ Parroquias reproyectadas: {gdf_parroquias_final.crs}")
else:
    print("‚úÖ Parroquias ya est√°n en EPSG:4326")

# Reprojectar pozos
if gdf_pozos.crs != 'EPSG:4326':
    gdf_pozos = gdf_pozos.to_crs('EPSG:4326')
    print(f"‚úÖ Pozos reproyectados: {gdf_pozos.crs}")

# Reprojectar contaminaci√≥n
if gdf_contaminacion.crs != 'EPSG:4326':
    gdf_contaminacion = gdf_contaminacion.to_crs('EPSG:4326')
    print(f"‚úÖ Contaminaci√≥n reproyectada: {gdf_contaminacion.crs}")

üåç REPROYECTANDO A WGS84 (EPSG:4326)

‚úÖ Parroquias reproyectadas: EPSG:4326
‚úÖ Contaminaci√≥n reproyectada: EPSG:4326


---
## 7. Cargar a PostGIS

In [10]:
print("üì§ CARGANDO DATOS A POSTGIS\n")
print("="*70)

# 1. Tabla de parroquias (la principal)
print("\n1Ô∏è‚É£ Cargando tabla 'parroquias'...")
gdf_parroquias_final.to_postgis(
    name='parroquias',
    con=engine,
    if_exists='replace',  # Sobrescribe si ya existe
    index=False
)
print(f"   ‚úÖ {len(gdf_parroquias_final)} registros cargados")

# 2. Tabla de pozos
print("\n2Ô∏è‚É£ Cargando tabla 'pozos_petroleros'...")
gdf_pozos.to_postgis(
    name='pozos_petroleros',
    con=engine,
    if_exists='replace',
    index=False
)
print(f"   ‚úÖ {len(gdf_pozos)} registros cargados")

# 3. Tabla de contaminaci√≥n
print("\n3Ô∏è‚É£ Cargando tabla 'sitios_contaminacion'...")
gdf_contaminacion.to_postgis(
    name='sitios_contaminacion',
    con=engine,
    if_exists='replace',
    index=False
)
print(f"   ‚úÖ {len(gdf_contaminacion)} registros cargados")

print("\n" + "="*70)
print("üéâ CARGA COMPLETADA")

üì§ CARGANDO DATOS A POSTGIS


1Ô∏è‚É£ Cargando tabla 'parroquias'...
   ‚úÖ 1236 registros cargados

2Ô∏è‚É£ Cargando tabla 'pozos_petroleros'...
   ‚úÖ 6287 registros cargados

3Ô∏è‚É£ Cargando tabla 'sitios_contaminacion'...
   ‚úÖ 7850 registros cargados

üéâ CARGA COMPLETADA


---
## 8. Crear √çndices Espaciales

In [11]:
print("üîß CREANDO √çNDICES ESPACIALES (GIST)\n")
print("="*70)

with engine.connect() as conn:
    # √çndice en parroquias
    try:
        conn.execute(text("CREATE INDEX idx_parroquias_geom ON parroquias USING GIST (geometry);"))
        conn.commit()
        print("‚úÖ √çndice creado: parroquias.geometry")
    except Exception as e:
        print(f"‚ö†Ô∏è √çndice ya existe o error: {e}")
    
    # √çndice en pozos
    try:
        conn.execute(text("CREATE INDEX idx_pozos_geom ON pozos_petroleros USING GIST (geometry);"))
        conn.commit()
        print("‚úÖ √çndice creado: pozos_petroleros.geometry")
    except Exception as e:
        print(f"‚ö†Ô∏è √çndice ya existe o error: {e}")
    
    # √çndice en contaminaci√≥n
    try:
        conn.execute(text("CREATE INDEX idx_contaminacion_geom ON sitios_contaminacion USING GIST (geometry);"))
        conn.commit()
        print("‚úÖ √çndice creado: sitios_contaminacion.geometry")
    except Exception as e:
        print(f"‚ö†Ô∏è √çndice ya existe o error: {e}")

print("\n" + "="*70)
print("üéâ √çNDICES CREADOS")

üîß CREANDO √çNDICES ESPACIALES (GIST)

‚úÖ √çndice creado: parroquias.geometry
‚úÖ √çndice creado: pozos_petroleros.geometry
‚úÖ √çndice creado: sitios_contaminacion.geometry

üéâ √çNDICES CREADOS


---
## 9. Validaciones

In [12]:
print("‚úÖ VALIDACIONES\n")
print("="*70)

with engine.connect() as conn:
    # 1. Contar registros
    print("\nüìä CONTEO DE REGISTROS:")
    
    result = conn.execute(text("SELECT COUNT(*) FROM parroquias;"))
    count_parroquias = result.fetchone()[0]
    print(f"   Parroquias: {count_parroquias}")
    
    result = conn.execute(text("SELECT COUNT(*) FROM pozos_petroleros;"))
    count_pozos = result.fetchone()[0]
    print(f"   Pozos: {count_pozos}")
    
    result = conn.execute(text("SELECT COUNT(*) FROM sitios_contaminacion;"))
    count_contaminacion = result.fetchone()[0]
    print(f"   Sitios contaminaci√≥n: {count_contaminacion}")
    
    # 2. Verificar geometr√≠as v√°lidas
    print("\nüó∫Ô∏è VALIDACI√ìN DE GEOMETR√çAS:")
    
    result = conn.execute(text("""
        SELECT COUNT(*) 
        FROM parroquias 
        WHERE geometry IS NOT NULL AND ST_IsValid(geometry);
    """))
    valid_geoms = result.fetchone()[0]
    print(f"   Parroquias con geometr√≠a v√°lida: {valid_geoms}/{count_parroquias}")
    
    # 3. Verificar CRS
    result = conn.execute(text("""
        SELECT DISTINCT ST_SRID(geometry) 
        FROM parroquias 
        WHERE geometry IS NOT NULL;
    """))
    srid = result.fetchone()[0]
    print(f"   SRID (debe ser 4326): {srid}")
    
    # 4. Query de ejemplo (parroquias con m√°s pozos)
    print("\nüîù TOP 5 PARROQUIAS CON M√ÅS POZOS:")
    result = conn.execute(text("""
        SELECT 
            p.nombre_parroquia,
            p.nombre_provincia,
            COUNT(pz.*) as num_pozos
        FROM parroquias p
        JOIN pozos_petroleros pz ON ST_Within(pz.geometry, p.geometry)
        GROUP BY p.nombre_parroquia, p.nombre_provincia
        ORDER BY num_pozos DESC
        LIMIT 5;
    """))
    
    for row in result:
        print(f"   ‚Ä¢ {row[0]} ({row[1]}): {row[2]} pozos")

print("\n" + "="*70)
print("‚úÖ VALIDACIONES COMPLETADAS")

‚úÖ VALIDACIONES


üìä CONTEO DE REGISTROS:
   Parroquias: 1236
   Pozos: 6287
   Sitios contaminaci√≥n: 7850

üó∫Ô∏è VALIDACI√ìN DE GEOMETR√çAS:
   Parroquias con geometr√≠a v√°lida: 1236/1236
   SRID (debe ser 4326): 4326

üîù TOP 5 PARROQUIAS CON M√ÅS POZOS:
   ‚Ä¢ SAN JOSE DE ANCON (SANTA ELENA): 1363 pozos
   ‚Ä¢ ATAHUALPA (SANTA ELENA): 853 pozos
   ‚Ä¢ TARAPOA (SUCUMBIOS): 310 pozos
   ‚Ä¢ DAYUMA (ORELLANA): 268 pozos
   ‚Ä¢ LA LIBERTAD (SANTA ELENA): 232 pozos

‚úÖ VALIDACIONES COMPLETADAS


---
## 10. Queries de Ejemplo

In [13]:
print("üî• CORROBORANDO AN√ÅLISIS DEL NOTEBOOK 06: PARADOJA EXTRACTIVISTA\n")
print("="*70)

with engine.connect() as conn:
    # Query: Top 5 parroquias por INFRAESTRUCTURA TOTAL (pozos + contaminaci√≥n)
    print("\nüìç TOP 5 PARROQUIAS M√ÅS PETROLERAS (Infraestructura Total):\n")
    
    result = conn.execute(text("""
        SELECT 
            p.nombre_parroquia,
            p.nombre_canton,
            p.nombre_provincia,
            p.num_infraestructura_petrolera as infra_total,
            p.num_pozos,
            p.num_sitios_contaminados,
            p.establecimientos_por_10k_hab as salud_10k,
            p.pct_poblacion_afro as pct_afro,
            p.poblacion_total,
            ROUND(CAST(p.densidad_petroleo_km2 AS NUMERIC), 2) as densidad_km2
        FROM parroquias p
        WHERE p.num_infraestructura_petrolera > 0
        ORDER BY p.num_infraestructura_petrolera DESC
        LIMIT 5;
    """))
    
    for i, row in enumerate(result, 1):
        print(f"{i}. {row[0]} ({row[1]}, {row[2]})")
        print(f"   ‚Ä¢ Infraestructura petrolera: {row[3]}")
        print(f"   ‚Ä¢ Pozos: {row[4]}")
        print(f"   ‚Ä¢ Sitios contaminados: {row[5]}")
        print(f"   ‚Ä¢ Densidad petrolera: {row[9]} infra/km¬≤")
        print(f"   ‚Ä¢ Establecimientos salud/10k hab: {f'{row[6]:.2f}' if row[6] is not None else 'N/A'}")
        print(f"   ‚Ä¢ Poblaci√≥n total: {row[8] if row[8] is not None else 'N/A'}")
        print(f"   ‚Ä¢ % Poblaci√≥n afro: {f'{row[7]:.2f}' if row[7] is not None else 'N/A'}%")
        print()
    
    # Query: Correlaci√≥n Petr√≥leo vs Salud
    print("\nüìä CORRELACI√ìN PETR√ìLEO vs SALUD:\n")

    result = conn.execute(text("""
        SELECT 
            CASE 
                WHEN tiene_petroleo = 1 THEN 'Con petr√≥leo'
                ELSE 'Sin petr√≥leo'
            END as categoria,
            COUNT(*) as num_parroquias,
            ROUND(CAST(AVG(establecimientos_por_10k_hab) AS NUMERIC), 2) as salud_promedio,
            ROUND(CAST(AVG(num_infraestructura_petrolera) AS NUMERIC), 2) as infra_promedio
        FROM parroquias
        WHERE establecimientos_por_10k_hab IS NOT NULL
        GROUP BY tiene_petroleo
        ORDER BY tiene_petroleo DESC;
    """))

    for row in result:
        print(f"‚Ä¢ {row[0]}:")
        print(f"  - Parroquias: {row[1]}")
        print(f"  - Salud promedio: {row[2]} establecimientos/10k hab")
        print(f"  - Infraestructura petrolera promedio: {row[3]}")
        print()
    
    # Query: Parroquias con CERO salud pero ALTA infraestructura petrolera
    print("\nüö® PARROQUIAS CON PARADOJA EXTRACTIVISTA CR√çTICA:\n")
    print("   (Alta infraestructura petrolera + CERO acceso a salud)\n")
    
    result = conn.execute(text("""
        SELECT 
            p.nombre_parroquia,
            p.nombre_provincia,
            p.num_infraestructura_petrolera,
            p.num_pozos,
            p.num_sitios_contaminados,
            p.establecimientos_por_10k_hab,
            p.poblacion_total
        FROM parroquias p
        WHERE p.num_infraestructura_petrolera > 100
          AND (p.establecimientos_por_10k_hab = 0 OR p.establecimientos_por_10k_hab IS NULL)
        ORDER BY p.num_infraestructura_petrolera DESC
        LIMIT 10;
    """))
    
    count = 0
    for row in result:
        count += 1
        print(f"{count}. {row[0]} ({row[1]})")
        print(f"   ‚Ä¢ Infraestructura: {row[2]} | Pozos: {row[3]} | Contaminaci√≥n: {row[4]}")
        print(f"   ‚Ä¢ Salud: {f'{row[5]:.2f}' if row[5] is not None else '0.00'}/10k hab | Poblaci√≥n: {row[6]}")
        print()

print("="*70)
print("‚úÖ AN√ÅLISIS COMPLETADO - Datos coinciden con Notebook 06")

üî• CORROBORANDO AN√ÅLISIS DEL NOTEBOOK 06: PARADOJA EXTRACTIVISTA


üìç TOP 5 PARROQUIAS M√ÅS PETROLERAS (Infraestructura Total):

1. SAN JOSE DE ANCON (SANTA ELENA, SANTA ELENA)
   ‚Ä¢ Infraestructura petrolera: 1511
   ‚Ä¢ Pozos: 1363
   ‚Ä¢ Sitios contaminados: 148
   ‚Ä¢ Densidad petrolera: 22.98 infra/km¬≤
   ‚Ä¢ Establecimientos salud/10k hab: N/A
   ‚Ä¢ Poblaci√≥n total: N/A
   ‚Ä¢ % Poblaci√≥n afro: N/A%

2. PACAYACU (LAGO AGRIO, SUCUMBIOS)
   ‚Ä¢ Infraestructura petrolera: 1234
   ‚Ä¢ Pozos: 172
   ‚Ä¢ Sitios contaminados: 1062
   ‚Ä¢ Densidad petrolera: 1.40 infra/km¬≤
   ‚Ä¢ Establecimientos salud/10k hab: 2.37
   ‚Ä¢ Poblaci√≥n total: 8428.0
   ‚Ä¢ % Poblaci√≥n afro: 1.52%

3. SANSAHUARI (PUTUMAYO, SUCUMBIOS)
   ‚Ä¢ Infraestructura petrolera: 1177
   ‚Ä¢ Pozos: 121
   ‚Ä¢ Sitios contaminados: 1056
   ‚Ä¢ Densidad petrolera: 2.36 infra/km¬≤
   ‚Ä¢ Establecimientos salud/10k hab: 0.00
   ‚Ä¢ Poblaci√≥n total: 2669.0
   ‚Ä¢ % Poblaci√≥n afro: 1.99%

4. SHUSHUFINDI CENTRAL (

In [14]:
print("üìä QUERIES DE EJEMPLO\n")
print("="*70)

with engine.connect() as conn:
    # Query 1: Parroquias con alta poblaci√≥n afro Y petr√≥leo
    print("\n1Ô∏è‚É£ Parroquias con >5% poblaci√≥n afro Y infraestructura petrolera:")
    result = conn.execute(text("""
        SELECT 
            nombre_parroquia,
            nombre_provincia,
            pct_poblacion_afro,
            num_infraestructura_petrolera
        FROM parroquias
        WHERE pct_poblacion_afro > 5 
          AND num_infraestructura_petrolera > 0
        ORDER BY pct_poblacion_afro DESC
        LIMIT 5;
    """))
    
    for row in result:
        print(f"   ‚Ä¢ {row[0]} ({row[1]}): {row[2]:.1f}% afro, {row[3]} infraestructura")
    
    # Query 2: Densidad de establecimientos de salud en zonas petroleras
    print("\n2Ô∏è‚É£ Densidad de salud promedio (tiene petr√≥leo vs no tiene):")
    result = conn.execute(text("""
        SELECT 
            CASE WHEN tiene_petroleo = 1 THEN 'Con petr√≥leo' ELSE 'Sin petr√≥leo' END as categoria,
            AVG(establecimientos_por_10k_hab) as densidad_promedio,
            COUNT(*) as num_parroquias
        FROM parroquias
        WHERE establecimientos_por_10k_hab IS NOT NULL
        GROUP BY tiene_petroleo;
    """))
    
    for row in result:
        print(f"   ‚Ä¢ {row[0]}: {row[1]:.2f} establecimientos/10k hab ({row[2]} parroquias)")

print("\n" + "="*70)

üìä QUERIES DE EJEMPLO


1Ô∏è‚É£ Parroquias con >5% poblaci√≥n afro Y infraestructura petrolera:
   ‚Ä¢ ROSA ZARATE (ESMERALDAS): 8.8% afro, 6 infraestructura
   ‚Ä¢ VICHE (ESMERALDAS): 7.5% afro, 2 infraestructura
   ‚Ä¢ TONCHIGUE (ESMERALDAS): 5.6% afro, 1 infraestructura
   ‚Ä¢ SHUSHUFINDI CENTRAL (SUCUMBIOS): 5.3% afro, 989 infraestructura

2Ô∏è‚É£ Densidad de salud promedio (tiene petr√≥leo vs no tiene):
   ‚Ä¢ Sin petr√≥leo: 7.77 establecimientos/10k hab (784 parroquias)
   ‚Ä¢ Con petr√≥leo: 5.15 establecimientos/10k hab (63 parroquias)



---
## 11. Informaci√≥n de Tablas

In [15]:
print("üìã INFORMACI√ìN DE TABLAS EN POSTGIS\n")
print("="*70)

with engine.connect() as conn:
    # Listar todas las tablas
    result = conn.execute(text("""
        SELECT 
            tablename,
            pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) AS size
        FROM pg_tables
        WHERE schemaname = 'public'
        ORDER BY pg_total_relation_size(schemaname||'.'||tablename) DESC;
    """))
    
    print("\nüìä TABLAS CARGADAS:")
    for row in result:
        print(f"   ‚Ä¢ {row[0]}: {row[1]}")
    
    # Info de geometry_columns (PostGIS)
    result = conn.execute(text("""
        SELECT 
            f_table_name,
            f_geometry_column,
            type,
            srid
        FROM geometry_columns
        WHERE f_table_schema = 'public';
    """))
    
    print("\nüó∫Ô∏è COLUMNAS GEOM√âTRICAS:")
    for row in result:
        print(f"   ‚Ä¢ {row[0]}.{row[1]}: {row[2]} (SRID: {row[3]})")

print("\n" + "="*70)

üìã INFORMACI√ìN DE TABLAS EN POSTGIS


üìä TABLAS CARGADAS:
   ‚Ä¢ parroquias: 224 MB
   ‚Ä¢ spatial_ref_sys: 7144 kB
   ‚Ä¢ sitios_contaminacion: 2000 kB
   ‚Ä¢ pozos_petroleros: 1864 kB

üó∫Ô∏è COLUMNAS GEOM√âTRICAS:
   ‚Ä¢ sitios_contaminacion.geometry: MULTIPOINT (SRID: 4326)
   ‚Ä¢ parroquias.geometry: GEOMETRY (SRID: 4326)
   ‚Ä¢ pozos_petroleros.geometry: POINT (SRID: 4326)



---
## 12. Resumen Final

In [16]:
print("\n" + "="*70)
print("üéâ RESUMEN: CARGA A POSTGIS COMPLETADA")
print("="*70)

print("\n‚úÖ TAREAS COMPLETADAS:")
print("  1. Conexi√≥n a PostgreSQL/PostGIS establecida")
print("  2. CSV integrado con geometr√≠as de shapefile")
print("  3. Reproyecci√≥n a EPSG:4326 (WGS84)")
print("  4. Tres tablas cargadas:")
print("     ‚Ä¢ parroquias (con todos los atributos)")
print("     ‚Ä¢ pozos_petroleros")
print("     ‚Ä¢ sitios_contaminacion")
print("  5. √çndices espaciales GIST creados")
print("  6. Validaciones exitosas")

print("\nüìä ESTAD√çSTICAS:")
print(f"  ‚Ä¢ Total parroquias: {count_parroquias}")
print(f"  ‚Ä¢ Total pozos: {count_pozos}")
print(f"  ‚Ä¢ Total sitios contaminaci√≥n: {count_contaminacion}")
print(f"  ‚Ä¢ CRS: EPSG:{srid}")

print("\nüîó CONEXI√ìN:")
print(f"  Host: {DB_CONFIG['host']}")
print(f"  Puerto: {DB_CONFIG['port']}")
print(f"  Database: {DB_CONFIG['database']}")

print("\nüí° SIGUIENTE PASO:")
print("  Crear dashboard en Streamlit que consuma de PostGIS")

print("\nüîß EJEMPLO DE CONEXI√ìN EN STREAMLIT:")
print(f"  conn = psycopg2.connect(\"host={DB_CONFIG['host']} dbname={DB_CONFIG['database']} user={DB_CONFIG['user']} password=***\")")

print("\n" + "="*70)


üéâ RESUMEN: CARGA A POSTGIS COMPLETADA

‚úÖ TAREAS COMPLETADAS:
  1. Conexi√≥n a PostgreSQL/PostGIS establecida
  2. CSV integrado con geometr√≠as de shapefile
  3. Reproyecci√≥n a EPSG:4326 (WGS84)
  4. Tres tablas cargadas:
     ‚Ä¢ parroquias (con todos los atributos)
     ‚Ä¢ pozos_petroleros
     ‚Ä¢ sitios_contaminacion
  5. √çndices espaciales GIST creados
  6. Validaciones exitosas

üìä ESTAD√çSTICAS:
  ‚Ä¢ Total parroquias: 1236
  ‚Ä¢ Total pozos: 6287
  ‚Ä¢ Total sitios contaminaci√≥n: 7850
  ‚Ä¢ CRS: EPSG:4326

üîó CONEXI√ìN:
  Host: localhost
  Puerto: 5434
  Database: prototipo_salud

üí° SIGUIENTE PASO:
  Crear dashboard en Streamlit que consuma de PostGIS

üîß EJEMPLO DE CONEXI√ìN EN STREAMLIT:
  conn = psycopg2.connect("host=localhost dbname=prototipo_salud user=postgres password=***")

