# üìì 01 Adquisici√≥n y Carga de Datos

Este notebook documenta el proceso de obtenci√≥n de datos desde fuentes externas (OSM, IDE Chile) y su carga inicial en la base de datos PostGIS.

## üõ†Ô∏è Configuraci√≥n

In [5]:
import os
import sys
from pathlib import Path
import geopandas as gpd
import osmnx as ox
from sqlalchemy import create_engine
from dotenv import load_dotenv

# --- CONFIGURACI√ìN DE RUTAS ---
# A√±adimos el directorio ra√≠z al PATH para permitir la importaci√≥n de scripts locales si es necesario
project_root = Path("..")
sys.path.append(str(project_root))

# Cargamos las variables de entorno desde el archivo .env (credenciales de DB, API keys)
load_dotenv(project_root / ".env")

# --- CONEXI√ìN A POSTGIS ---
# Construimos la URL de conexi√≥n usando las variables de entorno para mayor seguridad
db_url = (
    f"postgresql://{os.getenv('POSTGRES_USER')}:"
    f"{os.getenv('POSTGRES_PASSWORD')}@"
    f"{os.getenv('POSTGRES_HOST', 'localhost')}:5432/"
    f"{os.getenv('POSTGRES_DB')}"
)
engine = create_engine(db_url)
print("Conexi√≥n preparada.")

Conexi√≥n preparada.


## 1. Descarga de Datos

Utilizamos **OSMnx** para obtener los l√≠mites administrativos del √°rea de estudio.

In [6]:
comuna = "San Bernardo, Chile"

# --- GEOCRIFICACI√ìN Y DESCARGA ---
# ox.geocode_to_gdf permite obtener el pol√≠gono oficial de la comuna desde OpenStreetMap
print(f"Descargando l√≠mites para: {comuna}")
boundary = ox.geocode_to_gdf(comuna)

# Visualizamos el resultado inicial (GeoDataFrame)
boundary

## 2. Adquisici√≥n de Edificios y Amenidades

Descargamos las capas de infraestructura y equipamiento.

In [ ]:
# --- DESCARGA DE EQUIPAMIENTO (AMENITIES) ---
# Definimos las etiquetas de OSM que nos interesan para el an√°lisis territorial
tags = {'amenity': True, 'landuse': ['commercial', 'industrial', 'retail']}
amenities = ox.features_from_place(comuna, tags=tags)

# --- DESCARGA DE HUELLA DE EDIFICIOS (BUILDINGS) ---
buildings = ox.features_from_place(comuna, tags={'building': True})

print(f"Amenidades encontradas: {len(amenities)}")
print(f"Edificios encontrados: {len(buildings)}")

## 3. Carga a PostGIS

Cargamos los datos procesados al esquema `raw_data` para centralizar la informaci√≥n.

In [7]:
# --- CARGA SISTEM√ÅTICA A LA DB ---
# Usamos to_postgis para inyectar los GeoDataFrames directamente en tablas espaciales
# schema='raw_data' organiza nuestros datos originales sin procesar

boundary.to_postgis("comuna_boundaries", engine, schema="raw_data", if_exists="replace")
print("L√≠mites cargados exitosamente.")

# Nota: Para amenities y buildings, es recomendable limpiar columnas de listas antes de cargar
amenities = amenities.apply(lambda b: b.astype(str) if isinstance(b.dtype, object) else b)
amenities.to_postgis("osm_amenities", engine, schema="raw_data", if_exists="replace")

buildings = buildings.apply(lambda b: b.astype(str) if isinstance(b.dtype, object) else b)
buildings.to_postgis("osm_buildings", engine, schema="raw_data", if_exists="replace")

print("Carga completa terminada.")

L√≠mites cargados exitosamente.
