# 游늽 02 An치lisis Exploratorio de Datos Espaciales (ESDA)

Este notebook se enfoca en la exploraci칩n visual y estad칤stica de los datos cargados en PostGIS. Buscamos entender la distribuci칩n de las amenidades y validar la calidad de la informaci칩n antes de aplicar modelos complejos.

---

In [1]:
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sqlalchemy import create_engine
import os
from dotenv import load_dotenv

# --- CONFIGURACI칍N DE ENTORNO ---
load_dotenv("../.env")
db_url = f"postgresql://{os.getenv('POSTGRES_USER')}:{os.getenv('POSTGRES_PASSWORD')}@{os.getenv('POSTGRES_HOST', 'localhost')}:5432/{os.getenv('POSTGRES_DB')}"
engine = create_engine(db_url)

print(f"Conexi칩n establecida con la base de datos: {os.getenv('POSTGRES_DB')}")

## 1. Visualizaci칩n de Capas Base

Comenzamos superponiendo la capa de amenidades (puntos) sobre los l칤mites de la comuna para identificar patrones visuales iniciales.

In [2]:
# --- CARGA DE CAPAS DESDE POSTGIS ---
boundary = gpd.read_postgis("SELECT * FROM raw_data.comuna_boundaries", engine, geom_col='geometry')
amenities = gpd.read_postgis("SELECT * FROM raw_data.osm_amenities", engine, geom_col='geometry')

# --- MAPA EXPLORATORIO ---
fig, ax = plt.subplots(figsize=(10, 10))
boundary.plot(ax=ax, color='lightgrey', edgecolor='black', alpha=0.5, label='San Bernardo')
amenities.plot(ax=ax, markersize=8, color='red', alpha=0.4, label='Puntos de Servicio')
plt.title("Localizaci칩n de Amenidades (OpenStreetMap)")
plt.show()

## 2. An치lisis por Tipo de Amenidad

Queremos saber qu칠 servicios son m치s frecuentes en San Bernardo. Esto nos ayuda a entender la vocaci칩n urbana de la zona.

In [3]:
# --- ESTAD칈STICAS DESCRIPTIVAS ---
# Extraemos los 15 tipos de amenidades m치s recurrentes
summary = amenities['amenity'].value_counts().head(15)

plt.figure(figsize=(12, 6))
sns.barplot(x=summary.values, y=summary.index, palette='magma')
plt.title("Frecuencia de Servicios Urbanos en San Bernardo")
plt.xlabel("Cantidad Detectada")
plt.ylabel("Categor칤a")
plt.grid(axis='x', linestyle='--', alpha=0.7)
plt.show()

## 3. Mapas de Calor (Heatmaps)

Visualizar puntos individuales puede ser confuso. Un mapa de calor permite ver las 치reas de mayor densidad acumulada.

In [4]:
import seaborn as sns

# Extraemos coordenadas X, Y de la geometr칤a para el mapa de calor
amenities['x'] = amenities.geometry.x
amenities['y'] = amenities.geometry.y

plt.figure(figsize=(10, 10))
sns.kdeplot(x=amenities['x'], y=amenities['y'], fill=True, cmap='Blues', thresh=0.05, alpha=0.6)
boundary.boundary.plot(ax=plt.gca(), color='black', linewidth=1)
plt.title("Concentraci칩n Espacial de Servicios (Heatmap)")
plt.axis('off')
plt.show()