
# Tarea 3 – Proximity Analysis con Centros Poblados (Lima & Loreto)

**Objetivo:** Calcular, para cada Centro Poblado (CCPP), cuántos **hospitales operativos** hay en un **radio de 10 km** y encontrar por departamento (Lima, Loreto) el CCPP con **menos** y **más** hospitales cerca. Visualizar cada caso con **Folium** (centroide, círculo 10 km y hospitales dentro).


In [41]:

import os, warnings, unicodedata
import pandas as pd
import geopandas as gpd
import matplotlib.pyplot as plt

try:
    import folium
except ImportError:
    import sys
    !"{sys.executable}" -m pip install folium
    import folium

warnings.filterwarnings("ignore", category=UserWarning)
pd.set_option("display.max_colwidth", 120)



## Parámetros (ajusta rutas)


In [42]:
# === Parámetros (actualiza esta celda) ===
import os, glob
from pathlib import Path

USAR_URL_IPRESS = True
URL_IPRESS = "https://datosabiertos.gob.pe/node/2998/download"

# Si usaras IPRESS local:
RUTA_IPRESS_LOCAL = r"C:\ruta\a\IPRESS.csv"

# ---- Centros Poblados (INEI) ----
# Tu carpeta real con los shapes de CCPP:
CARPETA_CCPP = r"C:\Users\User\Documents\PROFE_CHRISTIAN\Hospitals-Access-Peru\code\shape_file_CP"

# Auto-detecta el .shp dentro de esa carpeta
candidatos = glob.glob(os.path.join(CARPETA_CCPP, "*.shp"))
if not candidatos:
    raise FileNotFoundError(f"No encontré ningún .shp en: {CARPETA_CCPP}")

# Si hay varios, intenta preferir nombres que contengan 'centro', 'pob' o 'ccpp'
preferidos = [c for c in candidatos if any(k in os.path.basename(c).lower() for k in ("centro", "pob", "ccpp"))]
RUTA_CCPP = preferidos[0] if preferidos else candidatos[0]

# (Solo para GeoPackage .gpkg: define la capa. Aquí usamos .shp, así que None)
CAPA_CCPP = None

# Departamentos a analizar
DEPARTAMENTOS = ["LIMA", "LORETO"]

# Carpeta de salida
OUT_DIR = Path(r"C:\Users\User\Documents\PROFE_CHRISTIAN\Hospitals-Access-Peru\output")
OUT_DIR.mkdir(parents=True, exist_ok=True)
print("OUT_DIR ->", OUT_DIR)

print("Usando shapefile de CCPP:", RUTA_CCPP)
OUT_DIR
# Nombre de la columna de departamento en tu CCPP
COL_DEP_CCPP = "DEP"


OUT_DIR -> C:\Users\User\Documents\PROFE_CHRISTIAN\Hospitals-Access-Peru\output
Usando shapefile de CCPP: C:\Users\User\Documents\PROFE_CHRISTIAN\Hospitals-Access-Peru\code\shape_file_CP\CCPP_IGN100K.shp


In [43]:
# Verificar que el shapefile existe y listar columnas (por si luego necesitamos la de Departamento)
import geopandas as gpd
gdf_tmp = gpd.read_file(RUTA_CCPP)
print("CRS:", gdf_tmp.crs)
print("Columnas:", gdf_tmp.columns.tolist()[:20])
len(gdf_tmp)


CRS: EPSG:4326
Columnas: ['OBJECTID', 'NOM_POBLAD', 'FUENTE', 'CÓDIGO', 'CAT_POBLAD', 'DIST', 'PROV', 'DEP', 'CÓD_INT', 'CATEGORIA', 'X', 'Y', 'N_BUSQDA', 'geometry']


136587


## Funciones base


In [44]:

def leer_centros_poblados(path: str, layer: str|None=None, col_dep_override: str|None=None) -> gpd.GeoDataFrame:
    import os
    if not path or not os.path.exists(path):
        raise FileNotFoundError(f"No encuentro Centros Poblados en: {path}")

    # Leer .gpkg o .shp
    if path.lower().endswith(".gpkg"):
        if not layer:
            import fiona
            raise ValueError(f"Para .gpkg define CAPA_CCPP. Capas: {fiona.listlayers(path)}")
        gdf = gpd.read_file(path, layer=layer)
    else:
        gdf = gpd.read_file(path)

    # 1) Detectar columna de Departamento (permite override)
    if col_dep_override and col_dep_override in gdf.columns:
        col_dep = col_dep_override
    else:
        candidatos = [
            "DEPARTAMENTO","DEPARTAMEN","DEPARTAM","NOMBDEP","REGION",
            "shapeName","NAME_1","DPTO","DEPTNAME","DEP"  # <-- agregado 'DEP'
        ]
        col_dep = next((c for c in candidatos if c in gdf.columns), None)
        if not col_dep:
            raise KeyError(f"No encuentro columna de Departamento en CCPP. Columnas: {list(gdf.columns)}")

    gdf = gdf.rename(columns={col_dep: "Departamento"})

    # 2) Geometría a puntos (si no lo fueran)
    if gdf.geom_type.iloc[0].upper() != "POINT":
        gdf["geometry"] = gdf.geometry.centroid

    # 3) Normalización y CRS
    gdf["DEP_NORM"] = gdf["Departamento"].map(_norm_txt)
    gdf = gdf[gdf.geometry.notna()].copy()
    gdf = gdf.set_crs(4326, allow_override=True) if gdf.crs is None else gdf.to_crs(4326)
    return gdf




## Cargar datos (IPRESS + CCPP)


In [45]:

ipress_raw = leer_ipress(URL_IPRESS if USAR_URL_IPRESS else None,
                         RUTA_IPRESS_LOCAL if not USAR_URL_IPRESS else None)
ipress_hosp = preparar_hospitales(filtrar_hospitales_operativos(ipress_raw))

ccpp = leer_centros_poblados(RUTA_CCPP, CAPA_CCPP, col_dep_override=COL_DEP_CCPP)


len(ipress_hosp), ipress_hosp.crs, len(ccpp), ccpp.crs


(279,
 <Geographic 2D CRS: EPSG:4326>
 Name: WGS 84
 Axis Info [ellipsoidal]:
 - Lat[north]: Geodetic latitude (degree)
 - Lon[east]: Geodetic longitude (degree)
 Area of Use:
 - name: World.
 - bounds: (-180.0, -90.0, 180.0, 90.0)
 Datum: World Geodetic System 1984 ensemble
 - Ellipsoid: WGS 84
 - Prime Meridian: Greenwich,
 136587,
 <Geographic 2D CRS: EPSG:4326>
 Name: WGS 84
 Axis Info [ellipsoidal]:
 - Lat[north]: Geodetic latitude (degree)
 - Lon[east]: Geodetic longitude (degree)
 Area of Use:
 - name: World.
 - bounds: (-180.0, -90.0, 180.0, 90.0)
 Datum: World Geodetic System 1984 ensemble
 - Ellipsoid: WGS 84
 - Prime Meridian: Greenwich)


## Conteo de hospitales en 10 km


In [46]:

def contar_hospitales_en_radio(ccpp_region: gpd.GeoDataFrame,
                               hosp_4326: gpd.GeoDataFrame,
                               radio_metros: int = 10_000) -> gpd.GeoDataFrame:
    ccpp_utm = ccpp_region.to_crs(32718)
    if ccpp_utm.geom_type.iloc[0].upper() != "POINT":
        ccpp_utm["geometry"] = ccpp_utm.geometry.centroid
    buffers = ccpp_utm.copy()
    buffers["geometry"] = ccpp_utm.buffer(radio_metros)
    hosp_utm = hosp_4326.to_crs(32718)
    join = gpd.sjoin(hosp_utm[["geometry"]], buffers[["geometry"]], predicate="within", how="left")
    conteos = join.groupby(join.index_right).size()
    ccpp_utm["n_hospitales_10km"] = ccpp_utm.index.map(conteos).fillna(0).astype(int)
    ccpp_out = ccpp_utm.to_crs(4326)
    buffers_out = buffers.to_crs(4326)
    return ccpp_out, buffers_out



## Ejecutar para Lima y Loreto y generar mapas Folium


In [47]:

def analizar_departamento(dep_nombre: str,
                          ccpp_all: gpd.GeoDataFrame,
                          hosp_4326: gpd.GeoDataFrame,
                          out_dir: str):
    dep_norm = _norm_txt(dep_nombre)
    ccpp_dep = ccpp_all[ccpp_all["DEP_NORM"] == dep_norm].copy()
    if ccpp_dep.empty:
        raise ValueError(f"No hay CCPP para el departamento: {dep_nombre}.")
    ccpp10, buf10 = contar_hospitales_en_radio(ccpp_dep, hosp_4326, 10_000)

    idx_min = ccpp10["n_hospitales_10km"].idxmin()
    idx_max = ccpp10["n_hospitales_10km"].idxmax()
    c_min = ccpp10.loc[idx_min]
    c_max = ccpp10.loc[idx_max]
    print(f"[{dep_nombre}] min={int(c_min['n_hospitales_10km'])} , max={int(c_max['n_hospitales_10km'])}")

    out_csv = os.path.join(out_dir, f"{dep_norm.lower()}_ccpp_conteo_10km.csv")
    ccpp10.drop(columns="geometry").to_csv(out_csv, index=False, encoding="utf-8")

    def _folium_caso(caso_row, titulo, fname):
        lat = caso_row.geometry.y
        lon = caso_row.geometry.x
        m = folium.Map(location=[lat, lon], zoom_start=9, control_scale=True)
        folium.Marker([lat, lon], tooltip=titulo, icon=folium.Icon(color="red")).add_to(m)
        folium.Circle([lat, lon], radius=10_000, fill=True, fill_opacity=0.1).add_to(m)
        # Filtrar hospitales dentro del buffer en UTM
        b_utm = gpd.GeoSeries([caso_row.geometry], crs=4326).to_crs(32718).buffer(10_000).iloc[0]
        hosp_utm = hosp_4326.to_crs(32718)
        inside_idx = hosp_utm[hosp_utm.within(b_utm)].index
        hosp_inside = hosp_4326.loc[inside_idx]
        for _, r in hosp_inside.iterrows():
            folium.CircleMarker([r.geometry.y, r.geometry.x], radius=4, tooltip="Hospital").add_to(m)
        out_html = os.path.join(out_dir, fname)
        m.save(out_html)
        return out_html

    h_min = _folium_caso(c_min, f"{dep_nombre}: menor disponibilidad ({int(c_min['n_hospitales_10km'])})", f"{dep_norm.lower()}_aislamiento_10km.html")
    h_max = _folium_caso(c_max, f"{dep_nombre}: mayor concentración ({int(c_max['n_hospitales_10km'])})", f"{dep_norm.lower()}_concentracion_10km.html")

    return {"dep": dep_nombre, "tabla": out_csv, "html_min": h_min, "html_max": h_max,
            "min_count": int(c_min["n_hospitales_10km"]), "max_count": int(c_max["n_hospitales_10km"])}

resultados = []
for dep in DEPARTAMENTOS:
    resultados.append(analizar_departamento(dep, ccpp, ipress_hosp, OUT_DIR))

resultados


[LIMA] min=0 , max=34
[LORETO] min=0 , max=4


[{'dep': 'LIMA',
  'tabla': 'C:\\Users\\User\\Documents\\PROFE_CHRISTIAN\\Hospitals-Access-Peru\\output\\lima_ccpp_conteo_10km.csv',
  'html_min': 'C:\\Users\\User\\Documents\\PROFE_CHRISTIAN\\Hospitals-Access-Peru\\output\\lima_aislamiento_10km.html',
  'html_max': 'C:\\Users\\User\\Documents\\PROFE_CHRISTIAN\\Hospitals-Access-Peru\\output\\lima_concentracion_10km.html',
  'min_count': 0,
  'max_count': 34},
 {'dep': 'LORETO',
  'tabla': 'C:\\Users\\User\\Documents\\PROFE_CHRISTIAN\\Hospitals-Access-Peru\\output\\loreto_ccpp_conteo_10km.csv',
  'html_min': 'C:\\Users\\User\\Documents\\PROFE_CHRISTIAN\\Hospitals-Access-Peru\\output\\loreto_aislamiento_10km.html',
  'html_max': 'C:\\Users\\User\\Documents\\PROFE_CHRISTIAN\\Hospitals-Access-Peru\\output\\loreto_concentracion_10km.html',
  'min_count': 0,
  'max_count': 4}]