In [26]:
import folium
from folium.plugins import MarkerCluster
import geopandas as gpd
import pandas as pd
from shapely.geometry import Point
from geopy.distance import geodesic

# rutas
distritos_fp = r"C:\Users\atara\Desktop\Hospitals-Access-Peru\_data\DISTRITOS.shp"
ipress_fp = r"C:\Users\atara\Desktop\Hospitals-Access-Peru\_data\IPRESS.csv"

# --- CARGA Y LIMPIEZA BÁSICA ---
# distritos
distritos = gpd.read_file(distritos_fp)
# asegurar columnas esperadas y CRS
distritos = distritos.to_crs(epsg=4326)

# ipress
ipress = pd.read_csv(ipress_fp, encoding="latin1")

# limpieza IPRESS: sólo en funcionamiento, eliminar duplicados y filas sin coordenadas
ipress = ipress[ipress["Condición"] == "EN FUNCIONAMIENTO"].copy()
ipress = ipress.drop_duplicates(subset=["Código Único"])            # eliminar duplicados por id único
ipress = ipress.dropna(subset=["ESTE", "NORTE"])                    # quitar sin coordenadas

# crear geometría desde ESTE/NORTE (UTM) -> asumimos UTM zona 18S para creación y luego reproyectamos
ipress_gdf = gpd.GeoDataFrame(
    ipress,
    geometry=gpd.points_from_xy(ipress["ESTE"], ipress["NORTE"]),
    crs="EPSG:32718"   # si notas desplazamiento, probar 32719
)

# transformar a lat/lon para visualización en folium
hospitales = ipress_gdf.to_crs(epsg=4326)

# validar geometrías
hospitales = hospitales[hospitales.geometry.is_valid].copy()

# --- ASIGNAR DISTRITO A CADA HOSPITAL (spatial join) ---
# usar columnas IDDIST, DEPARTAMEN, PROVINCIA, DISTRITO del shapefile
distritos_sub = distritos[["IDDIST", "DEPARTAMEN", "PROVINCIA", "DISTRITO", "geometry"]].copy()
# si distritos no estuviera en 4326, se reproyectó arriba
hospitales = gpd.sjoin(hospitales, distritos_sub, how="left", predicate="within")
# ahora hospitales tiene IDDIST y nombres de distrito cuando se pudo asignar

# --- CONTEO POR DISTRITO y COROPLETA ---
conteo = hospitales.groupby("IDDIST").size().reset_index(name="num_hospitales")
distritos_hosp = distritos.merge(conteo, on="IDDIST", how="left")
distritos_hosp["num_hospitales"] = distritos_hosp["num_hospitales"].fillna(0)

# --- MAPA BASE (coropleta + marcadores) ---
mapa = folium.Map(location=[-9.19, -75.0152], zoom_start=5, tiles="CartoDB positron")

# coropleta
folium.Choropleth(
    geo_data=distritos_hosp.to_json(),
    data=distritos_hosp,
    columns=["IDDIST", "num_hospitales"],
    key_on="feature.properties.IDDIST",
    fill_color="YlOrRd",
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name="Número de hospitales por distrito"
).add_to(mapa)

# marcadores cluster
marker_cluster = MarkerCluster().add_to(mapa)
name_col = "Nombre del establecimiento" if "Nombre del establecimiento" in hospitales.columns else hospitales.columns[0]

for _, row in hospitales.iterrows():
    popup = f"{row.get('Nombre del establecimiento', '')} - {row.get('Departamento', '')}"
    folium.Marker(location=[row.geometry.y, row.geometry.x], popup=popup).add_to(marker_cluster)

# --- TAREA 3: ANÁLISIS DE PROXIMIDAD POR CENTROS DE POBLACIÓN ---
# Metodología: usar centroides geométricos de cada localidad (aquí: centroids de los polígonos de distritos)
# Filtrar centroids por región (DEPARTAMEN == 'LIMA' o 'LORETO')

# preparar centroides de distritos (centro poblacional proxy)
centroids = distritos.copy()
centroids["centroid"] = centroids.geometry.centroid
centroids = centroids.set_geometry("centroid").to_crs(epsg=4326)

# filtrar por departamento (asegurar mayúsculas consistentes)
centroids["DEPARTAMEN_UP"] = centroids["DEPARTAMEN"].str.upper().str.strip()
hospitales["DEPARTAMENTO_UP"] = hospitales["DEPARTAMEN"].str.upper().str.strip() if "DEPARTAMEN" in hospitales.columns else hospitales["Departamento"].str.upper().str.strip()

regiones = ["LIMA", "LORETO"]
radio_km = 10

# guardar resultados por región
results = {}

for region in regiones:
    # centroids en la región
    c_reg = centroids[centroids["DEPARTAMEN_UP"] == region].copy()
    # si no hay centroids, saltar
    if c_reg.empty:
        results[region] = {"min": None, "max": None, "counts": {}}
        continue

    counts = []
    # para cada centro poblado (centroid), contar hospitales a <=10 km usando geodesic
    for _, c in c_reg.iterrows():
        centro_coords = (c.geometry.y, c.geometry.x)
        cnt = 0
        hospitales_en_buffer = []
        for _, h in hospitales.iterrows():
            hosp_coords = (h.geometry.y, h.geometry.x)
            if geodesic(centro_coords, hosp_coords).km <= radio_km:
                cnt += 1
                hospitales_en_buffer.append(h)  # guardo fila (Series)
        counts.append({
            "IDDIST": c["IDDIST"],
            "DEPARTAMEN": c["DEPARTAMEN"],
            "PROVINCIA": c["PROVINCIA"],
            "DISTRITO": c["DISTRITO"],
            "centroid_lat": c.geometry.y,
            "centroid_lon": c.geometry.x,
            "count": cnt,
            "hospitals": hospitales_en_buffer
        })

    # identificar min y max
    df_counts = pd.DataFrame(counts)
    if df_counts.empty:
        results[region] = {"min": None, "max": None, "counts": df_counts}
    else:
        min_row = df_counts.loc[df_counts["count"].idxmin()]
        max_row = df_counts.loc[df_counts["count"].idxmax()]
        results[region] = {"min": min_row, "max": max_row, "counts": df_counts}

# --- PLOTEO DE RESULTADOS DE PROXIMIDAD EN EL MAPA ---
for region in regiones:
    r = results.get(region)
    if r is None or r["min"] is None:
        continue

    # min (aislamiento) en rojo
    minc = r["min"]
    folium.Circle(
        location=[minc["centroid_lat"], minc["centroid_lon"]],
        radius=radio_km * 1000,
        color="red",
        fill=True,
        fill_opacity=0.2,
        popup=f'{region} - Aislado: {minc["DISTRITO"]} ({minc["count"]} hospitales)'
    ).add_to(mapa)

    # marcar hospitales dentro del buffer (min)
    for h in minc["hospitals"]:
        # h es una Series (fila); puede venir de GeoDataFrame original
        folium.CircleMarker(
            location=[h.geometry.y, h.geometry.x],
            radius=3,
            popup=f'{h.get("Nombre del establecimiento", "")}',
            fill=True
        ).add_to(mapa)

    # max (concentración) en verde
    maxc = r["max"]
    folium.Circle(
        location=[maxc["centroid_lat"], maxc["centroid_lon"]],
        radius=radio_km * 1000,
        color="green",
        fill=True,
        fill_opacity=0.2,
        popup=f'{region} - Concentrado: {maxc["DISTRITO"]} ({maxc["count"]} hospitales)'
    ).add_to(mapa)

    # marcar hospitales dentro del buffer (max)
    for h in maxc["hospitals"]:
        folium.CircleMarker(
            location=[h.geometry.y, h.geometry.x],
            radius=3,
            popup=f'{h.get("Nombre del establecimiento", "")}',
            fill=True
        ).add_to(mapa)

# --- RESULTADOS BÁSICOS (impresión) ---
# Imprimir los centros con menor y mayor hospitales por región
for region in regiones:
    r = results.get(region)
    if r and r["min"] is not None:
        print(f"\n{region}:")
        print(f"  Aislado: {r['min']['DISTRITO']} (IDDIST {r['min']['IDDIST']}) — {r['min']['count']} hospitales")
        print(f"  Concentrado: {r['max']['DISTRITO']} (IDDIST {r['max']['IDDIST']}) — {r['max']['count']} hospitales")
    else:
        print(f"\n{region}: no se encontraron centroides para analizar.")

# --- GUARDAR MAPA ---
mapa.save(r"C:\Users\atara\Desktop\Hospitals-Access-Peru\mapa_hospitales_proximidad.html")

# mostrar mapa en notebook
mapa



  centroids["centroid"] = centroids.geometry.centroid


AttributeError: 'Polygon' object has no attribute 'y'