In [2]:
"""
Código para poner la provincia dentro de cada distrito de la zonificación del MITMA
"""
import geopandas as gpd
import pandas as pd

# ----------------------------
# CONFIG: rutas y nombres de campos
# ----------------------------
PROVINCIAS_GEOJSON = r"D:\Datos\GeojsonZonas\provinciasEspana.geojson"
DISTRITOS_GEOJSON  = r"D:\Datos\GeojsonZonas\zonificacionDistritosMITMA\zonificacion_distritos.geojson"
SALIDA_GEOJSON     = r"D:\Datos\GeojsonZonas\zonificacionDistritosMITMA\zonificacion_distritos_provincia.geojson"

# Campo en el geojson de provincias que contiene el nombre de la provincia
CAMPO_NOMBRE_PROVINCIA = "Texto"   # <-- cámbialo por el tuyo (p.ej. "NAMEUNIT", "nombre", etc.)
NUEVO_CAMPO_EN_DISTRITOS = "provincia" # nombre del campo nuevo a crear en distritos

# Si tienes un id único en distritos úsalo (recomendado). Si no, el índice sirve.
CAMPO_ID_DISTRITO = None  # p.ej. "id_distrito"; si None, se usa el índice


def make_valid(gdf: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
    """Arregla geometrías inválidas de forma robusta (buffer(0) como fallback)."""
    gdf = gdf.copy()
    # GeoPandas/Shapely modernos suelen tener .make_valid en algunas versiones; aquí vamos a lo compatible:
    gdf["geometry"] = gdf["geometry"].buffer(0)
    return gdf


def main():
    # 1) Leer datos
    prov = gpd.read_file(PROVINCIAS_GEOJSON)
    dist = gpd.read_file(DISTRITOS_GEOJSON)

    # 2) Asegurar geometrías válidas (evita muchos errores de overlay)
    prov = make_valid(prov)
    dist = make_valid(dist)

    # 3) Asegurar mismo CRS
    if prov.crs is None or dist.crs is None:
        raise ValueError("Alguno de los GeoJSON no tiene CRS definido. Define el CRS antes de continuar.")
    if prov.crs != dist.crs:
        dist = dist.to_crs(prov.crs)

    # 4) Para medir áreas correctamente, mejor proyectar a un CRS métrico (España: ETRS89 / UTM 30N)
    #    Si tus datos están en EPSG:4326 (lat/lon), esto evita áreas incorrectas.
    CRS_AREA = "EPSG:25830"
    prov_m = prov.to_crs(CRS_AREA)
    dist_m = dist.to_crs(CRS_AREA)

    # 5) Preparar ID de distrito
    if CAMPO_ID_DISTRITO and CAMPO_ID_DISTRITO in dist_m.columns:
        dist_m["_dist_id_"] = dist_m[CAMPO_ID_DISTRITO]
    else:
        dist_m["_dist_id_"] = dist_m.index.astype(str)

    # 6) Intersección: genera trozos (distrito ∩ provincia)
    #    Nos quedamos con el nombre de provincia y el id del distrito
    prov_cols = [CAMPO_NOMBRE_PROVINCIA, "geometry"]
    inter = gpd.overlay(
        dist_m[["_dist_id_", "geometry"]],
        prov_m[prov_cols],
        how="intersection",
        keep_geom_type=False
    )

    if inter.empty:
        raise RuntimeError("La intersección salió vacía. Revisa CRS, geometrías y que realmente solapen.")

    # 7) Calcular área de cada intersección y quedarnos con la provincia con mayor solape por distrito
    inter["_area_"] = inter.geometry.area

    # Para cada distrito, elegir la fila con área máxima
    idx_max = inter.groupby("_dist_id_")["_area_"].idxmax()
    best = inter.loc[idx_max, ["_dist_id_", CAMPO_NOMBRE_PROVINCIA]].copy()

    # 8) Unir de vuelta al GeoDataFrame original de distritos (en CRS original)
    #    (usamos dist, no dist_m, para conservar CRS original y atributos)
    dist_out = dist.copy()
    if CAMPO_ID_DISTRITO and CAMPO_ID_DISTRITO in dist_out.columns:
        dist_out["_dist_id_"] = dist_out[CAMPO_ID_DISTRITO].astype(str)
    else:
        dist_out["_dist_id_"] = dist_out.index.astype(str)

    dist_out = dist_out.merge(best, on="_dist_id_", how="left")

    # Renombrar/crear el campo final
    if CAMPO_NOMBRE_PROVINCIA != NUEVO_CAMPO_EN_DISTRITOS:
        dist_out.rename(columns={CAMPO_NOMBRE_PROVINCIA: NUEVO_CAMPO_EN_DISTRITOS}, inplace=True)

    # 9) Limpieza
    dist_out.drop(columns=["_dist_id_"], inplace=True, errors="ignore")

    # 10) Guardar salida
    dist_out.to_file(SALIDA_GEOJSON, driver="GeoJSON")

    # Resumen útil
    n_total = len(dist_out)
    n_null = dist_out[NUEVO_CAMPO_EN_DISTRITOS].isna().sum()
    print(f"OK. Guardado: {SALIDA_GEOJSON}")
    print(f"Distritos: {n_total} | sin provincia asignada: {n_null}")


if __name__ == "__main__":
    main()




OK. Guardado: D:\Datos\GeojsonZonas\zonificacionDistritosMITMA\zonificacion_distritos_provincia.geojson
Distritos: 3909 | sin provincia asignada: 101
