In [5]:
import geopandas as gpd
import pandas as pd
import os
import matplotlib.pyplot as plt

import time
import datetime

# 1. Recopilación de fuentes y categorización

In [1]:
# #rutas (ALEJANDO - PERSONAL)

# # Ruta base donde se encuentran los archivos shapefile
# base_path = r"C:\Users\Alejandro\Downloads\DATA\SHP"

# output_path_excel = r"C:\Users\Alejandro\Downloads\DATA\Tratados\NAC\EQUIPAMIENTOS\Diccionario_2020.xlsx"
# output_path_gpkg = r"C:\Users\Alejandro\Downloads\DATA\Tratados\NAC\EQUIPAMIENTOS\Equipamientos_NAC_2020.gpkg"

#rutas (ALEJANDO - SSD)

# Ruta base donde se encuentran los archivos shapefile
base_path = r"Z:\VOCES\DATA\SHP"

output_path_excel = r"Z:\VOCES\DATA\Tratados\NAC\EQUIPAMIENTOS\Diccionario_2020.xlsx"
output_path_gpkg = r"Z:\VOCES\DATA\Tratados\NAC\EQUIPAMIENTOS\Equipamientos_NAC_2020.gpkg"

In [4]:
#1.2 Carga de capas de información puntual, de ambos años, en Jupyter

# Lista para almacenar los GeoDataFrames de cada estado
gdfs = []

# Recorrer los números de estado (del 01 al 32)
for i in range(1, 33):
    # Formatear el número del estado como 'XX' (ejemplo: 01, 02, 03...32)
    state_code = f"{i:02d}"
    # Crear la ruta completa del archivo shapefile
    file_path = os.path.join(base_path, f"{state_code}sip.shp")
    
    # Cargar el shapefile y añadirlo a la lista
    gdf_state = gpd.read_file(file_path)
    gdfs.append(gdf_state)

# Unir todos los GeoDataFrames en uno solo
gdf_2020 = gpd.pd.concat(gdfs, ignore_index=True)

# Verificar la unión exitosa
print(f"Total de registros en el archivo unido: {len(gdf_2020)}")

#guardar en gpkg
gdf_2020.to_file(output_path_gpkg, layer='Eq_full_2020')



#1.3 Desplegado de campos únicos

# Agrupar por 'GEOGRÁFICO' y obtener los valores únicos de 'TIPO' para cada uno
diccionario_geografico_tipo = {}

# Recorrer cada valor único de GEOGRAFICO
for geografico in gdf_2020['GEOGRAFICO'].unique():
    # Filtrar los datos correspondientes al valor de 'GEOGRAFICO' actual
    subset = gdf_2020[gdf_2020['GEOGRAFICO'] == geografico]
    
    # Obtener los valores únicos de 'TIPO' asociados a este 'GEOGRAFICO'
    tipos = subset['TIPO'].unique()
    
    # Añadir al diccionario, si no tiene subniveles, ponemos una lista vacía
    diccionario_geografico_tipo[geografico] = list(tipos) if len(tipos) > 0 else []

# Mostrar el diccionario creado
for geo, tipos in diccionario_geografico_tipo.items():
    print(f"{geo}: {tipos}")


#1.4 Desplegado de valores únicos en campos X e Y
#1.5 Exportación de ambas listas en .xlsx

# Convertir el diccionario en un DataFrame para exportar a Excel
data = []

# Recorrer el diccionario y estructurarlo en filas
for geografico, tipos in diccionario_geografico_tipo.items():
    if tipos:  # Si hay subniveles en 'TIPO'
        for tipo in tipos:
            data.append([geografico, tipo])
    else:
        data.append([geografico, None])  # Si no hay subniveles, ponemos 'None' en 'TIPO'

# Crear DataFrame
df_diccionario = pd.DataFrame(data, columns=['GEOGRAFICO', 'TIPO'])

# Exportar a archivo Excel
df_diccionario.to_excel(output_path_excel, index=False)

print(f"Diccionario exportado exitosamente a {output_path_excel}")


Total de registros en el archivo unido: 440164
Centro de Asistencia Médica: ['Centro de Salud', 'Hospital', 'Centro de Rehabilitación']
Escuela: ['Primaria', 'Preescolar', 'Secundaria', 'Medio Superior', 'Superior', 'Mixto']
Templo: ['No Aplica']
Cementerio: ['No Aplica']
Pozo: ['Agua', 'Petróleo', 'Gas']
Instalación Deportiva o Recreativa: ['Cancha', 'Parque', 'Unidad Deportiva', 'Jardín', 'Lienzo Charro', 'Áreas Verdes', 'Estadio', 'Plaza de Toros', 'Campo de Golf', 'Velódromo', 'Balneario', 'Hipódromo', 'Galgódromo', 'Zoológico', 'Alberca Olímpica', 'Campo de Tiro', 'Autódromo', 'Acuario']
Tanque de Agua: ['Tanque Elevado', 'Caja de Agua']
Instalación Gubernamental: ['Palacio de Gobierno', 'Palacio Municipal']
Mercado: ['No Aplica']
Plaza: ['No Aplica']
Instalación Diversa: ['Monumento u Obelisco', 'Silo', 'Planta de Tratamiento de Agua', 'Gasolinera', 'Museo', 'Centro de Investigación', 'Teatro', 'Edificación Cultural', 'Centro de Espectáculos', 'Cine', 'Estación de Gas', 'Observat

# 2. Ponderación y niveles de servicio

In [5]:
# #rutas (ALEJANDRO - PERSONAL)
# equipamientos_gpkg = r"C:\Users\Alejandro\Downloads\DATA\Tratados\NAC\EQUIPAMIENTOS\Equipamientos_NAC_2020.gpkg"
# Diccionario_comentado = r"C:\Users\Alejandro\Downloads\DATA\Tratados\NAC\EQUIPAMIENTOS\Diccionario_pond_2020.xlsx"

#rutas (ALEJANDRO - SSD)
equipamientos_gpkg = r"Z:\VOCES\DATA\Tratados\NAC\EQUIPAMIENTOS\Equipamientos_NAC_2020.gpkg"
Diccionario_comentado = r"Z:\VOCES\DATA\\Tratados\NAC\EQUIPAMIENTOS\Diccionario_pond_2020.xlsx"

In [6]:
# Cargar el diccionario actualizado con las nuevas columnas
diccionario = pd.read_excel(Diccionario_comentado)

# Unir el diccionario con el geodataframe gdf_2020 (asegurarse de que haya un campo en común, por ejemplo 'GEOGRAFICO' y 'TIPO')
gdf_2020 = gdf_2020.merge(diccionario, on=['GEOGRAFICO', 'TIPO'], how='left')

# Filtrar por categorías y exportar a archivos individuales

# Crear una lista de categorías
categorias = ['Educación', 'Salud', 'Recreación', 'Servicios']

# Crear y exportar un GeoDataFrame por cada categoría a una capa dentro del geopackage
for categoria in categorias:
    # Filtrar los equipamientos de la categoría actual
    gdf_categoria = gdf_2020[gdf_2020['CATEGORIA'] == categoria]
    
    # Exportar la categoría como una nueva capa en el geopackage
    gdf_categoria.to_file(equipamientos_gpkg, layer=categoria, driver="GPKG")
    
    print(f"Exportado: {categoria} a la capa {categoria} en el geopackage")

Exportado: Educación a la capa Educación en el geopackage
Exportado: Salud a la capa Salud en el geopackage
Exportado: Recreación a la capa Recreación en el geopackage
Exportado: Servicios a la capa Servicios en el geopackage


# 3. Trabajo a nivel manzana

In [9]:
# # #rutas (ALEJANDRO - PERSONAL)
# manzanas_gpkg_path = r"C:\Users\Alejandro\Downloads\DATA\Tratados\NAC\MZ\Manzanas_NAC.gpkg"
# equipamientos_gpkg = r"C:\Users\Alejandro\Downloads\DATA\Tratados\NAC\EQUIPAMIENTOS\Equipamientos_NAC_2020.gpkg"

#rutas (ALEJANDRO - SSD)
manzanas_gpkg_path = r"Z:\VOCES\DATA\Tratados\NAC\INT_MZN_NAC\Mzn_Tipologías_NAC.gpkg"
equipamientos_gpkg = r"Z:\VOCES\DATA\Tratados\NAC\EQUIPAMIENTOS\Equipamientos_NAC_2020.gpkg"

In [10]:
#3.1: Cargar el archivo de manzanas
print(now.time())

# Cargar el archivo de manzanas
gdf_manzanas = gpd.read_file(manzanas_gpkg_path, layer='Mzn_SubTipologias_ue')
print(now.time())

15:49:42.199721
15:49:42.199721


Unnamed: 0,CVEGEO,POPTOT2010,POPTOT2020,VIVTOT2010,VIVTOT2020,TVIVHAB2010,TVIVHAB2020,TVIVPAR2010,TVIVPAR2020,TVIVPARHAB2010,...,CVE_UEC,CVE_ue,TIPOLOGIA_ue,DENS_EMP20,DENS_EMP10,DENS_UEC20,DENS_UEC10,R_TAM,SUBTIPOLOGÍA_ue,geometry
0,100100010229001,65,57,24,25,1,21,1,25,1,...,C,C2,C2,25.841543,1.660663,1.053104,0.324032,MICRO,C2-MICRO,"POLYGON ((2469592.842 1101420.419, 2469595.825..."
1,100100010229002,0,0,0,0,0,0,0,0,0,...,C,C2,C2,108.388239,84.242674,6.803446,4.935834,MICRO,C2-MICRO,"POLYGON ((2469982.451 1100681.890, 2469958.510..."
2,100100010229003,0,0,0,0,0,0,0,0,0,...,C,C2,C2,57.424611,24.847188,0.883456,0.110432,MEDIANA,C2-MEDIANA,"POLYGON ((2470515.420 1100233.447, 2470474.428..."
3,100100010229004,0,0,0,0,0,0,0,0,0,...,C,C2,C2,68.597225,,3.957532,,MICRO,C2-MICRO,"POLYGON ((2469819.355 1100035.603, 2469843.745..."
4,100100010229006,25,26,8,10,1,9,1,10,1,...,C,C2,C2,,25.215731,,8.405244,0,C2-0,"POLYGON ((2469559.613 1101504.720, 2469551.460..."


In [15]:
# Crear un buffer de 2 metros alrededor de las manzanas
gdf_manzanas['buffer_2m'] = gdf_manzanas.geometry.buffer(2)

# Establecer el buffer como la geometría activa
gdf_manzanas = gdf_manzanas.set_geometry('buffer_2m')

# Inicializar las columnas para contar equipamientos en cada categoría
gdf_manzanas['num_edu'] = 0
gdf_manzanas['num_sal'] = 0
gdf_manzanas['num_rec'] = 0
gdf_manzanas['num_ser'] = 0

# Lista de categorías y sus respectivas columnas de conteo
categorias = {
    'Educación': 'num_edu',
    'Salud': 'num_sal',
    'Recreación': 'num_rec',
    'Servicios': 'num_ser'
}

# Cargar cada capa de equipamientos desde el geopackage y contar los elementos por manzana
for categoria, columna_conteo in categorias.items():
    # Cargar la capa correspondiente desde el geopackage
    gdf_categoria = gpd.read_file(equipamientos_gpkg, layer=categoria)
    
    # Realizar un join espacial entre los buffers de manzanas y los equipamientos de la categoría
    joined = gpd.sjoin(gdf_manzanas[['buffer_2m']], gdf_categoria, how='left', op='contains')
    
    # Contar los equipamientos de la categoría por cada manzana
    gdf_manzanas[columna_conteo] = joined.groupby(joined.index)['index_right'].count()

    print(f"Conteo completado para la categoría: {categoria}")

  if await self.run_code(code, result, async_=asy):
Use `to_crs()` to reproject one of the input geometries to match the CRS of the other.

Left CRS: EPSG:6372
Right CRS: PROJCS["MEXICO_ITRF_2008_LCC",GEOGCS["ITRF2008",DA ...

  joined = gpd.sjoin(gdf_manzanas[['buffer_2m']], gdf_categoria, how='left', op='contains')


Conteo completado para la categoría: Educación


  if await self.run_code(code, result, async_=asy):
Use `to_crs()` to reproject one of the input geometries to match the CRS of the other.

Left CRS: EPSG:6372
Right CRS: PROJCS["MEXICO_ITRF_2008_LCC",GEOGCS["ITRF2008",DA ...

  joined = gpd.sjoin(gdf_manzanas[['buffer_2m']], gdf_categoria, how='left', op='contains')


Conteo completado para la categoría: Salud


  if await self.run_code(code, result, async_=asy):
Use `to_crs()` to reproject one of the input geometries to match the CRS of the other.

Left CRS: EPSG:6372
Right CRS: PROJCS["MEXICO_ITRF_2008_LCC",GEOGCS["ITRF2008",DA ...

  joined = gpd.sjoin(gdf_manzanas[['buffer_2m']], gdf_categoria, how='left', op='contains')


Conteo completado para la categoría: Recreación


  if await self.run_code(code, result, async_=asy):
Use `to_crs()` to reproject one of the input geometries to match the CRS of the other.

Left CRS: EPSG:6372
Right CRS: PROJCS["MEXICO_ITRF_2008_LCC",GEOGCS["ITRF2008",DA ...

  joined = gpd.sjoin(gdf_manzanas[['buffer_2m']], gdf_categoria, how='left', op='contains')


Conteo completado para la categoría: Servicios


Unnamed: 0,CVEGEO,POPTOT2010,POPTOT2020,VIVTOT2010,VIVTOT2020,TVIVHAB2010,TVIVHAB2020,TVIVPAR2010,TVIVPAR2020,TVIVPARHAB2010,...,DENS_UEC20,DENS_UEC10,R_TAM,SUBTIPOLOGÍA_ue,geometry,buffer_2m,num_edu,num_sal,num_rec,num_ser
0,100100010229001,65,57,24,25,1,21,1,25,1,...,1.053104,0.324032,MICRO,C2-MICRO,"POLYGON ((2469592.842 1101420.419, 2469595.825...","POLYGON ((2469594.653 1101421.296, 2469597.517...",0,0,0,0
1,100100010229002,0,0,0,0,0,0,0,0,0,...,6.803446,4.935834,MICRO,C2-MICRO,"POLYGON ((2469982.451 1100681.890, 2469958.510...","POLYGON ((2469983.509 1100680.189, 2469959.659...",0,0,0,0
2,100100010229003,0,0,0,0,0,0,0,0,0,...,0.883456,0.110432,MEDIANA,C2-MEDIANA,"POLYGON ((2470515.420 1100233.447, 2470474.428...","POLYGON ((2470515.345 1100235.446, 2470515.546...",0,0,0,0
3,100100010229004,0,0,0,0,0,0,0,0,0,...,3.957532,,MICRO,C2-MICRO,"POLYGON ((2469819.355 1100035.603, 2469843.745...","POLYGON ((2469819.218 1100037.598, 2469843.603...",0,0,0,0
4,100100010229006,25,26,8,10,1,9,1,10,1,...,,8.405244,0,C2-0,"POLYGON ((2469559.613 1101504.720, 2469551.460...","POLYGON ((2469561.607 1101504.882, 2469561.613...",0,0,0,0


In [25]:
#3.3: Aplicación de radios de influencia para los equipamientos

# Definir los valores de radio en metros para cada nivel de servicio
radio_niveles = {1: 1600, 2: 4800, 3: 14400}  # 1 km, 5 km, 12 km

# Crear los buffers basados en el nivel de servicio (campo 'RADIO')
gdf_categoria['buffer_influencia'] = gdf_categoria.apply(lambda row: row.geometry.buffer(radio_niveles[row['RADIO']]), axis=1)

# Establecer el buffer como la geometría activa
gdf_categoria = gdf_categoria.set_geometry('buffer_influencia')

# Revisar el resultado
gdf_categoria.head()

Unnamed: 0,CVEGEO,CVE_ENT,CVE_MUN,CVE_LOC,CVE_AGEB,CVE_MZA,CONDICION,GEOGRAFICO,NOMSERV,TIPO,CVE_SERV,AMBITO,CATEGORIA,RADIO,IMPORTANCIA,geometry,buffer_influencia
0,100602640013003,1,6,264,13,3,En Operación,Escuela,Escuela Primaria Licenciado Benito Juárez,Primaria,5,Rural,Educación,1.0,3.0,POINT (2479843.724 1115640.081),"POLYGON ((2481443.724 1115640.081, 2481436.020..."
1,100602600047002,1,6,260,47,2,En Operación,Escuela,Escuela Primaria Carlos Fuentes,Primaria,4,Rural,Educación,1.0,3.0,POINT (2466553.982 1115401.453),"POLYGON ((2468153.982 1115401.453, 2468146.278..."
2,100602490047001,1,6,249,47,1,En Operación,Escuela,Preescolar Comunitario,Preescolar,2,Rural,Educación,1.0,3.0,POINT (2467792.532 1121250.407),"POLYGON ((2469392.532 1121250.407, 2469384.827..."
3,100601850013013,1,6,185,13,13,En Operación,Escuela,Escuela Primaria Licenciado Adolfo Lopez Mateos,Primaria,1,Rural,Educación,1.0,3.0,POINT (2474107.825 1121767.189),"POLYGON ((2475707.825 1121767.189, 2475700.120..."
4,100601850013001,1,6,185,13,1,En Operación,Escuela,Jardín De Niños 12 de Noviembre,Preescolar,2,Rural,Educación,1.0,3.0,POINT (2473982.477 1121880.522),"POLYGON ((2475582.477 1121880.522, 2475574.773..."


In [None]:
# Inicializar las columnas de importancia por categoría
gdf_manzanas['IMP_EDU'] = 0
gdf_manzanas['IMP_SAL'] = 0
gdf_manzanas['IMP_REC'] = 0
gdf_manzanas['IMP_SER'] = 0

# Establecer el buffer como la geometría activa
gdf_manzanas = gdf_manzanas.set_geometry('geometry')

# Diccionario que asocia las categorías con las columnas de importancia
categorias = {
    'Educación': 'IMP_EDU',
    'Salud': 'IMP_SAL',
    'Recreación': 'IMP_REC',
    'Servicios': 'IMP_SER'
}

# Realizar el join espacial entre los buffers de equipamientos y las manzanas
for categoria, columna_importancia in categorias.items():
    
    # Join espacial entre manzanas y equipamientos por categoría usando el buffer de influencia
    joined = gpd.sjoin(
        gdf_manzanas, 
        gdf_categoria[['buffer_influencia', 'IMPORTANCIA']], 
        how='left', 
        predicate='intersects',
        lsuffix='mz', 
        rsuffix='eq'
    )
    
    # Sumar la importancia de los equipamientos que caen dentro de cada manzana
    gdf_manzanas[columna_importancia] = joined.groupby(joined.index)['IMPORTANCIA'].sum()

    print(f"Suma de importancia completada para la categoría: {categoria}")

# Revisar el resultado
gdf_manzanas.head()


Use `to_crs()` to reproject one of the input geometries to match the CRS of the other.

Left CRS: EPSG:6372
Right CRS: None

  joined = gpd.sjoin(


In [26]:
# 3.4: Sumar los valores de ponderación por manzana

# Inicializar las columnas de importancia por categoría
gdf_manzanas['IMP_EDU'] = 0
gdf_manzanas['IMP_SAL'] = 0
gdf_manzanas['IMP_REC'] = 0
gdf_manzanas['IMP_SER'] = 0

# Diccionario que asocia las categorías con las columnas de importancia
categorias = {
    'Educación': 'IMP_EDU',
    'Salud': 'IMP_SAL',
    'Recreación': 'IMP_REC',
    'Servicios': 'IMP_SER'
}

# Realizar el join espacial entre los buffers de equipamientos y las manzanas
for categoria, columna_importancia in categorias.items():
    
    # Join espacial entre manzanas y equipamientos por categoría usando el buffer de influencia
    joined = gpd.sjoin(gdf_manzanas, gdf_categoria[['buffer_influencia', 'IMPORTANCIA']], how='left', predicate='intersects')
    
    # Sumar la importancia de los equipamientos que caen dentro de cada manzana
    gdf_manzanas[columna_importancia] = joined.groupby(joined.index)['IMPORTANCIA'].sum()

    print(f"Suma de importancia completada para la categoría: {categoria}")

# Revisar el resultado
gdf_manzanas.head()

Use `to_crs()` to reproject one of the input geometries to match the CRS of the other.

Left CRS: EPSG:6372
Right CRS: None

  joined = gpd.sjoin(gdf_manzanas, gdf_categoria[['buffer_influencia', 'IMPORTANCIA']], how='left', predicate='intersects')


ValueError: 'index_left' and 'index_right' cannot be names in the frames being joined

In [None]:
# 3.4: Sumar los valores de ponderación por manzana

# Inicializar las columnas de importancia por categoría
gdf_manzanas['IMP_EDU'] = 0
gdf_manzanas['IMP_SAL'] = 0
gdf_manzanas['IMP_REC'] = 0
gdf_manzanas['IMP_SER'] = 0

# Realizar el join espacial entre los buffers de equipamientos y las manzanas
for categoria in categorias:
    gdf_categoria = gdf_2020[gdf_2020['CATEGORIA'] == categoria]

    # Join espacial entre manzanas y equipamientos por categoría
    joined = gpd.sjoin(gdf_manzanas, gdf_categoria[['buffer_influencia', 'IMPORTANCIA']], how='left', op='intersects')
    
    # Sumar la importancia de los equipamientos que caen dentro de cada manzana
    if categoria == 'Educación':
        gdf_manzanas['IMP_EDU'] = joined.groupby(joined.index)['IMPORTANCIA'].sum()
    elif categoria == 'Salud':
        gdf_manzanas['IMP_SAL'] = joined.groupby(joined.index)['IMPORTANCIA'].sum()
    elif categoria == 'Recreación':
        gdf_manzanas['IMP_REC'] = joined.groupby(joined.index)['IMPORTANCIA'].sum()
    elif categoria == 'Servicios':
        gdf_manzanas['IMP_SER'] = joined.groupby(joined.index)['IMPORTANCIA'].sum()

# Revisar el resultado
gdf_manzanas.head()


In [None]:
# 3.5: Visualización estadística de los valores de importancia por categoría

# Resumen estadístico de las columnas de importancia
print(gdf_manzanas[['IMP_EDU', 'IMP_SAL', 'IMP_REC', 'IMP_SER']].describe())

# Visualización gráfica de los valores de importancia por categoría
gdf_manzanas[['IMP_EDU', 'IMP_SAL', 'IMP_REC', 'IMP_SER']].plot(kind='box', title='Importancia por Categoría')
plt.show()
