1. Inspeccionar la estructura del JSON

In [8]:
import json

with open("estados-municipios.json", "r", encoding="utf-8") as f:
    data = json.load(f)

# Si data es un diccionario, revisa sus claves:
if isinstance(data, dict):
    print("Claves principales:", data.keys())
else:
    print("Tipo de dato:", type(data))



Claves principales: dict_keys(['Aguascalientes', 'Baja California', 'Baja California Sur', 'Campeche', 'Coahuila', 'Colima', 'Chiapas', 'Chihuahua', 'Ciudad de Mexico', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'Estado de Mexico', 'Michoacan', 'Morelos', 'Nayarit', 'Nuevo Leon', 'Oaxaca', 'Puebla', 'Queretaro', 'Quintana Roo', 'San Luis Potosi', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Veracruz', 'Yucatan', 'Zacatecas'])


2. Inspeccionar la estructura de los municipios

In [15]:
# Inspeccionar la estructura de los municipios en Michoacán
estado_prueba = "Michoacan"
print(f"Estructura del estado {estado_prueba}:")
print(json.dumps(data[estado_prueba][:5], indent=4, ensure_ascii=False))  # Imprime los primeros 5 municipios

Estructura del estado Michoacan:
[
    "Acuitzio",
    "Aguililla",
    "Alvaro Obregon",
    "Angamacutiro",
    "Angangueo"
]


Hacer una base de datos por clave de municipios ajustada haciendo uso del repositorio que clone en GITHUB

In [26]:
import json
import pandas as pd

# --- 1. Leer el JSON ---
with open("estados-municipios.json", "r", encoding="utf-8") as f:
    data = json.load(f)

# Construir lista de registros con Estado y Municipio
registros = []
for estado, municipios in data.items():
    for municipio in municipios:
        if isinstance(municipio, dict):
            municipio_nombre = municipio.get("nombre", "").strip()
        else:
            municipio_nombre = str(municipio).strip()
        registros.append({"Estado": estado.strip(), "Municipio": municipio_nombre})

df_json = pd.DataFrame(registros)

# --- 2. Leer el Excel ---
excel_path = r"C:\Users\tecno\Documents\FAIS 2023\CLAVES INEGI\Entidades y Municipios generar claves.xlsx"
df_excel = pd.read_excel(excel_path, dtype={"CVEGEO": str, "CVE_MUN": str})

# --- 3. Verificar nombres de columnas ---
print("Columnas en df_excel:", df_excel.columns.tolist())

# --- 4. Renombrar las columnas de df_excel (ajustamos si es necesario) ---
df_excel.rename(columns={"Entidad": "Estado", "NOM_MUN": "Municipio", "CVE_MUN": "Clave_Municipio"}, inplace=True)

# --- 5. Verificar si las columnas se renombraron correctamente ---
print("Columnas renombradas en df_excel:", df_excel.columns.tolist())

# --- 6. Formatear las columnas de clave ---
df_excel["Estado"] = df_excel["Estado"].str.zfill(2)  # Rellenar con ceros en el caso de que la entidad sea de un solo dígito
df_excel["Clave_Municipio"] = df_excel["Estado"] + df_excel["Clave_Municipio"].str.zfill(3)  # Crear la clave del municipio

# --- 7. Unir los DataFrames ---
df_merged = pd.merge(df_json, df_excel, on=["Estado", "Municipio"], how="left")

# --- 8. Seleccionar las columnas finales ---
df_final = df_merged[["Estado", "Municipio", "Clave_Municipio"]]

# --- 9. Exportar a Excel ---
output_path = "municipios_claves_formato_correcto.xlsx"
df_final.to_excel(output_path, index=False)

print(f"Archivo generado: {output_path}")


Columnas en df_excel: ['CVEGEO', 'CVE_ENT', 'NOM_ENT', 'NOM_ABR', 'CVE_MUN', 'NOM_MUN', 'CVE_CAB', 'NOM_CAB', 'POB_TOTAL', 'POB_MASCULINA', 'POB_FEMENINA', 'TOTAL DE VIVIENDAS HABITADAS']
Columnas renombradas en df_excel: ['CVEGEO', 'CVE_ENT', 'NOM_ENT', 'NOM_ABR', 'Clave_Municipio', 'Municipio', 'CVE_CAB', 'NOM_CAB', 'POB_TOTAL', 'POB_MASCULINA', 'POB_FEMENINA', 'TOTAL DE VIVIENDAS HABITADAS']


KeyError: 'Estado'