# Exploración del perfil general de municipios

En esta libreta exploramos el perfil general de los municipios del estado de Oaxaca, a partir de los datos obtenidos de diversas fuentes. El objetivo es mostrar cómo se pueden combinar y analizar estos datos para obtener insights útiles para la toma de decisiones en políticas públicas y desarrollo local.

In [1]:
import pandas as pd

## 1. Carga de datos

In [2]:
data = pd.read_csv('../data/raw/dataset-081025.csv')

print(f"Total de municipios: {len(data)}")
data.head()

Total de municipios: 570


Unnamed: 0,clave_mun,municipio,poblacion,pob_indigena,pob_afrodescendiente,pob_analfabeta,pob_discapacidad,viviendas,viv_internet,viv_computadoras,...,otro_pers,otro_pers_prof,enfermeria_contac_paciente,enfermeria_otras,medicos_adiest,per_tecnico,total_elementos_salud,por_mas_15_analfabeta,tasa_alfa_1524,grad_escol_prom_15
0,20001,Abejones,841,815,1,132,43,217,17,17,...,0,0,1,0,2,0,8,78.0,99.5,6.9
1,20002,Acatlán de Pérez Figueroa,45167,8548,316,4198,3467,12859,3700,1715,...,12,1,28,0,3,6,72,87.1,97.6,7.3
2,20003,Asunción Cacalotepec,2547,2504,0,385,121,794,43,54,...,0,0,3,0,1,0,6,97.1,99.7,10.7
3,20004,Asunción Cuyotepeji,1107,3,15,69,114,342,60,47,...,0,0,0,0,0,0,0,79.2,97.0,6.7
4,20005,Asunción Ixtaltepec,15261,10406,723,1365,1178,4828,1409,1013,...,2,2,13,0,0,1,38,91.7,97.3,7.8


In [3]:
data.describe()

Unnamed: 0,clave_mun,poblacion,pob_afrodescendiente,pob_analfabeta,pob_discapacidad,viviendas,viv_internet,viv_computadoras,viv_celular,ind_rez_social,...,otro_pers,otro_pers_prof,enfermeria_contac_paciente,enfermeria_otras,medicos_adiest,per_tecnico,total_elementos_salud,por_mas_15_analfabeta,tasa_alfa_1524,grad_escol_prom_15
count,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,...,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0
mean,20285.5,7249.382456,341.182456,616.685965,480.484211,1977.254386,578.615789,401.712281,1425.121053,0.701381,...,5.312281,1.333333,10.403509,0.401754,1.775439,1.798246,34.898246,85.44614,98.338947,6.97386
std,164.689101,17346.120283,1633.327129,1013.000576,1013.232585,4771.957046,2512.091612,1915.52341,4249.175372,0.956557,...,33.742132,8.875894,48.190257,4.550633,11.352574,10.608035,169.579798,8.81725,1.703019,1.460915
min,20001.0,81.0,0.0,4.0,6.0,30.0,0.0,0.0,3.0,-1.308313,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,50.2,85.6,3.5
25%,20143.25,1239.5,6.25,101.25,100.0,351.0,32.0,20.0,157.0,0.003607,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,79.625,97.9,6.1
50%,20285.5,2881.0,31.5,260.0,212.5,781.5,97.0,50.0,393.5,0.58994,...,0.0,0.0,2.0,0.0,0.0,0.0,6.0,87.3,98.8,6.75
75%,20427.75,6294.75,158.5,691.5,447.0,1656.5,295.0,160.5,1057.0,1.348075,...,0.0,0.0,5.0,0.0,1.0,1.0,14.75,92.2,99.3,7.7
max,20570.0,270955.0,25632.0,8410.0,13826.0,73278.0,47008.0,37512.0,68935.0,3.990902,...,615.0,148.0,695.0,101.0,253.0,177.0,2726.0,98.8,100.0,12.6


## 2. Funciones que actúan como reglas para obtener el perfil del municipio

Para una mejor interpretación de los datos, es útil clasificar ciertos indicadores en categorías descriptivas. A continuación, se definen funciones que realizan esta tarea para varios indicadores relacionados con la marginación, rezago social, conectividad, acceso a servicios básicos, salud y educación.

In [4]:
def grade_connectivity(row: pd.Series):
    """
    Asigna el nivel de conectividad basado en el porcentaje de viviendas con acceso
    a internet, computadoras y celular.
    """
    if row['viviendas'] == 0:
        return 'Sin datos'
    
    pct_internet = (row['viv_internet'] / row['viviendas']) * 100
    pct_computadoras = (row['viv_computadoras'] / row['viviendas']) * 100
    pct_celular = (row['viv_celular'] / row['viviendas']) * 100
    
    # Promedio ponderado (internet y celular tienen más peso)
    promedio = (pct_internet * 0.4 + pct_celular * 0.4 + pct_computadoras * 0.2)
    
    if promedio >= 70:
        return 'Alta conectividad'
    elif promedio >= 40:
        return 'Conectividad media'
    elif promedio >= 20:
        return 'Baja conectividad'
    else:
        return 'Muy baja conectividad'

def grade_basic_services(row: pd.Series):
    """
    Asigna el nivel de acceso a servicios básicos basado en las carencias.
    """
    if row['poblacion'] == 0:
        return 'Sin datos'
    
    pct_carencias = (row['pob_car_ser_basicos'] / row['poblacion']) * 100
    
    if pct_carencias <= 10:
        return 'Buen acceso a servicios básicos'
    elif pct_carencias <= 30:
        return 'Acceso moderado a servicios básicos'
    elif pct_carencias <= 60:
        return 'Bajo acceso a servicios básicos'
    else:
        return 'Muy bajo acceso a servicios básicos'

def grade_health(row: pd.Series):
    """
    Asigna el nivel de acceso a servicios de salud basado en el número total de elementos
    de salud por cada 1000 habitantes.
    """
    if row['poblacion'] == 0:
        return 'Sin datos'
    
    elementos_por_mil = (row['total_elementos_salud'] / row['poblacion']) * 1000
    
    if elementos_por_mil >= 5:
        return 'Buen acceso a servicios de salud'
    elif elementos_por_mil >= 2:
        return 'Acceso moderado a servicios de salud'
    elif elementos_por_mil >= 1:
        return 'Bajo acceso a servicios de salud'
    else:
        return 'Muy bajo acceso a servicios de salud'

def grade_education(row: pd.Series):
    """
    Asigna el nivel de rezago educativo basado en el porcentaje de población alfabetizada
    y el grado de escolaridad promedio.
    """
    if row['poblacion'] == 0:
        return 'Sin datos'
    
    pct_alfabetizacion = row['por_mas_15_analfabeta']
    escolaridad = row['grad_escol_prom_15']
    
    # Combinación de factores (mayor alfabetización y escolaridad = menor rezago)
    if pct_alfabetizacion >= 95 and escolaridad >= 9:
        return 'Bajo rezago educativo'
    elif pct_alfabetizacion >= 85 and escolaridad >= 7:
        return 'Rezago educativo moderado'
    elif pct_alfabetizacion >= 70 and escolaridad >= 5:
        return 'Alto rezago educativo'
    else:
        return 'Muy alto rezago educativo'

## 3. Función para obtener indicadores del municipio

In [5]:
def municipality_indicators(data, nombre_municipio):
    """
    Busca un municipio e imprime un reporte completo de sus indicadores.

    Parameters
    ----------
        data (pd.DataFrame): DataFrame con los datos de los municipios.
        nombre_municipio (str): Nombre del municipio a consultar.
    """

    # --- Funciones Auxiliares Anidadas ---

    def _calculate_percentage(numerator, denominator, factor=100):
        """Calcula un porcentaje."""
        num = pd.to_numeric(numerator, errors="coerce")
        den = pd.to_numeric(denominator, errors="coerce")
        if pd.isna(num) or pd.isna(den) or den == 0:
            return 0.0
        return (num / den) * factor

    def _print_report(mun_series):
        """
        Imprime el reporte completo, calculando los valores 'al vuelo'.
        """
        poblacion = pd.to_numeric(mun_series.get("poblacion", 0), errors="coerce")
        viviendas = pd.to_numeric(mun_series.get("viviendas", 0), errors="coerce")

        header = f" INDICADORES DEL MUNICIPIO: {str(mun_series.get('municipio', '')).upper()} "
        print(f"\n{header:=^80}")
        print(f"Clave: {mun_series.get('clave_mun', 'N/D')}")

        print("\n📊 POBLACIÓN")
        print(f"  • Población total: {int(poblacion):,}")
        print(f"  • Población indígena: {int(mun_series.get('pob_indigena', 0)):,} ({_calculate_percentage(mun_series.get('pob_indigena'), poblacion):.2f}%)")
        print(f"  • Población afrodescendiente: {int(mun_series.get('pob_afrodescendiente', 0)):,} ({_calculate_percentage(mun_series.get('pob_afrodescendiente'), poblacion):.2f}%)")

        print("\n💰 POBREZA")
        print(f"  • Pobreza extrema: {int(mun_series.get('pobr_ext', 0)):,} ({_calculate_percentage(mun_series.get('pobr_ext'), poblacion):.2f}%)")
        print(f"  • Pobreza moderada: {int(mun_series.get('pobr_mod', 0)):,} ({_calculate_percentage(mun_series.get('pobr_mod'), poblacion):.2f}%)")
        
        print("\n📉 MARGINACIÓN Y REZAGO")
        print(f"  • Grado de marginación: {mun_series.get('grad_margi', 'N/D')}")
        print(f"  • Grado de rezago social: {mun_series.get('grad_rez_social', 'N/D')}")

        print("\n🏠 SERVICIOS BÁSICOS")
        print(f"  • Población con carencias en servicios básicos: {int(mun_series.get('pob_car_ser_basicos', 0)):,} ({_calculate_percentage(mun_series.get('pob_car_ser_basicos'), poblacion):.2f}%)")

        print("\n🏥 SERVICIOS DE SALUD")
        print(f"  • Total elementos de salud: {int(mun_series.get('total_elementos_salud', 0))}")
        print(f"  • Elementos de salud por cada 1,000 habitantes: {_calculate_percentage(mun_series.get('total_elementos_salud'), poblacion, factor=1000):.2f}")

        print("\n📚 EDUCACIÓN")
        print(f"  • % Analfabetismo (15+ años): {pd.to_numeric(mun_series.get('por_mas_15_analfabeta', 0), errors='coerce'):.2f}%")
        print(f"  • Tasa de alfabetización (15-24 años): {pd.to_numeric(mun_series.get('tasa_alfa_1524', 0), errors='coerce'):.2f}%")
        print(f"  • Escolaridad promedio (15+ años): {pd.to_numeric(mun_series.get('grad_escol_prom_15', 0), errors='coerce'):.2f}")

        print("\n💻 BRECHA DIGITAL")
        print(f"  • Viviendas totales: {int(viviendas):,}")
        print(f"  • Viviendas con internet: {int(mun_series.get('viv_internet', 0)):,} ({_calculate_percentage(mun_series.get('viv_internet'), viviendas):.2f}%)")
        print(f"  • Viviendas con computadoras: {int(mun_series.get('viv_computadoras', 0)):,} ({_calculate_percentage(mun_series.get('viv_computadoras'), viviendas):.2f}%)")
        print(f"  • Viviendas con celular: {int(mun_series.get('viv_celular', 0)):,} ({_calculate_percentage(mun_series.get('viv_celular'), viviendas):.2f}%)")

        print("=" * 80)

    # --- Lógica Principal de la Función ---

    municipio_query = data["municipio"].str.lower() == nombre_municipio.lower()
    if not municipio_query.any():
        print(f"Municipio '{nombre_municipio}' no encontrado.")
        return None

    mun_series = data[municipio_query].iloc[0]

    _print_report(mun_series)

## 4. Función para generar el perfil del municipio

In [6]:
def municipality_profile(data, nombre_municipio):
    """
    Genera un perfil descriptivo del municipio basado en sus indicadores,
    clasificando sus características en categorías cualitativas.

    Parameters
    ----------
        data: DataFrame con los datos
        nombre_municipio: Nombre del municipio a consultar

    Returns
    -------
        dict: Diccionario con el perfil categorizado del municipio
    """
    # Buscar el municipio
    municipio = data[data["municipio"].str.lower() == nombre_municipio.lower()]

    if municipio.empty:
        print(f"Municipio '{nombre_municipio}' no encontrado.")
        return None

    # Obtener la primera fila
    mun = municipio.iloc[0]

    # Aplicar funciones de clasificación
    profile = {
        "municipio": mun["municipio"],
        "clave_mun": mun["clave_mun"],
        "marginacion": mun["grad_margi"],
        "rezago_social": mun["grad_rez_social"],
        "conectividad": grade_connectivity(mun),
        "servicios_basicos": grade_basic_services(mun),
        "salud": grade_health(mun),
        "educacion": grade_education(mun),
    }

    # Imprimir perfil
    header = f" PERFIL DEL MUNICIPIO: {profile['municipio'].upper()} "
    print(f"\n{header:=^80}")

    print(f"\n🎯 RESUMEN DEL PERFIL:")
    print(f"  Municipio con {profile['marginacion'].lower()} marginación, ")
    print(f"  {profile['rezago_social'].lower()} rezago social,")
    print(f"  {profile['conectividad'].lower()},")
    print(f"  {profile['servicios_basicos'].lower()},")
    print(f"  {profile['salud'].lower()}, y")
    print(f"  {profile['educacion'].lower()}.")

    print(f"\n📋 DETALLE POR ASPECTO:")
    print(f"  • Marginación: {profile['marginacion']}")
    print(f"  • Rezago social: {profile['rezago_social']}")
    print(f"  • Conectividad: {profile['conectividad']}")
    print(f"  • Servicios básicos: {profile['servicios_basicos']}")
    print(f"  • Salud: {profile['salud']}")
    print(f"  • Educación: {profile['educacion']}")

    print("=" * 80)

    return profile

## 5. Función que unifica toda la información

In [7]:
def municipality_summary(data, nombre_municipio):
    """
    Función combinada que muestra tanto los indicadores detallados como el perfil
    categorizado de un municipio.
    
    Parameters
    ----------
        data: DataFrame con los datos
        nombre_municipio: Nombre del municipio a consultar
    
    Returns
    -------
        dict: profile - Datos del perfil del municipio
    """
    # Obtener indicadores
    municipality_indicators(data, nombre_municipio)
 
    print("\n")
    
    # Generar perfil
    profile = municipality_profile(data, nombre_municipio)
    
    return profile

## Ejemplos de uso

### 5.1 Ejemplo: Oaxaca de Juárez

In [8]:
_ = municipality_summary(data, "Oaxaca de Juárez")


Clave: 20067

📊 POBLACIÓN
  • Población total: 270,955
  • Población indígena: 50,012 (18.46%)
  • Población afrodescendiente: 9,419 (3.48%)

💰 POBREZA
  • Pobreza extrema: 21,605 (7.97%)
  • Pobreza moderada: 71,699 (26.46%)

📉 MARGINACIÓN Y REZAGO
  • Grado de marginación: Muy bajo
  • Grado de rezago social: Muy bajo

🏠 SERVICIOS BÁSICOS
  • Población con carencias en servicios básicos: 35,466 (13.09%)

🏥 SERVICIOS DE SALUD
  • Total elementos de salud: 2726
  • Elementos de salud por cada 1,000 habitantes: 10.06

📚 EDUCACIÓN
  • % Analfabetismo (15+ años): 89.20%
  • Tasa de alfabetización (15-24 años): 98.80%
  • Escolaridad promedio (15+ años): 8.00

💻 BRECHA DIGITAL
  • Viviendas totales: 73,278
  • Viviendas con internet: 47,008 (64.15%)
  • Viviendas con computadoras: 37,512 (51.19%)
  • Viviendas con celular: 68,935 (94.07%)




🎯 RESUMEN DEL PERFIL:
  Municipio con muy bajo marginación, 
  muy bajo rezago social,
  alta conectividad,
  acceso moderado a servicios básicos,
 

### 5.2 Ejemplo: Heroica Ciudad de Huajuapan de León

In [9]:
_ = municipality_summary(data, "Heroica Ciudad de Huajuapan de León")


Clave: 20039

📊 POBLACIÓN
  • Población total: 78,313
  • Población indígena: 10,439 (13.33%)
  • Población afrodescendiente: 2,206 (2.82%)

💰 POBREZA
  • Pobreza extrema: 7,817 (9.98%)
  • Pobreza moderada: 26,321 (33.61%)

📉 MARGINACIÓN Y REZAGO
  • Grado de marginación: Muy bajo
  • Grado de rezago social: Muy bajo

🏠 SERVICIOS BÁSICOS
  • Población con carencias en servicios básicos: 14,068 (17.96%)

🏥 SERVICIOS DE SALUD
  • Total elementos de salud: 501
  • Elementos de salud por cada 1,000 habitantes: 6.40

📚 EDUCACIÓN
  • % Analfabetismo (15+ años): 93.10%
  • Tasa de alfabetización (15-24 años): 99.20%
  • Escolaridad promedio (15+ años): 9.60

💻 BRECHA DIGITAL
  • Viviendas totales: 20,144
  • Viviendas con internet: 7,901 (39.22%)
  • Viviendas con computadoras: 6,854 (34.03%)
  • Viviendas con celular: 17,284 (85.80%)




🎯 RESUMEN DEL PERFIL:
  Municipio con muy bajo marginación, 
  muy bajo rezago social,
  conectividad media,
  acceso moderado a servicios básicos,
  buen

### 5.3 Ejemplo: Municipio con alta marginación

In [10]:
muy_alta_marginacion = data[data['grad_margi'] == 'Muy alto'].head(1)
if not muy_alta_marginacion.empty:
    nombre_mun = muy_alta_marginacion.iloc[0]['municipio']
    _ = municipality_summary(data, nombre_mun)


Clave: 20007

📊 POBLACIÓN
  • Población total: 2,395
  • Población indígena: 2,362 (98.62%)
  • Población afrodescendiente: 46 (1.92%)

💰 POBREZA
  • Pobreza extrema: 986 (41.17%)
  • Pobreza moderada: 1,017 (42.46%)

📉 MARGINACIÓN Y REZAGO
  • Grado de marginación: Muy alto
  • Grado de rezago social: Muy alto

🏠 SERVICIOS BÁSICOS
  • Población con carencias en servicios básicos: 1,986 (82.92%)

🏥 SERVICIOS DE SALUD
  • Total elementos de salud: 6
  • Elementos de salud por cada 1,000 habitantes: 2.51

📚 EDUCACIÓN
  • % Analfabetismo (15+ años): 93.80%
  • Tasa de alfabetización (15-24 años): 99.40%
  • Escolaridad promedio (15+ años): 9.20

💻 BRECHA DIGITAL
  • Viviendas totales: 769
  • Viviendas con internet: 125 (16.25%)
  • Viviendas con computadoras: 48 (6.24%)
  • Viviendas con celular: 548 (71.26%)




🎯 RESUMEN DEL PERFIL:
  Municipio con muy alto marginación, 
  muy alto rezago social,
  baja conectividad,
  muy bajo acceso a servicios básicos,
  acceso moderado a servicios

## 6. Resumen

Este notebook implementa un sistema completo para:

1. **Obtener indicadores** de un municipio seleccionado:
   - Población total y composición étnica
   - Niveles de pobreza (extrema y moderada)
   - Grados de marginación y rezago social
   - Acceso a servicios básicos
   - Infraestructura de salud
   - Indicadores educativos
   - Conectividad digital (internet, computadoras, celular)

2. **Generar un perfil cualitativo** del municipio mediante reglas que convierten indicadores numéricos en categorías descriptivas:
   - **Conectividad**: Alta, Media, Baja, Muy baja
   - **Servicios básicos**: Buen acceso, Acceso moderado, Bajo acceso, Muy bajo acceso
   - **Salud**: Buen acceso, Acceso moderado, Bajo acceso, Muy bajo acceso
   - **Educación**: Bajo rezago, Rezago moderado, Alto rezago, Muy alto rezago

### Nota:
- Los umbrales para categorizar pueden ser calibrados según las necesidades específicas del análisis