# Exploraci√≥n del perfil general de municipios

En esta libreta exploramos el perfil general de los municipios del estado de Oaxaca, a partir de los datos obtenidos de diversas fuentes. El objetivo es mostrar c√≥mo se pueden combinar y analizar estos datos para obtener insights √∫tiles para la toma de decisiones en pol√≠ticas p√∫blicas y desarrollo local.

In [1]:
import pandas as pd

## 1. Carga de datos

In [2]:
data = pd.read_csv('../data/raw/dataset-081025.csv')

print(f"Total de municipios: {len(data)}")
data.head()

Total de municipios: 570


Unnamed: 0,clave_mun,municipio,poblacion,pob_indigena,pob_afrodescendiente,pob_analfabeta,pob_discapacidad,viviendas,viv_internet,viv_computadoras,...,otro_pers,otro_pers_prof,enfermeria_contac_paciente,enfermeria_otras,medicos_adiest,per_tecnico,total_elementos_salud,por_mas_15_analfabeta,tasa_alfa_1524,grad_escol_prom_15
0,20001,Abejones,841,815,1,132,43,217,17,17,...,0,0,1,0,2,0,8,78.0,99.5,6.9
1,20002,Acatl√°n de P√©rez Figueroa,45167,8548,316,4198,3467,12859,3700,1715,...,12,1,28,0,3,6,72,87.1,97.6,7.3
2,20003,Asunci√≥n Cacalotepec,2547,2504,0,385,121,794,43,54,...,0,0,3,0,1,0,6,97.1,99.7,10.7
3,20004,Asunci√≥n Cuyotepeji,1107,3,15,69,114,342,60,47,...,0,0,0,0,0,0,0,79.2,97.0,6.7
4,20005,Asunci√≥n Ixtaltepec,15261,10406,723,1365,1178,4828,1409,1013,...,2,2,13,0,0,1,38,91.7,97.3,7.8


In [3]:
data.describe()

Unnamed: 0,clave_mun,poblacion,pob_afrodescendiente,pob_analfabeta,pob_discapacidad,viviendas,viv_internet,viv_computadoras,viv_celular,ind_rez_social,...,otro_pers,otro_pers_prof,enfermeria_contac_paciente,enfermeria_otras,medicos_adiest,per_tecnico,total_elementos_salud,por_mas_15_analfabeta,tasa_alfa_1524,grad_escol_prom_15
count,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,...,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0,570.0
mean,20285.5,7249.382456,341.182456,616.685965,480.484211,1977.254386,578.615789,401.712281,1425.121053,0.701381,...,5.312281,1.333333,10.403509,0.401754,1.775439,1.798246,34.898246,85.44614,98.338947,6.97386
std,164.689101,17346.120283,1633.327129,1013.000576,1013.232585,4771.957046,2512.091612,1915.52341,4249.175372,0.956557,...,33.742132,8.875894,48.190257,4.550633,11.352574,10.608035,169.579798,8.81725,1.703019,1.460915
min,20001.0,81.0,0.0,4.0,6.0,30.0,0.0,0.0,3.0,-1.308313,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,50.2,85.6,3.5
25%,20143.25,1239.5,6.25,101.25,100.0,351.0,32.0,20.0,157.0,0.003607,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,79.625,97.9,6.1
50%,20285.5,2881.0,31.5,260.0,212.5,781.5,97.0,50.0,393.5,0.58994,...,0.0,0.0,2.0,0.0,0.0,0.0,6.0,87.3,98.8,6.75
75%,20427.75,6294.75,158.5,691.5,447.0,1656.5,295.0,160.5,1057.0,1.348075,...,0.0,0.0,5.0,0.0,1.0,1.0,14.75,92.2,99.3,7.7
max,20570.0,270955.0,25632.0,8410.0,13826.0,73278.0,47008.0,37512.0,68935.0,3.990902,...,615.0,148.0,695.0,101.0,253.0,177.0,2726.0,98.8,100.0,12.6


## 2. Funciones que act√∫an como reglas para obtener el perfil del municipio

Para una mejor interpretaci√≥n de los datos, es √∫til clasificar ciertos indicadores en categor√≠as descriptivas. A continuaci√≥n, se definen funciones que realizan esta tarea para varios indicadores relacionados con la marginaci√≥n, rezago social, conectividad, acceso a servicios b√°sicos, salud y educaci√≥n.

In [4]:
def grade_connectivity(row: pd.Series):
    """
    Asigna el nivel de conectividad basado en el porcentaje de viviendas con acceso
    a internet, computadoras y celular.
    """
    if row['viviendas'] == 0:
        return 'Sin datos'
    
    pct_internet = (row['viv_internet'] / row['viviendas']) * 100
    pct_computadoras = (row['viv_computadoras'] / row['viviendas']) * 100
    pct_celular = (row['viv_celular'] / row['viviendas']) * 100
    
    # Promedio ponderado (internet y celular tienen m√°s peso)
    promedio = (pct_internet * 0.4 + pct_celular * 0.4 + pct_computadoras * 0.2)
    
    if promedio >= 70:
        return 'Alta conectividad'
    elif promedio >= 40:
        return 'Conectividad media'
    elif promedio >= 20:
        return 'Baja conectividad'
    else:
        return 'Muy baja conectividad'

def grade_basic_services(row: pd.Series):
    """
    Asigna el nivel de acceso a servicios b√°sicos basado en las carencias.
    """
    if row['poblacion'] == 0:
        return 'Sin datos'
    
    pct_carencias = (row['pob_car_ser_basicos'] / row['poblacion']) * 100
    
    if pct_carencias <= 10:
        return 'Buen acceso a servicios b√°sicos'
    elif pct_carencias <= 30:
        return 'Acceso moderado a servicios b√°sicos'
    elif pct_carencias <= 60:
        return 'Bajo acceso a servicios b√°sicos'
    else:
        return 'Muy bajo acceso a servicios b√°sicos'

def grade_health(row: pd.Series):
    """
    Asigna el nivel de acceso a servicios de salud basado en el n√∫mero total de elementos
    de salud por cada 1000 habitantes.
    """
    if row['poblacion'] == 0:
        return 'Sin datos'
    
    elementos_por_mil = (row['total_elementos_salud'] / row['poblacion']) * 1000
    
    if elementos_por_mil >= 5:
        return 'Buen acceso a servicios de salud'
    elif elementos_por_mil >= 2:
        return 'Acceso moderado a servicios de salud'
    elif elementos_por_mil >= 1:
        return 'Bajo acceso a servicios de salud'
    else:
        return 'Muy bajo acceso a servicios de salud'

def grade_education(row: pd.Series):
    """
    Asigna el nivel de rezago educativo basado en el porcentaje de poblaci√≥n alfabetizada
    y el grado de escolaridad promedio.
    """
    if row['poblacion'] == 0:
        return 'Sin datos'
    
    pct_alfabetizacion = row['por_mas_15_analfabeta']
    escolaridad = row['grad_escol_prom_15']
    
    # Combinaci√≥n de factores (mayor alfabetizaci√≥n y escolaridad = menor rezago)
    if pct_alfabetizacion >= 95 and escolaridad >= 9:
        return 'Bajo rezago educativo'
    elif pct_alfabetizacion >= 85 and escolaridad >= 7:
        return 'Rezago educativo moderado'
    elif pct_alfabetizacion >= 70 and escolaridad >= 5:
        return 'Alto rezago educativo'
    else:
        return 'Muy alto rezago educativo'

## 3. Funci√≥n para obtener indicadores del municipio

In [5]:
def municipality_indicators(data, nombre_municipio):
    """
    Busca un municipio e imprime un reporte completo de sus indicadores.

    Parameters
    ----------
        data (pd.DataFrame): DataFrame con los datos de los municipios.
        nombre_municipio (str): Nombre del municipio a consultar.
    """

    # --- Funciones Auxiliares Anidadas ---

    def _calculate_percentage(numerator, denominator, factor=100):
        """Calcula un porcentaje."""
        num = pd.to_numeric(numerator, errors="coerce")
        den = pd.to_numeric(denominator, errors="coerce")
        if pd.isna(num) or pd.isna(den) or den == 0:
            return 0.0
        return (num / den) * factor

    def _print_report(mun_series):
        """
        Imprime el reporte completo, calculando los valores 'al vuelo'.
        """
        poblacion = pd.to_numeric(mun_series.get("poblacion", 0), errors="coerce")
        viviendas = pd.to_numeric(mun_series.get("viviendas", 0), errors="coerce")

        header = f" INDICADORES DEL MUNICIPIO: {str(mun_series.get('municipio', '')).upper()} "
        print(f"\n{header:=^80}")
        print(f"Clave: {mun_series.get('clave_mun', 'N/D')}")

        print("\nüìä POBLACI√ìN")
        print(f"  ‚Ä¢ Poblaci√≥n total: {int(poblacion):,}")
        print(f"  ‚Ä¢ Poblaci√≥n ind√≠gena: {int(mun_series.get('pob_indigena', 0)):,} ({_calculate_percentage(mun_series.get('pob_indigena'), poblacion):.2f}%)")
        print(f"  ‚Ä¢ Poblaci√≥n afrodescendiente: {int(mun_series.get('pob_afrodescendiente', 0)):,} ({_calculate_percentage(mun_series.get('pob_afrodescendiente'), poblacion):.2f}%)")

        print("\nüí∞ POBREZA")
        print(f"  ‚Ä¢ Pobreza extrema: {int(mun_series.get('pobr_ext', 0)):,} ({_calculate_percentage(mun_series.get('pobr_ext'), poblacion):.2f}%)")
        print(f"  ‚Ä¢ Pobreza moderada: {int(mun_series.get('pobr_mod', 0)):,} ({_calculate_percentage(mun_series.get('pobr_mod'), poblacion):.2f}%)")
        
        print("\nüìâ MARGINACI√ìN Y REZAGO")
        print(f"  ‚Ä¢ Grado de marginaci√≥n: {mun_series.get('grad_margi', 'N/D')}")
        print(f"  ‚Ä¢ Grado de rezago social: {mun_series.get('grad_rez_social', 'N/D')}")

        print("\nüè† SERVICIOS B√ÅSICOS")
        print(f"  ‚Ä¢ Poblaci√≥n con carencias en servicios b√°sicos: {int(mun_series.get('pob_car_ser_basicos', 0)):,} ({_calculate_percentage(mun_series.get('pob_car_ser_basicos'), poblacion):.2f}%)")

        print("\nüè• SERVICIOS DE SALUD")
        print(f"  ‚Ä¢ Total elementos de salud: {int(mun_series.get('total_elementos_salud', 0))}")
        print(f"  ‚Ä¢ Elementos de salud por cada 1,000 habitantes: {_calculate_percentage(mun_series.get('total_elementos_salud'), poblacion, factor=1000):.2f}")

        print("\nüìö EDUCACI√ìN")
        print(f"  ‚Ä¢ % Analfabetismo (15+ a√±os): {pd.to_numeric(mun_series.get('por_mas_15_analfabeta', 0), errors='coerce'):.2f}%")
        print(f"  ‚Ä¢ Tasa de alfabetizaci√≥n (15-24 a√±os): {pd.to_numeric(mun_series.get('tasa_alfa_1524', 0), errors='coerce'):.2f}%")
        print(f"  ‚Ä¢ Escolaridad promedio (15+ a√±os): {pd.to_numeric(mun_series.get('grad_escol_prom_15', 0), errors='coerce'):.2f}")

        print("\nüíª BRECHA DIGITAL")
        print(f"  ‚Ä¢ Viviendas totales: {int(viviendas):,}")
        print(f"  ‚Ä¢ Viviendas con internet: {int(mun_series.get('viv_internet', 0)):,} ({_calculate_percentage(mun_series.get('viv_internet'), viviendas):.2f}%)")
        print(f"  ‚Ä¢ Viviendas con computadoras: {int(mun_series.get('viv_computadoras', 0)):,} ({_calculate_percentage(mun_series.get('viv_computadoras'), viviendas):.2f}%)")
        print(f"  ‚Ä¢ Viviendas con celular: {int(mun_series.get('viv_celular', 0)):,} ({_calculate_percentage(mun_series.get('viv_celular'), viviendas):.2f}%)")

        print("=" * 80)

    # --- L√≥gica Principal de la Funci√≥n ---

    municipio_query = data["municipio"].str.lower() == nombre_municipio.lower()
    if not municipio_query.any():
        print(f"Municipio '{nombre_municipio}' no encontrado.")
        return None

    mun_series = data[municipio_query].iloc[0]

    _print_report(mun_series)

## 4. Funci√≥n para generar el perfil del municipio

In [6]:
def municipality_profile(data, nombre_municipio):
    """
    Genera un perfil descriptivo del municipio basado en sus indicadores,
    clasificando sus caracter√≠sticas en categor√≠as cualitativas.

    Parameters
    ----------
        data: DataFrame con los datos
        nombre_municipio: Nombre del municipio a consultar

    Returns
    -------
        dict: Diccionario con el perfil categorizado del municipio
    """
    # Buscar el municipio
    municipio = data[data["municipio"].str.lower() == nombre_municipio.lower()]

    if municipio.empty:
        print(f"Municipio '{nombre_municipio}' no encontrado.")
        return None

    # Obtener la primera fila
    mun = municipio.iloc[0]

    # Aplicar funciones de clasificaci√≥n
    profile = {
        "municipio": mun["municipio"],
        "clave_mun": mun["clave_mun"],
        "marginacion": mun["grad_margi"],
        "rezago_social": mun["grad_rez_social"],
        "conectividad": grade_connectivity(mun),
        "servicios_basicos": grade_basic_services(mun),
        "salud": grade_health(mun),
        "educacion": grade_education(mun),
    }

    # Imprimir perfil
    header = f" PERFIL DEL MUNICIPIO: {profile['municipio'].upper()} "
    print(f"\n{header:=^80}")

    print(f"\nüéØ RESUMEN DEL PERFIL:")
    print(f"  Municipio con {profile['marginacion'].lower()} marginaci√≥n, ")
    print(f"  {profile['rezago_social'].lower()} rezago social,")
    print(f"  {profile['conectividad'].lower()},")
    print(f"  {profile['servicios_basicos'].lower()},")
    print(f"  {profile['salud'].lower()}, y")
    print(f"  {profile['educacion'].lower()}.")

    print(f"\nüìã DETALLE POR ASPECTO:")
    print(f"  ‚Ä¢ Marginaci√≥n: {profile['marginacion']}")
    print(f"  ‚Ä¢ Rezago social: {profile['rezago_social']}")
    print(f"  ‚Ä¢ Conectividad: {profile['conectividad']}")
    print(f"  ‚Ä¢ Servicios b√°sicos: {profile['servicios_basicos']}")
    print(f"  ‚Ä¢ Salud: {profile['salud']}")
    print(f"  ‚Ä¢ Educaci√≥n: {profile['educacion']}")

    print("=" * 80)

    return profile

## 5. Funci√≥n que unifica toda la informaci√≥n

In [7]:
def municipality_summary(data, nombre_municipio):
    """
    Funci√≥n combinada que muestra tanto los indicadores detallados como el perfil
    categorizado de un municipio.
    
    Parameters
    ----------
        data: DataFrame con los datos
        nombre_municipio: Nombre del municipio a consultar
    
    Returns
    -------
        dict: profile - Datos del perfil del municipio
    """
    # Obtener indicadores
    municipality_indicators(data, nombre_municipio)
 
    print("\n")
    
    # Generar perfil
    profile = municipality_profile(data, nombre_municipio)
    
    return profile

## Ejemplos de uso

### 5.1 Ejemplo: Oaxaca de Ju√°rez

In [8]:
_ = municipality_summary(data, "Oaxaca de Ju√°rez")


Clave: 20067

üìä POBLACI√ìN
  ‚Ä¢ Poblaci√≥n total: 270,955
  ‚Ä¢ Poblaci√≥n ind√≠gena: 50,012 (18.46%)
  ‚Ä¢ Poblaci√≥n afrodescendiente: 9,419 (3.48%)

üí∞ POBREZA
  ‚Ä¢ Pobreza extrema: 21,605 (7.97%)
  ‚Ä¢ Pobreza moderada: 71,699 (26.46%)

üìâ MARGINACI√ìN Y REZAGO
  ‚Ä¢ Grado de marginaci√≥n: Muy bajo
  ‚Ä¢ Grado de rezago social: Muy bajo

üè† SERVICIOS B√ÅSICOS
  ‚Ä¢ Poblaci√≥n con carencias en servicios b√°sicos: 35,466 (13.09%)

üè• SERVICIOS DE SALUD
  ‚Ä¢ Total elementos de salud: 2726
  ‚Ä¢ Elementos de salud por cada 1,000 habitantes: 10.06

üìö EDUCACI√ìN
  ‚Ä¢ % Analfabetismo (15+ a√±os): 89.20%
  ‚Ä¢ Tasa de alfabetizaci√≥n (15-24 a√±os): 98.80%
  ‚Ä¢ Escolaridad promedio (15+ a√±os): 8.00

üíª BRECHA DIGITAL
  ‚Ä¢ Viviendas totales: 73,278
  ‚Ä¢ Viviendas con internet: 47,008 (64.15%)
  ‚Ä¢ Viviendas con computadoras: 37,512 (51.19%)
  ‚Ä¢ Viviendas con celular: 68,935 (94.07%)




üéØ RESUMEN DEL PERFIL:
  Municipio con muy bajo marginaci√≥n, 
  muy bajo re

### 5.2 Ejemplo: Heroica Ciudad de Huajuapan de Le√≥n

In [9]:
_ = municipality_summary(data, "Heroica Ciudad de Huajuapan de Le√≥n")


Clave: 20039

üìä POBLACI√ìN
  ‚Ä¢ Poblaci√≥n total: 78,313
  ‚Ä¢ Poblaci√≥n ind√≠gena: 10,439 (13.33%)
  ‚Ä¢ Poblaci√≥n afrodescendiente: 2,206 (2.82%)

üí∞ POBREZA
  ‚Ä¢ Pobreza extrema: 7,817 (9.98%)
  ‚Ä¢ Pobreza moderada: 26,321 (33.61%)

üìâ MARGINACI√ìN Y REZAGO
  ‚Ä¢ Grado de marginaci√≥n: Muy bajo
  ‚Ä¢ Grado de rezago social: Muy bajo

üè† SERVICIOS B√ÅSICOS
  ‚Ä¢ Poblaci√≥n con carencias en servicios b√°sicos: 14,068 (17.96%)

üè• SERVICIOS DE SALUD
  ‚Ä¢ Total elementos de salud: 501
  ‚Ä¢ Elementos de salud por cada 1,000 habitantes: 6.40

üìö EDUCACI√ìN
  ‚Ä¢ % Analfabetismo (15+ a√±os): 93.10%
  ‚Ä¢ Tasa de alfabetizaci√≥n (15-24 a√±os): 99.20%
  ‚Ä¢ Escolaridad promedio (15+ a√±os): 9.60

üíª BRECHA DIGITAL
  ‚Ä¢ Viviendas totales: 20,144
  ‚Ä¢ Viviendas con internet: 7,901 (39.22%)
  ‚Ä¢ Viviendas con computadoras: 6,854 (34.03%)
  ‚Ä¢ Viviendas con celular: 17,284 (85.80%)




üéØ RESUMEN DEL PERFIL:
  Municipio con muy bajo marginaci√≥n, 
  muy bajo rezago s

### 5.3 Ejemplo: Municipio con alta marginaci√≥n

In [10]:
muy_alta_marginacion = data[data['grad_margi'] == 'Muy alto'].head(1)
if not muy_alta_marginacion.empty:
    nombre_mun = muy_alta_marginacion.iloc[0]['municipio']
    _ = municipality_summary(data, nombre_mun)


Clave: 20007

üìä POBLACI√ìN
  ‚Ä¢ Poblaci√≥n total: 2,395
  ‚Ä¢ Poblaci√≥n ind√≠gena: 2,362 (98.62%)
  ‚Ä¢ Poblaci√≥n afrodescendiente: 46 (1.92%)

üí∞ POBREZA
  ‚Ä¢ Pobreza extrema: 986 (41.17%)
  ‚Ä¢ Pobreza moderada: 1,017 (42.46%)

üìâ MARGINACI√ìN Y REZAGO
  ‚Ä¢ Grado de marginaci√≥n: Muy alto
  ‚Ä¢ Grado de rezago social: Muy alto

üè† SERVICIOS B√ÅSICOS
  ‚Ä¢ Poblaci√≥n con carencias en servicios b√°sicos: 1,986 (82.92%)

üè• SERVICIOS DE SALUD
  ‚Ä¢ Total elementos de salud: 6
  ‚Ä¢ Elementos de salud por cada 1,000 habitantes: 2.51

üìö EDUCACI√ìN
  ‚Ä¢ % Analfabetismo (15+ a√±os): 93.80%
  ‚Ä¢ Tasa de alfabetizaci√≥n (15-24 a√±os): 99.40%
  ‚Ä¢ Escolaridad promedio (15+ a√±os): 9.20

üíª BRECHA DIGITAL
  ‚Ä¢ Viviendas totales: 769
  ‚Ä¢ Viviendas con internet: 125 (16.25%)
  ‚Ä¢ Viviendas con computadoras: 48 (6.24%)
  ‚Ä¢ Viviendas con celular: 548 (71.26%)




üéØ RESUMEN DEL PERFIL:
  Municipio con muy alto marginaci√≥n, 
  muy alto rezago social,
  baja conectiv

## 6. Resumen

Este notebook implementa un sistema completo para:

1. **Obtener indicadores** de un municipio seleccionado:
   - Poblaci√≥n total y composici√≥n √©tnica
   - Niveles de pobreza (extrema y moderada)
   - Grados de marginaci√≥n y rezago social
   - Acceso a servicios b√°sicos
   - Infraestructura de salud
   - Indicadores educativos
   - Conectividad digital (internet, computadoras, celular)

2. **Generar un perfil cualitativo** del municipio mediante reglas que convierten indicadores num√©ricos en categor√≠as descriptivas:
   - **Conectividad**: Alta, Media, Baja, Muy baja
   - **Servicios b√°sicos**: Buen acceso, Acceso moderado, Bajo acceso, Muy bajo acceso
   - **Salud**: Buen acceso, Acceso moderado, Bajo acceso, Muy bajo acceso
   - **Educaci√≥n**: Bajo rezago, Rezago moderado, Alto rezago, Muy alto rezago

### Nota:
- Los umbrales para categorizar pueden ser calibrados seg√∫n las necesidades espec√≠ficas del an√°lisis