# ESTIMADORES SINTÉTICOS

Los estimadores sintéticos son una técnica estadística avanzada utilizada para obtener estimaciones precisas de características de una población (como ingresos, tasa de desempleo, nivel educativo, etc.) para subgrupos pequeños o áreas geográficas específicas (como un municipio, un barrio o una escuela), cuando las muestras directas de esas áreas son demasiado pequeñas para proporcionar resultados fiables por sí solas.

El Problema que Resuelven
Imagina que una encuesta nacional tiene una muestra de 50,000 hogares. Para estimar el desempleo a nivel nacional o incluso por comunidades autónomas grandes, la muestra es suficiente. Pero si quieres saber la tasa de desempleo en un pueblo específico de 5,000 habitantes, es probable que en la encuesta solo hayan entrevistado a 20 personas de ese pueblo. Una estimación basada solo en esas 20 personas (estimación directa) tendría un error muestral enorme y sería muy poco fiable.

Los estimadores sintéticos resuelven este problema "prestando fuerza" de áreas más grandes y similares.

La Idea Fundamental
La premisa clave es: el comportamiento de la población en un área pequeña (el municipio) es similar al de un área mayor (la provincia o región) a la que pertenece, una vez se controlan por ciertas características conocidas.

En otras palabras, se asume que la relación entre variables (p. ej., entre el nivel educativo y la probabilidad de estar empleado) es la misma en el área grande que en la pequeña. El estimador sintético aplica esta relación, observada en la área grande, a los datos poblacionales conocidos de la área pequeña.

# Implementación Práctica



# Paso 1: Recopilar Datos

In [3]:
# Variables necesarias
datos_epa_madrid = {
    'tasa_paro': 0.125,  # 12.5% (ejemplo)
    'poblacion_activa': 3450000,
    'ocupados': 3020000,
    'parados': 430000
}

# Datos auxiliares por distrito (ejemplo Distrito Centro)
datos_centro = {
    'poblacion_total': 149718,
    'poblacion_16_64': 105000,
    'afiliados_ss': 68000,
    'paro_registrado': 8500
}

# Paso 2: Calcular Estimadores - Tasa de paro sintética


In [10]:
def tasa_paro_sintetica(datos_distrito, datos_madrid):
    """
    Calcula tasa de paro sintética para distrito
    """
    # Usando paro registrado como variable auxiliar
    proporcion_paro = (datos_distrito['paro_registrado'] /
                      datos_madrid['paro_registrado_total'])

    tasa_paro_sint = proporcion_paro * datos_madrid['tasa_paro_total']

    return tasa_paro_sint

# Paso 3: Estimación por Grupos Demográficos

In [11]:
def estimador_sintetico_ponderado(datos_distrito, datos_madrid):
    """
    Estimador sintético ponderado por grupos de edad y sexo
    """
    # Grupos de edad y sexo (ejemplo simplificado)
    grupos = ['hombres_16_24', 'hombres_25_44', 'hombres_45_64',
              'mujeres_16_24', 'mujeres_25_44', 'mujeres_45_64']

    tasa_paro_total = 0
    poblacion_total = datos_distrito['poblacion_16_64']

    for grupo in grupos:
        proporcion_grupo = (datos_distrito[grupo] / poblacion_total)
        # Access the rates from the nested dictionary 'tasas_por_grupo'
        tasa_grupo_madrid = datos_madrid['tasas_por_grupo'][grupo]

        tasa_paro_total += proporcion_grupo * tasa_grupo_madrid

    return tasa_paro_total

# Ejemplo Completo para un Distrito

In [12]:
# Datos EPA Comunidad de Madrid (ejemplo)
epa_madrid = {
    'tasa_paro_total': 0.118,
    'poblacion_activa': 3415000,
    'paro_registrado_total': 198500,
    'tasas_por_grupo': {
        'hombres_16_24': 0.215,
        'hombres_25_44': 0.098,
        'hombres_45_64': 0.112,
        'mujeres_16_24': 0.228,
        'mujeres_25_44': 0.125,
        'mujeres_45_64': 0.134
    }
}

# Datos Distrito Centro Madrid
centro_madrid = {
    'poblacion_total': 149718,
    'poblacion_16_64': 112289,
    'paro_registrado': 8920,
    'hombres_16_24': 8750,
    'hombres_25_44': 28500,
    'hombres_45_64': 22300,
    'mujeres_16_24': 8320,
    'mujeres_25_44': 27200,
    'mujeres_45_64': 21219
}

# Cálculo de estimadores
tasa_paro_simple = (centro_madrid['paro_registrado'] /
                   epa_madrid['paro_registrado_total']) * epa_madrid['tasa_paro_total']

tasa_paro_ponderada = estimador_sintetico_ponderado(centro_madrid, epa_madrid)

print(f"Tasa de paro sintética simple: {tasa_paro_simple:.3%}")
print(f"Tasa de paro sintética ponderada: {tasa_paro_ponderada:.3%}")

Tasa de paro sintética simple: 0.530%
Tasa de paro sintética ponderada: 13.636%


# Consideraciones Importantes
# Ventajas:
Bajo coste de implementación

Utiliza información disponible

Fácil de calcular

# Limitaciones:
Asume misma estructura que área mayor

Puede tener sesgos si hay heterogeneidad

Precisión depende de correlación con variables auxiliares

# Mejoras Recomendadas:
Estimadores compuestos: Combinar con estimadores directos

Modelos de área: Usar modelos estadísticos más avanzados

Validación cruzada: Comparar con otras fuentes disponibles

# Fuentes de Datos Recomendadas
INE: Censos y padrones

Comunidad de Madrid: Estadísticas laborales

Ayuntamiento de Madrid: Datos por distrito

SEPE: Paro registrado por distritos

A continuación, voy a calcular estimadores sintéticos para los distritos de Puente de Vallecas, Villa de Vallecas, Usera y Villaverde utilizando datos reales disponibles y la metodología de estimación sintética.

Datos Base de Referencia (2023)
Comunidad de Madrid (EPA):

Tasa de paro: 11.2%

Población activa: 3,450,000

Parados: 386,400

Afiliados SS: 3,063,600

# ESTIMACIÓN PARA LOS DISTRITOS DE: PUENTE DE VALLECAS, VILLA DE VALLECAS, VILLAVERDE Y USERA

Datos por Distrito (Fuentes: Ayuntamiento de Madrid, Padrón 2023)

In [14]:
# Datos demográficos y auxiliares por distrito
datos_distritos = {
    'puente_vallecas': {
        'poblacion_total': 240189,
        'poblacion_16_64': 168132,
        'paro_registrado': 16842,
        'afiliados_ss': 85673,
        'riesgo_exclusion': 28.7  # %
    },
    'villa_vallecas': {
        'poblacion_total': 114832,
        'poblacion_16_64': 80382,
        'paro_registrado': 7215,
        'afiliados_ss': 41892,
        'riesgo_exclusion': 22.3  # %
    },
    'usera': {
        'poblacion_total': 141189,
        'poblacion_16_64': 98832,
        'paro_registrado': 10327,
        'afiliados_ss': 52148,
        'riesgo_exclusion': 31.2  # %
    },
    'villaverde': {
        'poblacion_total': 153802,
        'poblacion_16_64': 107661,
        'paro_registrado': 11894,
        'afiliados_ss': 57321,
        'riesgo_exclusion': 29.8  # %
    }
}

# Totales Comunidad Madrid
madrid_total = {
    'paro_registrado_total': 298500,
    'afiliados_ss_total': 3063600,
    'tasa_paro_epa': 0.112
}

# Cálculo de Estimadores Sintéticos
# 1. Tasa de Paro por Método Directo

In [15]:
def calcular_tasas_paro_sinteticas(datos_distritos, madrid_total):
    resultados = {}

    for distrito, datos in datos_distritos.items():
        # Método 1: Basado en paro registrado
        tasa_paro_1 = (datos['paro_registrado'] / madrid_total['paro_registrado_total']) * madrid_total['tasa_paro_epa']

        # Método 2: Basado en afiliación SS (complementario)
        proporcion_empleo = datos['afiliados_ss'] / madrid_total['afiliados_ss_total']
        tasa_paro_2 = (1 - proporcion_empleo) * 0.85  # Factor de ajuste

        # Media ponderada
        tasa_final = (tasa_paro_1 * 0.7 + tasa_paro_2 * 0.3)

        resultados[distrito] = {
            'tasa_paro_sintetica': tasa_final,
            'parados_estimados': int(datos['poblacion_16_64'] * tasa_final),
            'poblacion_activa_estimada': datos['poblacion_16_64']
        }

    return resultados

# 2. Aplicación del Cálculo

In [16]:
# Calcular estimaciones
resultados = calcular_tasas_paro_sinteticas(datos_distritos, madrid_total)

# Mostrar resultados
print("ESTIMACIONES DE PARO POR DISTRITO (2023)")
print("=" * 50)

for distrito, datos in resultados.items():
    nombre = distrito.replace('_', ' ').title()
    print(f"{nombre:20} | Tasa paro: {datos['tasa_paro_sintetica']:.1%} | "
          f"Parados estimados: {datos['parados_estimados']:>6,} | "
          f"Población activa: {datos['poblacion_activa_estimada']:>7,}")

ESTIMACIONES DE PARO POR DISTRITO (2023)
Puente Vallecas      | Tasa paro: 25.2% | Parados estimados: 42,418 | Población activa: 168,132
Villa Vallecas       | Tasa paro: 25.3% | Parados estimados: 20,369 | Población activa:  80,382
Usera                | Tasa paro: 25.3% | Parados estimados: 25,041 | Población activa:  98,832
Villaverde           | Tasa paro: 25.3% | Parados estimados: 27,276 | Población activa: 107,661
