# üë• An√°lisis Sociodemogr√°fico de Desigualdad en Espa√±a (2008-2023)

## Desigualdad por Edad, Sexo, Tipo de Hogar y Situaci√≥n Laboral

---

### üéØ Objetivos del An√°lisis

- **Identificar grupos vulnerables** por edad, sexo, tipo de hogar y situaci√≥n laboral
- **Cuantificar desigualdades** mediante tasas AROPE y personas afectadas
- **Analizar evoluci√≥n temporal** de vulnerabilidades (2008-2023)
- **Detectar patrones de interseccionalidad**: Cruces multidimensionales
- **Proponer pol√≠ticas diferenciadas** seg√∫n perfil de riesgo

---

### üìä Datos y Metodolog√≠a

**Fuentes:**
- INE - Encuesta de Condiciones de Vida (ECV)
- INE - Padr√≥n municipal (poblaci√≥n)
- Eurostat (metodolog√≠a AROPE)

**Indicador Principal:**
- **AROPE** (At Risk of Poverty Or Social Exclusion)
  - Pobreza monetaria: Ingresos < 60% mediana
  - Deprivaci√≥n material severa
  - Baja intensidad de empleo en hogar

**Per√≠odo:** 2008-2023 (16 a√±os)

---

## 1Ô∏è‚É£ Configuraci√≥n y Carga de Datos

In [None]:
# Importar librer√≠as
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pyodbc
from sqlalchemy import create_engine
import urllib.parse
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n de visualizaci√≥n
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (15, 8)
plt.rcParams['font.size'] = 10
pd.set_option('display.max_columns', None)

print("‚úÖ Librer√≠as importadas correctamente")

In [None]:
# Conexi√≥n a SQL Server
SERVER = 'localhost'
DATABASE = 'desigualdad'
DRIVER = '{ODBC Driver 17 for SQL Server}'

try:
    connection_string = f'DRIVER={DRIVER};SERVER={SERVER};DATABASE={DATABASE};Trusted_Connection=yes;'
    quoted_conn_str = urllib.parse.quote_plus(connection_string)
    engine = create_engine(f'mssql+pyodbc:///?odbc_connect={quoted_conn_str}')
    connection = engine.connect()
    print(f"‚úÖ Conexi√≥n exitosa a: {SERVER}/{DATABASE}")
    connection.close()
except Exception as e:
    print(f"‚ùå Error de conexi√≥n: {e}")

In [None]:
# Funci√≥n helper: Detectar columna de valor AROPE
def find_valor_col(df, table_name="tabla"):
    """Busca columna de valor AROPE de forma robusta"""
    if df is None or df.empty:
        return None
    
    # Buscar por nombre
    for col in df.columns:
        if any(x in col.upper() for x in ['AROPE', 'TASA', 'VALOR']):
            return col
    
    # Buscar primera columna num√©rica que no sea dimensi√≥n
    dimensiones = ['a√±o', 'edad', 'sexo', 'tipo_hogar', 'situacion_laboral', 'ccaa', 'indicador', 'decil']
    for col in df.columns:
        if col.lower() not in dimensiones and df[col].dtype in ['float64', 'int64']:
            return col
    
    return None

print("‚úÖ Funciones helper cargadas")

In [None]:
# Cargar datos sociodemogr√°ficos
print("=" * 100)
print("CARGA DE DATOS SOCIODEMOGR√ÅFICOS")
print("=" * 100)

# AROPE por Edad y Sexo
df_arope_edad_sexo = pd.read_sql("SELECT * FROM INE_AROPE_Edad_Sexo ORDER BY A√±o, Edad, Sexo", engine)
print(f"\n‚úì AROPE Edad/Sexo: {len(df_arope_edad_sexo)} registros ({df_arope_edad_sexo['A√±o'].min()}-{df_arope_edad_sexo['A√±o'].max()})")

# AROPE por Tipo de Hogar
df_arope_hogar = pd.read_sql("SELECT * FROM INE_AROPE_Hogar ORDER BY A√±o, Tipo_Hogar", engine)
print(f"‚úì AROPE Hogar: {len(df_arope_hogar)} registros ({df_arope_hogar['A√±o'].min()}-{df_arope_hogar['A√±o'].max()})")

# AROPE por Situaci√≥n Laboral
df_arope_laboral = pd.read_sql("SELECT * FROM INE_AROPE_Laboral ORDER BY A√±o, Situacion_Laboral", engine)
print(f"‚úì AROPE Laboral: {len(df_arope_laboral)} registros ({df_arope_laboral['A√±o'].min()}-{df_arope_laboral['A√±o'].max()})")

# Poblaci√≥n por Edad y Sexo
df_poblacion = pd.read_sql("""SELECT A√±o, Sexo, Edad, Poblacion 
                              FROM INE_Poblacion_Edad_Sexo 
                              WHERE A√±o >= 2008 ORDER BY A√±o, Edad, Sexo""", engine)
print(f"‚úì Poblaci√≥n: {len(df_poblacion)} registros ({df_poblacion['A√±o'].min()}-{df_poblacion['A√±o'].max()})")

# Normalizar nombres de Sexo (CR√çTICO para el cruce)
mapeo_sexo = {'Hombres': 'Hombre', 'Mujeres': 'Mujer', 'Total': 'Total'}
df_poblacion['Sexo'] = df_poblacion['Sexo'].map(mapeo_sexo)

# Excluir grupo agregado
df_poblacion = df_poblacion[df_poblacion['Edad'] != 'Todas las edades']

print("\n‚úÖ Datos cargados y normalizados correctamente")
print("=" * 100)

---

## 2Ô∏è‚É£ Preparaci√≥n de Datos: Mapeo y Cruce AROPE √ó Poblaci√≥n

In [None]:
# Mapeo: Poblaci√≥n Quinquenal ‚Üí Grupos AROPE
print("=" * 100)
print("MAPEO DE GRUPOS DE EDAD: Quinquenal ‚Üí AROPE")
print("=" * 100)

# Mapeo de grupos quinquenales (poblaci√≥n) a grupos AROPE (tasas vulnerabilidad)
mapeo_edad_arope = {
    '0-4': 'Menores de 16 a√±os',
    '5-9': 'Menores de 16 a√±os',
    '10-14': 'Menores de 16 a√±os',
    '15-19': '16 a 29 a√±os',
    '20-24': '16 a 29 a√±os',
    '25-29': '16 a 29 a√±os',
    '30-34': '30 a 44 a√±os',
    '35-39': '30 a 44 a√±os',
    '40-44': '30 a 44 a√±os',
    '45-49': '45 a 64 a√±os',
    '50-54': '45 a 64 a√±os',
    '55-59': '45 a 64 a√±os',
    '60-64': '45 a 64 a√±os',
    '65-69': '65 y m√°s a√±os',
    '70-74': '65 y m√°s a√±os',
    '75-79': '65 y m√°s a√±os',
    '80-84': '65 y m√°s a√±os',
    '85-89': '65 y m√°s a√±os',
    '90-94': '65 y m√°s a√±os',
    '90+': '65 y m√°s a√±os',
    '95+': '65 y m√°s a√±os'
}

# Aplicar mapeo
df_poblacion['Edad_AROPE'] = df_poblacion['Edad'].map(mapeo_edad_arope)

# Diagnosticar edades sin mapeo
edades_sin_mapeo = df_poblacion[df_poblacion['Edad_AROPE'].isna()]['Edad'].unique()
if len(edades_sin_mapeo) > 0:
    print(f"\n‚ö†Ô∏è  Edades SIN mapeo: {sorted(edades_sin_mapeo)}")
else:
    print(f"\n‚úì Todas las edades mapeadas correctamente")

# Agrupar poblaci√≥n por grupos AROPE
df_poblacion_arope = df_poblacion[df_poblacion['Edad_AROPE'].notna()].groupby(
    ['A√±o', 'Sexo', 'Edad_AROPE'], 
    as_index=False
)['Poblacion'].sum()

print(f"‚úì Poblaci√≥n agregada: {len(df_poblacion_arope)} registros")
print(f"  Periodo: {df_poblacion_arope['A√±o'].min()}-{df_poblacion_arope['A√±o'].max()}")
print(f"  Grupos edad: {df_poblacion_arope['Edad_AROPE'].nunique()}")

print("\n" + "=" * 100)

In [None]:
# Cruce AROPE √ó Poblaci√≥n
print("=" * 100)
print("CRUCE: TASAS AROPE √ó POBLACI√ìN = PERSONAS EN RIESGO")
print("=" * 100)

# Grupos v√°lidos (mutuamente excluyentes)
grupos_validos = ['Menores de 16 a√±os', '16 a 29 a√±os', '30 a 44 a√±os', '45 a 64 a√±os', '65 y m√°s a√±os']

# Detectar columna de valor AROPE
valor_col = find_valor_col(df_arope_edad_sexo, "AROPE_Edad_Sexo")

# Filtrar solo AROPE total (no componentes) y solo grupos v√°lidos
df_arope_total = df_arope_edad_sexo[
    (df_arope_edad_sexo['Indicador'] == 'AROPE') & 
    (df_arope_edad_sexo['Edad'].isin(grupos_validos))
].copy()

# Renombrar columna Edad a Edad_AROPE para el merge
df_arope_total = df_arope_total.rename(columns={'Edad': 'Edad_AROPE'})

# Limpiar duplicados en AROPE (usar primer valor cuando hay triplicados)
df_arope_clean = df_arope_total.groupby(['A√±o', 'Sexo', 'Edad_AROPE'], as_index=False).agg({
    'Valor': 'first'
})

# Hacer el cruce
df_cruce = pd.merge(
    df_arope_clean,
    df_poblacion_arope,
    on=['A√±o', 'Sexo', 'Edad_AROPE'],
    how='inner'
)

# Calcular personas en AROPE
df_cruce['Personas_AROPE'] = (df_cruce['Valor'] / 100) * df_cruce['Poblacion']

print(f"\n‚úì Cruce completado: {len(df_cruce)} registros")
print(f"  Periodo: {df_cruce['A√±o'].min()} - {df_cruce['A√±o'].max()}")
print(f"  Sexos: {df_cruce['Sexo'].nunique()}")
print(f"  Grupos edad: {df_cruce['Edad_AROPE'].nunique()}")
print(f"  Esperado: {(df_cruce['A√±o'].max() - df_cruce['A√±o'].min() + 1) * df_cruce['Sexo'].nunique() * df_cruce['Edad_AROPE'].nunique()} registros")

print("\n" + "=" * 100)

In [None]:
# VALIDACI√ìN CR√çTICA: Verificar integridad del cruce
print("=" * 100)
print("üîç VALIDACI√ìN DE INTEGRIDAD DE DATOS")
print("=" * 100)

# 1. Verificar que no hay duplicados en df_cruce
print("\n1Ô∏è‚É£ VERIFICACI√ìN DE DUPLICADOS:")
duplicados = df_cruce.groupby(['A√±o', 'Sexo', 'Edad_AROPE']).size()
duplicados_encontrados = duplicados[duplicados > 1]

if len(duplicados_encontrados) > 0:
    print(f"‚ùå ERROR: Se encontraron {len(duplicados_encontrados)} combinaciones duplicadas:")
    print(duplicados_encontrados)
else:
    print(f"‚úÖ No hay duplicados en df_cruce")

# 2. Verificar que columna 'Indicador' existe y est√° filtrada
print("\n2Ô∏è‚É£ VERIFICACI√ìN DE INDICADOR:")
if 'Indicador' in df_cruce.columns:
    indicadores_unicos = df_cruce['Indicador'].unique()
    print(f"   Indicadores en df_cruce: {indicadores_unicos}")
    if len(indicadores_unicos) == 1 and indicadores_unicos[0] == 'AROPE':
        print(f"   ‚úÖ Solo indicador AROPE (sin componentes)")
    else:
        print(f"   ‚ö†Ô∏è ADVERTENCIA: Hay m√°s de un indicador o no es solo AROPE")
else:
    print(f"   ‚ÑπÔ∏è Columna 'Indicador' no presente (posiblemente ya filtrada)")

# 3. Verificar cobertura temporal completa
print("\n3Ô∏è‚É£ VERIFICACI√ìN DE COBERTURA TEMPORAL:")
a√±os_esperados = set(range(2008, 2024))
a√±os_reales = set(df_cruce['A√±o'].unique())
a√±os_faltantes = a√±os_esperados - a√±os_reales

if a√±os_faltantes:
    print(f"   ‚ö†Ô∏è A√±os faltantes: {sorted(a√±os_faltantes)}")
else:
    print(f"   ‚úÖ Cobertura completa 2008-2023")

# 4. Verificar que todos los grupos de edad est√°n presentes
print("\n4Ô∏è‚É£ VERIFICACI√ìN DE GRUPOS DE EDAD:")
grupos_esperados = set(grupos_validos)
grupos_reales = set(df_cruce['Edad_AROPE'].unique())
grupos_faltantes = grupos_esperados - grupos_reales

if grupos_faltantes:
    print(f"   ‚ö†Ô∏è Grupos faltantes: {grupos_faltantes}")
else:
    print(f"   ‚úÖ Todos los grupos de edad presentes: {len(grupos_reales)}")

# 5. Verificar que las tasas AROPE est√°n en rango razonable
print("\n5Ô∏è‚É£ VERIFICACI√ìN DE RANGO DE VALORES:")
min_tasa = df_cruce['Valor'].min()
max_tasa = df_cruce['Valor'].max()
print(f"   Rango tasas AROPE: {min_tasa:.1f}% - {max_tasa:.1f}%")

if min_tasa < 0 or max_tasa > 100:
    print(f"   ‚ùå ERROR: Tasas fuera de rango v√°lido (0-100%)")
elif max_tasa > 60:
    print(f"   ‚ö†Ô∏è ADVERTENCIA: Tasa m√°xima muy alta ({max_tasa:.1f}%)")
else:
    print(f"   ‚úÖ Tasas en rango razonable")

# 6. Verificar que Personas_AROPE es coherente
print("\n6Ô∏è‚É£ VERIFICACI√ìN DE PERSONAS_AROPE:")
personas_negativas = df_cruce[df_cruce['Personas_AROPE'] < 0]
if len(personas_negativas) > 0:
    print(f"   ‚ùå ERROR: {len(personas_negativas)} registros con personas negativas")
else:
    print(f"   ‚úÖ Todas las personas AROPE >= 0")

# Verificar rec√°lculo
df_cruce['Personas_AROPE_Check'] = (df_cruce['Valor'] / 100) * df_cruce['Poblacion']
diferencias = abs(df_cruce['Personas_AROPE'] - df_cruce['Personas_AROPE_Check'])
if diferencias.max() > 1:
    print(f"   ‚ö†Ô∏è ADVERTENCIA: Diferencias en rec√°lculo (max: {diferencias.max():.1f})")
else:
    print(f"   ‚úÖ C√°lculo de Personas_AROPE verificado")
    
df_cruce.drop('Personas_AROPE_Check', axis=1, inplace=True)

print("\n" + "=" * 100)

---

## 3Ô∏è‚É£ An√°lisis de Vulnerabilidad por EDAD

### üéØ Objetivos

- **Ranking de vulnerabilidad** por grupo de edad
- **Evoluci√≥n temporal** (2008-2023) de tasas AROPE
- **Cuantificaci√≥n** de personas afectadas
- **√çndice de concentraci√≥n** del riesgo
- **Cambios estructurales** por crisis econ√≥mica y COVID

In [None]:
# 3.1 - Ranking de Vulnerabilidad por Edad y Cuantificaci√≥n de Personas Afectadas
print("=" * 100)
print("üë• CUANTIFICACI√ìN: Personas en Riesgo por Edad")
print("=" * 100)

# A√±o m√°s reciente y a√±o inicial para comparaciones
ano_reciente = df_cruce['A√±o'].max()
ano_inicial = df_cruce['A√±o'].min()

# DEFINIR ORDEN DE GRUPOS DE EDAD (para consistencia en tablas)
orden_edades = ['Menores de 16 a√±os', '16 a 29 a√±os', '30 a 44 a√±os', '45 a 64 a√±os', '65 y m√°s a√±os']

# Filtrar datos del a√±o m√°s reciente
df_reciente = df_cruce[
    (df_cruce['A√±o'] == ano_reciente) & 
    (df_cruce['Sexo'] == 'Total')
].sort_values('Valor', ascending=False).copy()

print(f"\n[TABLA INTEGRADA {ano_reciente}] Tasa AROPE + Personas Afectadas por Edad:")
print("-" * 100)
print(f"{'Grupo Edad':<30} {'Tasa AROPE':<12} {'Poblaci√≥n':<15} {'Personas AROPE':<18} {'% del Total':<12}")
print("-" * 100)

# Calcular totales
total_pob = df_reciente['Poblacion'].sum()
total_arope = df_reciente['Personas_AROPE'].sum()

for _, row in df_reciente.iterrows():
    edad = row['Edad_AROPE']
    tasa = row['Valor']
    poblacion = row['Poblacion']
    personas = row['Personas_AROPE']
    pct_total = (personas / total_arope) * 100
    
    # Emoji seg√∫n nivel de vulnerabilidad
    emoji = "üî¥" if tasa >= 30 else "üü†" if tasa >= 25 else "üü°" if tasa >= 20 else "üü¢"
    
    print(f"{emoji} {edad:<28} {tasa:>5.1f}%       {poblacion:>12,.0f}    {personas:>14,.0f}    {pct_total:>6.1f}%")

print("-" * 100)
print(f"{'TOTAL ESPA√ëA':<30} {(total_arope/total_pob*100):>5.1f}%       {total_pob:>12,.0f}    {total_arope:>14,.0f}    100.0%")
print("=" * 100)

# An√°lisis de magnitud: ¬øCu√°ntas personas representa cada punto porcentual?
print(f"\nüí° MAGNITUD DEL IMPACTO:")
print("-" * 100)
print(f"   ‚Ä¢ 1 punto porcentual de AROPE ‚âà {(total_pob / 100):,.0f} personas")
print(f"   ‚Ä¢ Total en AROPE ({ano_reciente}): {total_arope:,.0f} personas")
print(f"   ‚Ä¢ Poblaci√≥n total analizada: {total_pob:,.0f} personas")

# Identificar grupos m√°s afectados en t√©rminos absolutos
print(f"\nüî¥ TOP 3 GRUPOS POR PERSONAS AFECTADAS:")
print("-" * 100)
for i, (_, row) in enumerate(df_reciente.head(3).iterrows(), 1):
    edad = row['Edad_AROPE']
    personas = row['Personas_AROPE']
    tasa = row['Valor']
    pct_del_total = (personas / total_arope) * 100
    
    print(f"   {i}. {edad}")
    print(f"      ‚Ä¢ {personas:,.0f} personas ({pct_del_total:.1f}% del total en AROPE)")
    print(f"      ‚Ä¢ Tasa: {tasa:.1f}%")

# Comparaci√≥n temporal: Cambio absoluto 2008-2023
print(f"\nüìä EVOLUCI√ìN TEMPORAL [{ano_inicial} ‚Üí {ano_reciente}]:")
print("-" * 100)

df_inicial = df_cruce[
    (df_cruce['A√±o'] == ano_inicial) & 
    (df_cruce['Sexo'] == 'Total')
].set_index('Edad_AROPE')

df_reciente_idx = df_reciente.set_index('Edad_AROPE')

print(f"{'Grupo Edad':<30} {'Tasa Inicial':<15} {'Tasa Final':<15} {'Cambio Tasa':<15} {'Cambio Personas':<20}")
print("-" * 100)

for edad in orden_edades:
    if edad in df_inicial.index and edad in df_reciente_idx.index:
        tasa_inicial = df_inicial.loc[edad, 'Valor']
        tasa_final = df_reciente_idx.loc[edad, 'Valor']
        personas_inicial = df_inicial.loc[edad, 'Personas_AROPE']
        personas_final = df_reciente_idx.loc[edad, 'Personas_AROPE']
        
        cambio_tasa = tasa_final - tasa_inicial
        cambio_personas = personas_final - personas_inicial
        
        emoji_tasa = "üìâ" if cambio_tasa < 0 else "üìà" if cambio_tasa > 0 else "‚û°Ô∏è"
        emoji_personas = "üìâ" if cambio_personas < 0 else "üìà"
        
        print(f"{edad:<30} {tasa_inicial:>6.1f}%         {tasa_final:>6.1f}%         {emoji_tasa} {cambio_tasa:>+5.1f}pp       {emoji_personas} {cambio_personas:>+15,.0f}")

# An√°lisis de impacto combinado
print(f"\nüéØ AN√ÅLISIS DE IMPACTO COMBINADO:")
print("-" * 100)

for edad in orden_edades:
    if edad in df_inicial.index and edad in df_reciente_idx.index:
        tasa_inicial = df_inicial.loc[edad, 'Valor']
        tasa_final = df_reciente_idx.loc[edad, 'Valor']
        personas_inicial = df_inicial.loc[edad, 'Personas_AROPE']
        personas_final = df_reciente_idx.loc[edad, 'Personas_AROPE']
        
        cambio_tasa = tasa_final - tasa_inicial
        cambio_personas = personas_final - personas_inicial
        
        # An√°lisis: ¬øMejora/empeora en tasa? ¬øY en personas?
        if abs(cambio_tasa) > 2 or abs(cambio_personas) > 100000:  # Cambios significativos
            print(f"\n   ‚Ä¢ {edad}:")
            
            if cambio_tasa < -2:
                print(f"     ‚úÖ Tasa MEJORA: {cambio_tasa:.1f}pp")
            elif cambio_tasa > 2:
                print(f"     ‚ö†Ô∏è Tasa EMPEORA: {cambio_tasa:+.1f}pp")
            
            if cambio_personas > 100000:
                print(f"     üî¥ AUMENTO de {cambio_personas:,.0f} personas en riesgo")
            elif cambio_personas < -100000:
                print(f"     ‚úÖ REDUCCI√ìN de {abs(cambio_personas):,.0f} personas en riesgo")
            
            # Explicar la paradoja si existe
            if cambio_tasa < 0 and cambio_personas > 0:
                print(f"     üìå PARADOJA: Tasa mejora pero m√°s personas afectadas (crecimiento poblacional)")
            elif cambio_tasa > 0 and cambio_personas < 0:
                print(f"     üìå PARADOJA: Tasa empeora pero menos personas afectadas (descenso poblacional)")

print("\n" + "=" * 100)

In [None]:
# 3.2 - Evoluci√≥n Temporal por Edad
print("=" * 100)
print("üìà EVOLUCI√ìN TEMPORAL DE AROPE POR EDAD (2008-2023)")
print("=" * 100)

# Filtrar Total (ambos sexos)
df_evol_edad = df_cruce[df_cruce['Sexo'] == 'Total'].copy()

# VALIDACI√ìN: Verificar duplicados antes de pivot
duplicados_evol = df_evol_edad.groupby(['A√±o', 'Edad_AROPE']).size()
if (duplicados_evol > 1).any():
    print(f"‚ö†Ô∏è ADVERTENCIA: Hay duplicados en evoluci√≥n temporal:")
    print(duplicados_evol[duplicados_evol > 1])

# Crear pivot: A√±os √ó Grupos Edad (aggfunc='first' expl√≠cito para evitar promedios)
pivot_evol = df_evol_edad.pivot_table(
    index='A√±o', 
    columns='Edad_AROPE', 
    values='Valor',
    aggfunc='first'  # Tomar primer valor si hay duplicados
)

# Ordenar columnas por edad l√≥gica
orden_edades = ['Menores de 16 a√±os', '16 a 29 a√±os', '30 a 44 a√±os', '45 a 64 a√±os', '65 y m√°s a√±os']
pivot_evol = pivot_evol[[col for col in orden_edades if col in pivot_evol.columns]]

# VALIDACI√ìN: Verificar a√±os completos
a√±os_esperados = set(range(2008, 2024))
a√±os_reales = set(pivot_evol.index)
if a√±os_faltantes := a√±os_esperados - a√±os_reales:
    print(f"\n‚ö†Ô∏è A√±os faltantes en evoluci√≥n: {sorted(a√±os_faltantes)}")

print(f"\n[TABLA] Tasas AROPE por Edad y A√±o (%):")
print("-" * 100)
print(pivot_evol.to_string())

# An√°lisis de cambios 2008 ‚Üí 2023
print(f"\n[CAMBIOS] {pivot_evol.index.min()} ‚Üí {pivot_evol.index.max()}:")
print("-" * 100)

ano_inicial = pivot_evol.index.min()
ano_final = pivot_evol.index.max()

for edad in pivot_evol.columns:
    valor_inicial = pivot_evol.loc[ano_inicial, edad]
    valor_final = pivot_evol.loc[ano_final, edad]
    cambio = valor_final - valor_inicial
    
    # Calcular m√°ximo y m√≠nimo en el per√≠odo (volatilidad)
    valor_max = pivot_evol[edad].max()
    valor_min = pivot_evol[edad].min()
    volatilidad = valor_max - valor_min
    
    emoji = "üìâ" if cambio < 0 else "üìà" if cambio > 0 else "‚û°Ô∏è"
    tendencia = "MEJORA" if cambio < 0 else "EMPEORA" if cambio > 0 else "ESTABLE"
    
    print(f"{emoji} {edad:<30} {valor_inicial:>5.1f}% ‚Üí {valor_final:>5.1f}%  ({cambio:+.1f}pp)  [{tendencia}]")
    if volatilidad > 5:
        print(f"   ‚ö†Ô∏è  Alta volatilidad: Rango {valor_min:.1f}% - {valor_max:.1f}% (¬±{volatilidad:.1f}pp)")

print("\n" + "=" * 100)

In [None]:
# 3.3 - Visualizaci√≥n: Evoluci√≥n Temporal
print("=" * 100)
print("üìä VISUALIZACI√ìN: Evoluci√≥n de AROPE por Edad")
print("=" * 100)

fig, ax = plt.subplots(figsize=(14, 8))

# Colores diferenciados por grupo
colores = {
    'Menores de 16 a√±os': '#e74c3c',  # Rojo
    '16 a 29 a√±os': '#f39c12',        # Naranja
    '30 a 44 a√±os': '#f1c40f',        # Amarillo
    '45 a 64 a√±os': '#3498db',        # Azul
    '65 y m√°s a√±os': '#2ecc71'        # Verde
}

for edad in pivot_evol.columns:
    color = colores.get(edad, None)
    ax.plot(pivot_evol.index, pivot_evol[edad], 
           marker='o', linewidth=2.5, markersize=6, label=edad, color=color)

# Sombrear per√≠odos de crisis
ax.axvspan(2008, 2013, alpha=0.1, color='red', label='Crisis Financiera')
ax.axvspan(2020, 2021, alpha=0.1, color='orange', label='COVID-19')

ax.set_xlabel('A√±o', fontsize=12, fontweight='bold')
ax.set_ylabel('Tasa AROPE (%)', fontsize=12, fontweight='bold')
ax.set_title('Evoluci√≥n de Vulnerabilidad por Edad (2008-2023)', 
            fontsize=14, fontweight='bold', pad=20)
ax.legend(loc='best', fontsize=10, ncol=2)
ax.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("‚úì Gr√°fico generado")
print("=" * 100)

In [None]:
# 3.4 - √çndice de Concentraci√≥n del Riesgo
print("=" * 100)
print("‚öñÔ∏è √çNDICE DE CONCENTRACI√ìN DEL RIESGO")
print("=" * 100)

# Calcular % de personas en AROPE vs % de poblaci√≥n
df_concentracion = df_cruce[
    (df_cruce['A√±o'] == ano_reciente) & 
    (df_cruce['Sexo'] == 'Total')
].copy()

# Calcular porcentajes
total_pob = df_concentracion['Poblacion'].sum()
total_arope = df_concentracion['Personas_AROPE'].sum()

df_concentracion['Pct_Poblacion'] = (df_concentracion['Poblacion'] / total_pob) * 100
df_concentracion['Pct_AROPE'] = (df_concentracion['Personas_AROPE'] / total_arope) * 100

# √çndice de concentraci√≥n: Pct_AROPE / Pct_Poblacion
# > 1.0 = Grupo sobrerepresentado en AROPE
# < 1.0 = Grupo subrepresentado en AROPE
df_concentracion['Indice_Concentracion'] = df_concentracion['Pct_AROPE'] / df_concentracion['Pct_Poblacion']

# Ordenar por √≠ndice descendente
df_concentracion = df_concentracion.sort_values('Indice_Concentracion', ascending=False)

# MEJORAR: Calcular umbrales basados en percentiles de los datos
indices = df_concentracion['Indice_Concentracion']
umbral_muy_alto = indices.quantile(0.80)  # Top 20%
umbral_alto = indices.quantile(0.60)      # Top 40%
umbral_bajo = indices.quantile(0.40)      # Bottom 60%

print(f"\n[UMBRALES CALCULADOS] Basados en percentiles:")
print(f"  ‚Ä¢ MUY ALTA concentraci√≥n: ‚â• {umbral_muy_alto:.2f}x (P80)")
print(f"  ‚Ä¢ ALTA concentraci√≥n: ‚â• {umbral_alto:.2f}x (P60)")
print(f"  ‚Ä¢ BAJA concentraci√≥n: < {umbral_bajo:.2f}x (P40)")

print(f"\n[{ano_reciente}] √çndice de Concentraci√≥n del Riesgo por Edad:")
print("-" * 100)
print(f"{'Edad':<30} {'% Poblaci√≥n':<15} {'% AROPE':<15} {'√çndice':<15} {'Interpretaci√≥n'}")
print("-" * 100)

for _, row in df_concentracion.iterrows():
    edad = row['Edad_AROPE']
    pct_pob = row['Pct_Poblacion']
    pct_arope = row['Pct_AROPE']
    indice = row['Indice_Concentracion']
    
    # Interpretaci√≥n basada en percentiles
    if indice >= umbral_muy_alto:
        interpretacion = "üî¥ MUY ALTA concentraci√≥n"
    elif indice >= umbral_alto:
        interpretacion = "üü† ALTA concentraci√≥n"
    elif indice >= umbral_bajo:
        interpretacion = "üü° Proporcional"
    else:
        interpretacion = "üü¢ BAJA concentraci√≥n"
    
    print(f"{edad:<30} {pct_pob:>6.1f}%          {pct_arope:>6.1f}%          {indice:>6.2f}        {interpretacion}")

print("=" * 100)

# Hallazgos clave
print(f"\nüí° HALLAZGOS CLAVE:")
print("-" * 100)

grupo_max_concentracion = df_concentracion.iloc[0]
grupo_min_concentracion = df_concentracion.iloc[-1]

print(f"\nüî¥ MAYOR CONCENTRACI√ìN: {grupo_max_concentracion['Edad_AROPE']}")
print(f"   ‚Ä¢ Representan el {grupo_max_concentracion['Pct_Poblacion']:.1f}% de la poblaci√≥n")
print(f"   ‚Ä¢ Pero son el {grupo_max_concentracion['Pct_AROPE']:.1f}% de las personas en AROPE")
print(f"   ‚Ä¢ √çndice: {grupo_max_concentracion['Indice_Concentracion']:.2f}x")

print(f"\nüü¢ MENOR CONCENTRACI√ìN: {grupo_min_concentracion['Edad_AROPE']}")
print(f"   ‚Ä¢ Representan el {grupo_min_concentracion['Pct_Poblacion']:.1f}% de la poblaci√≥n")
print(f"   ‚Ä¢ Solo son el {grupo_min_concentracion['Pct_AROPE']:.1f}% de las personas en AROPE")
print(f"   ‚Ä¢ √çndice: {grupo_min_concentracion['Indice_Concentracion']:.2f}x")

print(f"\nüìå NOTA IMPORTANTE:")
print(f"   El √≠ndice de concentraci√≥n mide PROPORCI√ìN, no magnitud absoluta.")
print(f"   Un grupo con baja concentraci√≥n puede tener muchas personas en AROPE.")
print(f"   Ejemplo: Mayores 65+ (baja concentraci√≥n) pero 2M+ personas afectadas.")

print("\n" + "=" * 100)

In [None]:
# 3.5 - Conclusiones: An√°lisis de Edad
print("=" * 100)
print("üìù CONCLUSIONES: Vulnerabilidad por Edad")
print("=" * 100)

print(f"\nüéØ GRUPOS PRIORITARIOS ({ano_reciente}):\n")

# CORREGIR: Ordenar por TASA AROPE (vulnerabilidad real), NO por √≠ndice concentraci√≥n
# df_concentracion est√° ordenado por √≠ndice ‚Üí REORDENAR por Valor (tasa)
df_prioridad = df_concentracion.sort_values('Valor', ascending=False).copy()

print("1Ô∏è‚É£ INFANCIA Y JUVENTUD (< 30 a√±os):")
menores16 = df_prioridad[df_prioridad['Edad_AROPE'] == 'Menores de 16 a√±os'].iloc[0]
jovenes = df_prioridad[df_prioridad['Edad_AROPE'] == '16 a 29 a√±os'].iloc[0]

print(f"   ‚Ä¢ Menores de 16: {menores16['Valor']:.1f}% AROPE ({menores16['Personas_AROPE']:,.0f} personas)")
print(f"     - Concentraci√≥n: {menores16['Indice_Concentracion']:.2f}x")
print(f"   ‚Ä¢ J√≥venes 16-29: {jovenes['Valor']:.1f}% AROPE ({jovenes['Personas_AROPE']:,.0f} personas)")
print(f"     - Concentraci√≥n: {jovenes['Indice_Concentracion']:.2f}x")

print(f"\n2Ô∏è‚É£ ADULTOS (30-64 a√±os):")
adultos30_44 = df_prioridad[df_prioridad['Edad_AROPE'] == '30 a 44 a√±os'].iloc[0]
adultos45_64 = df_prioridad[df_prioridad['Edad_AROPE'] == '45 a 64 a√±os'].iloc[0]

print(f"   ‚Ä¢ Adultos 30-44: {adultos30_44['Valor']:.1f}% AROPE ({adultos30_44['Personas_AROPE']:,.0f} personas)")
print(f"   ‚Ä¢ Adultos 45-64: {adultos45_64['Valor']:.1f}% AROPE ({adultos45_64['Personas_AROPE']:,.0f} personas)")

print(f"\n3Ô∏è‚É£ MAYORES (65+ a√±os):")
mayores = df_prioridad[df_prioridad['Edad_AROPE'] == '65 y m√°s a√±os'].iloc[0]

print(f"   ‚Ä¢ Mayores 65+: {mayores['Valor']:.1f}% AROPE ({mayores['Personas_AROPE']:,.0f} personas)")
print(f"     - Concentraci√≥n: {mayores['Indice_Concentracion']:.2f}x (BAJA)")

print(f"\n" + "-" * 100)
print(f"\nüí° TENDENCIAS CLAVE ({ano_inicial}-{ano_final}):")
print("-" * 100)

# Analizar tendencias desde pivot_evol
print(f"\nüìâ MEJORAS:")
for edad in pivot_evol.columns:
    cambio = pivot_evol.loc[ano_final, edad] - pivot_evol.loc[ano_inicial, edad]
    if cambio < -2:  # Mejora > 2pp
        print(f"   ‚Ä¢ {edad}: {cambio:.1f}pp")

print(f"\nüìà EMPEORAMIENTOS:")
for edad in pivot_evol.columns:
    cambio = pivot_evol.loc[ano_final, edad] - pivot_evol.loc[ano_inicial, edad]
    if cambio > 2:  # Empeora > 2pp
        print(f"   ‚Ä¢ {edad}: {cambio:+.1f}pp")

print(f"\n" + "-" * 100)
print(f"\nüéØ RECOMENDACIONES DE POL√çTICA P√öBLICA:")
print("-" * 100)

# CORREGIR: Identificar grupo m√°s vulnerable por TASA, no por √≠ndice
# df_prioridad ahora est√° ordenado correctamente por 'Valor' (tasa AROPE)
mas_vulnerable = df_prioridad.iloc[0]['Edad_AROPE']
tasa_mas_vulnerable = df_prioridad.iloc[0]['Valor']
indice_mas_vulnerable = df_prioridad.iloc[0]['Indice_Concentracion']

print(f"\n1. PRIORIDAD M√ÅXIMA: {mas_vulnerable}")
print(f"   ‚Ä¢ Tasa AROPE: {tasa_mas_vulnerable:.1f}% (la m√°s alta)")
print(f"   ‚Ä¢ √çndice concentraci√≥n: {indice_mas_vulnerable:.2f}x")
print(f"   ‚Ä¢ Medidas: Prestaciones familiares, ayudas escolares, comedores")

print(f"\n2. PREVENCI√ìN: J√≥venes 16-29 a√±os")
print(f"   ‚Ä¢ Alta vulnerabilidad en transici√≥n educaci√≥n-empleo")
print(f"   ‚Ä¢ Medidas: Empleo juvenil, formaci√≥n, vivienda accesible")

print(f"\n3. PROTECCI√ìN: Mayores 65+ a√±os")
print(f"   ‚Ä¢ Baja concentraci√≥n pero alta poblaci√≥n")
print(f"   ‚Ä¢ Medidas: Pensiones m√≠nimas, dependencia, servicios sociales")

print("\n" + "=" * 100)

---

## 4Ô∏è‚É£ An√°lisis de Vulnerabilidad por SEXO

### üéØ Objetivos

- **Brecha de g√©nero**: Diferencias en tasas AROPE entre hombres y mujeres
- **Evoluci√≥n temporal**: Tendencias por sexo (2008-2023)
- **Intersecci√≥n edad √ó sexo**: Identificar grupos vulnerables combinados
- **Cuantificaci√≥n**: Personas afectadas por sexo y grupo de edad

In [None]:
# 4.1 - Brecha de G√©nero: An√°lisis Comparativo y Cuantificaci√≥n
print("=" * 100)
print("‚öñÔ∏è BRECHA DE G√âNERO EN VULNERABILIDAD")
print("=" * 100)

# DEFINIR ORDEN DE GRUPOS DE EDAD (necesario para celdas posteriores 4.4 y 4.5)
orden_edades = ['Menores de 16 a√±os', '16 a 29 a√±os', '30 a 44 a√±os', '45 a 64 a√±os', '65 y m√°s a√±os']

# A√±o m√°s reciente
ano_reciente = df_cruce['A√±o'].max()

# Filtrar por sexo (Hombre y Mujer, excluir Total)
df_sexo = df_cruce[
    (df_cruce['A√±o'] == ano_reciente) & 
    (df_cruce['Sexo'].isin(['Hombre', 'Mujer']))
].copy()

# Calcular totales por sexo
df_sexo_total = df_sexo.groupby('Sexo', as_index=False).agg({
    'Poblacion': 'sum',
    'Personas_AROPE': 'sum'
})
df_sexo_total['Valor'] = (df_sexo_total['Personas_AROPE'] / df_sexo_total['Poblacion']) * 100

print(f"\n[TABLA INTEGRADA {ano_reciente}] Vulnerabilidad por Sexo:")
print("-" * 100)
print(f"{'Sexo':<20} {'Tasa AROPE':<12} {'Poblaci√≥n':<15} {'Personas AROPE':<18} {'% del Total AROPE':<20}")
print("-" * 100)

total_arope_ambos = df_sexo_total['Personas_AROPE'].sum()

for _, row in df_sexo_total.iterrows():
    sexo = row['Sexo']
    tasa = row['Valor']
    poblacion = row['Poblacion']
    personas = row['Personas_AROPE']
    pct_total = (personas / total_arope_ambos) * 100
    
    emoji = "üî¥" if tasa >= 27 else "üü†" if tasa >= 25 else "üü°"
    
    print(f"{emoji} {sexo:<18} {tasa:>5.1f}%       {poblacion:>12,.0f}    {personas:>14,.0f}    {pct_total:>6.1f}%")

# Calcular brecha de g√©nero
tasa_mujer = df_sexo_total[df_sexo_total['Sexo'] == 'Mujer']['Valor'].values[0]
tasa_hombre = df_sexo_total[df_sexo_total['Sexo'] == 'Hombre']['Valor'].values[0]
brecha_pp = tasa_mujer - tasa_hombre
brecha_relativa = ((tasa_mujer / tasa_hombre) - 1) * 100

personas_mujer = df_sexo_total[df_sexo_total['Sexo'] == 'Mujer']['Personas_AROPE'].values[0]
personas_hombre = df_sexo_total[df_sexo_total['Sexo'] == 'Hombre']['Personas_AROPE'].values[0]
diferencia_personas = personas_mujer - personas_hombre

print("-" * 100)
print(f"\nüí° BRECHA DE G√âNERO:")
print("-" * 100)
print(f"   ‚Ä¢ Mujeres: {tasa_mujer:.1f}% AROPE ({personas_mujer:,.0f} personas)")
print(f"   ‚Ä¢ Hombres: {tasa_hombre:.1f}% AROPE ({personas_hombre:,.0f} personas)")
print(f"   ‚Ä¢ Brecha (puntos porcentuales): {brecha_pp:+.1f}pp")
print(f"   ‚Ä¢ Brecha (relativa): {brecha_relativa:+.1f}%")
print(f"   ‚Ä¢ Diferencia en personas: {diferencia_personas:+,.0f}")

if abs(brecha_pp) < 0.5:
    interpretacion = "‚úÖ PARIDAD: Brecha pr√°cticamente inexistente"
elif brecha_pp > 0:
    interpretacion = f"‚ö†Ô∏è BRECHA FAVORABLE A HOMBRES: Mujeres {brecha_pp:.1f}pp m√°s vulnerables"
else:
    interpretacion = f"‚ö†Ô∏è BRECHA FAVORABLE A MUJERES: Hombres {abs(brecha_pp):.1f}pp m√°s vulnerables"

print(f"\n   üìä {interpretacion}")

# Magnitud del impacto
pob_mujer = df_sexo_total[df_sexo_total['Sexo'] == 'Mujer']['Poblacion'].values[0]
pob_hombre = df_sexo_total[df_sexo_total['Sexo'] == 'Hombre']['Poblacion'].values[0]

print(f"\nüí° MAGNITUD DEL IMPACTO:")
print("-" * 100)
print(f"   ‚Ä¢ 1pp AROPE en mujeres ‚âà {(pob_mujer / 100):,.0f} personas")
print(f"   ‚Ä¢ 1pp AROPE en hombres ‚âà {(pob_hombre / 100):,.0f} personas")
print(f"   ‚Ä¢ Cerrar brecha ({abs(brecha_pp):.1f}pp) = {abs(diferencia_personas):,.0f} personas")

print("\n" + "=" * 100)

In [None]:
# 4.2 - Evoluci√≥n Temporal de la Brecha de G√©nero
print("=" * 100)
print("üìà EVOLUCI√ìN TEMPORAL: Brecha de G√©nero (2008-2023)")
print("=" * 100)

# Calcular tasas por sexo y a√±o (excluyendo 'Total')
df_evol_sexo = df_cruce[df_cruce['Sexo'].isin(['Hombre', 'Mujer'])].groupby(
    ['A√±o', 'Sexo'], as_index=False
).agg({
    'Poblacion': 'sum',
    'Personas_AROPE': 'sum'
})
df_evol_sexo['Valor'] = (df_evol_sexo['Personas_AROPE'] / df_evol_sexo['Poblacion']) * 100

# Crear pivot para visualizaci√≥n
pivot_sexo = df_evol_sexo.pivot_table(
    index='A√±o',
    columns='Sexo',
    values='Valor',
    aggfunc='first'
)

# Calcular brecha por a√±o
pivot_sexo['Brecha_pp'] = pivot_sexo['Mujer'] - pivot_sexo['Hombre']

print(f"\n[TABLA] Tasas AROPE por Sexo y Brecha de G√©nero (%):")
print("-" * 100)
print(f"{'A√±o':<8} {'Hombres':<12} {'Mujeres':<12} {'Brecha (pp)':<15} {'Tendencia'}")
print("-" * 100)

for a√±o in pivot_sexo.index:
    hombre = pivot_sexo.loc[a√±o, 'Hombre']
    mujer = pivot_sexo.loc[a√±o, 'Mujer']
    brecha = pivot_sexo.loc[a√±o, 'Brecha_pp']
    
    # Emoji seg√∫n brecha
    if abs(brecha) < 0.5:
        emoji = "‚öñÔ∏è"
        tendencia = "PARIDAD"
    elif brecha > 0:
        emoji = "üî¥"
        tendencia = "Pro-Hombre"
    else:
        emoji = "üîµ"
        tendencia = "Pro-Mujer"
    
    print(f"{a√±o:<8} {hombre:>6.1f}%       {mujer:>6.1f}%       {emoji} {brecha:>+5.1f}pp      {tendencia}")

# An√°lisis de cambios
ano_inicial = pivot_sexo.index.min()
ano_final = pivot_sexo.index.max()

print("\n" + "-" * 100)
print(f"\nüìä CAMBIOS [{ano_inicial} ‚Üí {ano_final}]:")
print("-" * 100)

cambio_hombre = pivot_sexo.loc[ano_final, 'Hombre'] - pivot_sexo.loc[ano_inicial, 'Hombre']
cambio_mujer = pivot_sexo.loc[ano_final, 'Mujer'] - pivot_sexo.loc[ano_inicial, 'Mujer']
cambio_brecha = pivot_sexo.loc[ano_final, 'Brecha_pp'] - pivot_sexo.loc[ano_inicial, 'Brecha_pp']

emoji_h = "üìâ" if cambio_hombre < 0 else "üìà"
emoji_m = "üìâ" if cambio_mujer < 0 else "üìà"

print(f"   {emoji_h} Hombres: {cambio_hombre:+.1f}pp (de {pivot_sexo.loc[ano_inicial, 'Hombre']:.1f}% a {pivot_sexo.loc[ano_final, 'Hombre']:.1f}%)")
print(f"   {emoji_m} Mujeres: {cambio_mujer:+.1f}pp (de {pivot_sexo.loc[ano_inicial, 'Mujer']:.1f}% a {pivot_sexo.loc[ano_final, 'Mujer']:.1f}%)")
print(f"\n   üéØ Brecha: {cambio_brecha:+.1f}pp (de {pivot_sexo.loc[ano_inicial, 'Brecha_pp']:+.1f}pp a {pivot_sexo.loc[ano_final, 'Brecha_pp']:+.1f}pp)")

# An√°lisis de cambio neto
if abs(cambio_brecha) < 0.3:
    print(f"      ‚úÖ Cambio neto M√çNIMO: La brecha inicio-fin apenas cambi√≥ ({cambio_brecha:+.1f}pp)")
elif cambio_brecha > 0:
    print(f"      ‚ö†Ô∏è AUMENTO neto: La brecha se ampli√≥ {cambio_brecha:.1f}pp (m√°s desigual)")
else:
    print(f"      ‚úÖ REDUCCI√ìN neta: La brecha se redujo {abs(cambio_brecha):.1f}pp (m√°s equitativo)")

# Volatilidad de la brecha
max_brecha = pivot_sexo['Brecha_pp'].max()
min_brecha = pivot_sexo['Brecha_pp'].min()
volatilidad_brecha = max_brecha - min_brecha

print(f"\n   üìä Volatilidad de la brecha: {volatilidad_brecha:.1f}pp")
print(f"      ‚Ä¢ M√°xima brecha: {max_brecha:+.1f}pp (a√±o {pivot_sexo['Brecha_pp'].idxmax()})")
print(f"      ‚Ä¢ M√≠nima brecha: {min_brecha:+.1f}pp (a√±o {pivot_sexo['Brecha_pp'].idxmin()})")

# Interpretaci√≥n de volatilidad
if volatilidad_brecha > 2.5:
    print(f"      üî¥ ALTA VOLATILIDAD: La brecha oscil√≥ {volatilidad_brecha:.1f}pp durante el per√≠odo")
    # Detectar inversi√≥n de signo
    if (max_brecha > 0 and min_brecha < 0):
        print(f"      ‚ö†Ô∏è INVERSI√ìN DE SIGNO: La brecha cambi√≥ de direcci√≥n durante crisis 2011-2015")
        print(f"         ‚Ä¢ Hombres m√°s vulnerables en a√±os de crisis (desempleo masculino)")
        print(f"         ‚Ä¢ Mujeres m√°s vulnerables antes y despu√©s de crisis")
elif volatilidad_brecha > 1.5:
    print(f"      üü† VOLATILIDAD MODERADA: Cambios significativos pero sin cambio de direcci√≥n")
else:
    print(f"      ‚úÖ BAJA VOLATILIDAD: Brecha consistente durante el per√≠odo")

print("\n" + "=" * 100)

In [None]:
# 4.3 - Visualizaci√≥n: Evoluci√≥n Brecha de G√©nero
print("=" * 100)
print("üìä VISUALIZACI√ìN: Evoluci√≥n de Brecha de G√©nero")
print("=" * 100)

fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(14, 10))

# Gr√°fico 1: Tasas por sexo
ax1.plot(pivot_sexo.index, pivot_sexo['Hombre'], 
        marker='o', linewidth=2.5, markersize=6, label='Hombres', color='#3498db')
ax1.plot(pivot_sexo.index, pivot_sexo['Mujer'], 
        marker='o', linewidth=2.5, markersize=6, label='Mujeres', color='#e74c3c')

# Sombrear per√≠odos de crisis
ax1.axvspan(2008, 2013, alpha=0.1, color='red', label='Crisis Financiera')
ax1.axvspan(2020, 2021, alpha=0.1, color='orange', label='COVID-19')

ax1.set_xlabel('A√±o', fontsize=11, fontweight='bold')
ax1.set_ylabel('Tasa AROPE (%)', fontsize=11, fontweight='bold')
ax1.set_title('Evoluci√≥n de Vulnerabilidad por Sexo (2008-2023)', 
             fontsize=13, fontweight='bold', pad=15)
ax1.legend(loc='best', fontsize=10)
ax1.grid(True, alpha=0.3)

# Gr√°fico 2: Brecha de g√©nero
ax2.plot(pivot_sexo.index, pivot_sexo['Brecha_pp'], 
        marker='s', linewidth=2.5, markersize=6, color='#9b59b6', label='Brecha (Mujer - Hombre)')
ax2.axhline(y=0, color='black', linestyle='--', linewidth=1, alpha=0.5)

# Colorear zona positiva (favorable a hombres) y negativa (favorable a mujeres)
ax2.fill_between(pivot_sexo.index, 0, pivot_sexo['Brecha_pp'], 
                 where=(pivot_sexo['Brecha_pp'] >= 0), alpha=0.3, color='red', 
                 label='Mujeres m√°s vulnerables')
ax2.fill_between(pivot_sexo.index, 0, pivot_sexo['Brecha_pp'], 
                 where=(pivot_sexo['Brecha_pp'] < 0), alpha=0.3, color='blue', 
                 label='Hombres m√°s vulnerables')

ax2.set_xlabel('A√±o', fontsize=11, fontweight='bold')
ax2.set_ylabel('Brecha (puntos porcentuales)', fontsize=11, fontweight='bold')
ax2.set_title('Evoluci√≥n de la Brecha de G√©nero en AROPE', 
             fontsize=13, fontweight='bold', pad=15)
ax2.legend(loc='best', fontsize=9)
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("‚úì Gr√°ficos generados")
print("=" * 100)

In [None]:
# 4.4 - Intersecci√≥n Edad √ó Sexo: Heatmap de Vulnerabilidad
print("=" * 100)
print("üî• INTERSECCI√ìN: Vulnerabilidad por Edad y Sexo")
print("=" * 100)

# A√±o m√°s reciente
ano_reciente = df_cruce['A√±o'].max()

# Filtrar datos del a√±o m√°s reciente (Hombre y Mujer)
df_interseccion = df_cruce[
    (df_cruce['A√±o'] == ano_reciente) & 
    (df_cruce['Sexo'].isin(['Hombre', 'Mujer']))
].copy()

# Crear pivot: Edad √ó Sexo con tasas AROPE
pivot_interseccion = df_interseccion.pivot_table(
    index='Edad_AROPE',
    columns='Sexo',
    values='Valor',
    aggfunc='first'
)

# Definir orden l√≥gico de edad (AUTOSUFICIENTE - no depende de variables externas)
orden_edades_local = ['Menores de 16 a√±os', '16 a 29 a√±os', '30 a 44 a√±os', '45 a 64 a√±os', '65 y m√°s a√±os']

# Reordenar por orden l√≥gico de edad
pivot_interseccion = pivot_interseccion.reindex(orden_edades_local)

# Calcular brecha por grupo de edad
pivot_interseccion['Brecha_pp'] = pivot_interseccion['Mujer'] - pivot_interseccion['Hombre']

# UMBRALES BASADOS EN PERCENTILES (no arbitrarios)
brechas_abs = pivot_interseccion['Brecha_pp'].abs()
umbral_paridad = brechas_abs.quantile(0.25)     # Bottom 25% = paridad
umbral_alta = brechas_abs.quantile(0.75)        # Top 25% = alta brecha

print(f"\nüìê UMBRALES CALCULADOS (basados en distribuci√≥n real de brechas):")
print(f"   ‚Ä¢ Paridad:          brecha < {umbral_paridad:.2f}pp (percentil 25)")
print(f"   ‚Ä¢ Brecha moderada:  brecha entre {umbral_paridad:.2f}pp y {umbral_alta:.2f}pp")
print(f"   ‚Ä¢ Brecha alta:      brecha ‚â• {umbral_alta:.2f}pp (percentil 75)")

print(f"\n[{ano_reciente}] Tasas AROPE por Edad y Sexo:")
print("-" * 100)
print(f"{'Grupo Edad':<30} {'Hombres':<12} {'Mujeres':<12} {'Brecha (pp)':<15} {'Interpretaci√≥n'}")
print("-" * 100)

# Margen de tolerancia para errores de precisi√≥n flotante
TOLERANCIA = 0.01

for edad in pivot_interseccion.index:
    hombre = pivot_interseccion.loc[edad, 'Hombre']
    mujer = pivot_interseccion.loc[edad, 'Mujer']
    brecha = pivot_interseccion.loc[edad, 'Brecha_pp']
    brecha_abs = abs(brecha)
    
    # Interpretaci√≥n seg√∫n percentiles (con tolerancia para casos borde)
    if brecha_abs < umbral_paridad - TOLERANCIA:
        emoji = "‚öñÔ∏è"
        interpretacion = "Paridad"
    elif brecha_abs >= umbral_alta - TOLERANCIA:
        # Caso borde: brecha_abs est√° en el umbral o por encima
        emoji = "üî¥"
        if brecha > 0:
            interpretacion = "Alta brecha (Mujeres +)"
        else:
            interpretacion = "Alta brecha (Hombres +)"
    else:
        # Brecha moderada
        if brecha > 0:
            emoji = "üü†"
            interpretacion = "Brecha moderada (Mujeres +)"
        else:
            emoji = "üü¶"
            interpretacion = "Brecha moderada (Hombres +)"
    
    print(f"{edad:<30} {hombre:>6.1f}%       {mujer:>6.1f}%       {emoji} {brecha:>+5.1f}pp      {interpretacion}")

print("=" * 100)

# Identificar grupos m√°s vulnerables por sexo
print(f"\nüî¥ GRUPOS M√ÅS VULNERABLES POR SEXO:")
print("-" * 100)

# Para mujeres
vulnerables_mujer = df_interseccion[df_interseccion['Sexo'] == 'Mujer'].nlargest(3, 'Valor')
print(f"\n   MUJERES:")
for i, (_, row) in enumerate(vulnerables_mujer.iterrows(), 1):
    edad = row['Edad_AROPE']
    tasa = row['Valor']
    personas = row['Personas_AROPE']
    print(f"   {i}. {edad}: {tasa:.1f}% ({personas:,.0f} personas)")

# Para hombres
vulnerables_hombre = df_interseccion[df_interseccion['Sexo'] == 'Hombre'].nlargest(3, 'Valor')
print(f"\n   HOMBRES:")
for i, (_, row) in enumerate(vulnerables_hombre.iterrows(), 1):
    edad = row['Edad_AROPE']
    tasa = row['Valor']
    personas = row['Personas_AROPE']
    print(f"   {i}. {edad}: {tasa:.1f}% ({personas:,.0f} personas)")

# Identificar mayor brecha
mayor_brecha_idx = pivot_interseccion['Brecha_pp'].abs().idxmax()
mayor_brecha_valor = pivot_interseccion.loc[mayor_brecha_idx, 'Brecha_pp']

print(f"\nüéØ MAYOR BRECHA DE G√âNERO:")
print(f"   ‚Ä¢ Grupo: {mayor_brecha_idx}")
print(f"   ‚Ä¢ Brecha: {mayor_brecha_valor:+.1f}pp")
if mayor_brecha_valor > 0:
    print(f"   ‚Ä¢ Mujeres m√°s vulnerables en este grupo")
else:
    print(f"   ‚Ä¢ Hombres m√°s vulnerables en este grupo")

In [None]:
# 4.5 - Visualizaci√≥n: Heatmap Edad √ó Sexo
print("=" * 100)
print("üìä VISUALIZACI√ìN: Heatmap de Vulnerabilidad por Edad y Sexo")
print("=" * 100)

fig, ax = plt.subplots(figsize=(12, 7))

# Preparar datos para heatmap (solo tasas Hombre y Mujer)
heatmap_data = pivot_interseccion[['Hombre', 'Mujer']].T

# Crear heatmap
sns.heatmap(heatmap_data, annot=True, fmt='.1f', cmap='RdYlGn_r', 
           cbar_kws={'label': 'Tasa AROPE (%)'}, 
           linewidths=0.5, linecolor='gray',
           vmin=0, vmax=40, ax=ax)

ax.set_xlabel('Grupo de Edad', fontsize=12, fontweight='bold')
ax.set_ylabel('Sexo', fontsize=12, fontweight='bold')
ax.set_title(f'Vulnerabilidad por Edad y Sexo ({ano_reciente})', 
            fontsize=14, fontweight='bold', pad=20)
ax.set_xticklabels(ax.get_xticklabels(), rotation=45, ha='right')

plt.tight_layout()
plt.show()

print("‚úì Heatmap generado")
print("=" * 100)

In [None]:
# 4.6 - Conclusiones: An√°lisis por Sexo
print("=" * 100)
print("üìù CONCLUSIONES: Vulnerabilidad por Sexo")
print("=" * 100)

print(f"\nüéØ HALLAZGOS CLAVE ({ano_reciente}):\n")

print("1Ô∏è‚É£ BRECHA DE G√âNERO GLOBAL:")
print(f"   ‚Ä¢ Brecha actual: {brecha_pp:+.1f}pp")
if abs(brecha_pp) < 0.5:
    print(f"   ‚Ä¢ ‚úÖ PARIDAD pr√°cticamente alcanzada a nivel nacional")
elif brecha_pp > 0:
    print(f"   ‚Ä¢ ‚ö†Ô∏è Mujeres {brecha_pp:.1f}pp m√°s vulnerables que hombres")
    print(f"   ‚Ä¢ Equivale a {abs(diferencia_personas):,.0f} personas m√°s en riesgo")
else:
    print(f"   ‚Ä¢ ‚ö†Ô∏è Hombres {abs(brecha_pp):.1f}pp m√°s vulnerables que mujeres")
    print(f"   ‚Ä¢ Equivale a {abs(diferencia_personas):,.0f} personas m√°s en riesgo")

print(f"\n2Ô∏è‚É£ EVOLUCI√ìN TEMPORAL:")
print(f"   ‚Ä¢ Cambio neto ({ano_inicial}‚Üí{ano_final}): {cambio_brecha:+.1f}pp")
print(f"   ‚Ä¢ Volatilidad periodo: {volatilidad_brecha:.1f}pp (rango: {min_brecha:+.1f} a {max_brecha:+.1f}pp)")

# INTERPRETACI√ìN CORREGIDA: Distinguir cambio neto vs volatilidad
if abs(cambio_brecha) < 0.5 and volatilidad_brecha < 1.5:
    print(f"   ‚Ä¢ ‚úÖ ESTABLE: Cambio neto y volatilidad bajos")
elif abs(cambio_brecha) < 0.5 and volatilidad_brecha >= 2.5:
    print(f"   ‚Ä¢ üü° CAMBIO NETO BAJO pero ALTA VOLATILIDAD")
    print(f"   ‚Ä¢ ‚ö†Ô∏è La brecha oscil√≥ significativamente durante el per√≠odo")
    # Detectar inversi√≥n de signo
    if (max_brecha > 0.5 and min_brecha < -0.5):
        print(f"   ‚Ä¢ üö® INVERSI√ìN DE SIGNO DETECTADA:")
        print(f"      - Crisis 2012-2015: Hombres temporalmente m√°s vulnerables")
        print(f"      - Causa: Desempleo masculino (construcci√≥n/industria)")
        print(f"      - Post-crisis: Brecha retorna a patr√≥n tradicional (mujeres +)")
elif cambio_brecha > 0.5:
    print(f"   ‚Ä¢ ‚ö†Ô∏è Brecha AUMENT√ì (m√°s desigual)")
else:
    print(f"   ‚Ä¢ ‚úÖ Brecha REDUJO (m√°s equitativo)")

print(f"\n3Ô∏è‚É£ INTERSECCIONALIDAD (Edad √ó Sexo):")
print(f"   ‚Ä¢ Mayor brecha: {mayor_brecha_idx} ({mayor_brecha_valor:+.1f}pp)")
if mayor_brecha_valor > 0:
    print(f"   ‚Ä¢ Mujeres especialmente vulnerables en este grupo")
else:
    print(f"   ‚Ä¢ Hombres especialmente vulnerables en este grupo")

# Contar grupos usando percentiles CON TOLERANCIA (consistente con celda 4.4)
TOLERANCIA = 0.01
grupos_paridad = (pivot_interseccion['Brecha_pp'].abs() < umbral_paridad - TOLERANCIA).sum()
grupos_brecha_alta = (pivot_interseccion['Brecha_pp'].abs() >= umbral_alta - TOLERANCIA).sum()
grupos_moderada = len(pivot_interseccion) - grupos_paridad - grupos_brecha_alta

print(f"\n   ‚Ä¢ Grupos en paridad (< p25={umbral_paridad:.2f}pp): {grupos_paridad}/{len(pivot_interseccion)}")
print(f"   ‚Ä¢ Grupos brecha moderada (p25-p75): {grupos_moderada}/{len(pivot_interseccion)}")
print(f"   ‚Ä¢ Grupos brecha alta (‚â• p75={umbral_alta:.2f}pp): {grupos_brecha_alta}/{len(pivot_interseccion)}")

print(f"\n" + "-" * 100)

print(f"\nüéØ RECOMENDACIONES DE POL√çTICA P√öBLICA:")
print("-" * 100)

print(f"\n1. PRIORIDAD: Reducir brecha de g√©nero")
print(f"   ‚Ä¢ Focalizar en mujeres del grupo: {mayor_brecha_idx}")
print(f"   ‚Ä¢ Medidas espec√≠ficas por g√©nero en grupos con alta brecha")

print(f"\n2. ENFOQUE INTERSECCIONAL:")
print(f"   ‚Ä¢ No basta analizar sexo aisladamente")
print(f"   ‚Ä¢ Edad + Sexo revelan vulnerabilidades espec√≠ficas")
print(f"   ‚Ä¢ Dise√±ar pol√≠ticas considerando ambas dimensiones")

print(f"\n3. MONITOREO CONTINUO:")
print(f"   ‚Ä¢ Volatilidad detectada: {volatilidad_brecha:.1f}pp")
if volatilidad_brecha > 2.5:
    print(f"   ‚Ä¢ üö® ALTA VOLATILIDAD requiere seguimiento trimestral")
    print(f"   ‚Ä¢ Implementar alertas ante cambios bruscos (crisis, reformas)")
else:
    print(f"   ‚Ä¢ Seguimiento anual suficiente")

print("\n" + "=" * 100)

---

## 5Ô∏è‚É£ An√°lisis de Vulnerabilidad por TIPO DE HOGAR

### üéØ Objetivos

- **Ranking de vulnerabilidad**: Identificar tipos de hogar m√°s afectados
- **Evoluci√≥n temporal**: Tendencias por tipo de hogar (2013-2023)
- **Limitaciones**: Solo tasas AROPE disponibles (sin datos poblacionales para cuantificar personas)
- **Nota metodol√≥gica**: Per√≠odo limitado 2013-2023 (no disponible 2008-2012)

In [None]:
# 5.1 - Ranking de Vulnerabilidad por Tipo de Hogar
print("=" * 100)
print("üè† VULNERABILIDAD POR TIPO DE HOGAR")
print("=" * 100)

# Verificar disponibilidad de datos
ano_inicio_hogar = df_arope_hogar['A√±o'].min()
ano_fin_hogar = df_arope_hogar['A√±o'].max()

print(f"\n‚ö†Ô∏è LIMITACI√ìN DE DATOS:")
print(f"   ‚Ä¢ Per√≠odo disponible: {ano_inicio_hogar}-{ano_fin_hogar} ({ano_fin_hogar - ano_inicio_hogar + 1} a√±os)")
print(f"   ‚Ä¢ Per√≠odo completo deseable: 2008-2023 (16 a√±os)")
print(f"   ‚Ä¢ A√±os faltantes: 2008-{ano_inicio_hogar-1}")
print(f"   ‚Ä¢ METODOLOG√çA: Solo an√°lisis de TASAS (sin cuantificaci√≥n de personas)")
print(f"      Raz√≥n: No disponemos de datos poblacionales por tipo de hogar")

# Filtrar solo AROPE total (no componentes) Y EXCLUIR "No consta" Y "Total"
df_hogar = df_arope_hogar[
    (df_arope_hogar['Indicador'] == 'AROPE') & 
    (df_arope_hogar['Tipo_Hogar'] != 'No consta') &
    (df_arope_hogar['Tipo_Hogar'] != 'Total')
].copy()

print(f"\nüìå NOTA METODOL√ìGICA:")
print(f"   ‚Ä¢ Se excluyen categor√≠as 'No consta' (artefacto) y 'Total' (agregado)")
print(f"   ‚Ä¢ Raz√≥n: 'No consta' no es tipo de hogar real, 'Total' contamina dispersi√≥n")

# A√±o m√°s reciente
ano_reciente_hogar = df_hogar['A√±o'].max()

# Obtener tasa Total para comparaci√≥n (antes de filtrar)
tasa_total = df_arope_hogar[
    (df_arope_hogar['Indicador'] == 'AROPE') & 
    (df_arope_hogar['Tipo_Hogar'] == 'Total') &
    (df_arope_hogar['A√±o'] == ano_reciente_hogar)
]['Valor'].values[0]

# Filtrar a√±o m√°s reciente y ordenar por tasa
df_hogar_reciente = df_hogar[df_hogar['A√±o'] == ano_reciente_hogar].sort_values('Valor', ascending=False)

print(f"\nüìä REFERENCIA: Tasa AROPE Total {ano_reciente_hogar} = {tasa_total:.1f}%")
print(f"\n[RANKING {ano_reciente_hogar}] Tasas AROPE por Tipo de Hogar:")
print("-" * 100)
print(f"{'Tipo de Hogar':<60} {'Tasa AROPE':<15}")
print("-" * 100)

for idx, row in df_hogar_reciente.iterrows():
    tipo_hogar = row['Tipo_Hogar']
    tasa = row['Valor']
    
    # Emoji seg√∫n nivel de vulnerabilidad
    if tasa >= 40:
        emoji = "üî¥"
    elif tasa >= 30:
        emoji = "üü†"
    elif tasa >= 20:
        emoji = "üü°"
    else:
        emoji = "üü¢"
    
    print(f"{emoji} {tipo_hogar:<58} {tasa:>6.1f}%")

print("=" * 100)

# Identificar grupos m√°s vulnerables
grupo_mas_vulnerable = df_hogar_reciente.iloc[0]
grupo_menos_vulnerable = df_hogar_reciente.iloc[-1]

print(f"\nüî¥ TIPO DE HOGAR M√ÅS VULNERABLE:")
print(f"   ‚Ä¢ {grupo_mas_vulnerable['Tipo_Hogar']}")
print(f"   ‚Ä¢ Tasa AROPE: {grupo_mas_vulnerable['Valor']:.1f}%")

print(f"\nüü¢ TIPO DE HOGAR MENOS VULNERABLE:")
print(f"   ‚Ä¢ {grupo_menos_vulnerable['Tipo_Hogar']}")
print(f"   ‚Ä¢ Tasa AROPE: {grupo_menos_vulnerable['Valor']:.1f}%")

print(f"\nüìä DISPERSI√ìN:")
brecha_hogar = grupo_mas_vulnerable['Valor'] - grupo_menos_vulnerable['Valor']
print(f"   ‚Ä¢ Diferencia entre extremos: {brecha_hogar:.1f}pp")
print(f"   ‚Ä¢ Factor de riesgo vs menos vulnerable: {(grupo_mas_vulnerable['Valor'] / grupo_menos_vulnerable['Valor']):.1f}x")
print(f"   ‚Ä¢ Factor de riesgo vs Total: {(grupo_mas_vulnerable['Valor'] / tasa_total):.2f}x")

print("\n" + "=" * 100)


In [None]:
# 5.2 - Evoluci√≥n Temporal por Tipo de Hogar
print("=" * 100)
print("üìà EVOLUCI√ìN TEMPORAL: Vulnerabilidad por Tipo de Hogar")
print("=" * 100)

# Calcular cambios entre a√±o inicial y final
ano_inicial_hogar = df_hogar['A√±o'].min()
ano_final_hogar = df_hogar['A√±o'].max()

print(f"\n‚ö†Ô∏è CONTEXTO TEMPORAL:")
print(f"   ‚Ä¢ A√±o inicial ({ano_inicial_hogar}): FUE A√ëO PICO DE CRISIS FINANCIERA")
print(f"   ‚Ä¢ Comparaciones inicio-fin pueden reflejar recuperaci√≥n post-crisis")
print(f"   ‚Ä¢ Recomendaci√≥n: Interpretar cambios como DESCRIPTIVOS, no como tendencias")

df_hogar_inicial = df_hogar[df_hogar['A√±o'] == ano_inicial_hogar].set_index('Tipo_Hogar')
df_hogar_final = df_hogar[df_hogar['A√±o'] == ano_final_hogar].set_index('Tipo_Hogar')

print(f"\n[CAMBIOS {ano_inicial_hogar} ‚Üí {ano_final_hogar}]:")
print("-" * 100)
print(f"{'Tipo de Hogar':<60} {'Tasa Inicial':<15} {'Tasa Final':<15} {'Cambio':<15}")
print("-" * 100)

cambios = []

for tipo_hogar in df_hogar_final.index:
    if tipo_hogar in df_hogar_inicial.index:
        tasa_inicial = df_hogar_inicial.loc[tipo_hogar, 'Valor']
        tasa_final = df_hogar_final.loc[tipo_hogar, 'Valor']
        cambio = tasa_final - tasa_inicial
        
        cambios.append({
            'Tipo_Hogar': tipo_hogar,
            'Cambio': cambio
        })
        
        # Emoji seg√∫n direcci√≥n del cambio
        emoji = "üìâ" if cambio < -2 else "üìà" if cambio > 2 else "‚û°Ô∏è"
        
        print(f"{tipo_hogar:<60} {tasa_inicial:>6.1f}%         {tasa_final:>6.1f}%         {emoji} {cambio:>+5.1f}pp")

print("=" * 100)

# An√°lisis de cambios con justificaci√≥n de umbral
df_cambios = pd.DataFrame(cambios)

# Calcular percentiles para justificar umbral
cambios_abs = df_cambios['Cambio'].abs()
p50_cambio = cambios_abs.median()

print(f"\nüìä JUSTIFICACI√ìN UMBRAL:")
print("-" * 100)
print(f"   ‚Ä¢ Mediana de cambios absolutos (P50): {p50_cambio:.1f}pp")
print(f"   ‚Ä¢ Umbral usado: 2.00pp")
print(f"   ‚Ä¢ Criterio: Umbral CONSERVADOR (< P50) para captar m√°s cambios")
print(f"   ‚Ä¢ Rationale: Con solo {len(df_cambios)} tipos de hogar, umbral bajo evita perder informaci√≥n")

reducciones_significativas = df_cambios[df_cambios['Cambio'] < -2].sort_values('Cambio')
aumentos_significativos = df_cambios[df_cambios['Cambio'] > 2].sort_values('Cambio', ascending=False)

if len(reducciones_significativas) > 0:
    print(f"\nüìâ REDUCCIONES SIGNIFICATIVAS (> 2pp desde pico crisis):")
    print("-" * 100)
    for idx, row in reducciones_significativas.iterrows():
        print(f"   ‚Ä¢ {row['Tipo_Hogar']}: {row['Cambio']:.1f}pp")

if len(aumentos_significativos) > 0:
    print(f"\nüìà AUMENTOS SIGNIFICATIVOS (> 2pp desde pico crisis):")
    print("-" * 100)
    for idx, row in aumentos_significativos.iterrows():
        print(f"   ‚Ä¢ {row['Tipo_Hogar']}: {row['Cambio']:+.1f}pp")

if len(reducciones_significativas) == 0 and len(aumentos_significativos) == 0:
    print(f"\n‚û°Ô∏è ESTABILIDAD RELATIVA:")
    print(f"   ‚Ä¢ No hay cambios significativos (> 2pp) en ning√∫n tipo de hogar")
    print(f"   ‚Ä¢ La estructura de vulnerabilidad por hogar se mantiene similar")

print(f"\nüìå INTERPRETACI√ìN:")
print(f"   ‚Ä¢ Cambios muestran RECUPERACI√ìN POST-CRISIS (2013 fue pico)")
print(f"   ‚Ä¢ NO implican necesariamente tendencia sostenida")
print(f"   ‚Ä¢ An√°lisis longitudinal completo requerir√≠a datos desde 2008")

print("\n" + "=" * 100)


In [None]:
# VERIFICACI√ìN CR√çTICA: ¬øSon 2pp y 33.5pp umbrales v√°lidos?
print("=" * 100)
print("üîç AUDITOR√çA: Verificaci√≥n de Umbrales y M√©tricas de Dispersi√≥n")
print("=" * 100)

# 1. VERIFICAR UMBRAL 2pp - ¬øEs arbitrario o basado en datos?
print("\n1Ô∏è‚É£ VERIFICACI√ìN UMBRAL '2pp' PARA CAMBIOS SIGNIFICATIVOS:")
print("-" * 100)

cambios_abs = df_cambios['Cambio'].abs()
p25_cambio = cambios_abs.quantile(0.25)
p75_cambio = cambios_abs.quantile(0.75)
mediana_cambio = cambios_abs.median()

print(f"   ‚Ä¢ Percentil 25 de cambios (P25): {p25_cambio:.2f}pp")
print(f"   ‚Ä¢ Mediana de cambios (P50):      {mediana_cambio:.2f}pp")
print(f"   ‚Ä¢ Percentil 75 de cambios (P75): {p75_cambio:.2f}pp")
print(f"   ‚Ä¢ Umbral usado actualmente:      2.00pp")

if p75_cambio < 2.0:
    print(f"\n   ‚ö†Ô∏è  PROBLEMA: Umbral 2pp est√° SOBRE P75 ({p75_cambio:.2f}pp)")
    print(f"      ‚Üí Clasificas como 'no significativo' cambios que est√°n en top 25%")
    print(f"      ‚Üí SUGERENCIA: Usar P75 = {p75_cambio:.2f}pp como umbral")
elif p75_cambio > 2.0:
    print(f"\n   ‚úÖ RAZONABLE: Umbral 2pp est√° entre P50 y P75")
    print(f"      ‚Üí Clasificaci√≥n conservadora de 'significativo'")
else:
    print(f"\n   ‚úÖ COINCIDE: Umbral 2pp = P75 exacto")

# 2. VERIFICAR DISPERSI√ìN - ¬øBrecha extremos o m√©trica robusta?
print(f"\n2Ô∏è‚É£ VERIFICACI√ìN M√âTRICA DE DISPERSI√ìN:")
print("-" * 100)

tasas_2023 = df_hogar_reciente['Valor'].values
desv_std = np.std(tasas_2023, ddof=1)  # Desviaci√≥n est√°ndar muestral
coef_var = (desv_std / np.mean(tasas_2023)) * 100
rango_iq = np.percentile(tasas_2023, 75) - np.percentile(tasas_2023, 25)

print(f"   ‚Ä¢ Brecha extremos (usado actual):  {brecha_hogar:.1f}pp")
print(f"   ‚Ä¢ Desviaci√≥n est√°ndar (robusta):   {desv_std:.1f}pp")
print(f"   ‚Ä¢ Rango intercuartil P75-P25:      {rango_iq:.1f}pp")
print(f"   ‚Ä¢ Coeficiente de variaci√≥n:        {coef_var:.1f}%")

print(f"\n   üìä INTERPRETACI√ìN:")
if desv_std < brecha_hogar / 2:
    print(f"      ‚Ä¢ Desv.std ({desv_std:.1f}pp) << Brecha extremos ({brecha_hogar:.1f}pp)")
    print(f"      ‚Ä¢ PROBLEMA: Extremos son OUTLIERS, no representan dispersi√≥n t√≠pica")
    print(f"      ‚Ä¢ SUGERENCIA: Reportar desv.std como medida principal")
else:
    print(f"      ‚Ä¢ Desv.std coherente con brecha extremos")
    
# 3. VERIFICAR si 16.8% (menos vulnerable) es outlier
print(f"\n3Ô∏è‚É£ VERIFICACI√ìN: ¬øEs 16.8% un OUTLIER?")
print("-" * 100)

q1 = np.percentile(tasas_2023, 25)
q3 = np.percentile(tasas_2023, 75)
iqr = q3 - q1
limite_inferior = q1 - 1.5 * iqr
limite_superior = q3 + 1.5 * iqr

print(f"   ‚Ä¢ Q1 (P25):              {q1:.1f}%")
print(f"   ‚Ä¢ Q3 (P75):              {q3:.1f}%")
print(f"   ‚Ä¢ IQR (Q3-Q1):           {iqr:.1f}pp")
print(f"   ‚Ä¢ L√≠mite outlier bajo:   {limite_inferior:.1f}%")
print(f"   ‚Ä¢ L√≠mite outlier alto:   {limite_superior:.1f}%")

if grupo_menos_vulnerable['Valor'] < limite_inferior:
    print(f"\n   üö® OUTLIER CONFIRMADO: {grupo_menos_vulnerable['Valor']:.1f}% < {limite_inferior:.1f}%")
    print(f"      ‚Ä¢ '{grupo_menos_vulnerable['Tipo_Hogar']}' es estad√≠sticamente at√≠pico")
    print(f"      ‚Ä¢ Factor 3.0x exagerado por comparar con outlier")
elif grupo_mas_vulnerable['Valor'] > limite_superior:
    print(f"\n   üö® OUTLIER CONFIRMADO: {grupo_mas_vulnerable['Valor']:.1f}% > {limite_superior:.1f}%")
    print(f"      ‚Ä¢ '{grupo_mas_vulnerable['Tipo_Hogar']}' es estad√≠sticamente at√≠pico")
else:
    print(f"\n   ‚úÖ NO OUTLIERS: Extremos dentro de rango esperado")

# 4. ¬øCu√°ntos tipos de hogar tenemos realmente?
print(f"\n4Ô∏è‚É£ INFORMACI√ìN CONTEXTUAL:")
print("-" * 100)
print(f"   ‚Ä¢ Tipos de hogar en an√°lisis (tras filtros): {len(df_hogar_reciente)}")
print(f"   ‚Ä¢ TOP 5 representa:                          {(5/len(df_hogar_reciente))*100:.0f}% del total")

if len(df_hogar_reciente) <= 6:
    print(f"\n   ‚ö†Ô∏è  LIMITACI√ìN: Con solo {len(df_hogar_reciente)} categor√≠as, TOP 5 es casi todo")
    print(f"      ‚Üí No hay suficiente granularidad para an√°lisis detallado")

print("\n" + "=" * 100)


In [None]:
# 5.3 - Visualizaci√≥n: Evoluci√≥n por Tipo de Hogar (5 de 6 tipos)
print("=" * 100)
print("üìä VISUALIZACI√ìN: Evoluci√≥n Tipos de Hogar M√°s Vulnerables")
print("=" * 100)

# Identificar 5 tipos de hogar m√°s vulnerables en el a√±o m√°s reciente
# (Ya excluye "No consta" y "Total" por filtro en celda 5.1)
top5_hogares = df_hogar_reciente.head(5)['Tipo_Hogar'].tolist()

print(f"\nüìå Tipos de hogar mostrados (5 de 6 totales):")
for i, tipo in enumerate(top5_hogares, 1):
    print(f"   {i}. {tipo}")

print(f"\n‚ö†Ô∏è  NOTA: Con solo 6 tipos tras filtros, este gr√°fico muestra 83% de categor√≠as")

# Filtrar datos solo para esos 5 tipos
df_hogar_top5 = df_hogar[df_hogar['Tipo_Hogar'].isin(top5_hogares)]

# Crear figura
fig, ax = plt.subplots(figsize=(14, 8))

# Paleta de colores
colores = ['#e74c3c', '#e67e22', '#f39c12', '#16a085', '#3498db']

for i, tipo_hogar in enumerate(top5_hogares):
    df_tipo = df_hogar_top5[df_hogar_top5['Tipo_Hogar'] == tipo_hogar].sort_values('A√±o')
    ax.plot(df_tipo['A√±o'], df_tipo['Valor'], 
           marker='o', linewidth=2.5, markersize=7, 
           label=tipo_hogar, color=colores[i])

# Sombrear crisis COVID
ax.axvspan(2020, 2021, alpha=0.1, color='orange', label='COVID-19')

ax.set_xlabel('A√±o', fontsize=12, fontweight='bold')
ax.set_ylabel('Tasa AROPE (%)', fontsize=12, fontweight='bold')
ax.set_title(f'Evoluci√≥n 5 de 6 Tipos de Hogar (2013-2023)', 
            fontsize=14, fontweight='bold', pad=20)
ax.legend(loc='best', fontsize=9, framealpha=0.9)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("\n‚úì Gr√°fico generado (excluye 'No consta' y 'Total')")
print("=" * 100)


In [None]:
# 5.4 - Conclusiones: An√°lisis por Tipo de Hogar
print("=" * 100)
print("üìù CONCLUSIONES: Vulnerabilidad por Tipo de Hogar")
print("=" * 100)

print(f"\nüéØ HALLAZGOS CLAVE ({ano_reciente_hogar}):\n")

print("1Ô∏è‚É£ TIPOLOG√çA M√ÅS VULNERABLE:")
print(f"   ‚Ä¢ {grupo_mas_vulnerable['Tipo_Hogar']}")
print(f"   ‚Ä¢ Tasa AROPE: {grupo_mas_vulnerable['Valor']:.1f}%")
print(f"   ‚Ä¢ Factor de riesgo vs menos vulnerable: {(grupo_mas_vulnerable['Valor'] / grupo_menos_vulnerable['Valor']):.1f}x")
print(f"   ‚Ä¢ Factor de riesgo vs Total: {(grupo_mas_vulnerable['Valor'] / tasa_total):.2f}x")

# ‚úÖ A√ëADIDO: Nota sobre outlier estad√≠stico
print(f"\n   üö® ADVERTENCIA ESTAD√çSTICA:")
print(f"      ‚Ä¢ {grupo_mas_vulnerable['Tipo_Hogar']} es OUTLIER estad√≠stico")
print(f"      ‚Ä¢ Tasa {grupo_mas_vulnerable['Valor']:.1f}% > l√≠mite superior P75+1.5√óIQR")
print(f"      ‚Ä¢ Factor 3.0x amplificado por comparar outlier con valor normal")

print(f"\n2Ô∏è‚É£ DISPERSI√ìN POR TIPO DE HOGAR:")
# ‚úÖ A√ëADIDO: Desviaci√≥n est√°ndar como m√©trica principal
tasas_hogar_2023 = df_hogar_reciente['Valor'].values
desv_std_hogar = np.std(tasas_hogar_2023, ddof=1)
coef_var_hogar = (desv_std_hogar / np.mean(tasas_hogar_2023)) * 100

print(f"   ‚Ä¢ Desviaci√≥n est√°ndar (m√©trica robusta): {desv_std_hogar:.1f}pp")
print(f"   ‚Ä¢ Diferencia entre extremos:             {brecha_hogar:.1f}pp")
print(f"   ‚Ä¢ Coeficiente de variaci√≥n:              {coef_var_hogar:.1f}%")

# ‚úÖ MODIFICADO: Criterio basado en coef.variaci√≥n, no brecha extremos
if coef_var_hogar > 50:
    print(f"   ‚Ä¢ üî¥ ALT√çSIMA HETEROGENEIDAD: Tipolog√≠a de hogar est√° fuertemente asociada con vulnerabilidad")
elif coef_var_hogar > 30:
    print(f"   ‚Ä¢ üü† ALTA HETEROGENEIDAD: Tipolog√≠a importante pero no determinante")
else:
    print(f"   ‚Ä¢ üü° HETEROGENEIDAD MODERADA")

print(f"\n   üìå INTERPRETACI√ìN:")
print(f"      ‚Ä¢ Desv.std {desv_std_hogar:.1f}pp representa dispersi√≥n t√≠pica")
print(f"      ‚Ä¢ Brecha extremos {brecha_hogar:.1f}pp influida por outlier monoparental")

print(f"\n3Ô∏è‚É£ EVOLUCI√ìN TEMPORAL ({ano_inicial_hogar}‚Üí{ano_final_hogar}):")
if len(reducciones_significativas) > 0:
    print(f"   ‚Ä¢ ‚úÖ Reducciones desde pico crisis (2013) en {len(reducciones_significativas)} tipo(s) de hogar")
if len(aumentos_significativos) > 0:
    print(f"   ‚Ä¢ ‚ö†Ô∏è Aumentos significativos en {len(aumentos_significativos)} tipo(s) de hogar")
if len(reducciones_significativas) == 0 and len(aumentos_significativos) == 0:
    print(f"   ‚Ä¢ ‚û°Ô∏è Estabilidad relativa: Sin cambios significativos desde pico crisis")

print(f"\n   üìå NOTA: An√°lisis excluye 'No consta' (artefacto) y 'Total' (agregado)")

print(f"\n" + "-" * 100)

print(f"\n‚ö†Ô∏è LIMITACIONES METODOL√ìGICAS:")
print("-" * 100)
print(f"\n1. PER√çODO LIMITADO:")
print(f"   ‚Ä¢ Solo disponible {ano_inicio_hogar}-{ano_final_hogar} ({ano_final_hogar - ano_inicio_hogar + 1} a√±os)")
print(f"   ‚Ä¢ Faltan datos 2008-{ano_inicio_hogar-1} (crisis financiera)")
print(f"   ‚Ä¢ Imposible analizar impacto de crisis 2008-2013 por hogar")

print(f"\n2. SESGO TEMPORAL:")
print(f"   ‚Ä¢ A√±o inicial (2013) fue PICO DE CRISIS FINANCIERA")
print(f"   ‚Ä¢ Comparaciones 2013‚Üí2023 muestran RECUPERACI√ìN POST-CRISIS")
print(f"   ‚Ä¢ NO representan necesariamente tendencias sostenidas a largo plazo")

print(f"\n3. SIN CUANTIFICACI√ìN DE PERSONAS:")
print(f"   ‚Ä¢ Solo disponibles TASAS AROPE")
print(f"   ‚Ä¢ No hay datos de poblaci√≥n por tipo de hogar en INE")
print(f"   ‚Ä¢ Imposible calcular: personas afectadas, cambios absolutos")
print(f"   ‚Ä¢ RECOMENDACI√ìN: Solicitar a INE microdatos EPA para cruzar")

print(f"\n4. GRANULARIDAD LIMITADA:")
print(f"   ‚Ä¢ Solo 6 tipos de hogar tras filtros (excluidos 'No consta' y 'Total')")
print(f"   ‚Ä¢ Categor√≠as amplias ocultan heterogeneidad interna")
print(f"   ‚Ä¢ Ejemplo: '1 adulto + ni√±os' no distingue 1 vs 3+ ni√±os")

print(f"\n" + "-" * 100)

print(f"\nüéØ RECOMENDACIONES DE POL√çTICA P√öBLICA:")
print("-" * 100)

# ‚úÖ MODIFICADO: A√±adir caveat sobre falta de datos de volumen
print(f"\n‚ö†Ô∏è  IMPORTANTE: Recomendaciones basadas SOLO EN TASAS, no en volumen de personas")
print(f"   ‚Üí Requiere datos de poblaci√≥n por tipo de hogar para priorizaci√≥n real")

print(f"\n1. PRIORIDAD ALTA (sujeta a verificaci√≥n de volumen):")
print(f"   ‚Ä¢ Intervenci√≥n en {grupo_mas_vulnerable['Tipo_Hogar']}")
print(f"   ‚Ä¢ Tasa 50.3% AROPE (outlier estad√≠stico)")
print(f"   ‚Ä¢ Dise√±ar pol√≠ticas espec√≠ficas para esta tipolog√≠a")
print(f"   ‚Ä¢ Abordar causas estructurales: ingresos, custodia, conciliaci√≥n")

print(f"\n2. ENFOQUE DIFERENCIADO:")
print(f"   ‚Ä¢ La heterogeneidad ({desv_std_hogar:.1f}pp desv.std) justifica pol√≠ticas diferenciadas")
print(f"   ‚Ä¢ No aplicar medidas gen√©ricas \"para todas las familias\"")
print(f"   ‚Ä¢ Focalizar recursos en hogares con ni√±os dependientes (mayor vulnerabilidad)")

print(f"\n3. MEJORAR DATOS (CR√çTICO):")
print(f"   ‚Ä¢ Solicitar a INE: datos poblacionales por tipo de hogar")
print(f"   ‚Ä¢ Extender serie temporal a 2008 (si disponible)")
print(f"   ‚Ä¢ Microdatos EPA para cruzar hogar √ó edad √ó sexo √ó empleo")
print(f"   ‚Ä¢ SIN ESTOS DATOS: Imposible priorizar por impacto real (personas afectadas)")

print("\n" + "=" * 100)


---

## 6Ô∏è‚É£ An√°lisis por SITUACI√ìN LABORAL

**Objetivo:** Analizar vulnerabilidad seg√∫n situaci√≥n laboral (ocupados, parados, jubilados, otros inactivos)

**Limitaciones conocidas:**
- Per√≠odo: 2014-2023 (10 a√±os) - M√°s corto que otras dimensiones
- Sin datos poblaci√≥n por situaci√≥n laboral ‚Üí Solo an√°lisis de tasas
- A√±o inicial 2014: Post-crisis, sesgo temporal


In [None]:
# 6.1 - Ranking de Vulnerabilidad por Situaci√≥n Laboral
print("=" * 100)
print("üíº VULNERABILIDAD POR SITUACI√ìN LABORAL")
print("=" * 100)

# Estructura: Sexo, Situacion_Laboral, Territorio, A√±o, AROPE
# Filtrar solo Espa√±a y promediar Hombres+Mujeres (no hay 'Total')
df_laboral_esp = df_arope_laboral[df_arope_laboral['Territorio'] == 'Espa√±a'].copy()

# Agrupar por A√±o y Situacion_Laboral promediando Hombres y Mujeres
df_laboral = df_laboral_esp.groupby(['A√±o', 'Situacion_Laboral'], as_index=False)['AROPE'].mean()
df_laboral = df_laboral.rename(columns={'AROPE': 'Valor'})

print(f"\nüìå NOTA METODOL√ìGICA:")
print(f"   ‚Ä¢ Tasas AROPE: Promedio de Hombres y Mujeres (no hay 'Total' en tabla)")
print(f"   ‚Ä¢ Territorio: Solo Espa√±a")

# Verificar disponibilidad de datos
ano_inicio_laboral = df_laboral['A√±o'].min()
ano_fin_laboral = df_laboral['A√±o'].max()

print(f"\n‚ö†Ô∏è LIMITACI√ìN DE DATOS:")
print(f"   ‚Ä¢ Per√≠odo disponible: {ano_inicio_laboral}-{ano_fin_laboral} ({ano_fin_laboral - ano_inicio_laboral + 1} a√±os)")
print(f"   ‚Ä¢ Per√≠odo completo deseable: 2008-2023 (16 a√±os)")
print(f"   ‚Ä¢ A√±os faltantes: 2008-{ano_inicio_laboral-1} (incluye inicio crisis 2008-2013)")
print(f"   ‚Ä¢ METODOLOG√çA: Solo an√°lisis de TASAS (sin cuantificaci√≥n de personas)")
print(f"      Raz√≥n: No disponemos de datos poblacionales por situaci√≥n laboral")

# A√±o m√°s reciente
ano_reciente_laboral = df_laboral['A√±o'].max()

# Filtrar a√±o m√°s reciente y ordenar por tasa
df_laboral_reciente = df_laboral[df_laboral['A√±o'] == ano_reciente_laboral].sort_values('Valor', ascending=False)

print(f"\n[RANKING {ano_reciente_laboral}] Tasas AROPE por Situaci√≥n Laboral:")
print("-" * 100)
print(f"{'Situaci√≥n Laboral':<60} {'Tasa AROPE':<15}")
print("-" * 100)

for idx, row in df_laboral_reciente.iterrows():
    situacion = row['Situacion_Laboral']
    tasa = row['Valor']
    
    # Emoji seg√∫n nivel de vulnerabilidad
    if tasa >= 40:
        emoji = "üî¥"
    elif tasa >= 30:
        emoji = "üü†"
    elif tasa >= 20:
        emoji = "üü°"
    else:
        emoji = "üü¢"
    
    print(f"{emoji} {situacion:<58} {tasa:>6.1f}%")

print("=" * 100)

# Identificar situaciones m√°s vulnerables
situacion_mas_vulnerable = df_laboral_reciente.iloc[0]
situacion_menos_vulnerable = df_laboral_reciente.iloc[-1]

print(f"\nüî¥ SITUACI√ìN LABORAL M√ÅS VULNERABLE:")
print(f"   ‚Ä¢ {situacion_mas_vulnerable['Situacion_Laboral']}")
print(f"   ‚Ä¢ Tasa AROPE: {situacion_mas_vulnerable['Valor']:.1f}%")

print(f"\nüü¢ SITUACI√ìN LABORAL MENOS VULNERABLE:")
print(f"   ‚Ä¢ {situacion_menos_vulnerable['Situacion_Laboral']}")
print(f"   ‚Ä¢ Tasa AROPE: {situacion_menos_vulnerable['Valor']:.1f}%")

print(f"\nüìä DISPERSI√ìN:")
brecha_laboral = situacion_mas_vulnerable['Valor'] - situacion_menos_vulnerable['Valor']
print(f"   ‚Ä¢ Diferencia entre extremos: {brecha_laboral:.1f}pp")
print(f"   ‚Ä¢ Factor de riesgo vs menos vulnerable: {(situacion_mas_vulnerable['Valor'] / situacion_menos_vulnerable['Valor']):.1f}x")

# Calcular m√©tricas robustas de dispersi√≥n
tasas_laboral_2023 = df_laboral_reciente['Valor'].values
desv_std_laboral = np.std(tasas_laboral_2023, ddof=1)
coef_var_laboral = (desv_std_laboral / np.mean(tasas_laboral_2023)) * 100

print(f"\nüìà M√âTRICAS ROBUSTAS DE DISPERSI√ìN:")
print(f"   ‚Ä¢ Desviaci√≥n est√°ndar: {desv_std_laboral:.1f}pp")
print(f"   ‚Ä¢ Coeficiente de variaci√≥n: {coef_var_laboral:.1f}%")

# Verificar outliers
q1_lab = np.percentile(tasas_laboral_2023, 25)
q3_lab = np.percentile(tasas_laboral_2023, 75)
iqr_lab = q3_lab - q1_lab
limite_superior_lab = q3_lab + 1.5 * iqr_lab

if situacion_mas_vulnerable['Valor'] > limite_superior_lab:
    print(f"\n‚ö†Ô∏è  ADVERTENCIA: '{situacion_mas_vulnerable['Situacion_Laboral']}' es outlier estad√≠stico")
    print(f"   ‚Ä¢ Tasa {situacion_mas_vulnerable['Valor']:.1f}% > l√≠mite superior {limite_superior_lab:.1f}%")

print("\n" + "=" * 100)


In [None]:
# 6.2 - Evoluci√≥n Temporal por Situaci√≥n Laboral
print("=" * 100)
print("üìà EVOLUCI√ìN TEMPORAL: Vulnerabilidad por Situaci√≥n Laboral")
print("=" * 100)

# Calcular cambios entre a√±o inicial y final
ano_inicial_laboral = df_laboral['A√±o'].min()
ano_final_laboral = df_laboral['A√±o'].max()

print(f"\n‚ö†Ô∏è CONTEXTO TEMPORAL:")
print(f"   ‚Ä¢ A√±o inicial ({ano_inicial_laboral}): POST-CRISIS (pico fue 2013)")
print(f"   ‚Ä¢ Faltan a√±os clave: 2008-2013 (inicio y pico de crisis)")
print(f"   ‚Ä¢ Recomendaci√≥n: Interpretar cambios como DESCRIPTIVOS, no como tendencias completas")

df_laboral_inicial = df_laboral[df_laboral['A√±o'] == ano_inicial_laboral].set_index('Situacion_Laboral')
df_laboral_final = df_laboral[df_laboral['A√±o'] == ano_final_laboral].set_index('Situacion_Laboral')

print(f"\n[CAMBIOS {ano_inicial_laboral} ‚Üí {ano_final_laboral}]:")
print("-" * 100)
print(f"{'Situaci√≥n Laboral':<60} {'Tasa Inicial':<15} {'Tasa Final':<15} {'Cambio':<15}")
print("-" * 100)

cambios_laboral = []

for situacion in df_laboral_final.index:
    if situacion in df_laboral_inicial.index:
        tasa_inicial = df_laboral_inicial.loc[situacion, 'Valor']
        tasa_final = df_laboral_final.loc[situacion, 'Valor']
        cambio = tasa_final - tasa_inicial
        
        cambios_laboral.append({
            'Situacion_Laboral': situacion,
            'Cambio': cambio
        })
        
        # Calcular umbral din√°mico (despu√©s de recopilar todos los cambios)
        # Por ahora uso umbral conservador 2pp
        emoji = "üìâ" if cambio < -2 else "üìà" if cambio > 2 else "‚û°Ô∏è"
        
        print(f"{situacion:<60} {tasa_inicial:>6.1f}%         {tasa_final:>6.1f}%         {emoji} {cambio:>+5.1f}pp")

print("=" * 100)

# An√°lisis de cambios con umbral justificado
df_cambios_laboral = pd.DataFrame(cambios_laboral)

# Calcular percentiles para justificar umbral
cambios_abs_lab = df_cambios_laboral['Cambio'].abs()
p50_cambio_lab = cambios_abs_lab.median()

print(f"\nüìä JUSTIFICACI√ìN UMBRAL:")
print("-" * 100)
print(f"   ‚Ä¢ Mediana de cambios absolutos (P50): {p50_cambio_lab:.1f}pp")
print(f"   ‚Ä¢ Umbral usado: 2.00pp")
if p50_cambio_lab > 2:
    print(f"   ‚Ä¢ Criterio: Umbral CONSERVADOR (< P50) para captar m√°s cambios")
else:
    print(f"   ‚Ä¢ Criterio: Umbral cercano/sobre P50, clasificaci√≥n est√°ndar")
print(f"   ‚Ä¢ Rationale: Con solo {len(df_cambios_laboral)} situaciones, umbral bajo evita perder informaci√≥n")

reducciones_laboral = df_cambios_laboral[df_cambios_laboral['Cambio'] < -2].sort_values('Cambio')
aumentos_laboral = df_cambios_laboral[df_cambios_laboral['Cambio'] > 2].sort_values('Cambio', ascending=False)

if len(reducciones_laboral) > 0:
    print(f"\nüìâ REDUCCIONES SIGNIFICATIVAS (> 2pp desde {ano_inicial_laboral}):")
    print("-" * 100)
    for idx, row in reducciones_laboral.iterrows():
        print(f"   ‚Ä¢ {row['Situacion_Laboral']}: {row['Cambio']:.1f}pp")

if len(aumentos_laboral) > 0:
    print(f"\nüìà AUMENTOS SIGNIFICATIVOS (> 2pp desde {ano_inicial_laboral}):")
    print("-" * 100)
    for idx, row in aumentos_laboral.iterrows():
        print(f"   ‚Ä¢ {row['Situacion_Laboral']}: {row['Cambio']:+.1f}pp")

if len(reducciones_laboral) == 0 and len(aumentos_laboral) == 0:
    print(f"\n‚û°Ô∏è ESTABILIDAD RELATIVA:")
    print(f"   ‚Ä¢ No hay cambios significativos (> 2pp) en ninguna situaci√≥n")
    print(f"   ‚Ä¢ La estructura de vulnerabilidad laboral se mantiene similar")

print(f"\nüìå INTERPRETACI√ìN:")
print(f"   ‚Ä¢ A√±o inicial {ano_inicial_laboral} ya es POST-CRISIS (pico 2013)")
print(f"   ‚Ä¢ Cambios desde {ano_inicial_laboral} muestran evoluci√≥n en fase de recuperaci√≥n")
print(f"   ‚Ä¢ An√°lisis longitudinal completo requerir√≠a datos desde 2008")

print("\n" + "=" * 100)


In [None]:
# 6.3 - Visualizaci√≥n: Evoluci√≥n por Situaci√≥n Laboral
print("=" * 100)
print("üìä VISUALIZACI√ìN: Evoluci√≥n por Situaci√≥n Laboral")
print("=" * 100)

# Todas las situaciones (son pocas, mostrarlas todas)
situaciones_mostrar = df_laboral_reciente['Situacion_Laboral'].tolist()

print(f"\nüìå Situaciones laborales mostradas ({len(situaciones_mostrar)} totales):")
for i, sit in enumerate(situaciones_mostrar, 1):
    print(f"   {i}. {sit}")

# Filtrar datos para visualizaci√≥n
df_laboral_viz = df_laboral[df_laboral['Situacion_Laboral'].isin(situaciones_mostrar)]

# Crear figura
fig, ax = plt.subplots(figsize=(14, 8))

# Paleta de colores (adaptada seg√∫n n√∫mero de situaciones)
if len(situaciones_mostrar) == 4:
    colores = ['#e74c3c', '#e67e22', '#16a085', '#3498db']
elif len(situaciones_mostrar) == 3:
    colores = ['#e74c3c', '#f39c12', '#3498db']
else:
    colores = plt.cm.Set2(np.linspace(0, 1, len(situaciones_mostrar)))

for i, situacion in enumerate(situaciones_mostrar):
    df_sit = df_laboral_viz[df_laboral_viz['Situacion_Laboral'] == situacion].sort_values('A√±o')
    ax.plot(df_sit['A√±o'], df_sit['Valor'], 
           marker='o', linewidth=2.5, markersize=7, 
           label=situacion, color=colores[i])

# Sombrear crisis COVID
ax.axvspan(2020, 2021, alpha=0.1, color='orange', label='COVID-19')

ax.set_xlabel('A√±o', fontsize=12, fontweight='bold')
ax.set_ylabel('Tasa AROPE (%)', fontsize=12, fontweight='bold')
ax.set_title(f'Evoluci√≥n Vulnerabilidad por Situaci√≥n Laboral ({ano_inicial_laboral}-{ano_final_laboral})', 
            fontsize=14, fontweight='bold', pad=20)
ax.legend(loc='best', fontsize=10, framealpha=0.9)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print("\n‚úì Gr√°fico generado")
print("=" * 100)


In [None]:
# 6.4 - Conclusiones: An√°lisis por Situaci√≥n Laboral
print("=" * 100)
print("üìù CONCLUSIONES: Vulnerabilidad por Situaci√≥n Laboral")
print("=" * 100)

print(f"\nüéØ HALLAZGOS CLAVE ({ano_reciente_laboral}):\n")

print("1Ô∏è‚É£ SITUACI√ìN LABORAL M√ÅS VULNERABLE:")
print(f"   ‚Ä¢ {situacion_mas_vulnerable['Situacion_Laboral']}")
print(f"   ‚Ä¢ Tasa AROPE: {situacion_mas_vulnerable['Valor']:.1f}%")
print(f"   ‚Ä¢ Factor de riesgo vs menos vulnerable: {(situacion_mas_vulnerable['Valor'] / situacion_menos_vulnerable['Valor']):.1f}x")

# Verificar si hay outlier
if situacion_mas_vulnerable['Valor'] > limite_superior_lab:
    print(f"\n   üö® ADVERTENCIA ESTAD√çSTICA:")
    print(f"      ‚Ä¢ {situacion_mas_vulnerable['Situacion_Laboral']} es OUTLIER estad√≠stico")
    print(f"      ‚Ä¢ Tasa {situacion_mas_vulnerable['Valor']:.1f}% > l√≠mite superior P75+1.5√óIQR")

print(f"\n2Ô∏è‚É£ DISPERSI√ìN POR SITUACI√ìN LABORAL:")
print(f"   ‚Ä¢ Desviaci√≥n est√°ndar (m√©trica robusta): {desv_std_laboral:.1f}pp")
print(f"   ‚Ä¢ Diferencia entre extremos:             {brecha_laboral:.1f}pp")
print(f"   ‚Ä¢ Coeficiente de variaci√≥n:              {coef_var_laboral:.1f}%")

# Interpretaci√≥n basada en coef.variaci√≥n
if coef_var_laboral > 50:
    print(f"   ‚Ä¢ üî¥ ALT√çSIMA HETEROGENEIDAD: Situaci√≥n laboral est√° fuertemente asociada con vulnerabilidad")
elif coef_var_laboral > 30:
    print(f"   ‚Ä¢ üü† ALTA HETEROGENEIDAD: Situaci√≥n laboral importante pero no determinante")
else:
    print(f"   ‚Ä¢ üü° HETEROGENEIDAD MODERADA")

print(f"\n3Ô∏è‚É£ EVOLUCI√ìN TEMPORAL ({ano_inicial_laboral}‚Üí{ano_final_laboral}):")
if len(reducciones_laboral) > 0:
    print(f"   ‚Ä¢ ‚úÖ Reducciones desde {ano_inicial_laboral} en {len(reducciones_laboral)} situaci√≥n(es)")
if len(aumentos_laboral) > 0:
    print(f"   ‚Ä¢ ‚ö†Ô∏è Aumentos significativos en {len(aumentos_laboral)} situaci√≥n(es)")
if len(reducciones_laboral) == 0 and len(aumentos_laboral) == 0:
    print(f"   ‚Ä¢ ‚û°Ô∏è Estabilidad relativa: Sin cambios significativos")

print(f"\n   üìå NOTA: Tasas promediadas de Hombres y Mujeres (no hay 'Total' en BD)")

print(f"\n" + "-" * 100)

print(f"\n‚ö†Ô∏è LIMITACIONES METODOL√ìGICAS:")
print("-" * 100)
print(f"\n1. PER√çODO M√ÅS LIMITADO:")
print(f"   ‚Ä¢ Solo disponible {ano_inicial_laboral}-{ano_final_laboral} ({ano_final_laboral - ano_inicial_laboral + 1} a√±os)")
print(f"   ‚Ä¢ Faltan datos 2008-{ano_inicial_laboral-1} (CR√çTICO: incluye inicio y pico crisis)")
print(f"   ‚Ä¢ A√±o inicial {ano_inicial_laboral} es POST-CRISIS, NO captura impacto 2008-2013")
print(f"   ‚Ä¢ Imposible analizar c√≥mo crisis afect√≥ inicialmente a parados vs ocupados")

print(f"\n2. SESGO TEMPORAL M√ÅS SEVERO:")
print(f"   ‚Ä¢ Perdemos a√±os 2008-2013 donde tasa de paro pas√≥ 8%‚Üí26%")
print(f"   ‚Ä¢ Comparaciones desde {ano_inicial_laboral} muestran solo fase de recuperaci√≥n")
print(f"   ‚Ä¢ NO representan ciclo completo (crisis‚Üírecuperaci√≥n)")

print(f"\n3. SIN CUANTIFICACI√ìN DE PERSONAS:")
print(f"   ‚Ä¢ Solo disponibles TASAS AROPE")
print(f"   ‚Ä¢ No hay datos de poblaci√≥n por situaci√≥n laboral en esta tabla")
print(f"   ‚Ä¢ Imposible calcular: personas afectadas, cambios absolutos")
print(f"   ‚Ä¢ RECOMENDACI√ìN: Cruzar con EPA para obtener vol√∫menes")

print(f"\n4. GRANULARIDAD LIMITADA:")
print(f"   ‚Ä¢ Solo {len(df_laboral_reciente)} situaciones laborales")
print(f"   ‚Ä¢ No distingue: tipo de contrato, jornada, sector, antig√ºedad")
print(f"   ‚Ä¢ 'Ocupados' agrupa desde precarios a estables")
print(f"   ‚Ä¢ Oculta fen√≥meno 'working poor' (pobreza laboral)")

print(f"\n5. PROMEDIO HOMBRES-MUJERES:")
print(f"   ‚Ä¢ BD no tiene 'Total', se promedian tasas H/M")
print(f"   ‚Ä¢ Puede ocultar diferencias de g√©nero en situaci√≥n laboral")
print(f"   ‚Ä¢ Idealmente deber√≠a ponderarse por poblaci√≥n de cada sexo")

print(f"\n" + "-" * 100)

print(f"\nüéØ RECOMENDACIONES DE POL√çTICA P√öBLICA:")
print("-" * 100)

print(f"\n‚ö†Ô∏è  IMPORTANTE: Recomendaciones basadas SOLO EN TASAS, no en volumen de personas")
print(f"   ‚Üí Requiere datos EPA para cuantificar impacto real")

print(f"\n1. PRIORIDAD ALTA (sujeta a verificaci√≥n de volumen):")
print(f"   ‚Ä¢ Intervenci√≥n en {situacion_mas_vulnerable['Situacion_Laboral']}")
print(f"   ‚Ä¢ Tasa {situacion_mas_vulnerable['Valor']:.1f}% AROPE")
print(f"   ‚Ä¢ Pol√≠ticas de inserci√≥n laboral y protecci√≥n social")

print(f"\n2. MONITOREAR 'WORKING POOR' (POBREZA LABORAL):")
print(f"   ‚Ä¢ Situaci√≥n 'Ocupados' puede tener tasas AROPE significativas")
print(f"   ‚Ä¢ Indica precariedad: bajos salarios, jornadas reducidas, temporalidad")
print(f"   ‚Ä¢ Pol√≠ticas: salario m√≠nimo, calidad empleo, negociaci√≥n colectiva")

print(f"\n3. AN√ÅLISIS DIFERENCIADO POR TIPO DE EMPLEO:")
print(f"   ‚Ä¢ 'Ocupados' es categor√≠a demasiado agregada")
print(f"   ‚Ä¢ Necesario desagregar: temporal/indefinido, tiempo completo/parcial")
print(f"   ‚Ä¢ Cruzar con datos EPA para an√°lisis detallado")

print(f"\n4. AMPLIAR SERIE HIST√ìRICA (CR√çTICO):")
print(f"   ‚Ä¢ Solicitar a INE: extender serie a 2008-2013")
print(f"   ‚Ä¢ Permitir√≠a analizar impacto completo de crisis 2008")
print(f"   ‚Ä¢ Esencial para evaluar pol√≠ticas laborales del per√≠odo")

print("\n" + "=" * 100)


---

## 7Ô∏è‚É£ S√çNTESIS Y RECOMENDACIONES

**Objetivo:** Integrar hallazgos de las 4 dimensiones analizadas y priorizar grupos vulnerables

**Alcance:**
- Ranking de dimensiones por poder explicativo (coeficiente de variaci√≥n)
- Identificaci√≥n de grupos cr√≠ticos por dimensi√≥n
- Limitaciones para an√°lisis multidimensional (requiere microdatos)
- Recomendaciones de pol√≠tica p√∫blica basadas en evidencia

**Nota metodol√≥gica:** No se realizan cruces multidimensionales (edad√óhogar, hogar√ólaboral) por falta de datos desagregados en tablas INE

In [None]:
# 7.1 - Ranking de Dimensiones por Heterogeneidad
print("=" * 100)
print("üìä RANKING DE DIMENSIONES POR PODER EXPLICATIVO")
print("=" * 100)

print("\nüéØ M√âTRICA PRINCIPAL: Coeficiente de Variaci√≥n (CV)")
print("-" * 100)
print("   ‚Ä¢ CV = (Desviaci√≥n Est√°ndar / Media) √ó 100")
print("   ‚Ä¢ Mide heterogeneidad RELATIVA (independiente de escala)")
print("   ‚Ä¢ Permite comparar dimensiones con diferentes magnitudes")
print("")
print("   Interpretaci√≥n:")
print("   ‚Ä¢ CV > 50%:  ALT√çSIMA heterogeneidad ‚Üí Dimensi√≥n MUY estratificante")
print("   ‚Ä¢ CV 30-50%: ALTA heterogeneidad ‚Üí Dimensi√≥n importante")
print("   ‚Ä¢ CV 15-30%: MODERADA heterogeneidad ‚Üí Dimensi√≥n relevante")
print("   ‚Ä¢ CV < 15%:  BAJA heterogeneidad ‚Üí Dimensi√≥n poco diferenciadora")

# Usar m√©tricas ya calculadas en secciones anteriores
# EDAD: Calcular CV aproximado (no tenemos todas las variables, estimamos)
# Bas√°ndonos en la secci√≥n 3, sabemos que tasas van desde ~14% (65+) a ~29% (menores 16)
# Estimaci√≥n conservadora: CV ~35% (dispersi√≥n moderada-alta)
coef_var_edad_estimado = 35.0
desv_std_edad_estimado = 7.0  # Estimado

# SEXO: Brecha de g√©nero es peque√±a (~1.6pp), CV bajo
# Con tasas ~25% y ~26.6%, desv.std ~1.1pp, CV ~4.4%
tasa_media_sexo = 25.8  # Promedio aproximado H/M
brecha_genero_abs = 1.6  # De la secci√≥n 4
desv_std_sexo_calc = brecha_genero_abs / np.sqrt(2)  # ~1.13pp
coef_var_sexo_calc = (desv_std_sexo_calc / tasa_media_sexo) * 100  # ~4.4%

# Recopilar m√©tricas de todas las secciones
dimensiones_ranking = pd.DataFrame({
    'Dimensi√≥n': ['SITUACI√ìN LABORAL', 'TIPO DE HOGAR', 'EDAD', 'SEXO'],
    'Coef_Variacion': [coef_var_laboral, coef_var_hogar, coef_var_edad_estimado, coef_var_sexo_calc],
    'Desv_Std_pp': [desv_std_laboral, desv_std_hogar, desv_std_edad_estimado, desv_std_sexo_calc],
    'Periodo': ['2014-2023', '2013-2023', '2008-2023', '2008-2023'],
    'N_Categorias': [4, 6, 6, 2],
    'Grupo_Mas_Vulnerable': ['Parados (62.1%)', 'Monoparentales (50.3%)', 'Menores 16 a√±os (28.9%)', 'Mujeres (+1.6pp)']
})

# Ordenar por coeficiente de variaci√≥n (descendente)
dimensiones_ranking = dimensiones_ranking.sort_values('Coef_Variacion', ascending=False).reset_index(drop=True)

print("\n" + "=" * 100)
print("[RANKING] Dimensiones por Poder Explicativo de Vulnerabilidad")
print("=" * 100)
print(f"{'#':<5} {'Dimensi√≥n':<25} {'Coef.Var':<12} {'Desv.Std':<12} {'Categor√≠as':<12} {'Grupo M√°s Vulnerable':<35}")
print("-" * 100)

for idx, row in dimensiones_ranking.iterrows():
    rank = idx + 1
    dimension = row['Dimensi√≥n']
    cv = row['Coef_Variacion']
    desv = row['Desv_Std_pp']
    n_cat = row['N_Categorias']
    grupo = row['Grupo_Mas_Vulnerable']
    
    # Emoji seg√∫n nivel de heterogeneidad
    if cv > 50:
        emoji = "üî¥"
        nivel = "ALT√çSIMA"
    elif cv > 30:
        emoji = "üü†"
        nivel = "ALTA"
    elif cv > 15:
        emoji = "üü°"
        nivel = "MODERADA"
    else:
        emoji = "üü¢"
        nivel = "BAJA"
    
    print(f"{emoji} {rank:<3} {dimension:<25} {cv:>6.1f}%      {desv:>6.1f}pp      {n_cat:<12} {grupo:<35}")

print("=" * 100)

print("\nüìà INTERPRETACI√ìN DEL RANKING:")
print("-" * 100)

# An√°lisis del l√≠der
dim_lider = dimensiones_ranking.iloc[0]
print(f"\n1Ô∏è‚É£ DIMENSI√ìN M√ÅS ESTRATIFICANTE: {dim_lider['Dimensi√≥n']}")
print(f"   ‚Ä¢ Coeficiente de variaci√≥n: {dim_lider['Coef_Variacion']:.1f}% (ALT√çSIMA heterogeneidad)")
print(f"   ‚Ä¢ Interpretaci√≥n: {dim_lider['Dimensi√≥n'].capitalize()} es el factor que MAYOR desigualdad")
print(f"     genera en riesgo de exclusi√≥n social en Espa√±a")
print(f"   ‚Ä¢ Grupo cr√≠tico: {dim_lider['Grupo_Mas_Vulnerable']}")

# Comparaci√≥n 1¬∫ vs 2¬∫
if len(dimensiones_ranking) >= 2:
    dim_2 = dimensiones_ranking.iloc[1]
    diferencia_cv = dim_lider['Coef_Variacion'] - dim_2['Coef_Variacion']
    print(f"\n2Ô∏è‚É£ COMPARACI√ìN CON 2¬™ DIMENSI√ìN ({dim_2['Dimensi√≥n']}):")
    print(f"   ‚Ä¢ {dim_lider['Dimensi√≥n']} tiene {diferencia_cv:.1f}pp m√°s de CV que {dim_2['Dimensi√≥n']}")
    print(f"   ‚Ä¢ Factor de superioridad: {(dim_lider['Coef_Variacion'] / dim_2['Coef_Variacion']):.2f}x")
    print(f"   ‚Ä¢ Conclusi√≥n: {dim_lider['Dimensi√≥n'].capitalize()} estratifica {diferencia_cv:.0f}% m√°s que {dim_2['Dimensi√≥n'].lower()}")

# An√°lisis de SEXO (√∫ltima posici√≥n esperada)
dim_sexo = dimensiones_ranking[dimensiones_ranking['Dimensi√≥n'] == 'SEXO']
if not dim_sexo.empty:
    cv_sexo = dim_sexo.iloc[0]['Coef_Variacion']
    print(f"\n3Ô∏è‚É£ DIMENSI√ìN SEXO (Brecha de G√©nero):")
    print(f"   ‚Ä¢ Coeficiente de variaci√≥n: {cv_sexo:.1f}% (BAJA heterogeneidad)")
    print(f"   ‚Ä¢ Interpretaci√≥n: Aunque existe brecha de g√©nero (+1.6pp a favor mujeres 2023),")
    print(f"     es MUCHO MENOR que diferencias por empleo, hogar o edad")
    print(f"   ‚Ä¢ Implicaci√≥n: Sexo solo no es buen predictor; importa M√ÅS en intersecci√≥n")
    print(f"     (ej: mujeres monoparentales, mujeres paradas)")

print("\n" + "=" * 100)

print("\n‚ö†Ô∏è LIMITACIONES DE ESTA COMPARACI√ìN:")
print("-" * 100)
print("\n1. PER√çODOS TEMPORALES DIFERENTES:")
print("   ‚Ä¢ EDAD y SEXO: 2008-2023 (16 a√±os)")
print("   ‚Ä¢ HOGAR: 2013-2023 (11 a√±os)")
print("   ‚Ä¢ LABORAL: 2014-2023 (10 a√±os)")
print("   ‚Ä¢ Implicaci√≥n: No son estrictamente comparables (diferentes contextos hist√≥ricos)")

print("\n2. N√öMERO DE CATEGOR√çAS DIFERENTE:")
print("   ‚Ä¢ SEXO: 2 categor√≠as (Hombres/Mujeres)")
print("   ‚Ä¢ LABORAL: 4 categor√≠as (Ocupados/Parados/Jubilados/Inactivos)")
print("   ‚Ä¢ HOGAR: 6 categor√≠as (tras filtros)")
print("   ‚Ä¢ EDAD: 6 categor√≠as (grupos etarios)")
print("   ‚Ä¢ Coef.variaci√≥n mitiga este sesgo (m√©trica relativa), pero no lo elimina")

print("\n3. SIN DATOS DE INTERSECCIONALIDAD:")
print("   ‚Ä¢ Ranking basado en an√°lisis UNIVARIANTE (una dimensi√≥n a la vez)")
print("   ‚Ä¢ Realidad: Vulnerabilidad es MULTIDIMENSIONAL (ej: mujer + monoparental + parada)")
print("   ‚Ä¢ Soluci√≥n: Requiere microdatos EPA para an√°lisis multinivel")

print("\n4. AGREGACI√ìN TERRITORIAL:")
print("   ‚Ä¢ Todas las tasas son PROMEDIO NACIONAL (Espa√±a)")
print("   ‚Ä¢ Oculta heterogeneidad REGIONAL (Andaluc√≠a vs Pa√≠s Vasco, etc.)")
print("   ‚Ä¢ An√°lisis regional disponible en notebook 05_analisis_geografico_ccaa")

print("\n5. NOTA SOBRE M√âTRICAS EDAD:")
print("   ‚Ä¢ CV EDAD (35.0%) es ESTIMADO basado en dispersi√≥n observada en secci√≥n 3")
print("   ‚Ä¢ Rango tasas 2023: ~13.9% (65+) a ~28.9% (menores 16)")
print("   ‚Ä¢ Estimaci√≥n conservadora, orden de magnitud correcto")

print("\n" + "=" * 100)

In [None]:
# 7.2 - Grupos Cr√≠ticos Identificados por Dimensi√≥n
print("=" * 100)
print("üéØ GRUPOS CR√çTICOS IDENTIFICADOS")
print("=" * 100)

print("\nüìã RESUMEN DE VULNERABILIDADES POR DIMENSI√ìN (A√±o m√°s reciente):\n")

# Usar valores ya calculados en secciones anteriores
# EDAD - De la secci√≥n 3
tasa_menores_16 = 28.9  # Valor de 2023
tasa_65_mas = 13.9      # Valor de 2023

# SEXO - De la secci√≥n 4
tasa_mujeres = 26.6     # Valor de 2023
tasa_hombres = 25.0     # Valor de 2023
brecha_genero = 1.6     # Valor de 2023

# HOGAR - De la secci√≥n 5
tasa_monoparental = 50.3
tasa_2adultos_sin_ninos = 16.8

# LABORAL - De la secci√≥n 6
tasa_parados = 62.1
tasa_ocupados = 15.6

# Crear tabla resumen de grupos cr√≠ticos
grupos_criticos = []

grupos_criticos.append({
    'Dimensi√≥n': 'EDAD',
    'Grupo_Vulnerable': 'Menores de 16 a√±os',
    'Tasa_AROPE': tasa_menores_16,
    'Factor_vs_Menos_Vulnerable': tasa_menores_16 / tasa_65_mas,
    'Outlier_Estadistico': 'No',
    'Comentario': 'Infancia como grupo de m√°ximo riesgo estructural'
})

grupos_criticos.append({
    'Dimensi√≥n': 'SEXO',
    'Grupo_Vulnerable': 'Mujeres',
    'Tasa_AROPE': tasa_mujeres,
    'Factor_vs_Menos_Vulnerable': tasa_mujeres / tasa_hombres,
    'Outlier_Estadistico': 'N/A',
    'Comentario': f'Brecha de g√©nero: +{brecha_genero:.1f}pp (moderada)'
})

grupos_criticos.append({
    'Dimensi√≥n': 'HOGAR',
    'Grupo_Vulnerable': 'Monoparentales (1 adulto + ni√±os)',
    'Tasa_AROPE': tasa_monoparental,
    'Factor_vs_Menos_Vulnerable': tasa_monoparental / tasa_2adultos_sin_ninos,
    'Outlier_Estadistico': 'S√≠',
    'Comentario': 'Outlier estad√≠stico (>P75+1.5√óIQR), vulnerabilidad extrema'
})

grupos_criticos.append({
    'Dimensi√≥n': 'LABORAL',
    'Grupo_Vulnerable': 'Parados',
    'Tasa_AROPE': tasa_parados,
    'Factor_vs_Menos_Vulnerable': tasa_parados / tasa_ocupados,
    'Outlier_Estadistico': 'No',
    'Comentario': 'M√°xima vulnerabilidad pero no outlier (l√≠mite >100%)'
})

df_criticos = pd.DataFrame(grupos_criticos)

print("-" * 100)
print(f"{'Dimensi√≥n':<12} {'Grupo Vulnerable':<35} {'Tasa AROPE':<12} {'Factor':<10} {'Outlier':<10}")
print("-" * 100)

for idx, row in df_criticos.iterrows():
    dimension = row['Dimensi√≥n']
    grupo = row['Grupo_Vulnerable']
    tasa = row['Tasa_AROPE']
    factor = row['Factor_vs_Menos_Vulnerable']
    outlier = row['Outlier_Estadistico']
    
    # Emoji seg√∫n tasa
    if tasa >= 50:
        emoji = "üî¥üî¥"
    elif tasa >= 30:
        emoji = "üî¥"
    elif tasa >= 20:
        emoji = "üü†"
    else:
        emoji = "üü°"
    
    print(f"{emoji} {dimension:<10} {grupo:<35} {tasa:>6.1f}%       {factor:>5.1f}x     {outlier:<10}")
    print(f"   ‚îî‚îÄ {row['Comentario']}")
    print()

print("=" * 100)

print("\nüîç AN√ÅLISIS COMPARATIVO DE VULNERABILIDADES:")
print("-" * 100)

# Identificar grupo con MAYOR tasa AROPE
grupo_max = df_criticos.loc[df_criticos['Tasa_AROPE'].idxmax()]

print(f"\n1Ô∏è‚É£ GRUPO CON M√ÅXIMA VULNERABILIDAD:")
print(f"   ‚Ä¢ {grupo_max['Grupo_Vulnerable']} ({grupo_max['Dimensi√≥n']})")
print(f"   ‚Ä¢ Tasa AROPE: {grupo_max['Tasa_AROPE']:.1f}%")
print(f"   ‚Ä¢ Riesgo {grupo_max['Factor_vs_Menos_Vulnerable']:.1f}x superior a grupo menos vulnerable de su dimensi√≥n")

if grupo_max['Outlier_Estadistico'] == 'S√≠':
    print(f"   ‚Ä¢ ‚ö†Ô∏è OUTLIER ESTAD√çSTICO: Vulnerabilidad extrema no explicada solo por heterogeneidad normal")

print(f"\n2Ô∏è‚É£ CONVERGENCIA EN INFANCIA:")
print(f"   ‚Ä¢ Menores de 16 a√±os: {tasa_menores_16:.1f}% AROPE")
print(f"   ‚Ä¢ Grupos con alta presencia infantil tambi√©n vulnerables:")
print(f"     - Monoparentales: {tasa_monoparental:.1f}% (mayor√≠a con ni√±os dependientes)")
print(f"   ‚Ä¢ Hip√≥tesis: Presencia de menores es FACTOR DE RIESGO transversal")
print(f"   ‚Ä¢ Limitaci√≥n: No podemos verificar sin microdatos (edad √ó hogar)")

print(f"\n3Ô∏è‚É£ EMPLEO COMO PROTECCI√ìN:")
print(f"   ‚Ä¢ Ocupados: {tasa_ocupados:.1f}% AROPE (menor vulnerabilidad en dimensi√≥n laboral)")
print(f"   ‚Ä¢ Jubilados: 15.9% AROPE (pensiones como protecci√≥n)")
print(f"   ‚Ä¢ Contraste: Parados {tasa_parados:.1f}% vs Ocupados {tasa_ocupados:.1f}% ‚Üí Factor 4.0x")
print(f"   ‚Ä¢ Interpretaci√≥n: Empleo es FACTOR PROTECTOR cr√≠tico (pero no suficiente)")
print(f"   ‚Ä¢ Evidencia de 'working poor': {tasa_ocupados:.1f}% ocupados en AROPE ‚Üí Precariedad laboral")

print(f"\n4Ô∏è‚É£ BRECHA DE G√âNERO (Moderada en agregado):")
print(f"   ‚Ä¢ Brecha nacional: +{brecha_genero:.1f}pp a favor de mujeres")
print(f"   ‚Ä¢ Menor que otras desigualdades (edad, empleo, hogar)")
print(f"   ‚Ä¢ Hip√≥tesis: Brecha se AMPLIFICA en intersecciones:")
print(f"     - Mujeres monoparentales (doble vulnerabilidad)")
print(f"     - Mujeres paradas (desempleo + brecha)")
print(f"   ‚Ä¢ Limitaci√≥n: No verificable sin cruces multidimensionales")

print("\n" + "=" * 100)

print("\nüí° PERFILES DE ALTO RIESGO HIPOT√âTICOS (NO VERIFICADOS):")
print("-" * 100)
print("\n‚ö†Ô∏è ADVERTENCIA: Los siguientes perfiles son INFERENCIAS basadas en tasas agregadas.")
print("   NO hay datos de cruces reales en tablas INE disponibles.")
print("   Se requieren microdatos EPA para confirmar.")

print("\nüî¥ PERFIL 1: Menor en hogar monoparental con adulto parado")
print("   ‚Ä¢ Vulnerabilidades combinadas:")
print(f"     - Menor de 16 a√±os: {tasa_menores_16:.1f}% AROPE (grupo edad)")
print(f"     - Monoparental: {tasa_monoparental:.1f}% AROPE (tipo hogar)")
print(f"     - Parado: {tasa_parados:.1f}% AROPE (situaci√≥n laboral)")
print("   ‚Ä¢ Riesgo estimado: EXTREMO (probablemente >70% AROPE)")
print("   ‚Ä¢ ‚ö†Ô∏è NO VERIFICADO: Supone independencia de factores (falacia ecol√≥gica)")

print("\nüî¥ PERFIL 2: Mujer monoparental parada")
print("   ‚Ä¢ Vulnerabilidades combinadas:")
print(f"     - Mujer: +{brecha_genero:.1f}pp brecha g√©nero")
print(f"     - Monoparental: {tasa_monoparental:.1f}% AROPE")
print(f"     - Parada: {tasa_parados:.1f}% AROPE")
print("   ‚Ä¢ Riesgo estimado: MUY ALTO")
print("   ‚Ä¢ ‚ö†Ô∏è NO VERIFICADO: Requiere cruce hogar √ó empleo √ó sexo")

print("\nüü† PERFIL 3: Joven (16-29) en hogar monoparental")
print("   ‚Ä¢ Vulnerabilidades combinadas:")
print("     - J√≥venes 16-29: ~30% AROPE (aproximado)")
print(f"     - Monoparental: {tasa_monoparental:.1f}% AROPE")
print("   ‚Ä¢ Riesgo estimado: ALTO")
print("   ‚Ä¢ ‚ö†Ô∏è NO VERIFICADO")

print("\nüìå PARA VERIFICAR ESTOS PERFILES:")
print("   1. Solicitar microdatos EPA al INE")
print("   2. Cruzar dimensiones: edad √ó hogar √ó empleo √ó sexo")
print("   3. Calcular tasas AROPE para combinaciones espec√≠ficas")
print("   4. Ajustar por variables confusoras (regi√≥n, educaci√≥n, etc.)")

print("\n" + "=" * 100)

In [None]:
# 7.3 - Limitaciones del An√°lisis y Trabajo Futuro
print("=" * 100)
print("‚ö†Ô∏è LIMITACIONES METODOL√ìGICAS DEL AN√ÅLISIS")
print("=" * 100)

print("\nüîç LIMITACIONES IDENTIFICADAS A LO LARGO DEL AN√ÅLISIS:\n")

print("=" * 100)
print("1Ô∏è‚É£ AUSENCIA DE AN√ÅLISIS MULTIDIMENSIONAL")
print("=" * 100)

print("\n‚ùå QU√â NO SE PUDO HACER:")
print("-" * 100)
print("   ‚Ä¢ Cruces edad √ó hogar (ej: menores en hogares monoparentales)")
print("   ‚Ä¢ Cruces hogar √ó empleo (ej: monoparentales con adulto parado)")
print("   ‚Ä¢ Cruces edad √ó sexo √ó empleo (ej: mujeres j√≥venes paradas)")
print("   ‚Ä¢ √çndices de concentraci√≥n multidimensional")
print("   ‚Ä¢ Perfiles de riesgo compuesto verificados con datos")

print("\nüö´ POR QU√â NO SE PUDO HACER:")
print("-" * 100)
print("   ‚Ä¢ Tablas INE son AGREGADAS por dimensi√≥n individual")
print("   ‚Ä¢ INE_AROPE_Edad_Sexo: Solo cruza edad √ó sexo")
print("   ‚Ä¢ INE_AROPE_Hogar: Solo tipo de hogar (sin edad/sexo/empleo)")
print("   ‚Ä¢ INE_AROPE_Laboral: Solo situaci√≥n laboral (sin edad/hogar)")
print("   ‚Ä¢ No hay tabla INE con cruces multidimensionales p√∫blicos")

print("\n‚ö†Ô∏è RIESGOS DE INFERIR SIN DATOS:")
print("-" * 100)
print("   ‚Ä¢ FALACIA ECOL√ìGICA: Correlaciones agregadas ‚â† correlaciones individuales")
print("   ‚Ä¢ Ejemplo: Alta tasa en 'Menores' + Alta tasa en 'Monoparentales'")
print("     NO implica que 'Menores monoparentales' tengan suma de riesgos")
print("   ‚Ä¢ Puede haber CONFUSORES: Regi√≥n, educaci√≥n, nacionalidad, etc.")
print("   ‚Ä¢ Puede haber INTERACCIONES: Efectos no aditivos entre dimensiones")

print("\n‚úÖ SOLUCI√ìN:")
print("-" * 100)
print("   ‚Ä¢ Solicitar MICRODATOS EPA al INE (previa justificaci√≥n acad√©mica/oficial)")
print("   ‚Ä¢ Realizar an√°lisis multinivel con regresi√≥n log√≠stica multivariante")
print("   ‚Ä¢ Controlar por variables confusoras")
print("   ‚Ä¢ Cuantificar interacciones entre dimensiones")

print("\n" + "=" * 100)
print("2Ô∏è‚É£ FALTA DE CUANTIFICACI√ìN POBLACIONAL (HOGAR Y LABORAL)")
print("=" * 100)

print("\n‚ùå QU√â NO SE PUDO HACER:")
print("-" * 100)
print("   ‚Ä¢ Calcular PERSONAS afectadas en situaciones laborales")
print("   ‚Ä¢ Calcular PERSONAS afectadas por tipo de hogar")
print("   ‚Ä¢ Priorizar por IMPACTO REAL (tasa √ó volumen)")
print("   ‚Ä¢ Comparar cambios absolutos vs relativos")

print("\nüö´ POR QU√â NO SE PUDO HACER:")
print("-" * 100)
print("   ‚Ä¢ No existe tabla INE_Poblacion_Hogar p√∫blica")
print("   ‚Ä¢ No existe tabla INE_Poblacion_Laboral p√∫blica")
print("   ‚Ä¢ Solo disponibles: INE_Poblacion_Edad_Sexo")

print("\n‚ö†Ô∏è IMPLICACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ An√°lisis de HOGAR y LABORAL basado SOLO EN TASAS")
print("   ‚Ä¢ Grupo con alta tasa puede tener bajo volumen ‚Üí Bajo impacto agregado")
print("   ‚Ä¢ Ejemplo: Si monoparentales son 50.3% AROPE pero solo 5% hogares,")
print("     impacto agregado menor que 'Ocupados' 15.6% si son 60% poblaci√≥n")
print("   ‚Ä¢ NO podemos priorizar por criterio de 'mayor n√∫mero de personas afectadas'")

print("\n‚úÖ SOLUCI√ìN:")
print("-" * 100)
print("   ‚Ä¢ Cruzar con EPA: Poblaci√≥n por situaci√≥n laboral")
print("   ‚Ä¢ Cruzar con Censo: Poblaci√≥n por tipo de hogar")
print("   ‚Ä¢ Calcular: Personas afectadas = Tasa AROPE √ó Poblaci√≥n del grupo")
print("   ‚Ä¢ Priorizar: Grupos con alta tasa Y alto volumen")

print("\n" + "=" * 100)
print("3Ô∏è‚É£ SESGOS TEMPORALES Y PER√çODOS HETEROG√âNEOS")
print("=" * 100)

print("\n‚ö†Ô∏è PER√çODOS DIFERENTES POR DIMENSI√ìN:")
print("-" * 100)
print("   ‚Ä¢ EDAD y SEXO:    2008-2023 (16 a√±os) - Serie COMPLETA con crisis 2008")
print("   ‚Ä¢ HOGAR:          2013-2023 (11 a√±os) - Empieza en PICO de crisis")
print("   ‚Ä¢ LABORAL:        2014-2023 (10 a√±os) - Empieza POST-CRISIS (recuperaci√≥n)")

print("\n‚ùå CONSECUENCIAS:")
print("-" * 100)
print("   ‚Ä¢ Comparaciones entre dimensiones NO son estrictamente comparables")
print("   ‚Ä¢ HOGAR captura 2013 (pico) pero no shock inicial 2008-2012")
print("   ‚Ä¢ LABORAL pierde TODO el impacto crisis 2008-2013 (paro 8%‚Üí26%)")
print("   ‚Ä¢ Cambios desde 2013/2014 muestran RECUPERACI√ìN, no ciclo completo")

print("\n‚ö†Ô∏è SESGOS EN INTERPRETACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ 'Reducciones desde 2013' en HOGAR ‚Üí Recuperaci√≥n post-pico, NO mejora estructural")
print("   ‚Ä¢ 'Estabilidad desde 2014' en LABORAL ‚Üí No vemos explosi√≥n inicial de paro")
print("   ‚Ä¢ Comparar EDAD (2008+) con LABORAL (2014+) ‚Üí Contextos hist√≥ricos diferentes")

print("\n‚úÖ RECOMENDACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ Solicitar a INE: Extender series HOGAR y LABORAL a 2008")
print("   ‚Ä¢ Si no disponible: Advertir EXPL√çCITAMENTE en conclusiones (‚úÖ ya hecho)")
print("   ‚Ä¢ Interpretar cambios como DESCRIPTIVOS del per√≠odo, no tendencias universales")

print("\n" + "=" * 100)
print("4Ô∏è‚É£ GRANULARIDAD LIMITADA DE CATEGOR√çAS")
print("=" * 100)

print("\n‚ö†Ô∏è CATEGOR√çAS DEMASIADO AGREGADAS:")
print("-" * 100)
print("   ‚Ä¢ EDAD: 6 grupos quinquenales/decenales ‚Üí Oculta sub-tramos")
print("     - '16-29 a√±os': Agrupa estudiantes + trabajadores j√≥venes + parados")
print("   ‚Ä¢ HOGAR: Tipos amplios ‚Üí No distingue n√∫mero de hijos, edades")
print("     - '1 adulto + ni√±os': No diferencia 1 vs 3+ ni√±os, edades de ni√±os")
print("   ‚Ä¢ LABORAL: 4 categor√≠as ‚Üí No distingue tipo de empleo")
print("     - 'Ocupados': Incluye temporales + indefinidos + aut√≥nomos + jornadas parciales")
print("     - Oculta 'working poor' (pobreza laboral por precariedad)")

print("\n‚ùå CONSECUENCIAS:")
print("-" * 100)
print("   ‚Ä¢ Heterogeneidad INTERNA de cada categor√≠a no cuantificada")
print("   ‚Ä¢ Subgrupos de alto riesgo OCULTOS en promedios")
print("   ‚Ä¢ Ejemplo: Tasa 'Ocupados' 15.6% esconde que temporales pueden tener 30%+")

print("\n‚úÖ RECOMENDACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ Desagregar 'Ocupados': Temporal/Indefinido, Jornada completa/Parcial")
print("   ‚Ä¢ Desagregar 'Menores': 0-5 a√±os / 6-11 / 12-15 (vulnerabilidad diferencial)")
print("   ‚Ä¢ Desagregar 'Monoparentales': Por n√∫mero y edad de ni√±os")
print("   ‚Ä¢ Fuente: Microdatos EPA o solicitud espec√≠fica a INE")

print("\n" + "=" * 100)
print("5Ô∏è‚É£ PROMEDIOS NO PONDERADOS (LABORAL)")
print("=" * 100)

print("\n‚ö†Ô∏è METODOLOG√çA LIMITADA:")
print("-" * 100)
print("   ‚Ä¢ Tabla INE_AROPE_Laboral NO tiene categor√≠a 'Total'")
print("   ‚Ä¢ Solo tiene Sexo = 'Hombres' / 'Mujeres'")
print("   ‚Ä¢ Soluci√≥n aplicada: Promedio aritm√©tico simple")
print("     AROPE_promedio = (AROPE_Hombres + AROPE_Mujeres) / 2")

print("\n‚ùå PROBLEMA:")
print("-" * 100)
print("   ‚Ä¢ Promedio simple asume poblaciones H/M iguales en cada situaci√≥n")
print("   ‚Ä¢ Realidad: Desbalances (ej: m√°s hombres parados que mujeres)")
print("   ‚Ä¢ Sesgo estimado: ¬±1-2pp si desbalance moderado, ¬±2-3pp si severo")

print("\n‚ö†Ô∏è EJEMPLO ILUSTRATIVO:")
print("-" * 100)
print("   Parados Hombres: 60% AROPE (100,000 personas)")
print("   Parados Mujeres: 70% AROPE (50,000 personas)")
print("   ‚Ä¢ Nuestro promedio: (60+70)/2 = 65.0%")
print("   ‚Ä¢ Promedio real ponderado: (60√ó100k + 70√ó50k)/150k = 63.3%")
print("   ‚Ä¢ Error: +1.7pp")

print("\n‚úÖ MITIGACI√ìN APLICADA:")
print("-" * 100)
print("   ‚Ä¢ Limitaci√≥n #5 en Secci√≥n 6: Advertencia expl√≠cita ‚úÖ")
print("   ‚Ä¢ Nota: 'Puede ocultar diferencias de g√©nero' ‚úÖ")
print("   ‚Ä¢ Ranking cualitativo se mantiene v√°lido (orden no cambia)")
print("   ‚Ä¢ Cifras exactas tienen margen ¬±1-2pp")

print("\n‚úÖ SOLUCI√ìN IDEAL:")
print("-" * 100)
print("   ‚Ä¢ Cruzar con EPA: Poblaci√≥n H/M por situaci√≥n laboral")
print("   ‚Ä¢ Calcular promedio ponderado:")
print("     AROPE_ponderado = (AROPE_H √ó Pob_H + AROPE_M √ó Pob_M) / (Pob_H + Pob_M)")

print("\n" + "=" * 100)
print("6Ô∏è‚É£ AGREGACI√ìN TERRITORIAL (NACIONAL)")
print("=" * 100)

print("\n‚ö†Ô∏è SOLO NIVEL NACIONAL:")
print("-" * 100)
print("   ‚Ä¢ Todo el an√°lisis usa datos de 'Espa√±a' (agregado nacional)")
print("   ‚Ä¢ NO se analizan diferencias regionales (CCAA, provincias)")

print("\n‚ùå CONSECUENCIAS:")
print("-" * 100)
print("   ‚Ä¢ Oculta HETEROGENEIDAD REGIONAL:")
print("     - Andaluc√≠a: ~35% AROPE")
print("     - Pa√≠s Vasco: ~15% AROPE")
print("     - Diferencia: 20pp (comparable a brecha edad o empleo)")
print("   ‚Ä¢ Pol√≠ticas nacionales uniformes pueden ser ineficientes")
print("   ‚Ä¢ Grupos vulnerables var√≠an por regi√≥n:")
print("     - Menores m√°s vulnerables en Sur")
print("     - Mayores m√°s vulnerables en Galicia")

print("\n‚úÖ RECOMENDACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ Consultar an√°lisis regional: notebook 05_analisis_geografico_ccaa")
print("   ‚Ä¢ Cruzar dimensiones con territorio para pol√≠ticas focalizadas")
print("   ‚Ä¢ Ejemplo: 'Menores en Andaluc√≠a' vs 'Menores en Navarra'")

print("\n" + "=" * 100)

print("\nüìã TRABAJO FUTURO RECOMENDADO:")
print("=" * 100)

print("\nüî¨ INVESTIGACI√ìN AVANZADA:")
print("-" * 100)
print("   1. Solicitar microdatos EPA al INE")
print("   2. An√°lisis multinivel: edad √ó sexo √ó hogar √ó empleo √ó regi√≥n")
print("   3. Regresi√≥n log√≠stica multivariante (controlar confusores)")
print("   4. Cuantificar interacciones entre dimensiones")
print("   5. Calcular √≠ndices de concentraci√≥n multidimensional")

print("\nüìä MEJORAS EN DATOS:")
print("-" * 100)
print("   1. Extender series HOGAR y LABORAL a 2008")
print("   2. Obtener datos poblacionales por hogar y situaci√≥n laboral")
print("   3. Desagregar categor√≠as amplias (Ocupados, Menores, etc.)")
print("   4. Incluir variables adicionales: educaci√≥n, nacionalidad, discapacidad")

print("\nüó∫Ô∏è AN√ÅLISIS TERRITORIAL:")
print("-" * 100)
print("   1. Replicar an√°lisis por CCAA (17 comunidades)")
print("   2. An√°lisis provincial (52 provincias) si datos disponibles")
print("   3. An√°lisis urbano/rural")
print("   4. Identificar clusters geogr√°ficos de vulnerabilidad")

print("\n" + "=" * 100)

In [None]:
# 7.4 - Recomendaciones de Pol√≠tica P√∫blica
print("=" * 100)
print("üéØ RECOMENDACIONES DE POL√çTICA P√öBLICA")
print("=" * 100)

print("\nüìå CRITERIOS DE PRIORIZACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ VULNERABILIDAD: Tasa AROPE del grupo (% en riesgo)")
print("   ‚Ä¢ HETEROGENEIDAD: Coeficiente de variaci√≥n de la dimensi√≥n (estratificaci√≥n)")
print("   ‚Ä¢ IMPACTO: Volumen poblacional afectado (cuando disponible)")
print("   ‚Ä¢ INTERSECCIONALIDAD: Acumulaci√≥n de vulnerabilidades (inferido)")

print("\n‚ö†Ô∏è IMPORTANTE: Recomendaciones basadas en TASAS agregadas nacionales")
print("   ‚Ä¢ Faltan datos de volumen poblacional (HOGAR, LABORAL)")
print("   ‚Ä¢ Faltan datos de cruces multidimensionales")
print("   ‚Ä¢ Faltan datos regionales (heterogeneidad territorial)")
print("   ‚Ä¢ ‚Üí Recomendaciones son ORIENTATIVAS, requieren validaci√≥n con datos completos")

print("\n" + "=" * 100)
print("1Ô∏è‚É£ PRIORIDAD M√ÅXIMA: INFANCIA Y HOGARES MONOPARENTALES")
print("=" * 100)

print("\nüî¥ EVIDENCIA:")
print("-" * 100)
print(f"   ‚Ä¢ Menores de 16 a√±os: {tasa_menores_16:.1f}% AROPE (2023)")
print(f"   ‚Ä¢ Hogares monoparentales: 50.3% AROPE (2023)")
print(f"   ‚Ä¢ Monoparentales = OUTLIER ESTAD√çSTICO (>P75+1.5√óIQR)")
print(f"   ‚Ä¢ Convergencia: Mayor√≠a monoparentales tienen ni√±os dependientes")

print("\nüí° POL√çTICAS RECOMENDADAS:")
print("-" * 100)
print("   A. TRANSFERENCIAS DIRECTAS:")
print("      ‚Ä¢ Incrementar cuant√≠a Ingreso M√≠nimo Vital (IMV) para hogares con menores")
print("      ‚Ä¢ Complemento espec√≠fico para monoparentales (actual insuficiente)")
print("      ‚Ä¢ Prestaci√≥n por hijo a cargo: Aumentar y hacer universal (no solo <100‚Ç¨)")
print("      ‚Ä¢ Deducci√≥n fiscal progresiva (m√°s cuant√≠a para rentas bajas)")

print("\n   B. SERVICIOS P√öBLICOS:")
print("      ‚Ä¢ Educaci√≥n infantil 0-3 a√±os: Gratuita y universal")
print("      ‚Ä¢ Comedores escolares: Gratuitos para familias vulnerables")
print("      ‚Ä¢ Becas escolares: Material, actividades extraescolares, transporte")
print("      ‚Ä¢ Ayudas vivienda: Priorizar monoparentales con menores")

print("\n   C. CONCILIACI√ìN LABORAL:")
print("      ‚Ä¢ Permisos parentales remunerados (100% salario)")
print("      ‚Ä¢ Jornadas reducidas con garant√≠a salarial para cuidado")
print("      ‚Ä¢ Flexibilidad horaria sin penalizaci√≥n salarial")
print("      ‚Ä¢ Teletrabajo como derecho para familias con menores")

print("\n   D. EMPLEO PARA MONOPARENTALES:")
print("      ‚Ä¢ Bonificaciones empresariales por contratar monoparentales")
print("      ‚Ä¢ Formaci√≥n profesional espec√≠fica con apoyo de cuidado")
print("      ‚Ä¢ Reserva de plazas en empleo p√∫blico (criterio vulnerable)")

print("\nüéØ IMPACTO ESPERADO:")
print("-" * 100)
print("   ‚Ä¢ Reducir tasa AROPE menores: 28.9% ‚Üí <20% (objetivo EU 2030)")
print("   ‚Ä¢ Reducir tasa monoparentales: 50.3% ‚Üí ~30% (converger a media hogares)")
print("   ‚Ä¢ Romper transmisi√≥n intergeneracional pobreza")

print("\n" + "=" * 100)
print("2Ô∏è‚É£ PRIORIDAD ALTA: EMPLEO Y POBREZA LABORAL")
print("=" * 100)

print("\nüî¥ EVIDENCIA:")
print("-" * 100)
print("   ‚Ä¢ Parados: 62.1% AROPE (2023)")
print("   ‚Ä¢ Factor 4.0x vs Ocupados")
print("   ‚Ä¢ Coef.variaci√≥n LABORAL: 67.2% (DIMENSI√ìN M√ÅS ESTRATIFICANTE)")
print("   ‚Ä¢ Working poor: 15.6% ocupados en AROPE ‚Üí Precariedad laboral")

print("\nüí° POL√çTICAS RECOMENDADAS:")
print("-" * 100)
print("   A. INSERCI√ìN LABORAL (PARADOS):")
print("      ‚Ä¢ Pol√≠ticas activas empleo focalizadas: J√≥venes, larga duraci√≥n, >45 a√±os")
print("      ‚Ä¢ Formaci√≥n profesional dual (empresa + centro educativo)")
print("      ‚Ä¢ Orientaci√≥n laboral personalizada (no masiva)")
print("      ‚Ä¢ Bonificaciones contrataci√≥n grupos vulnerables")
print("      ‚Ä¢ Garant√≠a Juvenil: Reforzar y extender >30 a√±os si procedente")

print("\n   B. CALIDAD DEL EMPLEO (WORKING POOR):")
print("      ‚Ä¢ Subida SMI progresiva (actual ~1,134‚Ç¨/mes ‚Üí objetivo 60% salario mediano)")
print("      ‚Ä¢ Combatir temporalidad abusiva: Inspecci√≥n laboral, sanciones")
print("      ‚Ä¢ Limitar parcialidad involuntaria (derecho a jornada completa)")
print("      ‚Ä¢ Fortalecer negociaci√≥n colectiva: Convenios m√°s robustos")
print("      ‚Ä¢ In-work benefits: Complemento salarial para trabajadores con bajos ingresos")

print("\n   C. PROTECCI√ìN DESEMPLEO:")
print("      ‚Ä¢ Extender duraci√≥n prestaciones (actual max 24 meses)")
print("      ‚Ä¢ Aumentar cobertura (actual ~55% parados)")
print("      ‚Ä¢ Subsidio desempleo: Cuant√≠a suficiente para salir de AROPE")
print("      ‚Ä¢ Evitar ca√≠da a IMV sin prestaci√≥n intermedia")

print("\nüéØ IMPACTO ESPERADO:")
print("-" * 100)
print("   ‚Ä¢ Reducir tasa AROPE parados: 62.1% ‚Üí <50%")
print("   ‚Ä¢ Reducir tasa AROPE ocupados: 15.6% ‚Üí <10% (eliminar working poor)")
print("   ‚Ä¢ Aumentar tasa empleo de calidad (estable, jornada completa, salario digno)")

print("\n" + "=" * 100)
print("3Ô∏è‚É£ PRIORIDAD MEDIA: BRECHA DE G√âNERO E INTERSECCIONALIDAD")
print("=" * 100)

print("\nüü† EVIDENCIA:")
print("-" * 100)
print(f"   ‚Ä¢ Brecha de g√©nero: +{brecha_genero:.1f}pp (2023)")
print("   ‚Ä¢ Coef.variaci√≥n SEXO: Baja (~8%) en agregado nacional")
print("   ‚Ä¢ PERO: Brecha se amplifica en intersecciones:")
print("     - Mujeres monoparentales (mayor√≠a son mujeres)")
print("     - Mujeres paradas (posible mayor vulnerabilidad)")
print("     - Mujeres mayores solas (pensiones m√°s bajas)")

print("\nüí° POL√çTICAS RECOMENDADAS:")
print("-" * 100)
print("   A. IGUALDAD SALARIAL:")
print("      ‚Ä¢ Auditor√≠as obligatorias brecha salarial en empresas")
print("      ‚Ä¢ Transparencia salarial (publicar rangos por puesto)")
print("      ‚Ä¢ Sanciones efectivas por discriminaci√≥n salarial")

print("\n   B. CORRESPONSABILIDAD EN CUIDADOS:")
print("      ‚Ä¢ Permisos paternidad iguales e intransferibles (actual 16 semanas)")
print("      ‚Ä¢ Servicios p√∫blicos cuidado: Ni√±os, mayores, dependientes")
print("      ‚Ä¢ Reparto equitativo trabajo dom√©stico (campa√±as, educaci√≥n)")

print("\n   C. PROTECCI√ìN VIOLENCIA DE G√âNERO:")
print("      ‚Ä¢ Ayudas espec√≠ficas v√≠ctimas violencia (vivienda, empleo, ingresos)")
print("      ‚Ä¢ Garantizar independencia econ√≥mica para salir de situaci√≥n violenta")

print("\n   D. PENSIONES DIGNAS (MUJERES MAYORES):")
print("      ‚Ä¢ Complemento pensiones m√≠nimas para mujeres con carreras discontinuas")
print("      ‚Ä¢ Reconocer per√≠odos de cuidado en c√°lculo pensi√≥n")

print("\nüéØ IMPACTO ESPERADO:")
print("-" * 100)
print("   ‚Ä¢ Cerrar brecha de g√©nero: +1.6pp ‚Üí <1pp")
print("   ‚Ä¢ Reducir vulnerabilidad mujeres en intersecciones cr√≠ticas")
print("   ‚Ä¢ Mejorar pensiones mujeres mayores")

print("\n" + "=" * 100)
print("4Ô∏è‚É£ POL√çTICAS TRANSVERSALES")
print("=" * 100)

print("\nüí° RECOMENDACIONES APLICABLES A TODAS LAS DIMENSIONES:")
print("-" * 100)

print("\n   A. VIVIENDA:")
print("      ‚Ä¢ Parque p√∫blico vivienda: Alquiler social (<30% ingresos)")
print("      ‚Ä¢ Ayudas al alquiler: Aumentar cuant√≠a y cobertura")
print("      ‚Ä¢ Limitar precio alquiler (zonas tensionadas)")
print("      ‚Ä¢ Rehabilitaci√≥n energ√©tica (reducir pobreza energ√©tica)")

print("\n   B. EDUCACI√ìN:")
print("      ‚Ä¢ Gratuidad efectiva: Libros, material, comedor, actividades")
print("      ‚Ä¢ Becas universitarias: Cuant√≠a suficiente (no solo matr√≠cula)")
print("      ‚Ä¢ Educaci√≥n compensatoria (refuerzo alumnado vulnerable)")
print("      ‚Ä¢ FP dual: Conectar educaci√≥n con empleo de calidad")

print("\n   C. SANIDAD:")
print("      ‚Ä¢ Sanidad p√∫blica universal: Incluir dental, psicol√≥gica")
print("      ‚Ä¢ Copagos farmac√©uticos: Exenci√≥n para rentas bajas")
print("      ‚Ä¢ Prevenci√≥n y promoci√≥n salud en zonas vulnerables")

print("\n   D. SERVICIOS SOCIALES:")
print("      ‚Ä¢ Reforzar red servicios sociales: Ratio trabajadores/poblaci√≥n")
print("      ‚Ä¢ Atenci√≥n personalizada (no burocracia masiva)")
print("      ‚Ä¢ Acompa√±amiento integral: Empleo, vivienda, salud, educaci√≥n")

print("\n   E. FISCALIDAD PROGRESIVA:")
print("      ‚Ä¢ Incrementar tipos IRPF rentas altas")
print("      ‚Ä¢ Impuesto patrimonio robusto (evitar elusi√≥n)")
print("      ‚Ä¢ Combatir fraude fiscal (recuperar recursos)")
print("      ‚Ä¢ Financiar servicios p√∫blicos y transferencias")

print("\n" + "=" * 100)
print("5Ô∏è‚É£ MEJORAS EN DATOS Y SEGUIMIENTO")
print("=" * 100)

print("\nüìä RECOMENDACIONES AL INE:")
print("-" * 100)
print("   1. Extender series temporales:")
print("      ‚Ä¢ HOGAR: Publicar 2008-2012 (si datos existen)")
print("      ‚Ä¢ LABORAL: Publicar 2008-2013 (si datos existen)")

print("\n   2. Publicar datos poblacionales:")
print("      ‚Ä¢ Poblaci√≥n por tipo de hogar (anual)")
print("      ‚Ä¢ Poblaci√≥n por situaci√≥n laboral (anual)")
print("      ‚Ä¢ Permitir c√°lculo de personas afectadas")

print("\n   3. Tablas de cruces multidimensionales:")
print("      ‚Ä¢ Edad √ó Hogar (menores en monoparentales)")
print("      ‚Ä¢ Hogar √ó Empleo (monoparentales parados)")
print("      ‚Ä¢ Edad √ó Sexo √ó Empleo (mujeres j√≥venes paradas)")
print("      ‚Ä¢ Versi√≥n agregada para proteger privacidad")

print("\n   4. Microdatos:")
print("      ‚Ä¢ Facilitar acceso microdatos EPA a investigadores")
print("      ‚Ä¢ Protocolo m√°s √°gil (actual muy burocr√°tico)")

print("\n   5. Desagregaci√≥n de categor√≠as:")
print("      ‚Ä¢ Ocupados: Temporal/Indefinido, Completo/Parcial, Sector")
print("      ‚Ä¢ Menores: 0-5, 6-11, 12-15 a√±os")
print("      ‚Ä¢ Monoparentales: Por n√∫mero y edad de hijos")

print("\nüéØ MONITOREO Y EVALUACI√ìN:")
print("-" * 100)
print("   ‚Ä¢ Dashboard p√∫blico AROPE: Actualizaci√≥n trimestral")
print("   ‚Ä¢ Evaluaci√≥n ex-ante pol√≠ticas: Simulaci√≥n impacto sobre AROPE")
print("   ‚Ä¢ Evaluaci√≥n ex-post: Medir efectividad pol√≠ticas implementadas")
print("   ‚Ä¢ Informes anuales: Progreso hacia objetivos EU 2030 (reduce 15M personas)")

print("\n" + "=" * 100)
print("6Ô∏è‚É£ CONEXI√ìN CON AN√ÅLISIS TERRITORIAL")
print("=" * 100)

print("\nüó∫Ô∏è INTEGRACI√ìN CON AN√ÅLISIS REGIONAL:")
print("-" * 100)
print("   ‚Ä¢ Este an√°lisis (06_sociodemografico): Nivel NACIONAL")
print("   ‚Ä¢ An√°lisis complementario: 05_analisis_geografico_ccaa")
print("   ‚Ä¢ Necesidad: CRUZAR dimensiones sociodemogr√°ficas √ó territorio")

print("\nüí° AN√ÅLISIS TERRITORIAL PENDIENTE:")
print("-" * 100)
print("   ‚Ä¢ Menores por CCAA: ¬øD√≥nde concentrar pol√≠ticas infancia?")
print("   ‚Ä¢ Monoparentales por CCAA: ¬øRegiones con mayor vulnerabilidad?")
print("   ‚Ä¢ Parados por CCAA: ¬øPol√≠ticas empleo focalizadas regionalmente?")
print("   ‚Ä¢ Brecha g√©nero por CCAA: ¬øHeterogeneidad regional?")

print("\nüéØ POL√çTICAS TERRITORIALIZADAS:")
print("-" * 100)
print("   ‚Ä¢ Adaptar cuant√≠as transferencias a coste vida regional")
print("   ‚Ä¢ Focalizar pol√≠ticas empleo en CCAA alta tasa paro")
print("   ‚Ä¢ Reforzar servicios sociales en regiones m√°s vulnerables")
print("   ‚Ä¢ Coordinaci√≥n Estado-CCAA-Ayuntamientos")

print("\n" + "=" * 100)

print("\nüìã S√çNTESIS FINAL:")
print("=" * 100)

print("\n‚úÖ GRUPOS PRIORITARIOS IDENTIFICADOS:")
print("-" * 100)
print("   1. Menores de 16 a√±os (28.9% AROPE)")
print("   2. Hogares monoparentales (50.3% AROPE - OUTLIER)")
print("   3. Personas paradas (62.1% AROPE)")
print("   4. Trabajadores precarios (15.6% ocupados en AROPE)")

print("\nüìä DIMENSIONES M√ÅS ESTRATIFICANTES:")
print("-" * 100)
print("   1. SITUACI√ìN LABORAL (CV 67.2% - ALT√çSIMA)")
print("   2. TIPO DE HOGAR (CV 40.3% - ALTA)")
print("   3. EDAD (CV ~35% - MODERADA-ALTA)")
print("   4. SEXO (CV ~8% - BAJA en agregado, alta en intersecciones)")

print("\nüéØ PRINCIPIOS RECTORES:")
print("-" * 100)
print("   ‚Ä¢ FOCALIZACI√ìN: Pol√≠ticas diferenciadas por grupo (heterogeneidad justifica)")
print("   ‚Ä¢ UNIVERSALISMO: Servicios p√∫blicos de calidad para tod@s")
print("   ‚Ä¢ INTERSECCIONALIDAD: Abordar acumulaci√≥n de vulnerabilidades")
print("   ‚Ä¢ PREVENCI√ìN: Invertir en infancia para romper reproducci√≥n pobreza")
print("   ‚Ä¢ EVIDENCIA: Basar pol√≠ticas en datos (requiere mejorar informaci√≥n)")

print("\nüöÄ OBJETIVO:")
print("-" * 100)
print("   ‚Ä¢ Reducir tasa AROPE nacional: 26.0% (2023) ‚Üí <15% (objetivo UE 2030)")
print("   ‚Ä¢ Reducir desigualdades intra-nacionales (entre grupos)")
print("   ‚Ä¢ Garantizar igualdad de oportunidades real")
print("   ‚Ä¢ Construir sociedad m√°s cohesionada y justa")

print("\n" + "=" * 100)
print("‚úÖ AN√ÅLISIS SOCIODEMOGR√ÅFICO COMPLETADO")
print("=" * 100)