# üß™ An√°lisis Exploratorio de Datos (EDA)
## Desempleo Regi√≥n de Los R√≠os (SU2) - Encuesta Nacional de Empleo (ENE)

### Introducci√≥n

Este notebook realiza un an√°lisis exploratorio de los indicadores de desocupaci√≥n en la Regi√≥n de Los R√≠os, segmentando por sexo y tramo etario, utilizando datos de la Encuesta Nacional de Empleo (ENE) del INE.  
El objetivo es identificar patrones, tendencias y grupos de mayor vulnerabilidad, para fundamentar an√°lisis posteriores y recomendaciones de pol√≠tica p√∫blica.

---

### Carga y Revisi√≥n de Datos

- **Fuente:** INE - Encuesta Nacional de Empleo (ENE)
- **Cobertura:** Regi√≥n de Los R√≠os, 2010-2025
- **Variables clave:** periodo, valor, dimensi√≥n (sexo/tramo etario), categor√≠a

Se verifica la estructura, duplicados y valores nulos para asegurar la calidad del dataset antes

In [50]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.io as pio

# Configurar paleta de colores DALT√ìNICA: AMARILLO, AZUL y GRIS
# Colores espec√≠ficamente optimizados para daltonismo con alta visibilidad
economist_colors = [
    '#FFD700',  # Amarillo dorado - m√°xima visibilidad para daltonismo
    '#1E88E5',  # Azul brillante - alto contraste con amarillo
    '#757575',  # Gris medio - neutral y distinguible
    '#FFC107',  # Amarillo √°mbar - variaci√≥n del amarillo
    '#2196F3',  # Azul material - variaci√≥n del azul
    '#9E9E9E',  # Gris claro - variaci√≥n del gris
    '#FFEB3B',  # Amarillo lim√≥n - tercera variaci√≥n
    '#0D47A1',  # Azul oscuro - cuarta variaci√≥n
    '#616161',  # Gris oscuro - cuarta variaci√≥n
    '#F57F17'   # Amarillo oscuro - quinta variaci√≥n
]

# Validar que tenemos suficientes colores
print(f"‚úÖ Paleta dalt√≥nica AMARILLO-AZUL-GRIS cargada: {len(economist_colors)} colores")
print("üé® Colores principales: AMARILLO (#FFD700), AZUL (#1E88E5), GRIS (#757575)")
print("üìä Optimizada para protanomal√≠a, deuteranomal√≠a y tritanomal√≠a")

# Configurar el template personalizado estilo The Economist
def apply_economist_style(fig):
    """Aplica el estilo The Economist a una figura de Plotly con tipograf√≠a Georgia"""
    fig.update_layout(
        font=dict(family='Georgia, serif', color='#1e293b'),
        title=dict(
            font=dict(size=18, family='Georgia, serif', color='#1e293b'),
            x=0.02,  # Alinear a la izquierda como The Economist
            xanchor='left'
        ),
        xaxis=dict(
            title=dict(font=dict(family='Georgia, serif')),
            tickfont=dict(family='Georgia, serif'),
            showgrid=True,
            gridcolor='#E5E5E5',
            gridwidth=0.5
        ),
        yaxis=dict(
            title=dict(font=dict(family='Georgia, serif')),
            tickfont=dict(family='Georgia, serif'),
            showgrid=True,
            gridcolor='#E5E5E5',
            gridwidth=0.5
        ),
        legend=dict(
            font=dict(family='Georgia, serif'),
            orientation="h",
            yanchor="bottom",
            y=1.02,
            xanchor="right",
            x=1
        ),
        plot_bgcolor='white',
        paper_bgcolor='white',
        margin=dict(l=60, r=40, t=80, b=60)
    )
    return fig

# Cargar datos
df = pd.read_csv("../data/processed/poblacion_desocupada_combinado.csv")
print(f"üìä Dataset cargado: {len(df)} registros")
df.head()

‚úÖ Paleta dalt√≥nica AMARILLO-AZUL-GRIS cargada: 10 colores
üé® Colores principales: AMARILLO (#FFD700), AZUL (#1E88E5), GRIS (#757575)
üìä Optimizada para protanomal√≠a, deuteranomal√≠a y tritanomal√≠a
üìä Dataset cargado: 15292 registros


Unnamed: 0,indicador,periodo,valor,region,dimension,categoria
0,DES,2010-01-01/P3M,420.763708,11,tramo_edad,Y35T44
1,DES,2010-02-01/P3M,244.385161,11,tramo_edad,Y35T44
2,DES,2010-03-01/P3M,531.47814,11,tramo_edad,Y35T44
3,DES,2010-04-01/P3M,650.276185,11,tramo_edad,Y35T44
4,DES,2010-05-01/P3M,789.708634,11,tramo_edad,Y35T44


### üìã Revisi√≥n de Calidad y Estructura de los Datos

A continuaci√≥n, se revisa la estructura y calidad del dataset utilizando los siguientes comandos:


In [2]:
df.info()
df.duplicated().sum()
df.isnull().sum()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 15292 entries, 0 to 15291
Data columns (total 6 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   indicador  15292 non-null  object 
 1   periodo    15292 non-null  object 
 2   valor      15292 non-null  float64
 3   region     15292 non-null  object 
 4   dimension  15292 non-null  object 
 5   categoria  15292 non-null  object 
dtypes: float64(1), object(5)
memory usage: 716.9+ KB


indicador    0
periodo      0
valor        0
region       0
dimension    0
categoria    0
dtype: int64

## üïµÔ∏è‚Äç‚ôÇÔ∏è Distribuci√≥n Temporal del Desempleo

Visualizamos la evoluci√≥n del desempleo desde 2010 hasta 2025.

In [51]:
# Preparar datos temporales
df_copy = df.copy()
df_copy["periodo"] = pd.to_datetime(df_copy["periodo"].str[:10])

# Calcular total de desocupados por periodo
df_temporal = df_copy.groupby("periodo")["valor"].sum().reset_index()

# Crear gr√°fico con elementos visuales mejorados
fig = go.Figure()

# L√≠nea principal con relleno
fig.add_trace(go.Scatter(
    x=df_temporal["periodo"],
    y=df_temporal["valor"],
    mode='lines+markers',
    line=dict(color=economist_colors[0], width=5),  # Amarillo principal - m√°s grueso
    marker=dict(size=7, color=economist_colors[0], line=dict(color='white', width=2)),
    fill='tozeroy',
    fillcolor='rgba(255, 215, 0, 0.15)',  # Relleno transl√∫cido del amarillo
    name='Desempleo Total',
    hovertemplate='<b>Desempleo Total</b><br>Fecha: %{x}<br>Personas: %{y:,.0f}<extra></extra>'
))

# A√±adir l√≠nea de tendencia (sin mostrar R¬≤)
import numpy as np
from scipy import stats

x_numeric = np.arange(len(df_temporal))
slope, intercept, r_value, p_value, std_err = stats.linregress(x_numeric, df_temporal["valor"])
trend_line = slope * x_numeric + intercept

fig.add_trace(go.Scatter(
    x=df_temporal["periodo"],
    y=trend_line,
    mode='lines',
    line=dict(color=economist_colors[1], width=4, dash='dash'),  # Azul contrastante
    name='Tendencia',
    hovertemplate='<b>L√≠nea de Tendencia</b><br>Fecha: %{x}<br>Valor: %{y:,.0f}<extra></extra>'
))

# A√±adir l√≠nea vertical y anotaci√≥n para inicio COVID-19 en 2020
fig.add_vline(
    x=pd.Timestamp('2020-01-01'),
    line_width=3,
    line_dash="dot",
    line_color=economist_colors[2],  # Gris
)
fig.add_annotation(
    x=pd.Timestamp('2020-01-01'),
    y=max(df_temporal["valor"]),
    text="Inicio COVID-19",
    showarrow=True,
    arrowhead=2,
    ax=0,
    ay=-60,
    font=dict(color=economist_colors[2], size=10, family='Georgia, serif'),  # Tama√±o reducido
    bgcolor="white",
    bordercolor=economist_colors[2],
    borderpad=4
)

# Aplicar estilo The Economist
fig = apply_economist_style(fig)

fig.update_layout(
    title="Evoluci√≥n del Desempleo Total en la Regi√≥n de Los R√≠os",
    xaxis_title="Per√≠odo",
    yaxis_title="N√∫mero de Personas Desocupadas",
    height=500,
    legend=dict(
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="center",
        x=0.5,
        font=dict(size=12)
    )
)

# Formato del eje Y con separadores de miles
fig.update_yaxes(tickformat=',')

fig.show()

print("‚úÖ Gr√°fico actualizado con fuente de anotaci√≥n COVID-19 m√°s peque√±a")

‚úÖ Gr√°fico actualizado con fuente de anotaci√≥n COVID-19 m√°s peque√±a


## üìä An√°lisis por Tramo Etario

In [60]:
# === AN√ÅLISIS POR TRAMO ETARIO - SIMPLE Y CLARO ===
print("üîç LIMPIANDO Y PREPARANDO DATOS...")

# Limpiar y preparar datos
df_edad = df[df["dimension"] == "tramo_edad"].copy()
df_edad["periodo"] = pd.to_datetime(df_edad["periodo"].astype(str).str[:10])

# Eliminar valores at√≠picos extremos (outliers)
Q1 = df_edad['valor'].quantile(0.25)
Q3 = df_edad['valor'].quantile(0.75)
IQR = Q3 - Q1
limite_inferior = Q1 - 1.5 * IQR
limite_superior = Q3 + 1.5 * IQR

# Filtrar datos an√≥malos
df_edad_limpio = df_edad[(df_edad['valor'] >= limite_inferior) & (df_edad['valor'] <= limite_superior)].copy()

# Etiquetas m√°s simples
etiquetas_simples = {
    "Y15T24": "15-24 a√±os",
    "Y25T34": "25-34 a√±os", 
    "Y35T44": "35-44 a√±os",
    "Y45T54": "45-54 a√±os",
    "Y55T64": "55-64 a√±os",
    "Y_GE65": "65+ a√±os",
    "_T": "Total"
}

df_edad_limpio.loc[:, "grupo"] = df_edad_limpio["categoria"].map(etiquetas_simples)
df_final = df_edad_limpio[df_edad_limpio["grupo"] != "Total"]

print(f"‚úÖ Datos limpios: {len(df_final)} registros")
print(f"üìä Rango de valores: {df_final['valor'].min():,.0f} - {df_final['valor'].max():,.0f}")

# GR√ÅFICO 1: SOLO LOS 2 GRUPOS M√ÅS J√ìVENES
print("\nüìà GR√ÅFICO 1: POBLACI√ìN JOVEN")

grupos_jovenes = ["15-24 a√±os", "25-34 a√±os"]
fig1 = go.Figure()

for i, grupo in enumerate(grupos_jovenes):
    data = df_final[df_final["grupo"] == grupo]
    
    # Promediar por a√±o para suavizar la l√≠nea
    data_anual = data.groupby(data["periodo"].dt.year)["valor"].mean().reset_index()
    data_anual["periodo"] = pd.to_datetime(data_anual["periodo"], format='%Y')
    
    fig1.add_trace(go.Scatter(
        x=data_anual["periodo"],
        y=data_anual["valor"],
        mode='lines+markers',
        line=dict(color=economist_colors[i], width=4),
        marker=dict(size=8),
        name=grupo,
        hovertemplate=f'<b>{grupo}</b><br>A√±o: %{{x|%Y}}<br>Promedio: %{{y:,.0f}} personas<extra></extra>'
    ))

fig1 = apply_economist_style(fig1)
fig1.update_layout(
    title="Desempleo Juvenil: Poblaci√≥n de 15-34 a√±os",
    xaxis_title="A√±o",
    yaxis_title="Personas Desocupadas (Promedio Anual)",
    height=500,
    showlegend=True
)

fig1.update_yaxes(tickformat=',')
fig1.show()

üîç LIMPIANDO Y PREPARANDO DATOS...
‚úÖ Datos limpios: 14071 registros
üìä Rango de valores: 9 - 10,415

üìà GR√ÅFICO 1: POBLACI√ìN JOVEN


In [53]:
# GRAFICO 2: POBLACION ADULTA
print("\n[GRAFICO 2] POBLACION ADULTA")

grupos_adultos = ["35-44 a√±os", "45-54 a√±os"]
fig2 = go.Figure()

for i, grupo in enumerate(grupos_adultos):
    data = df_final[df_final["grupo"] == grupo]
    
    # Promediar por a√±o
    data_anual = data.groupby(data["periodo"].dt.year)["valor"].mean().reset_index()
    data_anual["periodo"] = pd.to_datetime(data_anual["periodo"], format='%Y')
    
    fig2.add_trace(go.Scatter(
        x=data_anual["periodo"],
        y=data_anual["valor"],
        mode='lines+markers',
        line=dict(color=economist_colors[i+2], width=4),
        marker=dict(size=8),
        name=grupo,
        hovertemplate=f'<b>{grupo}</b><br>A√±o: %{{x|%Y}}<br>Promedio: %{{y:,.0f}} personas<extra></extra>'
    ))

fig2 = apply_economist_style(fig2)
fig2.update_layout(
    title="Desempleo Adulto: Poblacion de 35-54 a√±os",
    xaxis_title="A√±o",
    yaxis_title="Personas Desocupadas (Promedio Anual)",
    height=500,
    showlegend=True
)

fig2.update_yaxes(tickformat=',')
fig2.show()


[GRAFICO 2] POBLACION ADULTA


In [54]:
# GRAFICO 3: POBLACION MAYOR
print("\n[GRAFICO 3] POBLACION MAYOR")

grupos_mayores = ["55-64 a√±os", "65+ a√±os"]
fig3 = go.Figure()

for i, grupo in enumerate(grupos_mayores):
    data = df_final[df_final["grupo"] == grupo]
    
    # Promediar por a√±o
    data_anual = data.groupby(data["periodo"].dt.year)["valor"].mean().reset_index()
    data_anual["periodo"] = pd.to_datetime(data_anual["periodo"], format='%Y')
    
    fig3.add_trace(go.Scatter(
        x=data_anual["periodo"],
        y=data_anual["valor"],
        mode='lines+markers',
        line=dict(color=economist_colors[i+4], width=4),
        marker=dict(size=8),
        name=grupo,
        hovertemplate=f'<b>{grupo}</b><br>A√±o: %{{x|%Y}}<br>Promedio: %{{y:,.0f}} personas<extra></extra>'
    ))

fig3 = apply_economist_style(fig3)
fig3.update_layout(
    title="Desempleo Mayor: Poblacion de 55+ a√±os",
    xaxis_title="A√±o",
    yaxis_title="Personas Desocupadas (Promedio Anual)",
    height=500,
    showlegend=True
)

fig3.update_yaxes(tickformat=',')
fig3.show()

# RESUMEN SIMPLE
print(f"\n[RESUMEN] POR GRUPOS:")
print("-" * 40)

for grupo in sorted(df_final["grupo"].unique()):
    promedio = df_final[df_final["grupo"] == grupo]["valor"].mean()
    print(f"‚Ä¢ {grupo:12}: {promedio:7,.0f} personas promedio")

print("\n‚úÖ Analisis por edades completado")
print("üìå Datos suavizados por promedios anuales para mayor claridad")


[GRAFICO 3] POBLACION MAYOR



[RESUMEN] POR GRUPOS:
----------------------------------------
‚Ä¢ 15-24 a√±os  :   4,140 personas promedio
‚Ä¢ 25-34 a√±os  :   4,535 personas promedio
‚Ä¢ 35-44 a√±os  :   3,591 personas promedio
‚Ä¢ 45-54 a√±os  :   2,768 personas promedio
‚Ä¢ 55-64 a√±os  :   1,997 personas promedio
‚Ä¢ 65+ a√±os    :     882 personas promedio

‚úÖ Analisis por edades completado
üìå Datos suavizados por promedios anuales para mayor claridad


In [None]:
# COMPARACI√ìN GENERAL: TODOS LOS GRUPOS (ESTILO THE ECONOMIST, M√ÅS CLARO)
print("\n[GRAFICO GENERAL] COMPARACION DE TODOS LOS GRUPOS - ESTILO MEJORADO")

fig_general = go.Figure()

# Orden y estilos accesibles (mismo color por familia, distinguiendo con l√≠nea y marcador)
orden_grupos = [
    "15-24 a√±os", "25-34 a√±os", "35-44 a√±os",
    "45-54 a√±os", "55-64 a√±os", "65+ a√±os"
]

estilos = {
    "15-24 a√±os": {"color": economist_colors[0], "dash": "solid", "marker": "circle"},
    "25-34 a√±os": {"color": economist_colors[1], "dash": "solid", "marker": "square"},
    "35-44 a√±os": {"color": economist_colors[2], "dash": "solid", "marker": "diamond"},
    "45-54 a√±os": {"color": economist_colors[0], "dash": "dash",  "marker": "triangle-up"},
    "55-64 a√±os": {"color": economist_colors[1], "dash": "dash",  "marker": "cross"},
    "65+ a√±os":   {"color": economist_colors[2], "dash": "dash",  "marker": "x"},
}

# Si el dataset no tuviera alguno, usamos los presentes
presentes = sorted(df_final["grupo"].unique())
grupos = [g for g in orden_grupos if g in presentes]

for grupo in grupos:
    data = df_final[df_final["grupo"] == grupo]
    # Promedio anual para claridad
    data_anual = data.groupby(data["periodo"].dt.year)["valor"].mean().reset_index()
    data_anual["periodo"] = pd.to_datetime(data_anual["periodo"], format='%Y')

    estilo = estilos.get(grupo, {"color": economist_colors[2], "dash": "solid", "marker": "circle"})

    fig_general.add_trace(
        go.Scatter(
            x=data_anual["periodo"],
            y=data_anual["valor"],
            mode="lines+markers",
            line=dict(color=estilo["color"], width=3.5, dash=estilo["dash"]),
            marker=dict(size=7, symbol=estilo["marker"], line=dict(color="white", width=1.5)),
            name=grupo,
            hovertemplate=f"<b>{grupo}</b><br>A√±o: %{{x|%Y}}<br>Promedio: %{{y:,.0f}} personas<extra></extra>",
        )
    )

fig_general = apply_economist_style(fig_general)
fig_general.update_layout(
    title="Comparaci√≥n general: Desempleo por grupos etarios (promedio anual)",
    xaxis_title="A√±o",
    yaxis_title="Personas desocupadas (promedio anual)",
    height=600,
    legend=dict(
        orientation="v",
        yanchor="top",
        y=1,
        xanchor="left",
        x=1.02,
        title="Grupos etarios",
    ),
)

fig_general.update_yaxes(tickformat=',')
fig_general.show()


[GRAFICO GENERAL] COMPARACION DE TODOS LOS GRUPOS


In [55]:
# Usar datos limpios de la secci√≥n anterior
df_resumen_limpio = df_final.groupby("periodo")["valor"].sum().reset_index()

# Crear gr√°fico con √°rea rellena y colores dalt√≥nicos
fig = go.Figure()

# A√±adir √°rea principal con color dalt√≥nico
fig.add_trace(go.Scatter(
    x=df_resumen_limpio["periodo"],
    y=df_resumen_limpio["valor"],
    mode='lines',
    line=dict(color=economist_colors[0], width=4),  # Rojo dalt√≥nico
    fill='tozeroy',
    fillcolor=f'rgba(232, 68, 58, 0.15)',  # Relleno transl√∫cido
    name='Desempleo Total',
    hovertemplate='<b>Fecha:</b> %{x}<br><b>Total Personas:</b> %{y:,.0f}<extra></extra>'
))

# A√±adir l√≠nea de tendencia con color dalt√≥nico
import numpy as np
from scipy import stats

x_numeric = np.arange(len(df_resumen_limpio))
slope, intercept, r_value, p_value, std_err = stats.linregress(x_numeric, df_resumen_limpio["valor"])
trend_line = slope * x_numeric + intercept

fig.add_trace(go.Scatter(
    x=df_resumen_limpio["periodo"],
    y=trend_line,
    mode='lines',
    line=dict(color=economist_colors[8], width=3, dash='dash'),  # Gris dalt√≥nico
    name=f'Tendencia (R¬≤={r_value**2:.3f})',
    hovertemplate='<b>L√≠nea de Tendencia</b><br>Fecha: %{x}<br>Valor: %{y:,.0f}<extra></extra>'
))

# Aplicar estilo The Economist
fig = apply_economist_style(fig)

fig.update_layout(
    title="Resumen: Desempleo Total por Tramos Etarios con Tendencia",
    xaxis_title="Per√≠odo",
    yaxis_title="N√∫mero Total de Personas Desocupadas",
    height=500,
    legend=dict(
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="center",
        x=0.5
    )
)

fig.update_yaxes(tickformat=',')
fig.show()

## üë• An√°lisis por Sexo

Comparaci√≥n del desempleo entre hombres y mujeres en la regi√≥n.

In [None]:
# Preparar datos por sexo (incluye Total)
df_sexo = df[df["dimension"] == "sexo"].copy()
df_sexo["periodo"] = pd.to_datetime(df_sexo["periodo"].astype(str).str[:10])

# Mapear c√≥digos de sexo
etiquetas_sexo = {
    "F": "Mujeres",
    "M": "Hombres",
    "_T": "Total"
}

df_sexo["sexo_label"] = df_sexo["categoria"].map(etiquetas_sexo)
# Incluir Hombres, Mujeres y Total
orden_series = ["Hombres", "Mujeres", "Total"]
df_sexo_filtrado = df_sexo[df_sexo["sexo_label"].isin(orden_series)]

# Crear gr√°fico comparativo con estilo m√°s claro (l√≠neas m√°s delgadas)
fig = go.Figure()

colores_sexo_daltonico = {
    "Hombres": economist_colors[1],   # Azul
    "Mujeres": economist_colors[0],   # Amarillo
    "Total":   economist_colors[2]    # Gris
}

for sexo in orden_series:
    data_sexo = df_sexo_filtrado[df_sexo_filtrado["sexo_label"] == sexo]
    if data_sexo.empty:
        continue

    if sexo == "Total":
        # Total: l√≠nea discontinua, sin marcadores, un poco tenue
        fig.add_trace(go.Scatter(
            x=data_sexo["periodo"],
            y=data_sexo["valor"],
            mode='lines',
            line=dict(color=colores_sexo_daltonico[sexo], width=2.2, dash='dash'),
            opacity=0.9,
            name=sexo,
            hovertemplate=f'<b>{sexo}</b><br>Fecha: %{{x}}<br>Personas: %{{y:,.0f}}<extra></extra>'
        ))
    else:
        # Hombres/Mujeres: l√≠neas + marcadores, m√°s delgadas y marcadores peque√±os
        fig.add_trace(go.Scatter(
            x=data_sexo["periodo"],
            y=data_sexo["valor"],
            mode='lines+markers',
            line=dict(color=colores_sexo_daltonico[sexo], width=2.4),
            marker=dict(size=5, color=colores_sexo_daltonico[sexo], line=dict(color='white', width=1)),
            name=sexo,
            hovertemplate=f'<b>{sexo}</b><br>Fecha: %{{x}}<br>Personas: %{{y:,.0f}}<extra></extra>'
        ))

# Aplicar estilo The Economist
fig = apply_economist_style(fig)

fig.update_layout(
    title="Comparaci√≥n del Desempleo por Sexo - Regi√≥n de Los R√≠os",
    xaxis_title="Per√≠odo",
    yaxis_title="N√∫mero de Personas Desocupadas",
    height=500,
    legend=dict(
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="center",
        x=0.5,
        font=dict(size=12)
    )
)

fig.update_yaxes(tickformat=',')
fig.show()

## üìà Resumen Estad√≠stico y Tendencias Clave

Principales hallazgos del an√°lisis exploratorio.

## üé® Verificaci√≥n de Paleta de Colores Accesible

Demostraci√≥n de la paleta de colores utilizada, dise√±ada para facilitar la visualizaci√≥n y comprensi√≥n de los datos.

In [11]:
# Calcular estad√≠sticas resumen
print("üìä RESUMEN ESTAD√çSTICO - DESEMPLEO REGI√ìN DE LOS R√çOS")
print("=" * 60)

# Usar datos ya procesados de las celdas anteriores
# 1. Estad√≠sticas generales del per√≠odo
print(f"\nüîç DATOS GENERALES:")
print(f"‚Ä¢ Per√≠odo analizado: {df_temporal['periodo'].min().strftime('%Y-%m')} a {df_temporal['periodo'].max().strftime('%Y-%m')}")
print(f"‚Ä¢ Promedio de desocupados: {df_temporal['valor'].mean():,.0f} personas")
print(f"‚Ä¢ M√°ximo hist√≥rico: {df_temporal['valor'].max():,.0f} personas")
print(f"‚Ä¢ M√≠nimo hist√≥rico: {df_temporal['valor'].min():,.0f} personas")

# 2. An√°lisis por sexo (usando datos procesados)
print(f"\nüë• AN√ÅLISIS POR SEXO:")
sexo_resumen = df_sexo_filtrado.groupby("sexo_label")["valor"].mean()
for sexo, promedio in sexo_resumen.items():
    print(f"‚Ä¢ {sexo}: {promedio:,.0f} personas promedio")

# 3. An√°lisis por tramo etario
print(f"\nüìä GRUPOS ETARIOS M√ÅS AFECTADOS:")
promedio_por_edad = df_edad_filtrado.groupby("categoria_label")["valor"].mean().sort_values(ascending=False)
for i, (grupo, promedio) in enumerate(promedio_por_edad.head(3).items()):
    print(f"{i+1}. {grupo}: {promedio:,.0f} personas promedio")

# 4. Tendencia general usando datos ya procesados
print(f"\nüéØ TENDENCIA GENERAL:")
primer_valor = df_temporal['valor'].iloc[0]
ultimo_valor = df_temporal['valor'].iloc[-1]
cambio_porcentual = ((ultimo_valor - primer_valor) / primer_valor) * 100

if cambio_porcentual > 0:
    print(f"üìà CRECIENTE: +{cambio_porcentual:.1f}% desde el inicio del per√≠odo")
else:
    print(f"üìâ DECRECIENTE: {cambio_porcentual:.1f}% desde el inicio del per√≠odo")

# 5. Comparaci√≥n por sexo
diff_sexo = abs(sexo_resumen["Mujeres"] - sexo_resumen["Hombres"])
sexo_mayor = "Mujeres" if sexo_resumen["Mujeres"] > sexo_resumen["Hombres"] else "Hombres"
print(f"‚Ä¢ Brecha de g√©nero: {diff_sexo:,.0f} personas m√°s en {sexo_mayor}")

print("\n" + "=" * 60)
print("‚úÖ An√°lisis completado exitosamente")

üìä RESUMEN ESTAD√çSTICO - DESEMPLEO REGI√ìN DE LOS R√çOS

üîç DATOS GENERALES:
‚Ä¢ Per√≠odo analizado: 2010-01 a 2025-02
‚Ä¢ Promedio de desocupados: 279,049 personas
‚Ä¢ M√°ximo hist√≥rico: 520,387 personas
‚Ä¢ M√≠nimo hist√≥rico: 200,728 personas

üë• AN√ÅLISIS POR SEXO:
‚Ä¢ Hombres: 6,101 personas promedio
‚Ä¢ Mujeres: 6,281 personas promedio

üìä GRUPOS ETARIOS M√ÅS AFECTADOS:
1. 25-34 a√±os: 5,253 personas promedio
2. 15-24 a√±os: 4,220 personas promedio
3. 35-44 a√±os: 3,779 personas promedio

üéØ TENDENCIA GENERAL:
üìà CRECIENTE: +43.4% desde el inicio del per√≠odo
‚Ä¢ Brecha de g√©nero: 180 personas m√°s en Mujeres

‚úÖ An√°lisis completado exitosamente


## üë• Comparaci√≥n del Desempleo por Sexo

Este gr√°fico muestra la evoluci√≥n del desempleo en la Regi√≥n de Los R√≠os diferenciando entre hombres y mujeres. Se utilizan colores amarillo y azul para distinguir ambos grupos, siguiendo la paleta accesible definida para todo el an√°lisis.

- **Hombres:** L√≠nea azul
- **Mujeres:** L√≠nea amarilla

La visualizaci√≥n permite identificar tendencias y posibles brechas de g√©nero en el desempleo a lo largo del tiempo. El estilo The Economist asegura claridad y profesionalismo en la presentaci√≥n.