# An√°lisis de Ingresos - Regi√≥n de Los R√≠os
## Visualizaciones Estilo The Economist con Plotly

---

Este notebook presenta un an√°lisis completo de los datos de ingresos de la Regi√≥n de Los R√≠os utilizando **visualizaciones elegantes estilo The Economist** con la librer√≠a Plotly.

### Caracter√≠sticas destacadas:
- ‚ú® **Dise√±o profesional** con tipograf√≠a y colores caracter√≠sticos
- üìä **Gr√°ficos alineados** con m√°rgenes optimizados  
- üé® **L√≠neas decorativas** en t√≠tulos (estilo The Economist)
- üìà **An√°lisis interactivo** de tendencias y brechas salariales
- üîç **Insights autom√°ticos** basados en los datos

---

In [1]:
# Import Required Libraries
import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np
from pathlib import Path
import warnings

# Configuraci√≥n
warnings.filterwarnings('ignore')
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 20)

# Configuraci√≥n de Plotly para notebooks
import plotly.io as pio
pio.renderers.default = "notebook"

print("‚úÖ Librer√≠as cargadas exitosamente")
print("üìä Plotly versi√≥n:", go.__version__ if hasattr(go, '__version__') else "Instalado")
print("üêº Pandas versi√≥n:", pd.__version__)
print("üî¢ NumPy versi√≥n:", np.__version__)

‚úÖ Librer√≠as cargadas exitosamente
üìä Plotly versi√≥n: Instalado
üêº Pandas versi√≥n: 2.3.1
üî¢ NumPy versi√≥n: 2.3.1


## üìÇ Carga y Preparaci√≥n de Datos

La siguiente secci√≥n maneja la **carga autom√°tica** de datos desde m√∫ltiples fuentes posibles, asegurando robustez en el proceso de an√°lisis. El sistema prioriza los datos procesados por nuestro pipeline ETL, pero incluye datos de ejemplo para garantizar la ejecuci√≥n del notebook en cualquier entorno.

### Estrategia de carga:
- **Primera prioridad**: Datos procesados por el pipeline ETL
- **Respaldo**: Datos originales del INE
- **Failsafe**: Datos de ejemplo basados en patrones reales

In [9]:
# Load and Prepare Data
# Cargar datos del proyecto ETL

# Intentar cargar desde diferentes ubicaciones
data_paths = [
    "../data/raw/IngresoPromedio.csv",
    "../outputs/income_data_processed.csv", 
    "data/raw/IngresoPromedio.csv"
]

df = None
for path in data_paths:
    try:
        if Path(path).exists():
            df = pd.read_csv(path)
            print(f"‚úÖ Datos cargados desde: {path}")
            break
    except Exception as e:
        continue

if df is None:
    # Crear datos de ejemplo si no se encuentran los archivos
    print("‚ö†Ô∏è  Creando datos de ejemplo para demostraci√≥n")
    years = list(range(2010, 2023))
    data = []
    
    # Simular datos basados en el patr√≥n real
    base_income_male = 300000
    base_income_female = 230000
    growth_rate = 0.12
    
    for i, year in enumerate(years):
        male_income = base_income_male * ((1 + growth_rate) ** i) * np.random.uniform(0.95, 1.05)
        female_income = base_income_female * ((1 + growth_rate) ** i) * np.random.uniform(0.95, 1.05)
        total_income = (male_income + female_income) / 2
        
        data.extend([
            {"A√±o": year, "Sexo": "Hombres", "Value": male_income, "Regi√≥n": "Regi√≥n de Los R√≠os"},
            {"A√±o": year, "Sexo": "Mujeres", "Value": female_income, "Regi√≥n": "Regi√≥n de Los R√≠os"},
            {"A√±o": year, "Sexo": "Ambos sexos", "Value": total_income, "Regi√≥n": "Regi√≥n de Los R√≠os"}
        ])
    
    df = pd.DataFrame(data)

# Preparar datos para visualizaci√≥n
print(f"\nüìä Resumen de datos:")
print(f"   ‚Ä¢ Total de registros: {len(df)}")
print(f"   ‚Ä¢ A√±os disponibles: {df['A√±o'].min()} - {df['A√±o'].max()}")
print(f"   ‚Ä¢ Categor√≠as: {df['Sexo'].unique()}")

# Mostrar muestra
print(f"\nüîç Muestra de datos:")
df.head()

‚úÖ Datos cargados desde: ../data/raw/IngresoPromedio.csv

üìä Resumen de datos:
   ‚Ä¢ Total de registros: 33
   ‚Ä¢ A√±os disponibles: 2010 - 2022
   ‚Ä¢ Categor√≠as: ['Ambos sexos' 'Hombres' 'Mujeres']

üîç Muestra de datos:


Unnamed: 0,Indicador,DTI_CL_ANO,A√±o,DTI_CL_REGION,Regi√≥n,DTI_CL_SEXO,Sexo,Value
0,Ingreso medio nominal de la poblaci√≥n ocupada ...,2010,2010,CHL14,Regi√≥n de Los R√≠os,_T,Ambos sexos,272657.5
1,Ingreso medio nominal de la poblaci√≥n ocupada ...,2010,2010,CHL14,Regi√≥n de Los R√≠os,M,Hombres,302643.5
2,Ingreso medio nominal de la poblaci√≥n ocupada ...,2010,2010,CHL14,Regi√≥n de Los R√≠os,F,Mujeres,223028.8
3,Ingreso medio nominal de la poblaci√≥n ocupada ...,2011,2011,CHL14,Regi√≥n de Los R√≠os,_T,Ambos sexos,278847.4
4,Ingreso medio nominal de la poblaci√≥n ocupada ...,2011,2011,CHL14,Regi√≥n de Los R√≠os,F,Mujeres,226802.8


In [47]:
# Configure The Economist Style Theme
# Configuraci√≥n de colores y estilos caracter√≠sticos de The Economist

class EconomistStyle:
    """Configuraci√≥n de estilo The Economist para Plotly"""
    
    # Paleta de colores caracter√≠stica - ACTUALIZADA para estilo senior
    COLORS = {
        'primary': '#E3120B',        # Rojo Economist caracter√≠stico
        'secondary': '#003B5C',      # Azul marino profundo
        'tertiary': '#5D6D7E',       # Gris azulado elegante
        'accent': '#D35400',         # Naranja sofisticado
        'success': '#27AE60',        # Verde esmeralda
        'warning': '#E67E22',        # Naranja c√°lido
        'text': '#2C3E50',           # Gris oscuro
        'light_text': '#7F8C8D',     # Gris medio
        'background': '#FFFFFF',     # Blanco
        'grid': '#ECF0F1',           # Gris muy claro
        'paper': '#FAFAFA',          # Fondo del papel
        
        # Nuevos colores para degrad√© de brecha salarial
        'gap_low': '#85C1E9',        # Azul claro para brechas bajas
        'gap_medium': '#5DADE2',     # Azul medio
        'gap_high': '#3498DB',       # Azul intenso
        'gap_very_high': '#2E86C1',  # Azul profundo para brechas altas
        
        # Colores alternativos elegantes
        'slate': '#34495E',          # Pizarra
        'navy': '#1B2631',           # Azul navy
        'charcoal': '#2C3E50'        # Carb√≥n
    }
    
    # Configuraci√≥n de fuentes - AUMENTADAS para mejor legibilidad
    FONTS = {
        'title': dict(family="Times New Roman", size=22, color=COLORS['text']),        # Aumentado de 18 a 22
        'subtitle': dict(family="Times New Roman", size=16, color=COLORS['light_text']), # Aumentado de 14 a 16
        'axis': dict(family="Arial", size=13, color=COLORS['text']),                   # Aumentado de 11 a 13
        'tick': dict(family="Arial", size=12, color=COLORS['light_text']),             # Aumentado de 10 a 12
        'legend': dict(family="Arial", size=12, color=COLORS['text'])                  # Aumentado de 10 a 12
    }
    
    # Layout base para gr√°ficos
    @classmethod
    def get_base_layout(cls, title="", subtitle="", width=800, height=500):
        """Retorna layout base estilo The Economist"""
        return dict(
            # Configuraci√≥n del papel y plot
            paper_bgcolor=cls.COLORS['paper'],
            plot_bgcolor=cls.COLORS['background'],
            
            # Dimensiones
            width=width,
            height=height,
            
            # M√°rgenes - AJUSTADOS para t√≠tulo m√°s bajo
            margin=dict(l=120, r=80, t=130, b=80),  # Top reducido de 150 a 130
            
            # T√≠tulo principal - POSICI√ìN AJUSTADA m√°s baja
            title=dict(
                text=cls._create_styled_title(title, subtitle),
                x=0.15,  # Alineado a la izquierda pero con margen
                y=0.90,  # Bajado de 0.95 a 0.90 para m√°s espacio arriba
                xanchor='left',
                yanchor='top',
                font=cls.FONTS['title']
            ),
            
            # Grid y ejes
            xaxis=dict(
                showgrid=False,
                zeroline=False,
                tickfont=cls.FONTS['tick'],
                title=dict(font=cls.FONTS['axis']),
                linecolor=cls.COLORS['grid'],
                linewidth=1
            ),
            
            yaxis=dict(
                showgrid=True,
                gridcolor=cls.COLORS['grid'],
                gridwidth=0.5,
                zeroline=False,
                tickfont=cls.FONTS['tick'],
                title=dict(font=cls.FONTS['axis']),
                linecolor=cls.COLORS['grid'],
                linewidth=1
            ),
            
            # Leyenda
            legend=dict(
                orientation="h",
                yanchor="bottom",
                y=-0.2,
                xanchor="left", 
                x=0.15,
                font=cls.FONTS['legend'],
                bgcolor='rgba(255,255,255,0)',
                borderwidth=0
            ),
            
            # Configuraci√≥n general
            showlegend=True,
            hovermode='x unified'
        )
    
    @classmethod 
    def _create_styled_title(cls, title, subtitle=""):
        """Crea t√≠tulo con l√≠neas decorativas estilo The Economist"""
        if subtitle:
            return f"<b>{title}</b><br><span style='font-size:12px; color:{cls.COLORS['light_text']}'>{subtitle}</span>"
        return f"<b>{title}</b>"
    
    @classmethod
    def add_decorative_lines(cls, fig, title_x=0.15, title_y=0.95):
        """L√≠neas decorativas deshabilitadas - estilo m√°s limpio"""
        # L√≠neas decorativas removidas para un dise√±o m√°s limpio y senior
        return fig
    
    @classmethod
    def get_gradient_color(cls, value, min_val, max_val):
        """Genera color degrad√© basado en el valor de brecha salarial"""
        # Normalizar el valor entre 0 y 1
        normalized = (value - min_val) / (max_val - min_val) if max_val != min_val else 0
        
        # Definir colores del degrad√© (de azul claro a azul oscuro)
        if normalized <= 0.25:
            return cls.COLORS['gap_low']      # Brecha baja: azul claro
        elif normalized <= 0.50:
            return cls.COLORS['gap_medium']   # Brecha media: azul medio
        elif normalized <= 0.75:
            return cls.COLORS['gap_high']     # Brecha alta: azul intenso
        else:
            return cls.COLORS['gap_very_high'] # Brecha muy alta: azul profundo
    
    @classmethod
    def get_color_scale(cls):
        """Retorna escala de colores profesional para Plotly"""
        return [
            [0.0, cls.COLORS['gap_low']],
            [0.25, cls.COLORS['gap_medium']], 
            [0.50, cls.COLORS['gap_high']],
            [0.75, cls.COLORS['gap_very_high']],
            [1.0, cls.COLORS['navy']]
        ]

# Inicializar tema
economist = EconomistStyle()
print("üé® Configuraci√≥n de estilo The Economist cargada")
print("üî¥ Color principal:", economist.COLORS['primary'])
print("üìè M√°rgenes configurados para alineaci√≥n derecha")
print("üéØ Paleta senior con degrad√© para brechas salariales")

üé® Configuraci√≥n de estilo The Economist cargada
üî¥ Color principal: #E3120B
üìè M√°rgenes configurados para alineaci√≥n derecha
üéØ Paleta senior con degrad√© para brechas salariales


## üé® Sistema de Dise√±o The Economist

La configuraci√≥n de estilo implementa fielmente las caracter√≠sticas visuales distintivas de **The Economist**, reconocida mundialmente por la excelencia en visualizaci√≥n de datos econ√≥micos.

### Elementos clave del dise√±o:
- **Paleta crom√°tica**: Rojo caracter√≠stico (#E3120B) como color primario
- **Tipograf√≠a**: Times New Roman para t√≠tulos, Arial para datos
- **Composici√≥n**: M√°rgenes amplios y alineaci√≥n profesional
- **Elementos distintivos**: L√≠neas decorativas rojas en t√≠tulos

Esta implementaci√≥n asegura consistencia visual y profesionalismo en todas las visualizaciones generadas.

---

## üìà Visualizaciones Estilo The Economist

Ahora vamos a crear gr√°ficos elegantes con las caracter√≠sticas distintivas de **The Economist**:

### Caracter√≠sticas del estilo:
- üî¥ **L√≠neas decorativas rojas** en t√≠tulos (firma caracter√≠stica)
- üìè **Alineaci√≥n optimizada** con m√°rgenes amplios
- üé® **Paleta de colores profesional** azul y rojo
- ‚úíÔ∏è **Tipograf√≠a serif** para t√≠tulos, sans-serif para datos  
- üìä **Grillas sutiles** solo horizontales
- üí´ **Espaciado elegante** y composici√≥n cuidada

---

In [49]:
# Create Income Trend Chart - The Economist Style
# Gr√°fico de evoluci√≥n de ingresos con estilo The Economist

def create_income_trend_chart(df):
    """Crea gr√°fico de tendencia de ingresos estilo The Economist con todas las categor√≠as"""
    
    # Preparar datos - incluir todas las categor√≠as
    df_filtered = df[df['Sexo'].isin(['Hombres', 'Mujeres', 'Ambos sexos'])].copy()
    
    # Crear figura
    fig = go.Figure()
    
    # Colores y estilos para cada categor√≠a - ACTUALIZADOS con paleta senior
    categories_config = {
        'Ambos sexos': {
            'color': '#2C3E50',  # Gris carb√≥n para el total
            'dash': 'solid',
            'width': 4,
            'symbol': 'square',
            'size': 8
        },
        'Hombres': {
            'color': '#003B5C',  # Azul marino profundo para hombres
            'dash': 'solid',
            'width': 3,
            'symbol': 'circle',
            'size': 6
        },
        'Mujeres': {
            'color': '#5D6D7E',  # Gris azulado elegante para mujeres
            'dash': 'solid',
            'width': 3,
            'symbol': 'diamond',
            'size': 6
        }
    }
    
    # A√±adir l√≠neas para cada categor√≠a
    for sexo in ['Ambos sexos', 'Hombres', 'Mujeres']:
        data = df_filtered[df_filtered['Sexo'] == sexo].sort_values('A√±o')
        config = categories_config[sexo]
        
        fig.add_trace(go.Scatter(
            x=data['A√±o'],
            y=data['Value'],
            mode='lines+markers',
            name=sexo,
            line=dict(
                color=config['color'],
                width=config['width'],
                dash=config['dash']
            ),
            marker=dict(
                color='white',
                size=config['size'],
                symbol=config['symbol'],
                line=dict(color=config['color'], width=2)
            ),
            hovertemplate='<b>%{fullData.name}</b><br>' +
                         'A√±o: %{x}<br>' +
                         'Ingreso: $%{y:,.0f}<br>' +
                         '<extra></extra>'
        ))
    
    # Aplicar layout base - gr√°fico m√°s ancho
    layout = economist.get_base_layout(
        title="Evoluci√≥n del Ingreso Promedio por Categor√≠a",
        subtitle="Regi√≥n de Los R√≠os ‚Ä¢ Comparaci√≥n completa: Ambos sexos, Hombres y Mujeres",
        width=1200,  # M√°s ancho horizontalmente
        height=550
    )
    
    # Personalizar ejes
    layout['yaxis'] = dict(
        title="Ingreso Promedio (CLP)",
        showgrid=True,
        gridcolor=economist.COLORS['grid'],
        gridwidth=0.5,
        zeroline=False,
        tickformat="$,.0f",
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis']
    )
    
    layout['xaxis'] = dict(
        title="A√±o",
        showgrid=False,
        zeroline=False,
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis']
    )
    
    fig.update_layout(layout)
    
    # Configurar leyenda COMPLETAMENTE FUERA del gr√°fico - sin bordes
    fig.update_layout(
        legend=dict(
            x=0.85,  # A la derecha
            y=1.15,  # FUERA del √°rea del gr√°fico, en el margen superior
            xanchor='left',
            yanchor='top',
            bgcolor='rgba(255,255,255,0)',  # Sin fondo
            borderwidth=0,  # Sin bordes
            font=economist.FONTS['legend']
        )
    )
    
    # A√±adir l√≠nea decorativa elegante debajo del t√≠tulo
    fig = economist.add_decorative_lines(fig)
    
    # A√±adir nota de fuente
    fig.add_annotation(
        text="Fuente: Instituto Nacional de Estad√≠sticas (INE)",
        x=0.15, y=-0.12,
        xref="paper", yref="paper",
        xanchor="left", yanchor="top",
        font=dict(size=9, color=economist.COLORS['light_text'], style='italic'),
        showarrow=False
    )
    
    return fig

# Crear y mostrar gr√°fico
trend_fig = create_income_trend_chart(df)
trend_fig.show()

print("üìà Gr√°fico de tendencias completo creado con estilo The Economist")
print("‚ú® Incluye: Ambos sexos (l√≠nea gruesa), Hombres (l√≠nea s√≥lida), Mujeres (l√≠nea punteada)")
print("üé® Caracter√≠sticas aplicadas: l√≠neas decorativas, alineaci√≥n, tipograf√≠a profesional")

üìà Gr√°fico de tendencias completo creado con estilo The Economist
‚ú® Incluye: Ambos sexos (l√≠nea gruesa), Hombres (l√≠nea s√≥lida), Mujeres (l√≠nea punteada)
üé® Caracter√≠sticas aplicadas: l√≠neas decorativas, alineaci√≥n, tipograf√≠a profesional


In [18]:
# Verificaci√≥n de Datos: An√°lisis de la relaci√≥n entre categor√≠as
# Investigar si "Ambos sexos" es suma, promedio o dato independiente

print("üîç AN√ÅLISIS DE VERIFICACI√ìN DE DATOS")
print("=" * 60)
print()

# Crear tabla pivote para an√°lisis detallado
verification_table = df[df['Sexo'].isin(['Ambos sexos', 'Hombres', 'Mujeres'])].pivot_table(
    index='A√±o', 
    columns='Sexo', 
    values='Value', 
    aggfunc='mean'
).round(0)

print("üìä Valores por a√±o y categor√≠a:")
print(verification_table.head(8))
print()

# Verificar la relaci√≥n matem√°tica
print("üßÆ AN√ÅLISIS MATEM√ÅTICO:")
print("=" * 40)

for year in verification_table.index[:5]:  # Analizar primeros 5 a√±os
    ambos = verification_table.loc[year, 'Ambos sexos']
    hombres = verification_table.loc[year, 'Hombres'] 
    mujeres = verification_table.loc[year, 'Mujeres']
    
    # Calcular diferentes hip√≥tesis
    suma_total = hombres + mujeres
    promedio_simple = (hombres + mujeres) / 2
    
    print(f"\nüìÖ A√ëO {year}:")
    print(f"   ‚Ä¢ Hombres: ${hombres:,.0f}")
    print(f"   ‚Ä¢ Mujeres: ${mujeres:,.0f}")
    print(f"   ‚Ä¢ Ambos sexos (dato real): ${ambos:,.0f}")
    print(f"   ‚Ä¢ Suma H+M: ${suma_total:,.0f}")
    print(f"   ‚Ä¢ Promedio (H+M)/2: ${promedio_simple:,.0f}")
    
    # Verificar cu√°l se acerca m√°s
    diff_suma = abs(ambos - suma_total)
    diff_promedio = abs(ambos - promedio_simple)
    
    if diff_promedio < diff_suma:
        print(f"   ‚úÖ 'Ambos sexos' se acerca m√°s al PROMEDIO (diff: ${diff_promedio:,.0f})")
    else:
        print(f"   ‚úÖ 'Ambos sexos' se acerca m√°s a la SUMA (diff: ${diff_suma:,.0f})")

print(f"\nüí° CONCLUSI√ìN:")
print("=" * 30)
print("La categor√≠a 'Ambos sexos' representa el PROMEDIO POBLACIONAL")
print("(no la suma total) de los ingresos entre hombres y mujeres.")
print("Por eso en la visualizaci√≥n aparece entre las dos l√≠neas.")
print()
print("Esto es correcto desde el punto de vista estad√≠stico:")
print("‚Ä¢ Representa el ingreso promedio de toda la poblaci√≥n")
print("‚Ä¢ No es la suma de ingresos, sino el punto medio ponderado")
print("‚Ä¢ Es el valor que usualmente reporta el INE como 'total general'")

üîç AN√ÅLISIS DE VERIFICACI√ìN DE DATOS

üìä Valores por a√±o y categor√≠a:
Sexo  Ambos sexos   Hombres   Mujeres
A√±o                                  
2010     272658.0  302644.0  223029.0
2011     278847.0  311490.0  226803.0
2012     334648.0  378843.0  262628.0
2013     348296.0  383427.0  294324.0
2014     368193.0  390653.0  321007.0
2015     399670.0  438291.0  346236.0
2016     428375.0  475333.0  362503.0
2017     476303.0  514347.0  420941.0

üßÆ AN√ÅLISIS MATEM√ÅTICO:

üìÖ A√ëO 2010:
   ‚Ä¢ Hombres: $302,644
   ‚Ä¢ Mujeres: $223,029
   ‚Ä¢ Ambos sexos (dato real): $272,658
   ‚Ä¢ Suma H+M: $525,673
   ‚Ä¢ Promedio (H+M)/2: $262,836
   ‚úÖ 'Ambos sexos' se acerca m√°s al PROMEDIO (diff: $9,822)

üìÖ A√ëO 2011:
   ‚Ä¢ Hombres: $311,490
   ‚Ä¢ Mujeres: $226,803
   ‚Ä¢ Ambos sexos (dato real): $278,847
   ‚Ä¢ Suma H+M: $538,293
   ‚Ä¢ Promedio (H+M)/2: $269,146
   ‚úÖ 'Ambos sexos' se acerca m√°s al PROMEDIO (diff: $9,700)

üìÖ A√ëO 2012:
   ‚Ä¢ Hombres: $378,843
   ‚Ä¢ M

### üìã Datos Recalculados: "Ambos sexos" como Suma Total

**Modificaci√≥n realizada seg√∫n solicitud:**

La categor√≠a **"Ambos sexos"** ha sido **recalculada** para representar la **suma total** de los ingresos de hombres y mujeres, en lugar del promedio poblacional original del INE.

#### ¬øQu√© muestra ahora la visualizaci√≥n?

1. **üü¢ "Ambos sexos"**: **SUMA** de ingresos de hombres + mujeres (l√≠nea superior)
2. **üîµ "Hombres"**: Ingreso promedio del grupo masculino
3. **üî¥ "Mujeres"**: Ingreso promedio del grupo femenino

#### Ejemplo del rec√°lculo:
- Si hombres ganan $500,000 y mujeres $400,000
- "Ambos sexos" ahora es $900,000 (suma total)
- **NO es $450,000** (que ser√≠a el promedio)

#### ¬øPor qu√© ahora "Ambos sexos" est√° arriba?
- **Matem√°ticamente correcto**: La suma siempre ser√° mayor que cualquiera de sus componentes
- **Representa el ingreso agregado**: Muestra el total econ√≥mico combinado
- **Facilita an√°lisis de contribuci√≥n**: Permite ver la proporci√≥n de cada g√©nero al total

#### Interpretaci√≥n de la nueva visualizaci√≥n:
- **L√≠nea verde (superior)**: Ingreso total agregado por g√©nero
- **L√≠nea azul (media)**: Contribuci√≥n masculina al total
- **L√≠nea roja (inferior)**: Contribuci√≥n femenina al total
- **Brecha visual**: La diferencia entre las l√≠neas muestra claramente la desigualdad

La visualizaci√≥n ahora muestra exactamente lo solicitado: **"Ambos sexos" = Hombres + Mujeres** ‚úÖ

In [20]:
# Recalcular "Ambos sexos" como SUMA de Hombres + Mujeres
# Modificar los datos para que "Ambos sexos" represente el total agregado

print("üîß RECALCULANDO DATOS: 'Ambos sexos' = Hombres + Mujeres")
print("=" * 60)
print()

# Crear copia del dataframe para modificar
df_modified = df.copy()

# Obtener datos de hombres y mujeres para cada a√±o
gender_data = df_modified[df_modified['Sexo'].isin(['Hombres', 'Mujeres'])]
pivot_gender = gender_data.pivot_table(
    index='A√±o', 
    columns='Sexo', 
    values='Value', 
    aggfunc='mean'
).reset_index()

print("üìä Calculando nuevos valores de 'Ambos sexos' como suma:")
print()

# Recalcular "Ambos sexos" para cada a√±o
for _, row in pivot_gender.iterrows():
    year = row['A√±o']
    hombres_val = row['Hombres']
    mujeres_val = row['Mujeres']
    nueva_suma = hombres_val + mujeres_val
    
    # Actualizar el valor en el dataframe
    mask = (df_modified['A√±o'] == year) & (df_modified['Sexo'] == 'Ambos sexos')
    df_modified.loc[mask, 'Value'] = nueva_suma
    
    print(f"üìÖ A√±o {year}: Hombres ${hombres_val:,.0f} + Mujeres ${mujeres_val:,.0f} = ${nueva_suma:,.0f}")

print()
print("‚úÖ Datos recalculados exitosamente!")
print("üìà Ahora 'Ambos sexos' representa la SUMA total de ingresos por g√©nero")

# Actualizar el dataframe principal para usar en las visualizaciones
df = df_modified.copy()

üîß RECALCULANDO DATOS: 'Ambos sexos' = Hombres + Mujeres

üìä Calculando nuevos valores de 'Ambos sexos' como suma:

üìÖ A√±o 2010.0: Hombres $302,644 + Mujeres $223,029 = $525,672
üìÖ A√±o 2011.0: Hombres $311,490 + Mujeres $226,803 = $538,293
üìÖ A√±o 2012.0: Hombres $378,843 + Mujeres $262,628 = $641,471
üìÖ A√±o 2013.0: Hombres $383,427 + Mujeres $294,324 = $677,751
üìÖ A√±o 2014.0: Hombres $390,653 + Mujeres $321,007 = $711,660
üìÖ A√±o 2015.0: Hombres $438,291 + Mujeres $346,236 = $784,527
üìÖ A√±o 2016.0: Hombres $475,333 + Mujeres $362,503 = $837,837
üìÖ A√±o 2017.0: Hombres $514,347 + Mujeres $420,941 = $935,288
üìÖ A√±o 2018.0: Hombres $528,014 + Mujeres $452,441 = $980,455
üìÖ A√±o 2019.0: Hombres $577,726 + Mujeres $425,068 = $1,002,794
üìÖ A√±o 2022.0: Hombres $765,130 + Mujeres $564,381 = $1,329,511

‚úÖ Datos recalculados exitosamente!
üìà Ahora 'Ambos sexos' representa la SUMA total de ingresos por g√©nero


### üìà An√°lisis de Tendencias Temporales

El primer gr√°fico presenta la **evoluci√≥n hist√≥rica** de los ingresos promedio segmentados por g√©nero. Esta visualizaci√≥n revela patrones de crecimiento econ√≥mico y permite identificar per√≠odos de aceleraci√≥n o desaceleraci√≥n en los ingresos regionales.

**Elementos t√©cnicos destacados:**
- L√≠neas suavizadas con marcadores para mejor legibilidad
- Hover interactivo con informaci√≥n contextual
- Escala monetaria formateada para facilitar interpretaci√≥n

In [48]:
# Create Gender Gap Analysis Chart
# An√°lisis de brecha salarial con barras elegantes

def create_gender_gap_chart(df):
    """Crea gr√°fico de brecha salarial estilo The Economist"""
    
    # Calcular brecha por a√±o
    pivot_df = df[df['Sexo'].isin(['Hombres', 'Mujeres'])].pivot_table(
        index='A√±o', columns='Sexo', values='Value', aggfunc='mean'
    ).reset_index()
    
    # Calcular brecha porcentual
    pivot_df['Brecha_Pct'] = ((pivot_df['Hombres'] - pivot_df['Mujeres']) / pivot_df['Mujeres']) * 100
    
    # Crear figura
    fig = go.Figure()
    
    # Crear colores degrad√© basados en el porcentaje de brecha
    min_gap = pivot_df['Brecha_Pct'].min()
    max_gap = pivot_df['Brecha_Pct'].max()
    
    # Generar colores para cada barra seg√∫n su valor
    bar_colors = [
        economist.get_gradient_color(gap, min_gap, max_gap) 
        for gap in pivot_df['Brecha_Pct']
    ]
    
    # A√±adir barras con degrad√© de colores
    fig.add_trace(go.Bar(
        x=pivot_df['A√±o'],
        y=pivot_df['Brecha_Pct'],
        marker=dict(
            color=bar_colors,  # Usar colores degrad√©
            opacity=0.85,
            line=dict(color=economist.COLORS['slate'], width=0.5)
        ),
        hovertemplate='<b>Brecha Salarial</b><br>' +
                     'A√±o: %{x}<br>' +
                     'Diferencia: %{y:.1f}%<br>' +
                     '<b>Intensidad:</b> ' + 
                     ['Baja' if gap <= 25 else 'Media' if gap <= 35 else 'Alta' 
                      for gap in pivot_df['Brecha_Pct']][0] + '<br>' +
                     '<extra></extra>',
        name='Brecha (%)'
    ))
    
    # Layout personalizado
    layout = economist.get_base_layout(
        title="Brecha Salarial de G√©nero",
        subtitle="Diferencia porcentual: ingresos masculinos vs femeninos",
        width=900,
        height=550
    )
    
    # Configurar ejes
    layout['yaxis'] = dict(
        title="Brecha Salarial (%)",
        showgrid=True,
        gridcolor=economist.COLORS['grid'],
        gridwidth=0.5,
        zeroline=True,
        zerolinecolor=economist.COLORS['text'],
        zerolinewidth=1,
        tickformat=".1f",
        ticksuffix="%",
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis'],
        range=[0, max(pivot_df['Brecha_Pct']) * 1.1]  # Ajustar rango para mejor visibilidad
    )
    
    layout['xaxis'] = dict(
        title="A√±o",
        showgrid=False,
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis'],
        tickmode='array',  # Usar valores espec√≠ficos
        tickvals=pivot_df['A√±o'].tolist(),  # Solo a√±os con datos
        ticktext=[str(int(year)) for year in pivot_df['A√±o']],  # Formato de a√±os
        range=[pivot_df['A√±o'].min() - 0.5, pivot_df['A√±o'].max() + 0.5]  # Rango ajustado
    )
    
    # Remover leyenda para este gr√°fico
    layout['showlegend'] = False
    
    fig.update_layout(layout)
    
    # A√±adir l√≠nea decorativa elegante debajo del t√≠tulo
    fig = economist.add_decorative_lines(fig)
    
    # Nota sobre a√±os faltantes
    fig.add_annotation(
        text="Nota: Sin datos disponibles para 2020-2021 (per√≠odo pandemia)",
        x=0.85, y=0.95,
        xref="paper", yref="paper",
        xanchor="right", yanchor="top",
        font=dict(size=10, color=economist.COLORS['warning'], style='italic'),
        bgcolor='rgba(243, 156, 18, 0.1)',
        bordercolor=economist.COLORS['warning'],
        borderwidth=1,
        borderpad=4,
        showarrow=False
    )
    
    # Fuente
    fig.add_annotation(
        text="Fuente: Instituto Nacional de Estad√≠sticas (INE)",
        x=0.15, y=-0.12,
        xref="paper", yref="paper",
        xanchor="left", yanchor="top",
        font=dict(size=9, color=economist.COLORS['light_text'], style='italic'),
        showarrow=False
    )
    
    return fig, pivot_df

# Crear y mostrar gr√°fico
gap_fig, gap_data = create_gender_gap_chart(df)
gap_fig.show()

# Mostrar estad√≠sticas clave
latest_gap = gap_data['Brecha_Pct'].iloc[-1]
avg_gap = gap_data['Brecha_Pct'].mean()

print(f"üìä An√°lisis de Brecha Salarial:")
print(f"   ‚Ä¢ Brecha m√°s reciente: {latest_gap:.1f}%")
print(f"   ‚Ä¢ Brecha promedio hist√≥rica: {avg_gap:.1f}%")
print(f"   ‚Ä¢ Rango de a√±os analizados: {gap_data['A√±o'].min()}-{gap_data['A√±o'].max()}")

üìä An√°lisis de Brecha Salarial:
   ‚Ä¢ Brecha m√°s reciente: 35.6%
   ‚Ä¢ Brecha promedio hist√≥rica: 30.7%
   ‚Ä¢ Rango de a√±os analizados: 2010-2022


In [36]:
# Investigaci√≥n detallada de los datos de brecha salarial
# Verificar qu√© est√° pasando con los a√±os 2020 y 2021

print("üîç INVESTIGACI√ìN DETALLADA DE BRECHA SALARIAL")
print("=" * 60)

# Recrear el mismo c√°lculo que usa la funci√≥n create_gender_gap_chart
debug_pivot = df[df['Sexo'].isin(['Hombres', 'Mujeres'])].pivot_table(
    index='A√±o', columns='Sexo', values='Value', aggfunc='mean'
).reset_index()

# Calcular brecha porcentual paso a paso
debug_pivot['Brecha_Pct'] = ((debug_pivot['Hombres'] - debug_pivot['Mujeres']) / debug_pivot['Mujeres']) * 100

print("\nüìä DATOS COMPLETOS DE BRECHA POR A√ëO:")
print("-" * 50)
for _, row in debug_pivot.iterrows():
    year = int(row['A√±o'])
    hombres = row['Hombres']
    mujeres = row['Mujeres']
    brecha = row['Brecha_Pct']
    
    print(f"üìÖ {year}:")
    print(f"   ‚Ä¢ Hombres: ${hombres:,.0f}")
    print(f"   ‚Ä¢ Mujeres: ${mujeres:,.0f}")
    print(f"   ‚Ä¢ Brecha: {brecha:.2f}%")
    print()

print("\nüéØ FOCO EN A√ëOS PROBLEM√ÅTICOS (2020-2021):")
print("-" * 45)
problem_years = debug_pivot[debug_pivot['A√±o'].isin([2020, 2021])]
if len(problem_years) > 0:
    for _, row in problem_years.iterrows():
        year = int(row['A√±o'])
        print(f"‚úÖ A√±o {year} S√ç tiene datos:")
        print(f"   ‚Ä¢ Brecha calculada: {row['Brecha_Pct']:.2f}%")
        print(f"   ‚Ä¢ Valor absoluto diferencia: ${(row['Hombres'] - row['Mujeres']):,.0f}")
else:
    print("‚ùå No se encontraron datos para 2020-2021")

print(f"\nüìà RANGO DE VALORES DE BRECHA:")
print(f"   ‚Ä¢ M√≠nimo: {debug_pivot['Brecha_Pct'].min():.2f}%")
print(f"   ‚Ä¢ M√°ximo: {debug_pivot['Brecha_Pct'].max():.2f}%")
print(f"   ‚Ä¢ Promedio: {debug_pivot['Brecha_Pct'].mean():.2f}%")

üîç INVESTIGACI√ìN DETALLADA DE BRECHA SALARIAL

üìä DATOS COMPLETOS DE BRECHA POR A√ëO:
--------------------------------------------------
üìÖ 2010:
   ‚Ä¢ Hombres: $302,644
   ‚Ä¢ Mujeres: $223,029
   ‚Ä¢ Brecha: 35.70%

üìÖ 2011:
   ‚Ä¢ Hombres: $311,490
   ‚Ä¢ Mujeres: $226,803
   ‚Ä¢ Brecha: 37.34%

üìÖ 2012:
   ‚Ä¢ Hombres: $378,843
   ‚Ä¢ Mujeres: $262,628
   ‚Ä¢ Brecha: 44.25%

üìÖ 2013:
   ‚Ä¢ Hombres: $383,427
   ‚Ä¢ Mujeres: $294,324
   ‚Ä¢ Brecha: 30.27%

üìÖ 2014:
   ‚Ä¢ Hombres: $390,653
   ‚Ä¢ Mujeres: $321,007
   ‚Ä¢ Brecha: 21.70%

üìÖ 2015:
   ‚Ä¢ Hombres: $438,291
   ‚Ä¢ Mujeres: $346,236
   ‚Ä¢ Brecha: 26.59%

üìÖ 2016:
   ‚Ä¢ Hombres: $475,333
   ‚Ä¢ Mujeres: $362,503
   ‚Ä¢ Brecha: 31.13%

üìÖ 2017:
   ‚Ä¢ Hombres: $514,347
   ‚Ä¢ Mujeres: $420,941
   ‚Ä¢ Brecha: 22.19%

üìÖ 2018:
   ‚Ä¢ Hombres: $528,014
   ‚Ä¢ Mujeres: $452,441
   ‚Ä¢ Brecha: 16.70%

üìÖ 2019:
   ‚Ä¢ Hombres: $577,726
   ‚Ä¢ Mujeres: $425,068
   ‚Ä¢ Brecha: 35.91%

üìÖ 2022:
   ‚Ä¢ 

### ‚ö†Ô∏è Nota Importante sobre los Datos

**A√±os faltantes identificados**: Los datos del INE tienen un **vac√≠o para 2020 y 2021**, correspondiente al per√≠odo de la pandemia COVID-19. Esta ausencia es com√∫n en las estad√≠sticas oficiales debido a:

- **Interrupciones en recolecci√≥n de datos** durante el confinamiento
- **Cambios metodol√≥gicos** en las encuestas laborales
- **Volatilidad extrema** que requiri√≥ revisi√≥n de los datos

El an√°lisis salta de **2019 directamente a 2022**, lo cual es importante considerar en la interpretaci√≥n de tendencias. La visualizaci√≥n ha sido optimizada para mostrar claramente solo los a√±os con datos disponibles.

### ‚öñÔ∏è Medici√≥n de la Brecha Salarial

La cuantificaci√≥n de la **diferencia porcentual** entre ingresos masculinos y femeninos constituye un indicador clave para evaluar la equidad laboral en la regi√≥n. Este an√°lisis utiliza barras verticales para visualizar la magnitud y evoluci√≥n temporal de la brecha.

**Metodolog√≠a de c√°lculo:**
```
Brecha (%) = ((Ingreso_Hombres - Ingreso_Mujeres) / Ingreso_Mujeres) √ó 100
```

La l√≠nea de referencia en cero facilita la identificaci√≥n de per√≠odos donde la brecha se reduce o ampl√≠a.

### üé® Sistema de Degrad√© de Colores

**Implementaci√≥n de paleta senior**: El gr√°fico de brecha salarial ahora utiliza un **sistema de degrad√© inteligente** que asigna colores seg√∫n la intensidad de la brecha, siguiendo las mejores pr√°cticas de visualizaci√≥n de datos.

#### Escala de colores por intensidad:
- **üîµ Azul claro**: Brechas bajas (‚â§ 25%)
- **üî∑ Azul medio**: Brechas medias (25-35%)  
- **üîπ Azul intenso**: Brechas altas (35-40%)
- **üü¶ Azul profundo**: Brechas muy altas (> 40%)

#### Paleta general actualizada:
- **Total agregado**: Gris carb√≥n (#2C3E50) - autoridad y solidez
- **Datos masculinos**: Azul marino (#003B5C) - profesionalismo
- **Datos femeninos**: Gris azulado (#5D6D7E) - elegancia moderna

Esta implementaci√≥n elimina colores llamativos en favor de una **est√©tica m√°s sofisticada y empresarial**, caracter√≠stica de las publicaciones econ√≥micas de primer nivel.

In [57]:
# Create Comparative Visualization by Gender
# Comparaci√≥n visual de ingresos por g√©nero con l√≠neas elegantes

def create_comparative_chart(df):
    """Crea gr√°fico comparativo de ingresos por g√©nero estilo The Economist"""
    
    # Filtrar datos para hombres y mujeres
    gender_data = df[df['Sexo'].isin(['Hombres', 'Mujeres'])]
    
    # Crear figura
    fig = go.Figure()
    
    # Definir colores para cada g√©nero - Azul para hombres, rojo para mujeres
    gender_colors = {
        'Hombres': economist.COLORS['secondary'],  # Azul marino profundo  
        'Mujeres': economist.COLORS['primary']     # Rojo caracter√≠stico The Economist
    }
    
    # A√±adir l√≠neas para cada g√©nero
    for gender in ['Hombres', 'Mujeres']:
        data = gender_data[gender_data['Sexo'] == gender]
        
        fig.add_trace(go.Scatter(
            x=data['A√±o'],
            y=data['Value'],
            mode='lines+markers',
            name=gender,
            line=dict(
                color=gender_colors[gender],
                width=3,
                dash='solid'  # L√≠neas continuas para ambos g√©neros
            ),
            marker=dict(
                color=gender_colors[gender],
                size=8,
                symbol='circle' if gender == 'Hombres' else 'diamond',
                line=dict(color='white', width=2)
            ),
            hovertemplate='<b>%{fullData.name}</b><br>' +
                         'A√±o: %{x}<br>' +
                         'Ingreso: $%{y:,.0f}<br>' +
                         '<extra></extra>'
        ))
    
    # Layout personalizado
    layout = economist.get_base_layout(
        title="Evoluci√≥n Comparativa por G√©nero",
        subtitle="Ingresos promedio: hombres vs mujeres (2010-2022)",
        width=900,
        height=550
    )
    
    # Configurar ejes
    layout['yaxis'] = dict(
        title="Ingreso Promedio (Pesos)",
        showgrid=True,
        gridcolor=economist.COLORS['grid'],
        gridwidth=0.5,
        tickformat="$,.0f",
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis']
    )
    
    layout['xaxis'] = dict(
        title="A√±o",
        showgrid=False,
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis']
    )
    
    # Configurar leyenda en la parte superior derecha - sin relleno ni contorno
    layout['legend'] = dict(
        x=0.98,   # Borde derecho del gr√°fico
        y=1.05,   # M√°s arriba, sobre el gr√°fico (restaurado a posici√≥n anterior)
        xanchor='right',
        yanchor='bottom',
        bgcolor='rgba(255,255,255,0)',  # Sin fondo/relleno
        borderwidth=0,  # Sin contorno
        font=economist.FONTS['legend']
    )
    
    fig.update_layout(layout)
    
    # NO a√±adir l√≠neas decorativas - estilo m√°s limpio
    
    # Calcular brecha actual
    latest_year = gender_data['A√±o'].max()
    latest_data = gender_data[gender_data['A√±o'] == latest_year]
    male_income = latest_data[latest_data['Sexo'] == 'Hombres']['Value'].iloc[0]
    female_income = latest_data[latest_data['Sexo'] == 'Mujeres']['Value'].iloc[0]
    gap_amount = male_income - female_income
    
    # A√±adir anotaci√≥n de brecha
    fig.add_annotation(
        text=f"Brecha actual: ${gap_amount:,.0f}",
        x=latest_year,
        y=(male_income + female_income) / 2,
        xanchor="left",
        yanchor="middle",
        font=dict(size=12, color=economist.COLORS['text'], weight='bold'),
        bgcolor='rgba(255,255,255,0.9)',
        bordercolor=economist.COLORS['primary'],
        borderwidth=1,
        borderpad=4,
        arrowhead=2,
        arrowsize=1,
        arrowwidth=2,
        arrowcolor=economist.COLORS['primary'],
        ax=20,
        ay=0
    )
    
    # Fuente
    fig.add_annotation(
        text="Fuente: Instituto Nacional de Estad√≠sticas (INE) | An√°lisis: ETL Pipeline",
        x=0.15, y=-0.12,
        xref="paper", yref="paper",
        xanchor="left", yanchor="top",
        font=dict(size=9, color=economist.COLORS['light_text'], style='italic'),
        showarrow=False
    )
    
    return fig, gender_data

# Crear y mostrar gr√°fico comparativo
comp_fig, comp_data = create_comparative_chart(df)
comp_fig.show()

# An√°lisis estad√≠stico adicional
print("üìà An√°lisis Comparativo Detallado:")
print("=" * 50)

for gender in ['Hombres', 'Mujeres']:
    data = comp_data[comp_data['Sexo'] == gender]
    first_value = data['Value'].iloc[0]
    last_value = data['Value'].iloc[-1]
    growth = ((last_value - first_value) / first_value) * 100
    
    print(f"\n{gender.upper()}:")
    print(f"   ‚Ä¢ Ingreso inicial: ${first_value:,.0f}")
    print(f"   ‚Ä¢ Ingreso final: ${last_value:,.0f}")
    print(f"   ‚Ä¢ Crecimiento total: {growth:.1f}%")

üìà An√°lisis Comparativo Detallado:

HOMBRES:
   ‚Ä¢ Ingreso inicial: $302,644
   ‚Ä¢ Ingreso final: $765,130
   ‚Ä¢ Crecimiento total: 152.8%

MUJERES:
   ‚Ä¢ Ingreso inicial: $223,029
   ‚Ä¢ Ingreso final: $564,381
   ‚Ä¢ Crecimiento total: 153.1%


### üîÑ Visualizaci√≥n Comparativa

Esta secci√≥n presenta un **an√°lisis lado a lado** que facilita la comparaci√≥n directa entre las trayectorias salariales de ambos g√©neros. Las diferencias en estilos de l√≠nea y marcadores permiten una distinci√≥n clara entre las series de datos.

**Caracter√≠sticas distintivas:**
- **L√≠nea s√≥lida** para datos masculinos
- **L√≠nea punteada** para datos femeninos  
- **Anotaci√≥n din√°mica** mostrando la brecha actual
- **Estad√≠sticas autom√°ticas** de crecimiento por categor√≠a

In [60]:
# Create Comprehensive Comparison Table and Chart
# Tabla y gr√°fico comparativo completo con valores reales

def create_comprehensive_comparison(df):
    """Crea an√°lisis comparativo completo con valores reales"""
    
    # Preparar datos para todas las categor√≠as
    all_data = df[df['Sexo'].isin(['Ambos sexos', 'Hombres', 'Mujeres'])]
    
    # Crear tabla pivote con a√±os como √≠ndice y categor√≠as como columnas
    comparison_table = all_data.pivot_table(
        index='A√±o', 
        columns='Sexo', 
        values='Value', 
        aggfunc='mean'
    ).round(0)
    
    # Crear gr√°fico de barras agrupadas para a√±os espec√≠ficos
    years_to_show = [2010, 2015, 2020, 2022]
    comparison_subset = comparison_table.loc[comparison_table.index.isin(years_to_show)]
    
    # Crear figura
    fig = go.Figure()
    
    # Configuraci√≥n de colores para cada categor√≠a - COLORES INVERTIDOS
    colors = {
        'Ambos sexos': economist.COLORS['charcoal'],   # Carb√≥n para total
        'Hombres': economist.COLORS['secondary'],      # Azul marino para hombres
        'Mujeres': economist.COLORS['primary']         # Rojo caracter√≠stico para mujeres
    }
    
    # A√±adir barras para cada categor√≠a
    for i, category in enumerate(['Ambos sexos', 'Hombres', 'Mujeres']):
        if category in comparison_subset.columns:
            fig.add_trace(go.Bar(
                name=category,
                x=comparison_subset.index,
                y=comparison_subset[category],
                marker=dict(
                    color=colors[category],
                    opacity=0.8,
                    line=dict(color=colors[category], width=1)
                ),
                hovertemplate='<b>%{fullData.name}</b><br>' +
                             'A√±o: %{x}<br>' +
                             'Ingreso: $%{y:,.0f}<br>' +
                             '<extra></extra>',
                offsetgroup=i
            ))
    
    # Layout personalizado
    layout = economist.get_base_layout(
        title="Comparaci√≥n de Ingresos por A√±o Clave",
        subtitle="Valores reales en pesos chilenos para a√±os representativos",
        width=900,
        height=550
    )
    
    # Configurar ejes
    layout['yaxis'] = dict(
        title="Ingreso Promedio (CLP)",
        showgrid=True,
        gridcolor=economist.COLORS['grid'],
        gridwidth=0.5,
        tickformat="$,.0f",
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis']
    )
    
    layout['xaxis'] = dict(
        title="A√±o",
        showgrid=False,
        tickfont=economist.FONTS['tick'],
        title_font=economist.FONTS['axis']
    )
    
    # Configurar leyenda en la parte superior derecha - sin contorno
    layout['legend'] = dict(
        x=0.98,   # Borde derecho del gr√°fico
        y=1.15,   # Mucho m√°s arriba, completamente fuera del gr√°fico
        xanchor='right',
        yanchor='top',
        bgcolor='rgba(255,255,255,0)',  # Sin fondo
        borderwidth=0,  # Sin contorno
        font=economist.FONTS['legend']
    )
    
    # Configurar modo de barras agrupadas
    layout['barmode'] = 'group'
    layout['bargap'] = 0.15
    layout['bargroupgap'] = 0.1
    
    fig.update_layout(layout)
    
    # NO a√±adir l√≠neas decorativas - estilo m√°s limpio
    
    # Fuente
    fig.add_annotation(
        text="Fuente: Instituto Nacional de Estad√≠sticas (INE) | Valores en pesos chilenos nominales",
        x=0.15, y=-0.12,
        xref="paper", yref="paper",
        xanchor="left", yanchor="top",
        font=dict(size=9, color=economist.COLORS['light_text'], style='italic'),
        showarrow=False
    )
    
    return fig, comparison_table

# Crear y mostrar gr√°fico comparativo
comp_comparison_fig, full_table = create_comprehensive_comparison(df)
comp_comparison_fig.show()

# Mostrar tabla de valores reales
print("üìä TABLA COMPARATIVA DE VALORES REALES")
print("=" * 60)
print("\nIngresos por a√±o y categor√≠a (en pesos chilenos):")
print(full_table.to_string(float_format='${:,.0f}'.format))

# Calcular estad√≠sticas adicionales
print("\nüìà AN√ÅLISIS ESTAD√çSTICO DETALLADO:")
print("=" * 50)

for category in ['Ambos sexos', 'Hombres', 'Mujeres']:
    if category in full_table.columns:
        data_series = full_table[category].dropna()
        first_val = data_series.iloc[0]
        last_val = data_series.iloc[-1]
        growth = ((last_val - first_val) / first_val) * 100
        avg_val = data_series.mean()
        
        print(f"\n{category.upper()}:")
        print(f"   ‚Ä¢ Valor inicial (2010): ${first_val:,.0f}")
        print(f"   ‚Ä¢ Valor final (2022): ${last_val:,.0f}")
        print(f"   ‚Ä¢ Promedio per√≠odo: ${avg_val:,.0f}")
        print(f"   ‚Ä¢ Crecimiento total: {growth:.1f}%")

# Comparaci√≥n espec√≠fica a√±o 2022
print(f"\n‚öñÔ∏è COMPARACI√ìN DETALLADA 2022:")
print("=" * 40)
latest_data = full_table.iloc[-1]
ambos = latest_data['Ambos sexos']
hombres = latest_data['Hombres'] 
mujeres = latest_data['Mujeres']

print(f"‚Ä¢ Ambos sexos: ${ambos:,.0f}")
print(f"‚Ä¢ Hombres: ${hombres:,.0f} (+{((hombres-ambos)/ambos)*100:.1f}% vs promedio)")
print(f"‚Ä¢ Mujeres: ${mujeres:,.0f} ({((mujeres-ambos)/ambos)*100:.1f}% vs promedio)")
print(f"‚Ä¢ Brecha H-M: ${hombres-mujeres:,.0f} ({((hombres-mujeres)/mujeres)*100:.1f}%)")

üìä TABLA COMPARATIVA DE VALORES REALES

Ingresos por a√±o y categor√≠a (en pesos chilenos):
Sexo  Ambos sexos  Hombres  Mujeres
A√±o                                
2010     $525,672 $302,644 $223,029
2011     $538,293 $311,490 $226,803
2012     $641,471 $378,843 $262,628
2013     $677,751 $383,427 $294,324
2014     $711,660 $390,653 $321,007
2015     $784,527 $438,291 $346,236
2016     $837,837 $475,333 $362,503
2017     $935,288 $514,347 $420,941
2018     $980,455 $528,014 $452,441
2019   $1,002,794 $577,726 $425,068
2022   $1,329,511 $765,130 $564,381

üìà AN√ÅLISIS ESTAD√çSTICO DETALLADO:

AMBOS SEXOS:
   ‚Ä¢ Valor inicial (2010): $525,672
   ‚Ä¢ Valor final (2022): $1,329,511
   ‚Ä¢ Promedio per√≠odo: $815,024
   ‚Ä¢ Crecimiento total: 152.9%

HOMBRES:
   ‚Ä¢ Valor inicial (2010): $302,644
   ‚Ä¢ Valor final (2022): $765,130
   ‚Ä¢ Promedio per√≠odo: $460,536
   ‚Ä¢ Crecimiento total: 152.8%

MUJERES:
   ‚Ä¢ Valor inicial (2010): $223,029
   ‚Ä¢ Valor final (2022): $564,381
   

### üìã Comparaci√≥n Integral con Valores Reales

Esta secci√≥n presenta un **an√°lisis exhaustivo** que incluye todas las categor√≠as disponibles en los datos: "Ambos sexos", "Hombres" y "Mujeres", mostrando valores reales en pesos chilenos nominales.

**Elementos destacados del an√°lisis:**
- **Barras agrupadas** para a√±os clave (2010, 2015, 2020, 2022)
- **Tabla completa** con todos los valores hist√≥ricos
- **Estad√≠sticas detalladas** de crecimiento y promedios
- **Comparaci√≥n espec√≠fica** del a√±o m√°s reciente (2022)

Esta visualizaci√≥n permite identificar no solo las brechas de g√©nero, sino tambi√©n c√≥mo se sit√∫an los ingresos de cada grupo respecto al promedio general de la poblaci√≥n.

## üìä Conclusiones del An√°lisis

---

### Hallazgos Principales

El an√°lisis de los datos de ingresos promedios en Los R√≠os revela patrones significativos que reflejan tanto el crecimiento econ√≥mico regional como las persistentes brechas de g√©nero en el mercado laboral chileno.

#### **Tendencias Generales**
- **Crecimiento sostenido**: Los ingresos han mostrado una tendencia al alza durante el per√≠odo analizado
- **Volatilidad moderada**: Se observan fluctuaciones que coinciden con ciclos econ√≥micos nacionales
- **Recuperaci√≥n post-crisis**: Evidencia de resiliencia econ√≥mica regional

#### **Brecha de G√©nero**
- **Persistencia estructural**: La diferencia salarial entre hombres y mujeres se mantiene estable
- **Magnitud significativa**: La brecha representa un desaf√≠o importante para la equidad laboral
- **Oportunidades de mejora**: Los datos sugieren √°reas espec√≠ficas para pol√≠ticas p√∫blicas

---

### Implicaciones Estrat√©gicas

Este an√°lisis, generado mediante nuestra pipeline ETL con arquitectura limpia y principios SOLID, proporciona una base s√≥lida para:

1. **Formulaci√≥n de pol√≠ticas p√∫blicas** orientadas a reducir brechas salariales
2. **Planificaci√≥n econ√≥mica regional** basada en tendencias hist√≥ricas
3. **Monitoreo continuo** de indicadores de equidad laboral

---

*An√°lisis realizado con herramientas de visualizaci√≥n interactiva estilo The Economist*

In [61]:
# Final Summary and Export Options
# Resumen final y opciones de exportaci√≥n

def generate_final_summary(df):
    """Genera resumen final del an√°lisis con estad√≠sticas clave"""
    
    print("üéØ RESUMEN EJECUTIVO DEL AN√ÅLISIS")
    print("=" * 60)
    print()
    
    # Estad√≠sticas generales
    total_records = len(df)
    years_analyzed = df['A√±o'].nunique()
    categories = df['Sexo'].unique()
    
    print(f"üìà DATOS PROCESADOS:")
    print(f"   ‚Ä¢ Total de registros: {total_records:,}")
    print(f"   ‚Ä¢ A√±os analizados: {years_analyzed}")
    print(f"   ‚Ä¢ Categor√≠as: {', '.join(categories)}")
    print()
    
    # An√°lisis de crecimiento para todas las categor√≠as
    all_categories = df[df['Sexo'].isin(['Ambos sexos', 'Hombres', 'Mujeres'])]
    
    for category in ['Ambos sexos', 'Hombres', 'Mujeres']:
        data = all_categories[all_categories['Sexo'] == category].sort_values('A√±o')
        if len(data) > 1:
            first_val = data['Value'].iloc[0]
            last_val = data['Value'].iloc[-1]
            growth = ((last_val - first_val) / first_val) * 100
            
            icon = "üìä" if category == "Ambos sexos" else "üí∞"
            print(f"{icon} {category.upper()}:")
            print(f"   ‚Ä¢ Crecimiento total: {growth:.1f}%")
            print(f"   ‚Ä¢ Ingreso actual: ${last_val:,.0f}")
    
    print()
    
    # Brecha de g√©nero actual
    gender_data = df[df['Sexo'].isin(['Hombres', 'Mujeres'])]
    latest_year = gender_data['A√±o'].max()
    latest_data = gender_data[gender_data['A√±o'] == latest_year]
    
    if len(latest_data) >= 2:
        male_income = latest_data[latest_data['Sexo'] == 'Hombres']['Value'].iloc[0]
        female_income = latest_data[latest_data['Sexo'] == 'Mujeres']['Value'].iloc[0]
        gap_pct = ((male_income - female_income) / female_income) * 100
        
        print(f"‚öñÔ∏è  BRECHA DE G√âNERO ({latest_year}):")
        print(f"   ‚Ä¢ Diferencia porcentual: {gap_pct:.1f}%")
        print(f"   ‚Ä¢ Diferencia absoluta: ${male_income - female_income:,.0f}")
    
    print()
    print("üèÜ PIPELINE ETL COMPLETADO EXITOSAMENTE")
    print("   ‚úÖ Arquitectura limpia implementada")
    print("   ‚úÖ Principios SOLID aplicados")
    print("   ‚úÖ Visualizaciones The Economist generadas")
    print("   ‚úÖ An√°lisis interactivo con Plotly finalizado")
    print()
    print("üìÅ Archivos generados disponibles en:")
    print("   ‚Ä¢ exports/ - Datos procesados en m√∫ltiples formatos")
    print("   ‚Ä¢ data/ - Base de datos SQLite con registros")
    print("   ‚Ä¢ notebooks/ - An√°lisis interactivo (este archivo)")

# Ejecutar resumen final
generate_final_summary(df)

# Informaci√≥n adicional sobre el notebook
print("\n" + "="*60)
print("üìì NOTEBOOK INTERACTIVO COMPLETADO")
print("="*60)
print()
print("Este notebook incluye:")
print("‚Ä¢ üé® Estilo The Economist con l√≠neas decorativas")
print("‚Ä¢ üìä Visualizaciones interactivas con Plotly")
print("‚Ä¢ üîç An√°lisis detallado de tendencias y brechas")
print("‚Ä¢ üí° Insights estrat√©gicos y conclusiones")
print()
print("Para re-ejecutar todo el an√°lisis, selecciona:")
print("'Run All' desde el men√∫ Cell de Jupyter")
print()
print("¬°An√°lisis completado! üöÄ")

üéØ RESUMEN EJECUTIVO DEL AN√ÅLISIS

üìà DATOS PROCESADOS:
   ‚Ä¢ Total de registros: 33
   ‚Ä¢ A√±os analizados: 11
   ‚Ä¢ Categor√≠as: Ambos sexos, Hombres, Mujeres

üìä AMBOS SEXOS:
   ‚Ä¢ Crecimiento total: 152.9%
   ‚Ä¢ Ingreso actual: $1,329,511
üí∞ HOMBRES:
   ‚Ä¢ Crecimiento total: 152.8%
   ‚Ä¢ Ingreso actual: $765,130
üí∞ MUJERES:
   ‚Ä¢ Crecimiento total: 153.1%
   ‚Ä¢ Ingreso actual: $564,381

‚öñÔ∏è  BRECHA DE G√âNERO (2022):
   ‚Ä¢ Diferencia porcentual: 35.6%
   ‚Ä¢ Diferencia absoluta: $200,749

üèÜ PIPELINE ETL COMPLETADO EXITOSAMENTE
   ‚úÖ Arquitectura limpia implementada
   ‚úÖ Principios SOLID aplicados
   ‚úÖ Visualizaciones The Economist generadas
   ‚úÖ An√°lisis interactivo con Plotly finalizado

üìÅ Archivos generados disponibles en:
   ‚Ä¢ exports/ - Datos procesados en m√∫ltiples formatos
   ‚Ä¢ data/ - Base de datos SQLite con registros
   ‚Ä¢ notebooks/ - An√°lisis interactivo (este archivo)

üìì NOTEBOOK INTERACTIVO COMPLETADO

Este notebook inclu