# Actividad Grupal: An√°lisis de Desigualdad - Versi√≥n con Problemas de Visualizaci√≥n

Este notebook contiene **visualizaciones problem√°ticas** que demuestran c√≥mo NO se deben crear gr√°ficos para an√°lisis de datos. Los problemas incluyen:

1. **Escalas mal ajustadas**: Ejes Y truncados que exageran falsamente las diferencias
2. **Paletas de colores inadecuadas**: Colores similares que dificultan la comparaci√≥n entre pa√≠ses


In [215]:
import pandas as pd

# La URL "raw" es necesaria para que pandas pueda leer el flujo de datos directamente
ruta_github = "https://github.com/HugoAguilarReyna/Visualizacion_Inter_Info/raw/454eaf147621d033b7c2843363266a6aaf701cd2/API_SI.POV.GINI_DS2_es_excel_v2_126621.xls"

try:
    # Para archivos .xls antiguos, a veces es necesario especificar el motor 'xlrd'
    df = pd.read_excel(ruta_github, sheet_name='Data')
    print("¬°Datos cargados con √©xito desde GitHub!")
    print(df.head()) # Verificamos los primeros registros
except Exception as e:
    print(f"Error al cargar el archivo: {e}")
    print("\nNota: Aseg√∫rate de tener instalado xlrd (pip install xlrd) para leer archivos .xls")


¬°Datos cargados con √©xito desde GitHub!
  Country Name Country Code  Indicator Name Indicator Code  1960  1961  1962  \
0        Aruba          ABW  √çndice de Gini    SI.POV.GINI   NaN   NaN   NaN   
1          NaN          AFE  √çndice de Gini    SI.POV.GINI   NaN   NaN   NaN   
2   Afganist√°n          AFG  √çndice de Gini    SI.POV.GINI   NaN   NaN   NaN   
3          NaN          AFW  √çndice de Gini    SI.POV.GINI   NaN   NaN   NaN   
4       Angola          AGO  √çndice de Gini    SI.POV.GINI   NaN   NaN   NaN   

   1963  1964  1965  ...  2015  2016  2017  2018  2019  2020  2021  2022  \
0   NaN   NaN   NaN  ...   NaN   NaN   NaN   NaN   NaN   NaN   NaN   NaN   
1   NaN   NaN   NaN  ...   NaN   NaN   NaN   NaN   NaN   NaN   NaN   NaN   
2   NaN   NaN   NaN  ...   NaN   NaN   NaN   NaN   NaN   NaN   NaN   NaN   
3   NaN   NaN   NaN  ...   NaN   NaN   NaN   NaN   NaN   NaN   NaN   NaN   
4   NaN   NaN   NaN  ...   NaN   NaN   NaN  51.3   NaN   NaN   NaN   NaN   

   2023  2024 

In [216]:
# Las columnas que NO contienen los a√±os (variables de identificaci√≥n)
id_vars = ['Country Name', 'Country Code', 'Indicator Name', 'Indicator Code']

# Las columnas que S√ç contienen los a√±os (variables a "derretir")
year_cols = df.columns.difference(id_vars).tolist()

# 1. Aplicar melt()
df_long = df.melt(
    id_vars=id_vars,
    value_vars=year_cols,
    var_name='Year',
    value_name='Value'
)

# 2. Convertir la columna 'Year' a tipo num√©rico (entero) para an√°lisis
df_long['Year'] = pd.to_numeric(df_long['Year'])

# 3. Mostrar las primeras filas del nuevo DataFrame
print("Primeras filas del DataFrame en formato largo:")
print(df_long.head())


Primeras filas del DataFrame en formato largo:
  Country Name Country Code  Indicator Name Indicator Code  Year  Value
0        Aruba          ABW  √çndice de Gini    SI.POV.GINI  1960    NaN
1          NaN          AFE  √çndice de Gini    SI.POV.GINI  1960    NaN
2   Afganist√°n          AFG  √çndice de Gini    SI.POV.GINI  1960    NaN
3          NaN          AFW  √çndice de Gini    SI.POV.GINI  1960    NaN
4       Angola          AGO  √çndice de Gini    SI.POV.GINI  1960    NaN


In [217]:
df_clean = df_long.dropna(subset=['Value'])
print(f"Filas eliminadas (NaN en Value): {len(df_long) - len(df_clean)}")
df_clean = df_clean.dropna(subset=['Country Name'])


Filas eliminadas (NaN en Value): 14888


In [218]:
# Lista de agregaciones a excluir
names_to_exclude = [
    'Europa Central y del B√°ltico', 'El mundo √°rabe', 'Asia oriental y el Pac√≠fico (excluido altos ingresos)',
    'inicial del dividendo demogr√°fico', 'Asia oriental y el Pac√≠fico',
    'Europa y Asia central (excluido altos ingresos)', 'Europa y Asia central',
    'Zona del Euro', 'Uni√≥n Europea', 'Fr√°giles y situaciones de conflicto afectados',
    'Islas Feroe', 'Gibraltar', 'Groenlandia', 'Guam', 'Ingreso alto',
    'Pa√≠ses pobres muy endeudados (PPME)', 'S√≥lo BIRF', 'BIRF y la AIF',
    'total de la AIF', 'mezcla de la AIF', 'S√≥lo AIF', 'No clasificado',
    'Am√©rica Latina y el Caribe (excluido altos ingresos)', 'Am√©rica Latina y el Caribe',
    'Pa√≠ses menos desarrollados: clasificaci√≥n de las Naciones Unidas',
    'Pa√≠ses de ingreso bajo', 'Pa√≠ses de ingreso mediano bajo', 'Ingreso mediano y bajo',
    'avanzada del dividendo demogr√°fico', 'Oriente Medio, Norte de √Åfrica, Afganist√°n y Pakist√°n',
    'Ingreso mediano', 'Oriente Medio y Norte de √Åfrica (excluido altos ingresos)',
    'Am√©rica del Norte', 'Miembros OCDE', 'Otros Estados pequeos',
    'previa al dividendo demogr√°fico', 'Puerto Rico (US)', 'Ribera Occidental y Gaza',
    'Estados pequeos de las Islas del Pacfico', 'posterior al dividendo demogr√°fico',
    'Polinesia Francesa', 'Asia meridional', '√Åfrica al sur del Sahara (excluido altos ingresos)',
    'Sud√°n del Sur', '√Åfrica al sur del Sahara', 'Peque√±os Estados', 'Rep√∫blica √Årabe Siria',
    'Islas Turcas y Caicos', 'Asia oriental y el Pac√≠fico (BIRF y la AIF)',
    'Europa y Asia central (BIRF y la AIF)', 'Am√©rica Latina y el Caribe (BIRF y la AIF)',
    'Oriente Medio y Norte de √Åfrica (BIRF y la AIF)', 'Asia meridional (BIRF y la AIF)',
    '√Åfrica al sur del Sahara (BIRF y la AIF)', 'Ingreso mediano alto',
    'Islas V√≠rgenes Brit√°nicas', 'Islas V√≠rgenes (EE.UU.)', 'Mundo', 'Kosovo'
]

df_countries_by_name = df_long[~df_long['Country Name'].isin(names_to_exclude)].dropna(subset=['Value'])

print(f"Filas originales con datos v√°lidos: {len(df_long.dropna(subset=['Value']))}")
print(f"Filas despu√©s de la eliminaci√≥n de agregaciones: {len(df_countries_by_name)}")


Filas originales con datos v√°lidos: 2402
Filas despu√©s de la eliminaci√≥n de agregaciones: 2369


In [219]:
# Lista de pa√≠ses europeos
PAISES_EUROPEOS = [
    'Albania', 'Alemania', 'Armenia', 'Austria', 'Azerbaiy√°n', 'Belar√∫s', 
    'B√©lgica', 'Bosnia y Herzegovina', 'Bulgaria', 'Chipre', 'Croacia', 
    'Dinamarca', 'Eslovenia', 'Espa√±a', 'Estonia', 'Federaci√≥n de Rusia', 
    'Finlandia', 'Francia', 'Georgia', 'Grecia', 'Hungr√≠a', 'Irlanda', 
    'Islandia', 'Italia', 'Kazajst√°n', 'Letonia', 'Lituania', 'Luxemburgo', 
    'Macedonia del Norte', 'Malta', 'Montenegro', 'Noruega', 'Pa√≠ses Bajos', 
    'Polonia', 'Portugal', 'Reino Unido', 'Rep√∫blica Checa', 'Rep√∫blica de Moldova', 
    'Rep√∫blica Eslovaca', 'Rumania', 'Serbia', 'Suecia', 'Suiza', 'Turqu√≠a', 
    'Ucrania'
]

def get_agrupacion(country):
    occidental_nordica = [
        'Alemania', 'Austria', 'B√©lgica', 'Dinamarca', 'Eslovenia', 'Espa√±a', 
        'Finlandia', 'Francia', 'Grecia', 'Islandia', 'Irlanda', 'Italia', 
        'Luxemburgo', 'Malta', 'Noruega', 'Pa√≠ses Bajos', 'Portugal', 
        'Reino Unido', 'Suecia', 'Suiza'
    ]
    oriental_central = [
        'Albania', 'Belar√∫s', 'Bosnia y Herzegovina', 'Bulgaria', 'Chipre', 
        'Croacia', 'Estonia', 'Hungr√≠a', 'Letonia', 'Lituania', 'Macedonia del Norte', 
        'Montenegro', 'Polonia', 'Rep√∫blica Checa', 'Rep√∫blica de Moldova', 
        'Rep√∫blica Eslovaca', 'Rumania', 'Serbia', 'Ucrania'
    ]
    
    if country in occidental_nordica:
        return 'Europa Occidental / N√≥rdica'
    elif country in oriental_central:
        return 'Europa Oriental / Central'
    else: 
        return 'Transcontinental / C√°ucaso'

df_countries_by_name['Agrupacion'] = df_countries_by_name['Country Name'].apply(get_agrupacion)
df_paises_europeos = df_countries_by_name[df_countries_by_name['Country Name'].isin(PAISES_EUROPEOS)]


## Parte 1: Visualizaci√≥n con Problemas

### Problema 1: Escalas mal ajustadas y paleta de colores inadecuada

Esta visualizaci√≥n demuestra los problemas mencionados:
- **Eje Y truncado**: No comienza en 0, exagerando falsamente las diferencias
- **Paleta de colores problem√°tica**: Colores muy similares que dificultan la comparaci√≥n


In [220]:
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd

# Seleccionar algunos pa√≠ses para la visualizaci√≥n problem√°tica
PAISES_FILTRADOS = ['Reino Unido', 'Francia', 'Italia', 'Noruega', 'Suecia', 'Alemania', 'Espa√±a', 'Polonia']

df_estudio = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_FILTRADOS)].copy()

if df_estudio.empty:
    print("‚ùå Error: No se encontraron los pa√≠ses solicitados en el DataFrame.")
else:
    # ==========================================================
    # ‚ö†Ô∏è VISUALIZACI√ìN PROBLEM√ÅTICA 1: Eje Y truncado
    # ==========================================================
    print("‚ö†Ô∏è PROBLEMA 1: Eje Y truncado (no comienza en 0)")
    print("   Esto exagera falsamente las diferencias entre pa√≠ses")
    
    # Calcular el rango m√≠nimo y m√°ximo de los datos
    gini_min = df_estudio['Value'].min()
    gini_max = df_estudio['Value'].max()
    
    # ‚ö†Ô∏è PROBLEMA: Truncar el eje Y para exagerar diferencias
    # En lugar de [0, 50], usamos un rango muy estrecho
    Y_MIN_PROBLEMA = gini_min - 1  # No comienza en 0
    Y_MAX_PROBLEMA = gini_max + 1  # Rango muy estrecho
    
    # ‚ö†Ô∏è PROBLEMA: Paleta de colores con tonos muy similares (grises)
    # Esto dificulta distinguir entre pa√≠ses
    COLOR_PALETTE_PROBLEMA = [
        '#808080',  # Gris medio
        '#888888',  # Gris ligeramente m√°s claro
        '#909090',  # Gris m√°s claro
        '#989898',  # Gris a√∫n m√°s claro
        '#A0A0A0',  # Gris claro
        '#A8A8A8',  # Gris muy claro
        '#B0B0B0',  # Gris casi blanco
        '#B8B8B8'   # Gris muy claro
    ]
    
    fig_problema = px.line(
        df_estudio.sort_values('Year'),
        x='Year',
        y='Value',
        color='Country Name',
        color_discrete_sequence=COLOR_PALETTE_PROBLEMA,  # Colores muy similares
        markers=True,
        title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: Evoluci√≥n del Gini con Escala Truncada y Colores Similares</b>',
        labels={'Value': '√çndice de Gini', 'Year': 'A√±o'}
    )
    
    # ‚ö†Ô∏è Configuraci√≥n problem√°tica del eje Y
    fig_problema.update_layout(
        template='plotly_dark',
        plot_bgcolor='black',
        paper_bgcolor='black',
        yaxis=dict(
            range=[Y_MIN_PROBLEMA, Y_MAX_PROBLEMA],  # ‚ö†Ô∏è Rango truncado, no desde 0
            gridcolor='#333'
        ),
        xaxis=dict(gridcolor='#333'),
        legend=dict(
            orientation="h",
            yanchor="top",
            y=-0.3,
            xanchor="center",
            x=0.5
        )
    )
    
    fig_problema.show()
    
    print(f"\nüìä Rango del eje Y problem√°tico: [{Y_MIN_PROBLEMA:.1f}, {Y_MAX_PROBLEMA:.1f}]")
    print(f"   (Deber√≠a ser [0, 50] para una perspectiva real)")
    print(f"   ‚ö†Ô∏è Esto hace que diferencias peque√±as parezcan enormes!")


‚ö†Ô∏è PROBLEMA 1: Eje Y truncado (no comienza en 0)
   Esto exagera falsamente las diferencias entre pa√≠ses



üìä Rango del eje Y problem√°tico: [21.9, 39.8]
   (Deber√≠a ser [0, 50] para una perspectiva real)
   ‚ö†Ô∏è Esto hace que diferencias peque√±as parezcan enormes!


In [221]:
# ==========================================================
# ‚ö†Ô∏è VISUALIZACI√ìN PROBLEM√ÅTICA 2: M√∫ltiples pa√≠ses con colores similares
# ==========================================================
print("\n‚ö†Ô∏è PROBLEMA 2: M√∫ltiples pa√≠ses con colores muy similares")
print("   Esto hace imposible seguir las l√≠neas de cada pa√≠s")

# Seleccionar m√°s pa√≠ses para empeorar el problema
PAISES_MUCHOS = ['Reino Unido', 'Francia', 'Italia', 'Noruega', 'Suecia', 
                 'Alemania', 'Espa√±a', 'Polonia', 'B√©lgica', 'Austria', 
                 'Dinamarca', 'Finlandia', 'Portugal', 'Grecia', 'Pa√≠ses Bajos']

df_muchos = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_MUCHOS)].copy()

# ‚ö†Ô∏è PROBLEMA: Paleta con colores muy similares (todos en tonos azules/grises)
COLOR_PALETTE_SIMILAR = [
    '#4A90E2', '#5A9FE2', '#6AAEE2', '#7ABDE2', '#8ACCE2',  # Azules muy similares
    '#9ADBE2', '#AAEAE2', '#BAF9E2', '#CAFFE2', '#DAFFE2',  # Azules-verdes similares
    '#E2E2E2', '#E8E8E8', '#EEEEEE', '#F4F4F4', '#FAFAFA'   # Grises casi id√©nticos
]

fig_muchos = px.line(
    df_muchos.sort_values('Year'),
    x='Year',
    y='Value',
    color='Country Name',
    color_discrete_sequence=COLOR_PALETTE_SIMILAR,  # ‚ö†Ô∏è Colores muy similares
    markers=True,
    title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: 15 Pa√≠ses con Colores Casi Id√©nticos</b>',
    labels={'Value': '√çndice de Gini', 'Year': 'A√±o'}
)

# ‚ö†Ô∏è Tambi√©n truncar el eje Y para empeorar el problema
gini_min_muchos = df_muchos['Value'].min()
gini_max_muchos = df_muchos['Value'].max()

fig_muchos.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        range=[gini_min_muchos - 2, gini_max_muchos + 2],  # ‚ö†Ô∏è Truncado
        gridcolor='#333'
    ),
    xaxis=dict(gridcolor='#333'),
    legend=dict(
        orientation="v",
        yanchor="top",
        y=1,
        xanchor="left",
        x=1.02,
        font=dict(size=8)  # ‚ö†Ô∏è Leyenda peque√±a y dif√≠cil de leer
    ),
    margin=dict(r=150)  # Espacio para leyenda
)

fig_muchos.show()

print(f"\n‚ö†Ô∏è Problemas identificados:")
print(f"   1. {len(PAISES_MUCHOS)} pa√≠ses con colores casi id√©nticos")
print(f"   2. Eje Y truncado: [{gini_min_muchos - 2:.1f}, {gini_max_muchos + 2:.1f}]")
print(f"   3. Leyenda peque√±a y dif√≠cil de leer")
print(f"   4. Imposible distinguir qu√© l√≠nea corresponde a cada pa√≠s")



‚ö†Ô∏è PROBLEMA 2: M√∫ltiples pa√≠ses con colores muy similares
   Esto hace imposible seguir las l√≠neas de cada pa√≠s



‚ö†Ô∏è Problemas identificados:
   1. 15 pa√≠ses con colores casi id√©nticos
   2. Eje Y truncado: [20.2, 40.9]
   3. Leyenda peque√±a y dif√≠cil de leer
   4. Imposible distinguir qu√© l√≠nea corresponde a cada pa√≠s


In [222]:
# ==========================================================
# ‚ö†Ô∏è VISUALIZACI√ìN PROBLEM√ÅTICA 3: Box Plot con escala truncada
# ==========================================================
print("\n‚ö†Ô∏è PROBLEMA 3: Box Plot con escala truncada")
print("   Esto exagera las diferencias entre pa√≠ses")

fig_box_problema = px.box(
    df_estudio,
    x='Country Name',
    y='Value',
    color='Country Name',
    points="all",
    color_discrete_sequence=COLOR_PALETTE_PROBLEMA,  # ‚ö†Ô∏è Colores similares
    title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: Box Plot con Escala Truncada</b>'
)

# ‚ö†Ô∏è PROBLEMA: Eje Y truncado
gini_min_box = df_estudio['Value'].min()
gini_max_box = df_estudio['Value'].max()

fig_box_problema.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        range=[gini_min_box - 1, gini_max_box + 1],  # ‚ö†Ô∏è No comienza en 0
        gridcolor='#333'
    ),
    showlegend=False,
    xaxis=dict(tickangle=45)
)

fig_box_problema.show()

print(f"\n‚ö†Ô∏è Rango del eje Y: [{gini_min_box - 1:.1f}, {gini_max_box + 1:.1f}]")
print(f"   Deber√≠a ser [0, 50] para mostrar la verdadera magnitud de las diferencias")



‚ö†Ô∏è PROBLEMA 3: Box Plot con escala truncada
   Esto exagera las diferencias entre pa√≠ses



‚ö†Ô∏è Rango del eje Y: [21.9, 39.8]
   Deber√≠a ser [0, 50] para mostrar la verdadera magnitud de las diferencias


## Comparaci√≥n: Visualizaci√≥n Correcta vs. Problem√°tica

A continuaci√≥n se muestra una comparaci√≥n lado a lado para demostrar el impacto de estos problemas.


In [223]:
# ==========================================================
# COMPARACI√ìN: Correcta vs. Problem√°tica
# ==========================================================

# VISUALIZACI√ìN CORRECTA
print("‚úÖ VISUALIZACI√ìN CORRECTA:")
print("   - Eje Y desde 0 hasta 50")
print("   - Paleta de colores contrastantes y distinguibles")

COLOR_PALETTE_CORRECTA = ['#FF00FF', '#00FFFF', '#00FF00', '#FF4500', '#9400D3',
                          '#FF1493', '#00CED1', '#32CD32']

fig_correcta = px.line(
    df_estudio.sort_values('Year'),
    x='Year',
    y='Value',
    color='Country Name',
    color_discrete_sequence=COLOR_PALETTE_CORRECTA,  # ‚úÖ Colores contrastantes
    markers=True,
    title='<b>‚úÖ CORRECTO: Evoluci√≥n del Gini con Escala Completa y Colores Distinguibles</b>',
    labels={'Value': '√çndice de Gini', 'Year': 'A√±o'}
)

fig_correcta.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        range=[0, 50],  # ‚úÖ Comienza en 0, rango completo
        gridcolor='#333'
    ),
    xaxis=dict(gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    )
)

fig_correcta.show()

print("\n" + "="*80)
print("RESUMEN DE PROBLEMAS IDENTIFICADOS:")
print("="*80)
print("1. ‚ùå Eje Y truncado: Exagera falsamente las diferencias")
print("2. ‚ùå Paleta de colores similar: Dificulta distinguir pa√≠ses")
print("3. ‚ùå M√∫ltiples pa√≠ses con colores casi id√©nticos: Imposible seguir l√≠neas")
print("4. ‚ùå Leyenda mal posicionada o muy peque√±a: Dificulta la lectura")
print("\n‚úÖ SOLUCIONES:")
print("1. ‚úÖ Eje Y desde 0: Muestra la verdadera magnitud")
print("2. ‚úÖ Paleta contrastante: Facilita la comparaci√≥n")
print("3. ‚úÖ Limitar n√∫mero de pa√≠ses o usar small multiples")
print("4. ‚úÖ Leyenda clara y bien posicionada")


‚úÖ VISUALIZACI√ìN CORRECTA:
   - Eje Y desde 0 hasta 50
   - Paleta de colores contrastantes y distinguibles



RESUMEN DE PROBLEMAS IDENTIFICADOS:
1. ‚ùå Eje Y truncado: Exagera falsamente las diferencias
2. ‚ùå Paleta de colores similar: Dificulta distinguir pa√≠ses
3. ‚ùå M√∫ltiples pa√≠ses con colores casi id√©nticos: Imposible seguir l√≠neas
4. ‚ùå Leyenda mal posicionada o muy peque√±a: Dificulta la lectura

‚úÖ SOLUCIONES:
1. ‚úÖ Eje Y desde 0: Muestra la verdadera magnitud
2. ‚úÖ Paleta contrastante: Facilita la comparaci√≥n
3. ‚úÖ Limitar n√∫mero de pa√≠ses o usar small multiples
4. ‚úÖ Leyenda clara y bien posicionada


## Parte 2: Interpretaci√≥n de Gini en diferentes contextos

### Ejercicio 1: Pa√≠ses con evoluci√≥n similar vs. divergente

**Objetivo**: Identificar pa√≠ses con evoluci√≥n similar o divergente en t√©rminos de desigualdad.

**Problema a identificar**: Gr√°fico con l√≠neas superpuestas y colores similares, dificultando el seguimiento de cada pa√≠s.


In [224]:
# ==========================================================
# ‚ö†Ô∏è EJERCICIO 1 - PROBLEMA: L√≠neas superpuestas con colores similares
# ==========================================================
print("‚ö†Ô∏è EJERCICIO 1: Problema de l√≠neas superpuestas y colores similares")
print("   Esto dificulta identificar pa√≠ses con evoluci√≥n similar vs. divergente")

# Seleccionar pa√≠ses que queremos comparar (algunos con evoluci√≥n similar, otros divergente)
PAISES_COMPARACION = ['Reino Unido', 'Francia', 'Italia', 'Noruega', 'Suecia', 
                      'Alemania', 'Espa√±a', 'Polonia', 'B√©lgica', 'Austria']

df_comparacion = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_COMPARACION)].copy()

# ‚ö†Ô∏è PROBLEMA: Colores muy similares en tonos pastel que se confunden
COLOR_PALETTE_SUPERPUESTA = [
    '#FFB6C1',  # Rosa claro
    '#FFC0CB',  # Rosa
    '#FFDAB9',  # Melocot√≥n claro
    '#FFE4B5',  # Mocas√≠n
    '#FFF8DC',  # Beige
    '#F0E68C',  # Caqui
    '#E6E6FA',  # Lavanda
    '#DDA0DD',  # Ciruela
    '#D8BFD8',  # Cardo
    '#DA70D6'   # Orqu√≠dea
]

fig_superpuesta = px.line(
    df_comparacion.sort_values('Year'),
    x='Year',
    y='Value',
    color='Country Name',
    color_discrete_sequence=COLOR_PALETTE_SUPERPUESTA,  # ‚ö†Ô∏è Colores muy similares
    markers=True,
    title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: L√≠neas Superpuestas con Colores Similares</b><br><sub>Imposible distinguir qu√© pa√≠s tiene evoluci√≥n similar o divergente</sub>',
    labels={'Value': '√çndice de Gini', 'Year': 'A√±o'}
)

# ‚ö†Ô∏è Tambi√©n truncar el eje Y
gini_min_comp = df_comparacion['Value'].min()
gini_max_comp = df_comparacion['Value'].max()

fig_superpuesta.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        range=[gini_min_comp - 1, gini_max_comp + 1],  # ‚ö†Ô∏è Truncado
        gridcolor='#333'
    ),
    xaxis=dict(gridcolor='#333'),
    legend=dict(
        orientation="v",
        yanchor="top",
        y=1,
        xanchor="left",
        x=1.02,
        font=dict(size=9)  # ‚ö†Ô∏è Leyenda peque√±a
    ),
    margin=dict(r=150)
)

fig_superpuesta.show()

print(f"\n‚ö†Ô∏è Problemas identificados:")
print(f"   1. {len(PAISES_COMPARACION)} pa√≠ses con colores pastel muy similares")
print(f"   2. L√≠neas completamente superpuestas - imposible seguir cada pa√≠s")
print(f"   3. No se puede identificar qu√© pa√≠ses tienen evoluci√≥n similar")
print(f"   4. No se puede identificar qu√© pa√≠ses tienen evoluci√≥n divergente")
print(f"   5. Eje Y truncado: [{gini_min_comp - 1:.1f}, {gini_max_comp + 1:.1f}]")


‚ö†Ô∏è EJERCICIO 1: Problema de l√≠neas superpuestas y colores similares
   Esto dificulta identificar pa√≠ses con evoluci√≥n similar vs. divergente



‚ö†Ô∏è Problemas identificados:
   1. 10 pa√≠ses con colores pastel muy similares
   2. L√≠neas completamente superpuestas - imposible seguir cada pa√≠s
   3. No se puede identificar qu√© pa√≠ses tienen evoluci√≥n similar
   4. No se puede identificar qu√© pa√≠ses tienen evoluci√≥n divergente
   5. Eje Y truncado: [21.9, 39.8]


In [225]:
# ==========================================================
# ‚úÖ EJERCICIO 1 - SOLUCI√ìN: Visualizaci√≥n que resalta similitudes y diferencias
# ==========================================================
print("\n‚úÖ SOLUCI√ìN: Visualizaci√≥n que permite identificar similitudes y diferencias")

# Agrupar pa√≠ses por evoluci√≥n similar (basado en correlaci√≥n de tendencias)
# Pa√≠ses con evoluci√≥n similar: Noruega, Suecia, Dinamarca (n√≥rdicos)
# Pa√≠ses con evoluci√≥n divergente: Reino Unido (aumenta), Francia (disminuye)

PAISES_SIMILARES = ['Noruega', 'Suecia', 'Dinamarca', 'Finlandia']  # N√≥rdicos - evoluci√≥n similar
PAISES_DIVERGENTES = ['Reino Unido', 'Francia', 'Italia']  # Evoluci√≥n diferente

df_similares = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_SIMILARES)].copy()
df_divergentes = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_DIVERGENTES)].copy()

# Colores contrastantes para cada grupo
COLOR_SIMILARES = ['#00FF00', '#32CD32', '#7CFC00', '#90EE90']  # Verdes para similares
COLOR_DIVERGENTES = ['#FF00FF', '#FF1493', '#FF69B4']  # Magentas/Rosas para divergentes

fig_solucion = go.Figure()

# Agregar pa√≠ses con evoluci√≥n similar (grupo 1)
for idx, pais in enumerate(PAISES_SIMILARES):
    df_pais = df_similares[df_similares['Country Name'] == pais].sort_values('Year')
    if not df_pais.empty:
        fig_solucion.add_trace(go.Scatter(
            x=df_pais['Year'],
            y=df_pais['Value'],
            mode='lines+markers',
            name=f'{pais} (Similar)',
            line=dict(width=3, color=COLOR_SIMILARES[idx % len(COLOR_SIMILARES)], dash='solid'),
            marker=dict(size=6)
        ))

# Agregar pa√≠ses con evoluci√≥n divergente (grupo 2)
for idx, pais in enumerate(PAISES_DIVERGENTES):
    df_pais = df_divergentes[df_divergentes['Country Name'] == pais].sort_values('Year')
    if not df_pais.empty:
        fig_solucion.add_trace(go.Scatter(
            x=df_pais['Year'],
            y=df_pais['Value'],
            mode='lines+markers',
            name=f'{pais} (Divergente)',
            line=dict(width=3, color=COLOR_DIVERGENTES[idx % len(COLOR_DIVERGENTES)], dash='dash'),
            marker=dict(size=6)
        ))

fig_solucion.update_layout(
    template='plotly_dark',
    title='<b>‚úÖ CORRECTO: Identificaci√≥n de Pa√≠ses con Evoluci√≥n Similar vs. Divergente</b><br><sub>Verdes: Evoluci√≥n similar (N√≥rdicos) | Magentas: Evoluci√≥n divergente</sub>',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        title='√çndice de Gini',
        range=[0, 50],  # ‚úÖ Eje desde 0
        gridcolor='#333'
    ),
    xaxis=dict(title='A√±o', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    ),
    height=600
)

fig_solucion.show()

print("\n‚úÖ Ventajas de esta visualizaci√≥n:")
print("   1. Colores contrastantes: Verdes para similares, Magentas para divergentes")
print("   2. Estilos de l√≠nea diferentes: S√≥lida para similares, punteada para divergentes")
print("   3. Eje Y desde 0: Muestra la verdadera magnitud")
print("   4. F√°cil identificar qu√© pa√≠ses tienen evoluci√≥n similar (n√≥rdicos)")
print("   5. F√°cil identificar qu√© pa√≠ses tienen evoluci√≥n divergente (Reino Unido vs. Francia)")



‚úÖ SOLUCI√ìN: Visualizaci√≥n que permite identificar similitudes y diferencias



‚úÖ Ventajas de esta visualizaci√≥n:
   1. Colores contrastantes: Verdes para similares, Magentas para divergentes
   2. Estilos de l√≠nea diferentes: S√≥lida para similares, punteada para divergentes
   3. Eje Y desde 0: Muestra la verdadera magnitud
   4. F√°cil identificar qu√© pa√≠ses tienen evoluci√≥n similar (n√≥rdicos)
   5. F√°cil identificar qu√© pa√≠ses tienen evoluci√≥n divergente (Reino Unido vs. Francia)


In [226]:
# ==========================================================
# ‚ö†Ô∏è EJERCICIO 2 - PROBLEMA: Solo Gini sin contexto adicional
# ==========================================================
print("‚ö†Ô∏è EJERCICIO 2: Problema de interpretaci√≥n limitada")
print("   Mostrar solo el Gini sin contexto adicional")

# Seleccionar pa√≠ses que pueden tener Gini similar pero contextos diferentes
# Por ejemplo: Bulgaria y Francia pueden tener Gini similar pero contextos muy diferentes
PAISES_CONTEXTO = ['Bulgaria', 'Francia', 'Rumania', 'Espa√±a']

df_contexto = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_CONTEXTO)].copy()

# Obtener el a√±o m√°s reciente con datos para cada pa√≠s
ultimo_a√±o_por_pais = df_contexto.groupby('Country Name')['Year'].max().reset_index()
df_ultimo = df_contexto.merge(ultimo_a√±o_por_pais, on=['Country Name', 'Year'])

print("\nüìä Datos del √∫ltimo a√±o disponible por pa√≠s:")
print(df_ultimo[['Country Name', 'Year', 'Value']].to_string(index=False))

# ‚ö†Ô∏è PROBLEMA: Visualizaci√≥n que muestra SOLO el Gini, sin contexto
fig_sin_contexto = px.bar(
    df_ultimo,
    x='Country Name',
    y='Value',
    color='Country Name',
    title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: Solo Gini sin Contexto Adicional</b><br><sub>Interpretaci√≥n limitada: No muestra diferencias en ingresos, PIB, etc.</sub>',
    labels={'Value': '√çndice de Gini', 'Country Name': 'Pa√≠s'},
    color_discrete_sequence=['#808080', '#909090', '#A0A0A0', '#B0B0B0']  # Colores similares
)

fig_sin_contexto.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        title='√çndice de Gini',
        range=[df_ultimo['Value'].min() - 2, df_ultimo['Value'].max() + 2],  # ‚ö†Ô∏è Truncado
        gridcolor='#333'
    ),
    xaxis=dict(title='Pa√≠s', gridcolor='#333'),
    showlegend=False
)

fig_sin_contexto.show()

print("\n‚ö†Ô∏è Problemas identificados:")
print("   1. Solo muestra el Gini - no hay contexto sobre ingresos, PIB, etc.")
print("   2. No se puede entender por qu√© dos pa√≠ses con Gini similar son diferentes")
print("   3. Interpretaci√≥n limitada: 'Bulgaria y Francia tienen Gini similar'")
print("   4. Falta informaci√≥n sobre: PIB per c√°pita, ingresos promedio, etc.")
print("   5. Eje Y truncado exagera diferencias peque√±as")


‚ö†Ô∏è EJERCICIO 2: Problema de interpretaci√≥n limitada
   Mostrar solo el Gini sin contexto adicional

üìä Datos del √∫ltimo a√±o disponible por pa√≠s:
Country Name  Year  Value
    Bulgaria  2023   39.5
      Espa√±a  2023   33.4
     Francia  2023   31.8
     Rumania  2023   29.8



‚ö†Ô∏è Problemas identificados:
   1. Solo muestra el Gini - no hay contexto sobre ingresos, PIB, etc.
   2. No se puede entender por qu√© dos pa√≠ses con Gini similar son diferentes
   3. Interpretaci√≥n limitada: 'Bulgaria y Francia tienen Gini similar'
   4. Falta informaci√≥n sobre: PIB per c√°pita, ingresos promedio, etc.
   5. Eje Y truncado exagera diferencias peque√±as


In [227]:
# ==========================================================
# ‚úÖ EJERCICIO 2 - SOLUCI√ìN: Visualizaci√≥n con contexto adicional
# ==========================================================
print("\n‚úÖ SOLUCI√ìN: Visualizaci√≥n que muestra contexto adicional")
print("   Usando la evoluci√≥n temporal como contexto (ya que no tenemos datos de ingresos)")

# La soluci√≥n es mostrar la EVOLUCI√ìN TEMPORAL como contexto
# Esto revela que pa√≠ses con Gini similar pueden tener trayectorias muy diferentes

fig_con_contexto = go.Figure()

# Colores contrastantes para cada pa√≠s
colores_paises = {
    'Bulgaria': '#FF6B6B',  # Rojo
    'Francia': '#0000FF',   # Azul
    'Rumania': '#FFE66D',   # Amarillo
    'Espa√±a': '#95E1D3'     # Verde claro
}

for pais in PAISES_CONTEXTO:
    df_pais = df_contexto[df_contexto['Country Name'] == pais].sort_values('Year')
    if not df_pais.empty:
        # Obtener el valor m√°s reciente para anotaci√≥n
        valor_reciente = df_pais.iloc[-1]['Value']
        a√±o_reciente = df_pais.iloc[-1]['Year']
        
        fig_con_contexto.add_trace(go.Scatter(
            x=df_pais['Year'],
            y=df_pais['Value'],
            mode='lines+markers',
            name=pais,
            line=dict(width=3, color=colores_paises.get(pais, '#FFFFFF')),
            marker=dict(size=8),
            hovertemplate=f'<b>{pais}</b><br>A√±o: %{{x}}<br>Gini: %{{y:.1f}}<extra></extra>'
        ))
        
        # Anotaci√≥n con el valor m√°s reciente
        fig_con_contexto.add_annotation(
            x=a√±o_reciente,
            y=valor_reciente,
            text=f"{pais}<br>Gini: {valor_reciente:.1f}",
            showarrow=True,
            arrowhead=2,
            arrowcolor=colores_paises.get(pais, '#FFFFFF'),
            font=dict(color='white', size=10),
            bgcolor='rgba(0,0,0,0.7)',
            bordercolor=colores_paises.get(pais, '#FFFFFF'),
            borderwidth=1
        )

fig_con_contexto.update_layout(
    template='plotly_dark',
    title='<b>‚úÖ CORRECTO: Gini con Contexto Temporal</b><br><sub>Muestra que pa√≠ses con Gini similar pueden tener trayectorias hist√≥ricas muy diferentes</sub>',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        title='√çndice de Gini',
        range=[0, 50],  # ‚úÖ Eje desde 0
        gridcolor='#333'
    ),
    xaxis=dict(title='A√±o', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    ),
    height=600
)

fig_con_contexto.show()

print("\n‚úÖ Ventajas de esta visualizaci√≥n:")
print("   1. Muestra la EVOLUCI√ìN TEMPORAL como contexto adicional")
print("   2. Revela que pa√≠ses con Gini similar pueden tener trayectorias diferentes")
print("   3. Permite entender el CONTEXTO HIST√ìRICO de cada pa√≠s")
print("   4. Ejemplo: Bulgaria puede tener Gini similar a Francia, pero:")
print("      - Bulgaria: Evoluci√≥n desde niveles muy altos (post-comunismo)")
print("      - Francia: Evoluci√≥n m√°s estable (pa√≠s desarrollado)")
print("   5. Eje Y desde 0 muestra la verdadera magnitud")
print("\nüí° Nota: Si tuvi√©ramos datos de ingresos/PIB, podr√≠amos agregar un segundo eje Y")
print("   o un gr√°fico de dispersi√≥n Gini vs. PIB per c√°pita para m√°s contexto")



‚úÖ SOLUCI√ìN: Visualizaci√≥n que muestra contexto adicional
   Usando la evoluci√≥n temporal como contexto (ya que no tenemos datos de ingresos)



‚úÖ Ventajas de esta visualizaci√≥n:
   1. Muestra la EVOLUCI√ìN TEMPORAL como contexto adicional
   2. Revela que pa√≠ses con Gini similar pueden tener trayectorias diferentes
   3. Permite entender el CONTEXTO HIST√ìRICO de cada pa√≠s
   4. Ejemplo: Bulgaria puede tener Gini similar a Francia, pero:
      - Bulgaria: Evoluci√≥n desde niveles muy altos (post-comunismo)
      - Francia: Evoluci√≥n m√°s estable (pa√≠s desarrollado)
   5. Eje Y desde 0 muestra la verdadera magnitud

üí° Nota: Si tuvi√©ramos datos de ingresos/PIB, podr√≠amos agregar un segundo eje Y
   o un gr√°fico de dispersi√≥n Gini vs. PIB per c√°pita para m√°s contexto


In [228]:
# ==========================================================
# EJERCICIO 2 - SOLUCI√ìN ALTERNATIVA: Gr√°fico de dispersi√≥n con m√∫ltiples dimensiones
# ==========================================================
print("\n‚úÖ SOLUCI√ìN ALTERNATIVA: Visualizaci√≥n multi-dimensional")
print("   Mostrando Gini actual vs. Gini hist√≥rico (rango) como contexto")

# Calcular estad√≠sticas por pa√≠s para mostrar m√∫ltiples dimensiones
stats_paises = df_contexto.groupby('Country Name').agg({
    'Value': ['mean', 'min', 'max', 'std', 'count']
}).reset_index()

stats_paises.columns = ['Country Name', 'Gini_Promedio', 'Gini_Min', 'Gini_Max', 'Gini_Std', 'Num_Datos']

# Obtener el valor m√°s reciente
ultimos_valores = df_contexto.groupby('Country Name').apply(
    lambda x: x.loc[x['Year'].idxmax(), 'Value']
).reset_index(name='Gini_Actual')

stats_paises = stats_paises.merge(ultimos_valores, on='Country Name')

# Calcular el rango hist√≥rico (diferencia entre max y min)
stats_paises['Rango_Historico'] = stats_paises['Gini_Max'] - stats_paises['Gini_Min']

print("\nüìä Estad√≠sticas por pa√≠s (contexto adicional):")
print(stats_paises[['Country Name', 'Gini_Actual', 'Gini_Promedio', 'Rango_Historico', 'Gini_Std']].to_string(index=False))

# Visualizaci√≥n: Gini Actual vs. Rango Hist√≥rico (muestra variabilidad)
fig_multidim = px.scatter(
    stats_paises,
    x='Gini_Actual',
    y='Rango_Historico',
    size='Gini_Std',
    color='Country Name',
    text='Country Name',
    title='<b>‚úÖ CORRECTO: Gini Actual vs. Variabilidad Hist√≥rica (Contexto Adicional)</b><br><sub>Tama√±o = Desviaci√≥n est√°ndar | Muestra que pa√≠ses con Gini similar pueden tener historias muy diferentes</sub>',
    labels={
        'Gini_Actual': 'Gini Actual (√öltimo a√±o disponible)',
        'Rango_Historico': 'Rango Hist√≥rico (Max - Min)',
        'Gini_Std': 'Desviaci√≥n Est√°ndar'
    },
    color_discrete_sequence=['#FF6B6B', '#0000FF', '#FFE66D', '#95E1D3']
)

fig_multidim.update_traces(
    textposition="top center",
    textfont=dict(color='white', size=12)
)

fig_multidim.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(gridcolor='#333'),
    xaxis=dict(gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    ),
    height=600
)

fig_multidim.show()

print("\n‚úÖ Esta visualizaci√≥n muestra:")
print("   1. Gini Actual (eje X): Valor m√°s reciente")
print("   2. Rango Hist√≥rico (eje Y): Variabilidad a lo largo del tiempo")
print("   3. Tama√±o del punto: Desviaci√≥n est√°ndar (estabilidad)")
print("   4. Permite identificar: Pa√≠ses con Gini similar pero historias diferentes")
print("   5. Ejemplo: Dos pa√≠ses pueden tener Gini=32, pero uno con rango 5 y otro con rango 15")



‚úÖ SOLUCI√ìN ALTERNATIVA: Visualizaci√≥n multi-dimensional
   Mostrando Gini actual vs. Gini hist√≥rico (rango) como contexto

üìä Estad√≠sticas por pa√≠s (contexto adicional):
Country Name  Gini_Actual  Gini_Promedio  Rango_Historico  Gini_Std
    Bulgaria         39.5      35.072000             17.9  5.091293
      Espa√±a         33.4      34.562500              4.7  1.200202
     Francia         31.8      32.333333              7.4  1.466643
     Rumania         29.8      32.748387             16.3  3.823687







‚úÖ Esta visualizaci√≥n muestra:
   1. Gini Actual (eje X): Valor m√°s reciente
   2. Rango Hist√≥rico (eje Y): Variabilidad a lo largo del tiempo
   3. Tama√±o del punto: Desviaci√≥n est√°ndar (estabilidad)
   4. Permite identificar: Pa√≠ses con Gini similar pero historias diferentes
   5. Ejemplo: Dos pa√≠ses pueden tener Gini=32, pero uno con rango 5 y otro con rango 15


## Parte 3: Uso del Gini para la propuesta de soluciones

### Ejercicio 3: An√°lisis para pol√≠ticas p√∫blicas

**Objetivo**: Proponer pol√≠ticas p√∫blicas que podr√≠an reducir la desigualdad, bas√°ndose en el an√°lisis del Gini.

**Problema a identificar**: Gr√°fico con el eje Y truncado para exagerar los efectos de las pol√≠ticas, lo cual puede dar una impresi√≥n incorrecta.

### Problemas Identificados en las Visualizaciones

1. **Parte 1 - Escalas mal ajustadas**: Eje Y truncado que exagera diferencias
2. **Parte 1 - Paleta inadecuada**: Colores similares que dificultan comparaci√≥n
3. **Parte 2 - Ejercicio 1**: L√≠neas superpuestas con colores similares
4. **Parte 2 - Ejercicio 2**: Solo Gini sin contexto adicional

### Soluciones Implementadas

1. **Eje Y desde 0**: Muestra la verdadera magnitud de las diferencias
2. **Paleta contrastante**: Facilita distinguir entre pa√≠ses
3. **Agrupaci√≥n visual**: Colores y estilos diferentes para grupos similares/divergentes
4. **Contexto temporal**: Evoluci√≥n hist√≥rica como contexto adicional
5. **Visualizaci√≥n multi-dimensional**: M√∫ltiples m√©tricas para contexto completo


In [229]:
# ==========================================================
# ‚ö†Ô∏è EJERCICIO 3 - PROBLEMA: Eje Y truncado para exagerar efectos de pol√≠ticas
# ==========================================================
print("‚ö†Ô∏è EJERCICIO 3: Problema de eje Y truncado en an√°lisis de pol√≠ticas")
print("   Esto exagera falsamente el impacto de las pol√≠ticas p√∫blicas")

# Seleccionar algunos pa√≠ses para el an√°lisis de pol√≠ticas
PAISES_POLITICAS = ['Reino Unido', 'Francia', 'Italia', 'Espa√±a']

df_politicas = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_POLITICAS)].copy()

# Obtener el valor m√°s reciente de Gini para cada pa√≠s
ultimo_a√±o_pol = df_politicas.groupby('Country Name')['Year'].max().reset_index()
df_actual_pol = df_politicas.merge(ultimo_a√±o_pol, on=['Country Name', 'Year'])

# Simular el impacto de pol√≠ticas p√∫blicas (reducci√≥n del 5% en el Gini)
df_actual_pol['Gini_Proyectado'] = df_actual_pol['Value'] * 0.95
df_actual_pol['Reduccion'] = df_actual_pol['Value'] - df_actual_pol['Gini_Proyectado']

print("\nüìä Impacto proyectado de pol√≠ticas p√∫blicas (reducci√≥n del 5%):")
print(df_actual_pol[['Country Name', 'Value', 'Gini_Proyectado', 'Reduccion']].to_string(index=False))

# ‚ö†Ô∏è PROBLEMA: Visualizaci√≥n con eje Y truncado que exagera el impacto
gini_min_pol = df_actual_pol['Gini_Proyectado'].min()
gini_max_pol = df_actual_pol['Value'].max()

# Crear datos para el gr√°fico de barras agrupadas
import numpy as np

fig_politicas_problema = go.Figure()

# Barras de Gini Actual
fig_politicas_problema.add_trace(go.Bar(
    x=df_actual_pol['Country Name'],
    y=df_actual_pol['Value'],
    name='Gini Actual',
    marker_color='#FF6B6B',
    text=[f'{val:.1f}' for val in df_actual_pol['Value']],
    textposition='auto'
))

# Barras de Gini Proyectado
fig_politicas_problema.add_trace(go.Bar(
    x=df_actual_pol['Country Name'],
    y=df_actual_pol['Gini_Proyectado'],
    name='Gini Proyectado (Pol√≠ticas)',
    marker_color='#4ECDC4',
    text=[f'{val:.1f}' for val in df_actual_pol['Gini_Proyectado']],
    textposition='auto'
))

# ‚ö†Ô∏è PROBLEMA: Eje Y truncado para exagerar el impacto
fig_politicas_problema.update_layout(
    template='plotly_dark',
    title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: Impacto de Pol√≠ticas con Eje Y Truncado</b><br><sub>Exagera falsamente el efecto de las pol√≠ticas (parece una reducci√≥n enorme)</sub>',
    plot_bgcolor='black',
    paper_bgcolor='black',
    barmode='group',
    yaxis=dict(
        title='√çndice de Gini',
        range=[gini_min_pol - 0.5, gini_max_pol + 0.5],  # ‚ö†Ô∏è TRUNCADO - no desde 0
        gridcolor='#333'
    ),
    xaxis=dict(title='Pa√≠s', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    )
)

fig_politicas_problema.show()

print(f"\n‚ö†Ô∏è Problemas identificados:")
print(f"   1. Eje Y truncado: [{gini_min_pol - 0.5:.1f}, {gini_max_pol + 0.5:.1f}]")
print(f"   2. Deber√≠a ser [0, 50] para mostrar la verdadera magnitud")
print(f"   3. Una reducci√≥n de ~1.5 puntos parece enorme en este gr√°fico")
print(f"   4. En realidad, es solo una reducci√≥n del 5% (relativamente peque√±a)")
print(f"   5. Esto puede llevar a conclusiones incorrectas sobre la efectividad de las pol√≠ticas")


‚ö†Ô∏è EJERCICIO 3: Problema de eje Y truncado en an√°lisis de pol√≠ticas
   Esto exagera falsamente el impacto de las pol√≠ticas p√∫blicas

üìä Impacto proyectado de pol√≠ticas p√∫blicas (reducci√≥n del 5%):
Country Name  Value  Gini_Proyectado  Reduccion
 Reino Unido   32.4           30.780      1.620
      Espa√±a   33.4           31.730      1.670
     Francia   31.8           30.210      1.590
      Italia   34.3           32.585      1.715



‚ö†Ô∏è Problemas identificados:
   1. Eje Y truncado: [29.7, 34.8]
   2. Deber√≠a ser [0, 50] para mostrar la verdadera magnitud
   3. Una reducci√≥n de ~1.5 puntos parece enorme en este gr√°fico
   4. En realidad, es solo una reducci√≥n del 5% (relativamente peque√±a)
   5. Esto puede llevar a conclusiones incorrectas sobre la efectividad de las pol√≠ticas


In [230]:
# ==========================================================
# ‚úÖ EJERCICIO 3 - SOLUCI√ìN: Visualizaci√≥n honesta del impacto de pol√≠ticas
# ==========================================================
print("\n‚úÖ SOLUCI√ìN: Visualizaci√≥n honesta con eje Y desde 0")
print("   Muestra el verdadero impacto de las pol√≠ticas p√∫blicas")

fig_politicas_correcta = go.Figure()

# Barras de Gini Actual
fig_politicas_correcta.add_trace(go.Bar(
    x=df_actual_pol['Country Name'],
    y=df_actual_pol['Value'],
    name='Gini Actual',
    marker_color='#FF6B6B',
    text=[f'{val:.1f}' for val in df_actual_pol['Value']],
    textposition='auto'
))

# Barras de Gini Proyectado
fig_politicas_correcta.add_trace(go.Bar(
    x=df_actual_pol['Country Name'],
    y=df_actual_pol['Gini_Proyectado'],
    name='Gini Proyectado (Pol√≠ticas)',
    marker_color='#4ECDC4',
    text=[f'{val:.1f}' for val in df_actual_pol['Gini_Proyectado']],
    textposition='auto'
))

# ‚úÖ CORRECTO: Eje Y desde 0
fig_politicas_correcta.update_layout(
    template='plotly_dark',
    title='<b>‚úÖ CORRECTO: Impacto Real de Pol√≠ticas P√∫blicas</b><br><sub>Eje Y desde 0 muestra la verdadera magnitud del impacto (reducci√≥n del 5%)</sub>',
    plot_bgcolor='black',
    paper_bgcolor='black',
    barmode='group',
    yaxis=dict(
        title='√çndice de Gini',
        range=[0, 50],  # ‚úÖ Desde 0 - muestra la verdadera magnitud
        gridcolor='#333'
    ),
    xaxis=dict(title='Pa√≠s', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    )
)

fig_politicas_correcta.show()

print("\n‚úÖ Ventajas de esta visualizaci√≥n:")
print("   1. Eje Y desde 0: Muestra la verdadera magnitud del impacto")
print("   2. Honestidad visual: Una reducci√≥n del 5% se ve como lo que es (modesta)")
print("   3. Permite evaluar correctamente la efectividad de las pol√≠ticas")
print("   4. Evita conclusiones incorrectas sobre el impacto")
print("   5. Proporciona contexto real: el cambio es peque√±o pero significativo")



‚úÖ SOLUCI√ìN: Visualizaci√≥n honesta con eje Y desde 0
   Muestra el verdadero impacto de las pol√≠ticas p√∫blicas



‚úÖ Ventajas de esta visualizaci√≥n:
   1. Eje Y desde 0: Muestra la verdadera magnitud del impacto
   2. Honestidad visual: Una reducci√≥n del 5% se ve como lo que es (modesta)
   3. Permite evaluar correctamente la efectividad de las pol√≠ticas
   4. Evita conclusiones incorrectas sobre el impacto
   5. Proporciona contexto real: el cambio es peque√±o pero significativo


### Ejercicio 4: An√°lisis del impacto de la crisis econ√≥mica en Gini

**Objetivo**: Analizar c√≥mo la crisis econ√≥mica (por ejemplo, la crisis del COVID-19) ha impactado en la desigualdad.

**Problema a identificar**: No proporcionar contexto hist√≥rico, lo cual puede llevar a una interpretaci√≥n incorrecta de las causas de las variaciones en el Gini.


In [231]:
# ==========================================================
# ‚ö†Ô∏è EJERCICIO 4 - PROBLEMA: Sin contexto hist√≥rico de la crisis
# ==========================================================
print("‚ö†Ô∏è EJERCICIO 4: Problema de falta de contexto hist√≥rico")
print("   Sin contexto, es imposible entender las causas de las variaciones")

# Seleccionar pa√≠ses para analizar el impacto de la crisis
PAISES_CRISIS = ['Italia', 'Reino Unido', 'Francia', 'Espa√±a']

df_crisis = df_paises_europeos[df_paises_europeos['Country Name'].isin(PAISES_CRISIS)].copy()

# Filtrar solo a√±os recientes (2018-2023) para mostrar el problema
df_crisis_reciente = df_crisis[df_crisis['Year'] >= 2018].copy()

print("\nüìä Datos recientes (2018-2023) sin contexto hist√≥rico:")
print(df_crisis_reciente.pivot_table(index='Year', columns='Country Name', values='Value').round(1))

# ‚ö†Ô∏è PROBLEMA: Visualizaci√≥n SIN contexto hist√≥rico de la crisis
fig_sin_contexto_crisis = px.line(
    df_crisis_reciente.sort_values('Year'),
    x='Year',
    y='Value',
    color='Country Name',
    markers=True,
    title='<b>‚ö†Ô∏è PROBLEM√ÅTICO: Evoluci√≥n del Gini SIN Contexto Hist√≥rico</b><br><sub>No muestra la crisis COVID-19 ni el contexto previo - interpretaci√≥n incorrecta</sub>',
    labels={'Value': '√çndice de Gini', 'Year': 'A√±o'},
    color_discrete_sequence=['#FF6B6B', '#4ECDC4', '#FFE66D', '#95E1D3']
)

fig_sin_contexto_crisis.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        title='√çndice de Gini',
        range=[df_crisis_reciente['Value'].min() - 1, df_crisis_reciente['Value'].max() + 1],  # ‚ö†Ô∏è Truncado
        gridcolor='#333'
    ),
    xaxis=dict(title='A√±o', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    )
)

fig_sin_contexto_crisis.show()

print("\n‚ö†Ô∏è Problemas identificados:")
print("   1. Solo muestra a√±os recientes (2018-2023) - sin contexto hist√≥rico")
print("   2. No indica cu√°ndo ocurri√≥ la crisis del COVID-19 (2020-2021)")
print("   3. No muestra la tendencia previa a la crisis")
print("   4. Imposible distinguir si el cambio es por la crisis o por tendencia previa")
print("   5. Puede llevar a interpretaci√≥n incorrecta: '¬øEl aumento es por mala gesti√≥n?'")
print("   6. Eje Y truncado exagera las variaciones")


‚ö†Ô∏è EJERCICIO 4: Problema de falta de contexto hist√≥rico
   Sin contexto, es imposible entender las causas de las variaciones

üìä Datos recientes (2018-2023) sin contexto hist√≥rico:
Country Name  Espa√±a  Francia  Italia  Reino Unido
Year                                              
2018            34.7     32.4    35.2         33.7
2019            34.3     31.2    34.6         32.8
2020            34.9     30.7    35.2         32.6
2021            33.9     31.5    34.8         32.4
2022            33.6     31.2    33.7          NaN
2023            33.4     31.8    34.3          NaN



‚ö†Ô∏è Problemas identificados:
   1. Solo muestra a√±os recientes (2018-2023) - sin contexto hist√≥rico
   2. No indica cu√°ndo ocurri√≥ la crisis del COVID-19 (2020-2021)
   3. No muestra la tendencia previa a la crisis
   4. Imposible distinguir si el cambio es por la crisis o por tendencia previa
   5. Puede llevar a interpretaci√≥n incorrecta: '¬øEl aumento es por mala gesti√≥n?'
   6. Eje Y truncado exagera las variaciones


In [232]:
# ==========================================================
# ‚úÖ EJERCICIO 4 - SOLUCI√ìN: Visualizaci√≥n con contexto hist√≥rico completo
# ==========================================================
print("\n‚úÖ SOLUCI√ìN: Visualizaci√≥n con contexto hist√≥rico y marcadores de crisis")
print("   Permite entender las causas reales de las variaciones")

# Expandir el rango temporal para incluir contexto hist√≥rico (desde 2000)
df_crisis_completo = df_crisis[df_crisis['Year'] >= 2000].copy()

fig_con_contexto_crisis = go.Figure()

# Colores para cada pa√≠s
colores_crisis = {
    'Italia': '#FF6B6B',
    'Reino Unido': '#4ECDC4',
    'Francia': '#FFE66D',
    'Espa√±a': '#95E1D3'
}

# Agregar l√≠neas para cada pa√≠s
for pais in PAISES_CRISIS:
    df_pais = df_crisis_completo[df_crisis_completo['Country Name'] == pais].sort_values('Year')
    if not df_pais.empty:
        fig_con_contexto_crisis.add_trace(go.Scatter(
            x=df_pais['Year'],
            y=df_pais['Value'],
            mode='lines+markers',
            name=pais,
            line=dict(width=3, color=colores_crisis.get(pais, '#FFFFFF')),
            marker=dict(size=6)
        ))

# ‚úÖ AGREGAR CONTEXTO: Marcar el per√≠odo de la crisis COVID-19
fig_con_contexto_crisis.add_vrect(
    x0=2019.8,
    x1=2021.2,
    fillcolor="rgba(255, 0, 0, 0.2)",  # Rojo semitransparente
    layer="below",
    line_width=0,
    annotation_text="CRISIS COVID-19",
    annotation_position="top left",
    annotation_font=dict(size=14, color="white", family="Arial Black"),
    annotation_bgcolor="rgba(255, 0, 0, 0.7)",
    annotation_bordercolor="white",
    annotation_borderwidth=2
)

# ‚úÖ AGREGAR CONTEXTO: Marcar el per√≠odo pre-crisis para comparaci√≥n
fig_con_contexto_crisis.add_vrect(
    x0=2015,
    x1=2019.8,
    fillcolor="rgba(0, 255, 0, 0.1)",  # Verde muy transparente
    layer="below",
    line_width=0,
    annotation_text="Pre-Crisis",
    annotation_position="top right",
    annotation_font=dict(size=10, color="white"),
    annotation_bgcolor="rgba(0, 255, 0, 0.3)"
)

fig_con_contexto_crisis.update_layout(
    template='plotly_dark',
    title='<b>‚úÖ CORRECTO: Impacto de la Crisis COVID-19 con Contexto Hist√≥rico</b><br><sub>Muestra la tendencia previa, la crisis (2020-2021) y la recuperaci√≥n posterior</sub>',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        title='√çndice de Gini',
        range=[0, 50],  # ‚úÖ Eje desde 0
        gridcolor='#333'
    ),
    xaxis=dict(title='A√±o', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    ),
    height=600
)

fig_con_contexto_crisis.show()

print("\n‚úÖ Ventajas de esta visualizaci√≥n:")
print("   1. Contexto hist√≥rico completo: Muestra tendencias desde 2000")
print("   2. Marcador de crisis: Zona sombreada roja indica el per√≠odo COVID-19")
print("   3. Zona pre-crisis: Permite comparar con el per√≠odo anterior")
print("   4. Permite identificar:")
print("      - Tendencias previas a la crisis")
print("      - Impacto inmediato de la crisis (2020-2021)")
print("      - Recuperaci√≥n post-crisis (2022-2023)")
print("   5. Evita interpretaci√≥n incorrecta: 'El aumento es por la crisis, no por mala gesti√≥n'")
print("   6. Eje Y desde 0: Muestra la verdadera magnitud de los cambios")



‚úÖ SOLUCI√ìN: Visualizaci√≥n con contexto hist√≥rico y marcadores de crisis
   Permite entender las causas reales de las variaciones



‚úÖ Ventajas de esta visualizaci√≥n:
   1. Contexto hist√≥rico completo: Muestra tendencias desde 2000
   2. Marcador de crisis: Zona sombreada roja indica el per√≠odo COVID-19
   3. Zona pre-crisis: Permite comparar con el per√≠odo anterior
   4. Permite identificar:
      - Tendencias previas a la crisis
      - Impacto inmediato de la crisis (2020-2021)
      - Recuperaci√≥n post-crisis (2022-2023)
   5. Evita interpretaci√≥n incorrecta: 'El aumento es por la crisis, no por mala gesti√≥n'
   6. Eje Y desde 0: Muestra la verdadera magnitud de los cambios


In [233]:
# ==========================================================
# EJERCICIO 4 - AN√ÅLISIS DETALLADO: Comparaci√≥n Pre-Crisis vs. Durante Crisis
# ==========================================================
print("\nüìä An√°lisis detallado: Comparaci√≥n Pre-Crisis vs. Durante Crisis")

# Calcular promedios por per√≠odo
df_crisis_completo['Periodo'] = df_crisis_completo['Year'].apply(
    lambda x: 'Pre-Crisis (2015-2019)' if 2015 <= x < 2020 
    else 'Crisis (2020-2021)' if 2020 <= x <= 2021 
    else 'Post-Crisis (2022-2023)' if x >= 2022 
    else 'Hist√≥rico (2000-2014)'
)

# Estad√≠sticas por per√≠odo y pa√≠s
stats_crisis = df_crisis_completo.groupby(['Country Name', 'Periodo'])['Value'].agg(['mean', 'std', 'count']).reset_index()
stats_crisis.columns = ['Pa√≠s', 'Periodo', 'Gini_Promedio', 'Desviacion', 'Num_Datos']

print("\nüìä Estad√≠sticas por per√≠odo:")
print(stats_crisis.pivot_table(index='Pa√≠s', columns='Periodo', values='Gini_Promedio').round(2))

# Visualizaci√≥n de barras comparando per√≠odos
fig_comparacion_periodos = px.bar(
    stats_crisis[stats_crisis['Periodo'].isin(['Pre-Crisis (2015-2019)', 'Crisis (2020-2021)', 'Post-Crisis (2022-2023)'])],
    x='Pa√≠s',
    y='Gini_Promedio',
    color='Periodo',
    barmode='group',
    title='<b>‚úÖ Comparaci√≥n: Pre-Crisis vs. Crisis vs. Post-Crisis</b><br><sub>Muestra el impacto real de la crisis COVID-19 en cada pa√≠s</sub>',
    labels={'Gini_Promedio': 'Gini Promedio', 'Pa√≠s': 'Pa√≠s'},
    color_discrete_map={
        'Pre-Crisis (2015-2019)': '#4ECDC4',  # Turquesa
        'Crisis (2020-2021)': '#FF6B6B',       # Rojo
        'Post-Crisis (2022-2023)': '#FFE66D'   # Amarillo
    }
)

fig_comparacion_periodos.update_layout(
    template='plotly_dark',
    plot_bgcolor='black',
    paper_bgcolor='black',
    yaxis=dict(
        title='Gini Promedio',
        range=[0, 50],  # ‚úÖ Desde 0
        gridcolor='#333'
    ),
    xaxis=dict(title='Pa√≠s', gridcolor='#333'),
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.3,
        xanchor="center",
        x=0.5
    )
)

fig_comparacion_periodos.show()

print("\n‚úÖ Esta visualizaci√≥n permite:")
print("   1. Comparar directamente el Gini antes, durante y despu√©s de la crisis")
print("   2. Identificar qu√© pa√≠ses fueron m√°s afectados")
print("   3. Ver qu√© pa√≠ses se recuperaron m√°s r√°pido")
print("   4. Entender el impacto real de la crisis en cada contexto nacional")



üìä An√°lisis detallado: Comparaci√≥n Pre-Crisis vs. Durante Crisis

üìä Estad√≠sticas por per√≠odo:
Periodo      Crisis (2020-2021)  Hist√≥rico (2000-2014)  \
Pa√≠s                                                     
Espa√±a                     34.4                  34.38   
Francia                    31.1                  32.09   
Italia                     35.0                  34.41   
Reino Unido                32.5                  34.85   

Periodo      Post-Crisis (2022-2023)  Pre-Crisis (2015-2019)  
Pa√≠s                                                          
Espa√±a                          33.5                   35.14  
Francia                         31.5                   31.96  
Italia                          34.0                   35.26  
Reino Unido                      NaN                   33.10  



‚úÖ Esta visualizaci√≥n permite:
   1. Comparar directamente el Gini antes, durante y despu√©s de la crisis
   2. Identificar qu√© pa√≠ses fueron m√°s afectados
   3. Ver qu√© pa√≠ses se recuperaron m√°s r√°pido
   4. Entender el impacto real de la crisis en cada contexto nacional


## Resumen Final: Problemas y Soluciones


### Problemas Identificados en las Visualizaciones

1. **Parte 1 - Escalas mal ajustadas**: Eje Y truncado que exagera diferencias
2. **Parte 1 - Paleta inadecuada**: Colores similares que dificultan comparaci√≥n
3. **Parte 2 - Ejercicio 1**: L√≠neas superpuestas con colores similares
4. **Parte 2 - Ejercicio 2**: Solo Gini sin contexto adicional
5. **Parte 3 - Ejercicio 3**: Eje Y truncado para exagerar efectos de pol√≠ticas
6. **Parte 3 - Ejercicio 4**: Falta de contexto hist√≥rico para interpretar crisis

### Soluciones Implementadas

1. **Eje Y desde 0**: Muestra la verdadera magnitud de las diferencias
2. **Paleta contrastante**: Facilita distinguir entre pa√≠ses
3. **Agrupaci√≥n visual**: Colores y estilos diferentes para grupos similares/divergentes
4. **Contexto temporal**: Evoluci√≥n hist√≥rica como contexto adicional
5. **Visualizaci√≥n multi-dimensional**: M√∫ltiples m√©tricas para contexto completo
6. **Marcadores de eventos**: Zonas sombreadas para indicar per√≠odos de crisis
7. **Comparaci√≥n de per√≠odos**: An√°lisis antes/durante/despu√©s de eventos importantes
