# Gr√°ficos de Cleveland: Diferencias CT por Tipo de √çtem

Este notebook genera **gr√°ficos de Cleveland comparativos** separando los √≠tems por tipo:
- **Panel A**: √çtems Progresistas
- **Panel B**: √çtems Conservadores

## Objetivo:

Visualizar si los patrones de cambio entre Generales y Ballotage difieren seg√∫n el tipo de √≠tem.

## Interpretaci√≥n:

- **Valores positivos**: Mayor tiempo en candidatos de Izquierda
- **Valores negativos**: Mayor tiempo en candidatos de Derecha
- **Punto azul**: Diferencia en Generales
- **Punto rojo**: Diferencia en Ballotage
- **L√≠nea verde**: Aument√≥ en Ballotage
- **L√≠nea naranja**: Disminuy√≥ en Ballotage

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
from matplotlib.lines import Line2D
import warnings
warnings.filterwarnings('ignore')

# Configurar estilo
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')

print('‚úì Librer√≠as cargadas exitosamente')

## 1. Cargar Datos

In [None]:
# Ruta al archivo
Ruta_Base = os.path.join(os.getcwd(), '..', 'Data', 'Procesados')
Archivo_Elecciones = os.path.join(Ruta_Base, 'df_Elecciones.xlsx')

# Cargar datos
df_Elecciones = pd.read_excel(Archivo_Elecciones)

print(f'‚úì Datos cargados:')
print(f'  - {len(df_Elecciones)} registros')
print(f'  - {len(df_Elecciones.columns)} columnas')

# Verificar columnas
columnas_dif_gen = [col for col in df_Elecciones.columns if col.startswith('Dif_Gen_CT')]
columnas_dif_bal = [col for col in df_Elecciones.columns if col.startswith('Dif_Bal_CT')]

print(f'\n  - Variables Dif_Gen_CT: {len(columnas_dif_gen)}')
print(f'  - Variables Dif_Bal_CT: {len(columnas_dif_bal)}')

## 2. Preparar Datos para Gr√°fico

In [None]:
# Definir √≠tems
Items_Progresistas = [5, 6, 9, 11, 16, 20, 24, 25, 27, 28]
Items_Conservadores = [3, 4, 7, 8, 10, 19, 22, 23, 29, 30]
Todos_Items = sorted(Items_Progresistas + Items_Conservadores)

print(f'Total de √≠tems: {len(Todos_Items)}')
print(f'√çtems Progresistas: {Items_Progresistas}')
print(f'√çtems Conservadores: {Items_Conservadores}')

# Calcular promedios por √≠tem
datos_grafico = []

for item in Todos_Items:
    var_gen = f'Dif_Gen_CT_Item_{item}'
    var_bal = f'Dif_Bal_CT_Item_{item}'
    
    if var_gen in df_Elecciones.columns and var_bal in df_Elecciones.columns:
        # Calcular promedios (ignorando NaN)
        media_gen = df_Elecciones[var_gen].mean()
        media_bal = df_Elecciones[var_bal].mean()
        
        # Calcular cambio
        cambio = media_bal - media_gen
        
        # Determinar tipo de √≠tem
        tipo = 'Progresista' if item in Items_Progresistas else 'Conservador'
        
        datos_grafico.append({
            'Item': item,
            'Tipo': tipo,
            'Dif_Generales': media_gen,
            'Dif_Ballotage': media_bal,
            'Cambio': cambio
        })

# Crear DataFrame
df_grafico = pd.DataFrame(datos_grafico)

# Separar por tipo
df_prog = df_grafico[df_grafico['Tipo'] == 'Progresista'].reset_index(drop=True)
df_cons = df_grafico[df_grafico['Tipo'] == 'Conservador'].reset_index(drop=True)

print(f'\n‚úì Datos preparados:')
print(f'  - √çtems Progresistas: {len(df_prog)}')
print(f'  - √çtems Conservadores: {len(df_cons)}')
print(f'  - Total: {len(df_grafico)}')

## 3. Funci√≥n para Crear Gr√°fico de Cleveland (Panel Individual)

In [None]:
def Crear_Panel_Cleveland(df, ax, titulo, mostrar_ylabel=True):
    """
    Crea un panel de Cleveland en un eje espec√≠fico.
    
    Par√°metros:
    -----------
    df : DataFrame
        DataFrame con columnas: Item, Dif_Generales, Dif_Ballotage, Cambio
    ax : matplotlib.axes.Axes
        Eje donde dibujar
    titulo : str
        T√≠tulo del panel
    mostrar_ylabel : bool
        Si mostrar etiqueta del eje Y
    """
    
    # Ordenar por cambio (descendente)
    df_sorted = df.sort_values('Cambio', ascending=True).reset_index(drop=True)
    
    # Par√°metros visuales
    y_positions = np.arange(len(df_sorted))
    
    # Dibujar l√≠neas conectando los puntos
    for idx, row in df_sorted.iterrows():
        gen_val = row['Dif_Generales']
        bal_val = row['Dif_Ballotage']
        cambio = row['Cambio']
        
        # Determinar color de l√≠nea seg√∫n cambio
        if cambio > 0.5:  # Aument√≥
            color_linea = '#2ecc71'  # Verde
            alpha = 0.6
        elif cambio < -0.5:  # Disminuy√≥
            color_linea = '#e74c3c'  # Rojo/Naranja
            alpha = 0.6
        else:  # Cambio peque√±o
            color_linea = '#95a5a6'  # Gris
            alpha = 0.3
        
        # Dibujar l√≠nea
        ax.plot([gen_val, bal_val], [idx, idx], 
                color=color_linea, linewidth=1.5, alpha=alpha, zorder=1)
    
    # Dibujar puntos de Generales
    ax.scatter(df_sorted['Dif_Generales'], y_positions, 
               s=120, c='#3498db', marker='o', 
               edgecolors='white', linewidths=1.5,
               label='Generales', zorder=3, alpha=0.8)
    
    # Dibujar puntos de Ballotage
    ax.scatter(df_sorted['Dif_Ballotage'], y_positions, 
               s=120, c='#e74c3c', marker='o', 
               edgecolors='white', linewidths=1.5,
               label='Ballotage', zorder=3, alpha=0.8)
    
    # L√≠nea vertical en x=0
    ax.axvline(x=0, color='black', linestyle='--', linewidth=0.8, alpha=0.3, zorder=0)
    
    # Configurar ejes
    ax.set_yticks(y_positions)
    ax.set_yticklabels([f'√çtem {int(item)}' for item in df_sorted['Item']], fontsize=9)
    
    ax.set_xlabel('Diferencia Izq - Der (segundos)', fontsize=11, fontweight='bold')
    if mostrar_ylabel:
        ax.set_ylabel('√çtem', fontsize=11, fontweight='bold')
    
    ax.set_title(titulo, fontsize=12, fontweight='bold', pad=15)
    
    # Grid
    ax.grid(True, axis='x', alpha=0.3, linestyle=':', linewidth=0.5)
    ax.set_axisbelow(True)
    
    # Ajustar l√≠mites del eje X para que ambos paneles tengan la misma escala
    return ax

## 4. Gr√°fico Comparativo: Progresistas vs Conservadores

In [None]:
# Crear figura con 2 paneles lado a lado
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(20, 10), sharey=False)

# Determinar l√≠mites comunes del eje X
min_val = min(df_grafico['Dif_Generales'].min(), df_grafico['Dif_Ballotage'].min())
max_val = max(df_grafico['Dif_Generales'].max(), df_grafico['Dif_Ballotage'].max())
margen = (max_val - min_val) * 0.1

# Panel A: √çtems Progresistas
Crear_Panel_Cleveland(df_prog, ax1, 'A) √çtems Progresistas', mostrar_ylabel=True)
ax1.set_xlim(min_val - margen, max_val + margen)

# Panel B: √çtems Conservadores
Crear_Panel_Cleveland(df_cons, ax2, 'B) √çtems Conservadores', mostrar_ylabel=False)
ax2.set_xlim(min_val - margen, max_val + margen)

# Leyenda com√∫n en la parte superior
legend_elements = [
    Line2D([0], [0], marker='o', color='w', markerfacecolor='#3498db', 
           markersize=10, label='Generales', markeredgecolor='white', markeredgewidth=1),
    Line2D([0], [0], marker='o', color='w', markerfacecolor='#e74c3c', 
           markersize=10, label='Ballotage', markeredgecolor='white', markeredgewidth=1),
    Line2D([0], [0], color='#2ecc71', linewidth=2, label='Aument√≥ (>0.5s)'),
    Line2D([0], [0], color='#95a5a6', linewidth=2, label='Sin cambio (¬±0.5s)'),
    Line2D([0], [0], color='#e74c3c', linewidth=2, label='Disminuy√≥ (<-0.5s)')
]

fig.legend(handles=legend_elements, loc='upper center', ncol=5, 
           fontsize=11, framealpha=0.95, edgecolor='gray', 
           bbox_to_anchor=(0.5, 0.98))

# T√≠tulo general
fig.suptitle('Diferencias en Tiempo (Izq - Der): Generales vs Ballotage\nComparaci√≥n por Tipo de √çtem',
             fontsize=14, fontweight='bold', y=0.995)

# Ajustar layout
plt.tight_layout(rect=[0, 0, 1, 0.96])

# Guardar
Carpeta_Destino = 'Graficos_Cleveland'
if not os.path.exists(Carpeta_Destino):
    os.makedirs(Carpeta_Destino)

ruta_completa = os.path.join(Carpeta_Destino, 'Cleveland_CT_Por_Tipo.png')
plt.savefig(ruta_completa, dpi=300, bbox_inches='tight', facecolor='white')
print(f'‚úÖ Gr√°fico guardado: {ruta_completa}')

plt.show()

## 4.1. An√°lisis de Significancia Estad√≠stica

In [None]:
print('='*70)
print('AN√ÅLISIS DE SIGNIFICANCIA ESTAD√çSTICA')
print('='*70)

for tipo, df_tipo in [('Progresistas', df_prog), ('Conservadores', df_cons)]:
    print(f'\nüìä √çtems {tipo}:')
    print('-'*70)
    
    sig_items = df_tipo[df_tipo['Significancia'] != '']
    print(f'  Total de √≠tems: {len(df_tipo)}')
    print(f'  √çtems significativos: {len(sig_items)} ({len(sig_items)/len(df_tipo)*100:.1f}%)')
    
    if len(sig_items) > 0:
        n_p001 = len(df_tipo[df_tipo['Significancia'] == '***'])
        n_p01 = len(df_tipo[df_tipo['Significancia'] == '**'])
        n_p05 = len(df_tipo[df_tipo['Significancia'] == '*'])
        
        print(f'\n  Desglose:')
        print(f'    *** (p < 0.001): {n_p001} √≠tems')
        print(f'    **  (p < 0.01):  {n_p01} √≠tems')
        print(f'    *   (p < 0.05):  {n_p05} √≠tems')
        
        print(f'\n  √çtems significativos:')
        sig_sorted = sig_items.sort_values('p_valor')[['Item', 'Cambio', 'p_valor', 'Significancia']]
        for idx, row in sig_sorted.iterrows():
            print(f"    √çtem {int(row['Item']):2d}: Cambio = {row['Cambio']:6.3f}s, p = {row['p_valor']:.4f} {row['Significancia']}")
    else:
        print('  ‚ö†Ô∏è  Ning√∫n √≠tem significativo')

print('\n' + '='*70)

## 5. An√°lisis Comparativo por Tipo

In [None]:
print('='*70)
print('AN√ÅLISIS COMPARATIVO: PROGRESISTAS vs CONSERVADORES')
print('='*70)

print('\nüìä √çTEMS PROGRESISTAS:')
print('-'*70)
print(f'  Cantidad: {len(df_prog)} √≠tems')
print(f'  Promedio Dif_Generales: {df_prog["Dif_Generales"].mean():.3f} seg')
print(f'  Promedio Dif_Ballotage: {df_prog["Dif_Ballotage"].mean():.3f} seg')
print(f'  Promedio Cambio: {df_prog["Cambio"].mean():.3f} seg')

aumentaron_prog = len(df_prog[df_prog['Cambio'] > 0.5])
sin_cambio_prog = len(df_prog[(df_prog['Cambio'] >= -0.5) & (df_prog['Cambio'] <= 0.5)])
disminuyeron_prog = len(df_prog[df_prog['Cambio'] < -0.5])

print(f'\n  Distribuci√≥n de cambios:')
print(f'    - Aumentaron: {aumentaron_prog} ({aumentaron_prog/len(df_prog)*100:.1f}%)')
print(f'    - Sin cambio: {sin_cambio_prog} ({sin_cambio_prog/len(df_prog)*100:.1f}%)')
print(f'    - Disminuyeron: {disminuyeron_prog} ({disminuyeron_prog/len(df_prog)*100:.1f}%)')

print('\nüìä √çTEMS CONSERVADORES:')
print('-'*70)
print(f'  Cantidad: {len(df_cons)} √≠tems')
print(f'  Promedio Dif_Generales: {df_cons["Dif_Generales"].mean():.3f} seg')
print(f'  Promedio Dif_Ballotage: {df_cons["Dif_Ballotage"].mean():.3f} seg')
print(f'  Promedio Cambio: {df_cons["Cambio"].mean():.3f} seg')

aumentaron_cons = len(df_cons[df_cons['Cambio'] > 0.5])
sin_cambio_cons = len(df_cons[(df_cons['Cambio'] >= -0.5) & (df_cons['Cambio'] <= 0.5)])
disminuyeron_cons = len(df_cons[df_cons['Cambio'] < -0.5])

print(f'\n  Distribuci√≥n de cambios:')
print(f'    - Aumentaron: {aumentaron_cons} ({aumentaron_cons/len(df_cons)*100:.1f}%)')
print(f'    - Sin cambio: {sin_cambio_cons} ({sin_cambio_cons/len(df_cons)*100:.1f}%)')
print(f'    - Disminuyeron: {disminuyeron_cons} ({disminuyeron_cons/len(df_cons)*100:.1f}%)')

print('\n' + '='*70)

## 6. Comparaci√≥n Estad√≠stica

In [None]:
from scipy import stats

print('='*70)
print('COMPARACI√ìN ESTAD√çSTICA')
print('='*70)

# Test t para comparar cambios entre tipos
t_stat, p_value = stats.ttest_ind(df_prog['Cambio'], df_cons['Cambio'])

print('\nüìä Test t de Student: Cambio Promedio')
print('-'*70)
print(f'  H0: Los cambios promedio son iguales entre tipos')
print(f'  Ha: Los cambios promedio son diferentes entre tipos')
print(f'\n  Estad√≠stico t: {t_stat:.4f}')
print(f'  Valor p: {p_value:.4f}')

if p_value < 0.05:
    print(f'\n  ‚úÖ SIGNIFICATIVO (p < 0.05)')
    print(f'     Los √≠tems {"Progresistas" if df_prog["Cambio"].mean() > df_cons["Cambio"].mean() else "Conservadores"} muestran mayor cambio promedio')
else:
    print(f'\n  ‚ùå NO SIGNIFICATIVO (p ‚â• 0.05)')
    print(f'     No hay diferencia significativa en el cambio promedio entre tipos')

# Diferencia de medias
dif_medias = df_prog['Cambio'].mean() - df_cons['Cambio'].mean()
print(f'\n  Diferencia de medias: {dif_medias:.4f} seg')
print(f'  (Progresistas - Conservadores)')

print('\n' + '='*70)

## 7. Top √çtems por Tipo

In [None]:
print('='*70)
print('TOP √çTEMS CON MAYOR CAMBIO (POR TIPO)')
print('='*70)

print('\nüèÜ √çTEMS PROGRESISTAS - Mayor Aumento:')
print('-'*70)
top_aumento_prog = df_prog.nlargest(5, 'Cambio')[['Item', 'Dif_Generales', 'Dif_Ballotage', 'Cambio']]
print(top_aumento_prog.to_string(index=False))

print('\nüèÜ √çTEMS PROGRESISTAS - Mayor Disminuci√≥n:')
print('-'*70)
top_disminucion_prog = df_prog.nsmallest(5, 'Cambio')[['Item', 'Dif_Generales', 'Dif_Ballotage', 'Cambio']]
print(top_disminucion_prog.to_string(index=False))

print('\nüèÜ √çTEMS CONSERVADORES - Mayor Aumento:')
print('-'*70)
top_aumento_cons = df_cons.nlargest(5, 'Cambio')[['Item', 'Dif_Generales', 'Dif_Ballotage', 'Cambio']]
print(top_aumento_cons.to_string(index=False))

print('\nüèÜ √çTEMS CONSERVADORES - Mayor Disminuci√≥n:')
print('-'*70)
top_disminucion_cons = df_cons.nsmallest(5, 'Cambio')[['Item', 'Dif_Generales', 'Dif_Ballotage', 'Cambio']]
print(top_disminucion_cons.to_string(index=False))

print('\n' + '='*70)

## 8. Guardar Tablas Resumen

In [None]:
# Crear carpeta de salida
Carpeta_Salida = os.path.join(os.getcwd(), '..', 'Data', 'Resultados_Cleveland')
if not os.path.exists(Carpeta_Salida):
    os.makedirs(Carpeta_Salida)

# Guardar tablas separadas por tipo
Archivo_Prog = os.path.join(Carpeta_Salida, 'Resumen_CT_Progresistas.xlsx')
Archivo_Cons = os.path.join(Carpeta_Salida, 'Resumen_CT_Conservadores.xlsx')

df_prog.to_excel(Archivo_Prog, index=False)
df_cons.to_excel(Archivo_Cons, index=False)

print(f'‚úÖ Tablas guardadas:')
print(f'   - {Archivo_Prog}')
print(f'   - {Archivo_Cons}')

# Crear tabla comparativa
comparacion = pd.DataFrame({
    'Tipo': ['Progresistas', 'Conservadores'],
    'N_Items': [len(df_prog), len(df_cons)],
    'Media_Dif_Gen': [df_prog['Dif_Generales'].mean(), df_cons['Dif_Generales'].mean()],
    'Media_Dif_Bal': [df_prog['Dif_Ballotage'].mean(), df_cons['Dif_Ballotage'].mean()],
    'Media_Cambio': [df_prog['Cambio'].mean(), df_cons['Cambio'].mean()],
    'Aumentaron_N': [aumentaron_prog, aumentaron_cons],
    'Sin_Cambio_N': [sin_cambio_prog, sin_cambio_cons],
    'Disminuyeron_N': [disminuyeron_prog, disminuyeron_cons]
})

Archivo_Comparacion = os.path.join(Carpeta_Salida, 'Comparacion_Por_Tipo.xlsx')
comparacion.to_excel(Archivo_Comparacion, index=False)

print(f'   - {Archivo_Comparacion}')
print(f'\n‚úì Total: 3 archivos Excel generados')

## 9. Resumen Final

In [None]:
print('='*70)
print('RESUMEN: GR√ÅFICOS DE CLEVELAND POR TIPO DE √çTEM')
print('='*70)

print('\nüìä An√°lisis completado:')
print(f'  - √çtems Progresistas: {len(df_prog)}')
print(f'  - √çtems Conservadores: {len(df_cons)}')
print(f'  - Gr√°ficos generados: 1 (2 paneles comparativos)')

print('\nüìÅ Archivos generados:')
print('  - Cleveland_CT_Por_Tipo.png (gr√°fico comparativo)')
print('  - Resumen_CT_Progresistas.xlsx')
print('  - Resumen_CT_Conservadores.xlsx')
print('  - Comparacion_Por_Tipo.xlsx')

print('\nüéØ Hallazgos clave:')
print(f'\n  PROGRESISTAS:')
print(f'    - Cambio promedio: {df_prog["Cambio"].mean():.3f} seg')
print(f'    - Aumentaron: {aumentaron_prog}/{len(df_prog)} √≠tems')
print(f'    - Disminuyeron: {disminuyeron_prog}/{len(df_prog)} √≠tems')

print(f'\n  CONSERVADORES:')
print(f'    - Cambio promedio: {df_cons["Cambio"].mean():.3f} seg')
print(f'    - Aumentaron: {aumentaron_cons}/{len(df_cons)} √≠tems')
print(f'    - Disminuyeron: {disminuyeron_cons}/{len(df_cons)} √≠tems')

print('\nüí° Interpretaci√≥n:')
if abs(dif_medias) < 0.1:
    print('  ‚úì Ambos tipos de √≠tems muestran patrones similares de cambio')
elif dif_medias > 0:
    print('  ‚úì Los √≠tems Progresistas muestran MAYOR incremento en asimetr√≠a Izq-Der')
else:
    print('  ‚úì Los √≠tems Conservadores muestran MAYOR incremento en asimetr√≠a Izq-Der')

print('\n' + '='*70)
print('‚úÖ AN√ÅLISIS COMPLETADO')
print('='*70)