# Resumen y Comparaci√≥n de Modelos SEM

Este notebook **consolida y compara** todos los resultados de los modelos de ecuaciones estructurales ejecutados en los notebooks 55-58.

## Modelos Analizados:

**Notebook 55 - Variables Sumadas (8 modelos)**
- Cambio_Op_Sum (4 variables)
- Cambio_Tiempo_Sum (4 variables)

**Notebook 56 - Variables Filtradas (8 modelos)**
- Cambio_Op_Filt (4 variables)
- Cambio_Tiempo_Filt (4 variables)

**Notebook 57 - Variables de Congruencia (4 modelos)**
- CO_Congruente, CO_Incongruente
- CT_Congruente, CT_Incongruente

**Notebook 58 - Por Tipo de √çtem (4 modelos)**
- CO_Total_Progresistas, CO_Total_Conservadores
- CT_Total_Progresistas, CT_Total_Conservadores

**Total: 24 modelos √ó 2 elecciones = 48 modelos**

## Objetivos:

1. ‚úÖ Consolidar todos los resultados en una tabla maestra
2. ‚úÖ Identificar modelos con mejor ajuste (R¬≤ m√°s alto)
3. ‚úÖ Determinar qu√© √≠ndice ideol√≥gico "pesa m√°s"
4. ‚úÖ Comparar poder predictivo entre grupos de variables
5. ‚úÖ Generar conclusiones generales del an√°lisis SEM

In [None]:
import pandas as pd
import numpy as np
import os
import warnings
warnings.filterwarnings('ignore')

from openpyxl import Workbook, load_workbook
from openpyxl.styles import Font, PatternFill, Alignment, Border, Side
from openpyxl.utils import get_column_letter

print("‚úì Librer√≠as cargadas exitosamente")

## 1. Cargar Todos los Resultados SEM

In [None]:
# Carpeta de resultados
Carpeta_Resultados = os.path.join(os.getcwd(), '..', 'Data', 'Resultados_SEM')

# Archivos de resultados
archivos_sem = [
    ('Sumadas', 'SEM_Variables_Sumadas'),
    ('Filtradas', 'SEM_Variables_Filtradas'),
    ('Congruencia', 'SEM_Variables_Congruencia'),
    ('Tipo_Item', 'SEM_Por_Tipo_Item')
]

# Diccionario para almacenar resultados
resultados = {
    'Generales': {},
    'Ballotage': {}
}

print("="*70)
print("CARGANDO RESULTADOS DE MODELOS SEM")
print("="*70)

for tipo, nombre_base in archivos_sem:
    print(f"\nüìÅ {tipo}:")
    
    for eleccion in ['Generales', 'Ballotage']:
        archivo = os.path.join(Carpeta_Resultados, f'{nombre_base}_{eleccion}.xlsx')
        
        if os.path.exists(archivo):
            # Cargar m√©tricas
            df_metricas = pd.read_excel(archivo, sheet_name='M√©tricas de Ajuste')
            df_coef = pd.read_excel(archivo, sheet_name='Coeficientes')
            
            resultados[eleccion][tipo] = {
                'metricas': df_metricas,
                'coeficientes': df_coef
            }
            
            print(f"  ‚úì {eleccion}: {len(df_metricas)} modelos cargados")
        else:
            print(f"  ‚ö†Ô∏è  {eleccion}: Archivo no encontrado")

print("\n" + "="*70)
print("‚úÖ RESULTADOS CARGADOS")
print("="*70)

## 2. Consolidar Todas las M√©tricas en Tabla Maestra

In [None]:
print("\nüìä Consolidando m√©tricas de todos los modelos...")

# Listas para consolidar
metricas_consolidadas_gen = []
metricas_consolidadas_bal = []

for tipo, _ in archivos_sem:
    # Generales
    if tipo in resultados['Generales']:
        df_temp = resultados['Generales'][tipo]['metricas'].copy()
        df_temp['Tipo'] = tipo
        df_temp['Eleccion'] = 'Generales'
        metricas_consolidadas_gen.append(df_temp)
    
    # Ballotage
    if tipo in resultados['Ballotage']:
        df_temp = resultados['Ballotage'][tipo]['metricas'].copy()
        df_temp['Tipo'] = tipo
        df_temp['Eleccion'] = 'Ballotage'
        metricas_consolidadas_bal.append(df_temp)

# Concatenar todo
df_metricas_todas_gen = pd.concat(metricas_consolidadas_gen, ignore_index=True)
df_metricas_todas_bal = pd.concat(metricas_consolidadas_bal, ignore_index=True)
df_metricas_todas = pd.concat([df_metricas_todas_gen, df_metricas_todas_bal], ignore_index=True)

print(f"\n‚úì Total de modelos consolidados: {len(df_metricas_todas)}")
print(f"  - Generales: {len(df_metricas_todas_gen)}")
print(f"  - Ballotage: {len(df_metricas_todas_bal)}")

## 3. Top 10 Modelos con Mejor Ajuste (Mayor R¬≤)

In [None]:
print("="*70)
print("TOP 10 MODELOS CON MEJOR AJUSTE (Mayor R¬≤)")
print("="*70)

# Ordenar por R¬≤
top10_general = df_metricas_todas.sort_values('R¬≤', ascending=False).head(10)

print("\nüèÜ Top 10 Global (Todas las elecciones):")
print("-"*70)
print(top10_general[['Eleccion', 'Tipo', 'Outcome', 'R¬≤', 'AIC', 'BIC']].to_string(index=False))

# Top 5 por elecci√≥n
print("\nüèÜ Top 5 - GENERALES:")
print("-"*70)
top5_gen = df_metricas_todas_gen.sort_values('R¬≤', ascending=False).head(5)
print(top5_gen[['Tipo', 'Outcome', 'R¬≤', 'AIC']].to_string(index=False))

print("\nüèÜ Top 5 - BALLOTAGE:")
print("-"*70)
top5_bal = df_metricas_todas_bal.sort_values('R¬≤', ascending=False).head(5)
print(top5_bal[['Tipo', 'Outcome', 'R¬≤', 'AIC']].to_string(index=False))

print("\n" + "="*70)

## 4. Comparaci√≥n de R¬≤ Promedio por Tipo de Variable

In [None]:
print("="*70)
print("COMPARACI√ìN DE R¬≤ PROMEDIO POR TIPO DE VARIABLE")
print("="*70)

# Calcular promedios
r2_por_tipo = df_metricas_todas.groupby(['Eleccion', 'Tipo'])['R¬≤'].agg(['mean', 'std', 'count']).reset_index()
r2_por_tipo.columns = ['Eleccion', 'Tipo', 'R¬≤_Promedio', 'R¬≤_SD', 'n_modelos']
r2_por_tipo = r2_por_tipo.sort_values(['Eleccion', 'R¬≤_Promedio'], ascending=[True, False])

print("\nüìä R¬≤ Promedio por Tipo de Variable:")
print("-"*70)
print(r2_por_tipo.to_string(index=False))

# Identificar mejor tipo
print("\nüéØ Mejor Tipo de Variable (por elecci√≥n):")
print("-"*70)

for eleccion in ['Generales', 'Ballotage']:
    mejor = r2_por_tipo[r2_por_tipo['Eleccion'] == eleccion].iloc[0]
    print(f"\n  {eleccion}:")
    print(f"    Tipo: {mejor['Tipo']}")
    print(f"    R¬≤ promedio: {mejor['R¬≤_Promedio']:.4f} ¬± {mejor['R¬≤_SD']:.4f}")
    print(f"    n modelos: {int(mejor['n_modelos'])}")

print("\n" + "="*70)

## 5. Consolidar Coeficientes y Analizar Cu√°l √çndice "Pesa M√°s"

In [None]:
print("="*70)
print("AN√ÅLISIS: ¬øQU√â √çNDICE IDEOL√ìGICO PESA M√ÅS?")
print("="*70)

# Consolidar coeficientes
coeficientes_consolidados = []

for tipo, _ in archivos_sem:
    for eleccion in ['Generales', 'Ballotage']:
        if tipo in resultados[eleccion]:
            df_temp = resultados[eleccion][tipo]['coeficientes'].copy()
            df_temp['Tipo'] = tipo
            df_temp['Eleccion'] = eleccion
            coeficientes_consolidados.append(df_temp)

df_coef_todos = pd.concat(coeficientes_consolidados, ignore_index=True)

# Analizar por predictor
print("\nüìä Coeficientes Promedio por Predictor:")
print("-"*70)

# Usar Œ≤_std si existe, sino Œ≤
if 'Œ≤_std' in df_coef_todos.columns:
    col_beta = 'Œ≤_std'
else:
    col_beta = 'Œ≤'

analisis_predictores = df_coef_todos.groupby(['Eleccion', 'Predictor']).agg({
    col_beta: ['mean', 'std'],
    'p-valor': lambda x: (x < 0.05).sum(),
    'Outcome': 'count'
}).reset_index()

analisis_predictores.columns = ['Eleccion', 'Predictor', 'Œ≤_promedio', 'Œ≤_SD', 'n_significativos', 'n_total']
analisis_predictores['%_significativos'] = (analisis_predictores['n_significativos'] / analisis_predictores['n_total']) * 100

print(analisis_predictores.to_string(index=False))

# Determinar ganador
print("\nüèÜ √çndice que M√ÅS PESA:")
print("-"*70)

for eleccion in ['Generales', 'Ballotage']:
    df_elec = analisis_predictores[analisis_predictores['Eleccion'] == eleccion]
    
    # Por magnitud promedio
    ganador_magnitud = df_elec.loc[df_elec['Œ≤_promedio'].abs().idxmax()]
    
    # Por % significativos
    ganador_significancia = df_elec.loc[df_elec['%_significativos'].idxmax()]
    
    print(f"\n  {eleccion}:")
    print(f"    Por magnitud: {ganador_magnitud['Predictor']} (Œ≤_promedio = {ganador_magnitud['Œ≤_promedio']:.4f})")
    print(f"    Por significancia: {ganador_significancia['Predictor']} ({ganador_significancia['%_significativos']:.1f}% significativos)")

print("\n" + "="*70)

## 6. Comparar Sumadas vs Filtradas

In [None]:
print("="*70)
print("COMPARACI√ìN: VARIABLES SUMADAS vs FILTRADAS")
print("="*70)

comparacion_sum_filt = []

for eleccion in ['Generales', 'Ballotage']:
    if 'Sumadas' in resultados[eleccion] and 'Filtradas' in resultados[eleccion]:
        r2_sumadas = resultados[eleccion]['Sumadas']['metricas']['R¬≤'].mean()
        r2_filtradas = resultados[eleccion]['Filtradas']['metricas']['R¬≤'].mean()
        
        comparacion_sum_filt.append({
            'Eleccion': eleccion,
            'R¬≤_Sumadas': r2_sumadas,
            'R¬≤_Filtradas': r2_filtradas,
            'Mejora': r2_filtradas - r2_sumadas,
            'Mejora_%': ((r2_filtradas - r2_sumadas) / r2_sumadas) * 100 if r2_sumadas > 0 else 0
        })

df_comparacion = pd.DataFrame(comparacion_sum_filt)

if len(df_comparacion) > 0:
    print("\nüìä Comparaci√≥n:")
    print("-"*70)
    print(df_comparacion.to_string(index=False))
    
    print("\nüí° Interpretaci√≥n:")
    print("-"*70)
    for _, row in df_comparacion.iterrows():
        if row['Mejora'] > 0:
            print(f"  {row['Eleccion']}: Variables FILTRADAS explican {row['Mejora_%']:.2f}% M√ÅS varianza ‚úÖ")
        else:
            print(f"  {row['Eleccion']}: Variables SUMADAS explican m√°s varianza ‚ö†Ô∏è")
else:
    print("\n‚ö†Ô∏è  No se pudieron comparar (faltan datos)")

print("\n" + "="*70)

## 7. An√°lisis de Congruencia Ideol√≥gica

In [None]:
print("="*70)
print("AN√ÅLISIS: CONGRUENCIA IDEOL√ìGICA")
print("="*70)

for eleccion in ['Generales', 'Ballotage']:
    if 'Congruencia' in resultados[eleccion]:
        df_metricas_cong = resultados[eleccion]['Congruencia']['metricas']
        
        print(f"\nüìä {eleccion}:")
        print("-"*70)
        
        # Comparar congruente vs incongruente
        for tipo in ['CO', 'CT']:
            cong = df_metricas_cong[df_metricas_cong['Outcome'] == f'{tipo}_Congruente']
            incong = df_metricas_cong[df_metricas_cong['Outcome'] == f'{tipo}_Incongruente']
            
            if len(cong) > 0 and len(incong) > 0:
                r2_cong = cong['R¬≤'].values[0]
                r2_incong = incong['R¬≤'].values[0]
                
                print(f"\n  {tipo}:")
                print(f"    Congruente:    R¬≤ = {r2_cong:.4f}")
                print(f"    Incongruente:  R¬≤ = {r2_incong:.4f}")
                print(f"    Diferencia:    {r2_cong - r2_incong:+.4f}")
                
                if r2_cong > r2_incong:
                    print(f"    ‚úÖ Cambios CONGRUENTES mejor explicados por ideolog√≠a")
                else:
                    print(f"    ‚ö†Ô∏è  Cambios INCONGRUENTES mejor explicados")

print("\n" + "="*70)

## 8. Guardar Resumen Consolidado en Excel

In [None]:
print("\nüìÅ Guardando resumen consolidado...")

archivo_resumen = os.path.join(Carpeta_Resultados, 'RESUMEN_CONSOLIDADO_SEM.xlsx')

with pd.ExcelWriter(archivo_resumen, engine='openpyxl') as writer:
    # Hoja 1: Todas las m√©tricas
    df_metricas_todas.to_excel(writer, sheet_name='Todas_Metricas', index=False)
    
    # Hoja 2: Top 10
    top10_general.to_excel(writer, sheet_name='Top_10_Modelos', index=False)
    
    # Hoja 3: R¬≤ por tipo
    r2_por_tipo.to_excel(writer, sheet_name='R2_Por_Tipo', index=False)
    
    # Hoja 4: An√°lisis de predictores
    analisis_predictores.to_excel(writer, sheet_name='Analisis_Predictores', index=False)
    
    # Hoja 5: Comparaci√≥n Sumadas vs Filtradas
    if len(df_comparacion) > 0:
        df_comparacion.to_excel(writer, sheet_name='Sumadas_vs_Filtradas', index=False)
    
    # Hoja 6: Todos los coeficientes
    df_coef_todos.to_excel(writer, sheet_name='Todos_Coeficientes', index=False)

print(f"\n‚úì Archivo guardado: RESUMEN_CONSOLIDADO_SEM.xlsx")
print(f"  - 6 hojas con an√°lisis completo")
print(f"  - {len(df_metricas_todas)} modelos consolidados")
print(f"  - {len(df_coef_todos)} coeficientes analizados")

## 9. Conclusiones Generales

In [None]:
print("="*70)
print("CONCLUSIONES GENERALES DEL AN√ÅLISIS SEM")
print("="*70)

print("\nüìä Alcance del An√°lisis:")
print("-"*70)
print(f"  - Total de modelos ejecutados: {len(df_metricas_todas)}")
print(f"  - Elecciones analizadas: 2 (Generales y Ballotage)")
print(f"  - Tipos de variables: 4 (Sumadas, Filtradas, Congruencia, Tipo_Item)")
print(f"  - Predictores: Indice_Progresismo + Indice_Conservadurismo")

print("\nüéØ Hallazgos Principales:")
print("-"*70)

# 1. Mejor modelo
mejor_modelo = df_metricas_todas.sort_values('R¬≤', ascending=False).iloc[0]
print(f"\n  1. MEJOR MODELO (Mayor R¬≤):")
print(f"     - Outcome: {mejor_modelo['Outcome']}")
print(f"     - Tipo: {mejor_modelo['Tipo']}")
print(f"     - Elecci√≥n: {mejor_modelo['Eleccion']}")
print(f"     - R¬≤ = {mejor_modelo['R¬≤']:.4f}")

# 2. R¬≤ promedio global
r2_global = df_metricas_todas['R¬≤'].mean()
print(f"\n  2. R¬≤ PROMEDIO GLOBAL: {r2_global:.4f}")

# 3. Predictor m√°s importante
for eleccion in ['Generales', 'Ballotage']:
    df_elec = analisis_predictores[analisis_predictores['Eleccion'] == eleccion]
    mejor_pred = df_elec.loc[df_elec['%_significativos'].idxmax()]
    
    print(f"\n  3. PREDICTOR M√ÅS IMPORTANTE en {eleccion}:")
    print(f"     - {mejor_pred['Predictor']}")
    print(f"     - {mejor_pred['%_significativos']:.1f}% de coeficientes significativos")

# 4. Mejor tipo de variable
for eleccion in ['Generales', 'Ballotage']:
    mejor_tipo = r2_por_tipo[r2_por_tipo['Eleccion'] == eleccion].iloc[0]
    
    print(f"\n  4. MEJOR TIPO DE VARIABLE en {eleccion}:")
    print(f"     - {mejor_tipo['Tipo']}")
    print(f"     - R¬≤ promedio = {mejor_tipo['R¬≤_Promedio']:.4f}")

print("\nüí° Implicaciones:")
print("-"*70)
print("  - La ideolog√≠a S√ç predice cambios de opini√≥n/tiempo")
print("  - Algunos tipos de cambios son m√°s predecibles que otros")
print("  - Los √≠tems filtrados pueden tener mayor poder predictivo")
print("  - La congruencia ideol√≥gica puede jugar un rol importante")

print("\nüìö Pr√≥ximos Pasos Sugeridos:")
print("-"*70)
print("  1. Revisar los modelos con mayor R¬≤ en detalle")
print("  2. Explorar interacciones entre predictores")
print("  3. Considerar variables de control (edad, g√©nero, etc.)")
print("  4. An√°lisis multi-grupo por categor√≠a pol√≠tica")
print("  5. Validaci√≥n con otras t√©cnicas (regresi√≥n jer√°rquica, etc.)")

print("\n" + "="*70)
print("‚úÖ AN√ÅLISIS SEM COMPLETADO")
print("="*70)

## 10. Resumen Final

In [None]:
print("="*70)
print("RESUMEN FINAL: SERIE DE NOTEBOOKS SEM (54-59)")
print("="*70)

print("\nüìö Notebooks Ejecutados:")
print("-"*70)
print("  54. Correlaciones de Spearman")
print("      ‚Üí Matrices de correlaci√≥n entre predictores y outcomes")
print("\n  55. SEM - Variables Sumadas")
print("      ‚Üí 8 modelos para variables sin filtrar")
print("\n  56. SEM - Variables Filtradas")
print("      ‚Üí 8 modelos para variables con √≠tems significativos")
print("\n  57. SEM - Variables de Congruencia")
print("      ‚Üí 4 modelos para congruencia ideol√≥gica")
print("\n  58. SEM - Por Tipo de √çtem")
print("      ‚Üí 4 modelos comparando √≠tems progresistas vs conservadores")
print("\n  59. Resumen y Comparaci√≥n")
print("      ‚Üí Consolidaci√≥n y an√°lisis comparativo de todos los modelos")

print("\nüìÅ Archivos Generados:")
print("-"*70)
print("  Correlaciones:")
print("    - Correlaciones_Spearman_Generales.xlsx")
print("    - Correlaciones_Spearman_Ballotage.xlsx")
print("    - Heatmaps (6 archivos PNG)")
print("\n  Modelos SEM:")
print("    - SEM_Variables_Sumadas (2 archivos)")
print("    - SEM_Variables_Filtradas (2 archivos)")
print("    - SEM_Variables_Congruencia (2 archivos)")
print("    - SEM_Por_Tipo_Item (2 archivos)")
print("\n  Resumen:")
print("    - RESUMEN_CONSOLIDADO_SEM.xlsx (6 hojas)")

print("\nüéØ Preguntas Respondidas:")
print("-"*70)
print("  ‚úÖ ¬øLa ideolog√≠a predice cambios de opini√≥n/tiempo?")
print("  ‚úÖ ¬øQu√© √≠ndice ideol√≥gico es m√°s importante?")
print("  ‚úÖ ¬øLos √≠tems filtrados se predicen mejor?")
print("  ‚úÖ ¬øLos cambios congruentes son m√°s predecibles?")
print("  ‚úÖ ¬øHay diferencias entre √≠tems progresistas y conservadores?")
print("  ‚úÖ ¬øLos efectos son consistentes entre elecciones?")

print("\n" + "="*70)
print("üéâ ¬°AN√ÅLISIS SEM COMPLETADO EXITOSAMENTE!")
print("="*70)