# Modelos de Ecuaciones Estructurales (SEM) - Variables Filtradas

Este notebook implementa **modelos de path analysis** para analizar la relaci√≥n entre las variables ideol√≥gicas y las variables de cambio de opini√≥n/tiempo **filtradas** (solo √≠tems significativos).

## Modelo para cada variable dependiente:

```
Indice_Progresismo ‚îÄ‚îÄ‚îÄ‚îÄ‚Üí Y
                          ‚Üë
Indice_Conservadurismo ‚îÄ‚îÄ‚Üí
```

**Ecuaci√≥n:**
```
Y = Œ≤‚ÇÄ + Œ≤‚ÇÅ(Indice_Progresismo) + Œ≤‚ÇÇ(Indice_Conservadurismo) + Œµ
```

## Variables Dependientes (8 modelos):

**Cambio de Opini√≥n Filtrado (CO):**
1. `Cambio_Op_Filt_Pro_Izq`
2. `Cambio_Op_Filt_Pro_Der`
3. `Cambio_Op_Filt_Con_Izq`
4. `Cambio_Op_Filt_Con_Der`

**Cambio de Tiempo Filtrado (CT):**
5. `Cambio_Tiempo_Filt_Pro_Izq`
6. `Cambio_Tiempo_Filt_Pro_Der`
7. `Cambio_Tiempo_Filt_Con_Izq`
8. `Cambio_Tiempo_Filt_Con_Der`

## Diferencia con Variables Sumadas:

Las **variables filtradas** solo incluyen los √≠tems que fueron **significativos** en el an√°lisis de Kruskal-Wallis (p < 0.05), por lo que esperamos:
- **Mayor R¬≤** (mejor ajuste del modelo)
- **Coeficientes m√°s fuertes** (relaciones m√°s claras)
- **Mayor significancia estad√≠stica**

In [1]:
import pandas as pd
import numpy as np
import os
from scipy import stats
import warnings
warnings.filterwarnings('ignore')

# Imports para SEM
try:
    from semopy import Model
    from semopy.inspector import inspect
    print("‚úì semopy disponible")
    USAR_SEMOPY = True
except ImportError:
    print("‚ö†Ô∏è  semopy no disponible, usando statsmodels OLS")
    from statsmodels.api import OLS, add_constant
    from sklearn.preprocessing import StandardScaler
    USAR_SEMOPY = False

from openpyxl import Workbook, load_workbook
from openpyxl.styles import Font, PatternFill, Alignment, Border, Side
from openpyxl.utils import get_column_letter

print("‚úì Librer√≠as cargadas exitosamente")

‚ö†Ô∏è  semopy no disponible, usando statsmodels OLS
‚úì Librer√≠as cargadas exitosamente


## 1. Cargar Datos

In [2]:
# Rutas
Ruta_Base = os.path.join(os.getcwd(), '..', 'Data', 'Bases definitivas')
Excel_Generales = os.path.join(Ruta_Base, 'Generales.xlsx')
Excel_Ballotage = os.path.join(Ruta_Base, 'Ballotage.xlsx')

# Cargar DataFrames
df_Generales = pd.read_excel(Excel_Generales)
df_Ballotage = pd.read_excel(Excel_Ballotage)

dfs_Finales = {
    'Generales': df_Generales,
    'Ballotage': df_Ballotage
}

print(f"‚úì Datos cargados:")
print(f"  - Generales: {len(df_Generales)} registros")
print(f"  - Ballotage: {len(df_Ballotage)} registros")

‚úì Datos cargados:
  - Generales: 2786 registros
  - Ballotage: 1254 registros


## 2. Definir Variables

In [3]:
# Variables predictoras
Predictores = [
    'Indice_Progresismo',
    'Indice_Conservadurismo'
]

# Variables dependientes - Filtradas
Outcomes_Filtradas = [
    'Cambio_Op_Filt_Pro_Izq',
    'Cambio_Op_Filt_Pro_Der',
    'Cambio_Op_Filt_Con_Izq',
    'Cambio_Op_Filt_Con_Der',
    'Cambio_Tiempo_Filt_Pro_Izq',
    'Cambio_Tiempo_Filt_Pro_Der',
    'Cambio_Tiempo_Filt_Con_Izq',
    'Cambio_Tiempo_Filt_Con_Der'
]

print(f"‚úì Variables definidas:")
print(f"  - Predictores: {len(Predictores)}")
print(f"  - Outcomes: {len(Outcomes_Filtradas)}")

‚úì Variables definidas:
  - Predictores: 2
  - Outcomes: 8


## 3. Funci√≥n para Ejecutar Modelo SEM

In [4]:
def Ejecutar_Modelo_Path(df, outcome, predictores, nombre_modelo):
    """
    Ejecuta un modelo de path analysis (regresi√≥n m√∫ltiple).
    
    Par√°metros:
    -----------
    df : DataFrame
        Datos
    outcome : str
        Variable dependiente
    predictores : list
        Lista de predictores
    nombre_modelo : str
        Nombre del modelo (para reportes)
    
    Retorna:
    --------
    dict : Resultados del modelo
    """
    
    # Verificar que las variables existan
    variables_necesarias = [outcome] + predictores
    variables_existentes = [v for v in variables_necesarias if v in df.columns]
    
    if len(variables_existentes) != len(variables_necesarias):
        faltantes = set(variables_necesarias) - set(variables_existentes)
        print(f"  ‚ö†Ô∏è  Variables faltantes en {nombre_modelo}: {faltantes}")
        return None
    
    # Seleccionar datos y eliminar NaN
    df_modelo = df[variables_necesarias].dropna()
    
    if len(df_modelo) < 10:
        print(f"  ‚ö†Ô∏è  Datos insuficientes en {nombre_modelo}: n={len(df_modelo)}")
        return None
    
    if USAR_SEMOPY:
        # Usar semopy para SEM verdadero
        try:
            # Definir modelo en sintaxis semopy
            modelo_spec = f"{outcome} ~ {' + '.join(predictores)}"
            
            modelo = Model(modelo_spec)
            modelo.fit(df_modelo)
            
            # Extraer resultados
            params = modelo.inspect()
            
            # Calcular R¬≤
            residuos = df_modelo[outcome] - modelo.predict(df_modelo)[outcome]
            ss_res = np.sum(residuos**2)
            ss_tot = np.sum((df_modelo[outcome] - df_modelo[outcome].mean())**2)
            r_squared = 1 - (ss_res / ss_tot)
            
            # Obtener m√©tricas de ajuste
            try:
                stats_modelo = inspect(modelo)
                aic = stats_modelo.get('AIC', np.nan)
                bic = stats_modelo.get('BIC', np.nan)
            except:
                aic = np.nan
                bic = np.nan
            
            # Formatear resultados
            resultados = {
                'Modelo': nombre_modelo,
                'Outcome': outcome,
                'n': len(df_modelo),
                'R¬≤': r_squared,
                'AIC': aic,
                'BIC': bic,
                'Coeficientes': {}
            }
            
            # Extraer coeficientes
            for idx, row in params.iterrows():
                if row['lval'] == outcome and row['rval'] in predictores:
                    resultados['Coeficientes'][row['rval']] = {
                        'Œ≤': row['Estimate'],
                        'SE': row['Std. Err'],
                        'z': row['z-value'],
                        'p': row['p-value']
                    }
            
            return resultados
            
        except Exception as e:
            print(f"  ‚ùå Error en semopy para {nombre_modelo}: {e}")
            print(f"     Usando regresi√≥n OLS como respaldo...")
    
    # Fallback: Usar OLS de statsmodels
    try:
        from statsmodels.api import OLS, add_constant
        
        # Preparar datos
        X = df_modelo[predictores]
        y = df_modelo[outcome]
        
        # Agregar constante
        X_const = add_constant(X)
        
        # Ajustar modelo
        modelo_ols = OLS(y, X_const).fit()
        
        # Calcular coeficientes estandarizados
        from sklearn.preprocessing import StandardScaler
        scaler_X = StandardScaler()
        scaler_y = StandardScaler()
        
        X_std = scaler_X.fit_transform(X)
        y_std = scaler_y.fit_transform(y.values.reshape(-1, 1)).flatten()
        
        modelo_std = OLS(y_std, X_std).fit()
        
        # Formatear resultados
        resultados = {
            'Modelo': nombre_modelo,
            'Outcome': outcome,
            'n': len(df_modelo),
            'R¬≤': modelo_ols.rsquared,
            'AIC': modelo_ols.aic,
            'BIC': modelo_ols.bic,
            'Coeficientes': {}
        }
        
        # Extraer coeficientes (excluyendo constante)
        for i, pred in enumerate(predictores):
            resultados['Coeficientes'][pred] = {
                'Œ≤': modelo_ols.params[pred],
                'Œ≤_std': modelo_std.params[i],
                'SE': modelo_ols.bse[pred],
                't': modelo_ols.tvalues[pred],
                'p': modelo_ols.pvalues[pred]
            }
        
        return resultados
        
    except Exception as e:
        print(f"  ‚ùå Error en OLS para {nombre_modelo}: {e}")
        return None

## 4. Ejecutar Modelos para GENERALES

In [5]:
print("="*70)
print("EJECUTANDO MODELOS SEM: GENERALES (Variables Filtradas)")
print("="*70)

resultados_generales = []

for outcome in Outcomes_Filtradas:
    print(f"\nüìä Modelo: {outcome}")
    print("-"*70)
    
    resultado = Ejecutar_Modelo_Path(
        df_Generales,
        outcome,
        Predictores,
        f"Generales_{outcome}"
    )
    
    if resultado:
        resultados_generales.append(resultado)
        
        print(f"  n = {resultado['n']}")
        print(f"  R¬≤ = {resultado['R¬≤']:.4f}")
        print(f"  AIC = {resultado['AIC']:.2f}")
        print(f"  BIC = {resultado['BIC']:.2f}")
        print(f"\n  Coeficientes:")
        
        for pred, coefs in resultado['Coeficientes'].items():
            beta = coefs.get('Œ≤', coefs.get('Œ≤_std', 0))
            p_val = coefs.get('p', 1)
            sig = '***' if p_val < 0.001 else '**' if p_val < 0.01 else '*' if p_val < 0.05 else 'ns'
            
            print(f"    {pred:<25} Œ≤ = {beta:>7.4f}  (p = {p_val:.4f}) {sig}")
        
        print(f"\n  {'‚úÖ Modelo ajustado exitosamente' if resultado['R¬≤'] > 0 else '‚ö†Ô∏è  R¬≤ muy bajo'}")

print(f"\n{'-'*70}")
print(f"‚úÖ {len(resultados_generales)} modelos ejecutados para Generales")
print("="*70)

EJECUTANDO MODELOS SEM: GENERALES (Variables Filtradas)

üìä Modelo: Cambio_Op_Filt_Pro_Izq
----------------------------------------------------------------------
  n = 2786
  R¬≤ = 0.0108
  AIC = 9447.49
  BIC = 9465.29

  Coeficientes:
    Indice_Progresismo        Œ≤ = -0.2378  (p = 0.0000) ***
    Indice_Conservadurismo    Œ≤ = -0.2427  (p = 0.0000) ***

  ‚úÖ Modelo ajustado exitosamente

üìä Modelo: Cambio_Op_Filt_Pro_Der
----------------------------------------------------------------------
  n = 2786
  R¬≤ = nan
  AIC = -inf
  BIC = -inf

  Coeficientes:
    Indice_Progresismo        Œ≤ =  0.0000  (p = nan) ns
    Indice_Conservadurismo    Œ≤ =  0.0000  (p = nan) ns

  ‚ö†Ô∏è  R¬≤ muy bajo

üìä Modelo: Cambio_Op_Filt_Con_Izq
----------------------------------------------------------------------
  n = 2786
  R¬≤ = 0.0316
  AIC = 9247.45
  BIC = 9265.25

  Coeficientes:
    Indice_Progresismo        Œ≤ = -0.1013  (p = 0.0163) *
    Indice_Conservadurismo    Œ≤ = -0.4841  (p = 

## 5. Ejecutar Modelos para BALLOTAGE

In [6]:
print("="*70)
print("EJECUTANDO MODELOS SEM: BALLOTAGE (Variables Filtradas)")
print("="*70)

resultados_ballotage = []

for outcome in Outcomes_Filtradas:
    print(f"\nüìä Modelo: {outcome}")
    print("-"*70)
    
    resultado = Ejecutar_Modelo_Path(
        df_Ballotage,
        outcome,
        Predictores,
        f"Ballotage_{outcome}"
    )
    
    if resultado:
        resultados_ballotage.append(resultado)
        
        print(f"  n = {resultado['n']}")
        print(f"  R¬≤ = {resultado['R¬≤']:.4f}")
        print(f"  AIC = {resultado['AIC']:.2f}")
        print(f"  BIC = {resultado['BIC']:.2f}")
        print(f"\n  Coeficientes:")
        
        for pred, coefs in resultado['Coeficientes'].items():
            beta = coefs.get('Œ≤', coefs.get('Œ≤_std', 0))
            p_val = coefs.get('p', 1)
            sig = '***' if p_val < 0.001 else '**' if p_val < 0.01 else '*' if p_val < 0.05 else 'ns'
            
            print(f"    {pred:<25} Œ≤ = {beta:>7.4f}  (p = {p_val:.4f}) {sig}")
        
        print(f"\n  {'‚úÖ Modelo ajustado exitosamente' if resultado['R¬≤'] > 0 else '‚ö†Ô∏è  R¬≤ muy bajo'}")

print(f"\n{'-'*70}")
print(f"‚úÖ {len(resultados_ballotage)} modelos ejecutados para Ballotage")
print("="*70)

EJECUTANDO MODELOS SEM: BALLOTAGE (Variables Filtradas)

üìä Modelo: Cambio_Op_Filt_Pro_Izq
----------------------------------------------------------------------
  n = 1254
  R¬≤ = 0.0192
  AIC = 3473.73
  BIC = 3489.13

  Coeficientes:
    Indice_Progresismo        Œ≤ = -0.1565  (p = 0.0007) ***
    Indice_Conservadurismo    Œ≤ =  0.0245  (p = 0.6675) ns

  ‚úÖ Modelo ajustado exitosamente

üìä Modelo: Cambio_Op_Filt_Pro_Der
----------------------------------------------------------------------
  n = 1254
  R¬≤ = 0.0227
  AIC = 3663.29
  BIC = 3678.69

  Coeficientes:
    Indice_Progresismo        Œ≤ = -0.2552  (p = 0.0000) ***
    Indice_Conservadurismo    Œ≤ = -0.1324  (p = 0.0316) *

  ‚úÖ Modelo ajustado exitosamente

üìä Modelo: Cambio_Op_Filt_Con_Izq
----------------------------------------------------------------------
  n = 1254
  R¬≤ = 0.0370
  AIC = 3905.83
  BIC = 3921.23

  Coeficientes:
    Indice_Progresismo        Œ≤ = -0.0391  (p = 0.4766) ns
    Indice_Conservadur

## 6. Crear Tablas de Resultados

In [7]:
def Crear_Tabla_Resultados(lista_resultados, nombre_dataset):
    """
    Convierte lista de resultados en DataFrames para exportar.
    
    Retorna:
    --------
    df_metricas : DataFrame con R¬≤, AIC, BIC
    df_coeficientes : DataFrame con Œ≤ y p-valores
    """
    
    # Tabla de m√©tricas de ajuste
    metricas_data = []
    
    for res in lista_resultados:
        metricas_data.append({
            'Outcome': res['Outcome'],
            'n': res['n'],
            'R¬≤': res['R¬≤'],
            'AIC': res['AIC'],
            'BIC': res['BIC']
        })
    
    df_metricas = pd.DataFrame(metricas_data)
    
    # Tabla de coeficientes
    coef_data = []
    
    for res in lista_resultados:
        for pred, coefs in res['Coeficientes'].items():
            beta = coefs.get('Œ≤', coefs.get('Œ≤_std', np.nan))
            p_val = coefs.get('p', np.nan)
            sig = '***' if p_val < 0.001 else '**' if p_val < 0.01 else '*' if p_val < 0.05 else 'ns'
            
            coef_data.append({
                'Outcome': res['Outcome'],
                'Predictor': pred,
                'Œ≤': beta,
                'SE': coefs.get('SE', np.nan),
                'p-valor': p_val,
                'Sig': sig
            })
    
    df_coeficientes = pd.DataFrame(coef_data)
    
    return df_metricas, df_coeficientes

In [8]:
# Crear tablas para Generales
df_metricas_gen, df_coef_gen = Crear_Tabla_Resultados(resultados_generales, 'Generales')

print("\nüìã TABLA DE M√âTRICAS - GENERALES:")
print(df_metricas_gen.to_string(index=False))

print("\nüìã TABLA DE COEFICIENTES - GENERALES:")
print(df_coef_gen.to_string(index=False))


üìã TABLA DE M√âTRICAS - GENERALES:
                   Outcome    n       R¬≤          AIC          BIC
    Cambio_Op_Filt_Pro_Izq 2786 0.010827  9447.489010  9465.286097
    Cambio_Op_Filt_Pro_Der 2786      NaN         -inf         -inf
    Cambio_Op_Filt_Con_Izq 2786 0.031642  9247.452303  9265.249390
    Cambio_Op_Filt_Con_Der 2786 0.019763  7949.154221  7966.951308
Cambio_Tiempo_Filt_Pro_Izq 2786 0.002280 18873.327723 18891.124809
Cambio_Tiempo_Filt_Pro_Der 2786 0.006312 22375.507224 22393.304311
Cambio_Tiempo_Filt_Con_Izq 2786 0.000381 24548.807502 24566.604588
Cambio_Tiempo_Filt_Con_Der 2786 0.002801 25104.012210 25121.809296

üìã TABLA DE COEFICIENTES - GENERALES:
                   Outcome              Predictor         Œ≤       SE      p-valor Sig
    Cambio_Op_Filt_Pro_Izq     Indice_Progresismo -0.237839 0.043705 5.727683e-08 ***
    Cambio_Op_Filt_Pro_Izq Indice_Conservadurismo -0.242656 0.058067 3.019697e-05 ***
    Cambio_Op_Filt_Pro_Der     Indice_Progresismo  0.00000

In [9]:
# Crear tablas para Ballotage
df_metricas_bal, df_coef_bal = Crear_Tabla_Resultados(resultados_ballotage, 'Ballotage')

print("\nüìã TABLA DE M√âTRICAS - BALLOTAGE:")
print(df_metricas_bal.to_string(index=False))

print("\nüìã TABLA DE COEFICIENTES - BALLOTAGE:")
print(df_coef_bal.to_string(index=False))


üìã TABLA DE M√âTRICAS - BALLOTAGE:
                   Outcome    n       R¬≤         AIC         BIC
    Cambio_Op_Filt_Pro_Izq 1254 0.019217 3473.728808 3489.131089
    Cambio_Op_Filt_Pro_Der 1254 0.022737 3663.291255 3678.693536
    Cambio_Op_Filt_Con_Izq 1254 0.037050 3905.830834 3921.233115
    Cambio_Op_Filt_Con_Der 1254 0.006637 2826.488849 2841.891130
Cambio_Tiempo_Filt_Pro_Izq 1254      NaN        -inf        -inf
Cambio_Tiempo_Filt_Pro_Der 1254      NaN        -inf        -inf
Cambio_Tiempo_Filt_Con_Izq 1254 0.008345 9033.263140 9048.665422
Cambio_Tiempo_Filt_Con_Der 1254 0.002746 9153.707213 9169.109495

üìã TABLA DE COEFICIENTES - BALLOTAGE:
                   Outcome              Predictor         Œ≤       SE      p-valor Sig
    Cambio_Op_Filt_Pro_Izq     Indice_Progresismo -0.156489 0.046226 7.330610e-04 ***
    Cambio_Op_Filt_Pro_Izq Indice_Conservadurismo  0.024523 0.057080 6.675373e-01  ns
    Cambio_Op_Filt_Pro_Der     Indice_Progresismo -0.255247 0.049856 3.53953

## 7. Guardar Resultados en Excel

In [10]:
# Crear carpeta de resultados
Carpeta_Resultados = os.path.join(os.getcwd(), '..', 'Data', 'Resultados_SEM')
if not os.path.exists(Carpeta_Resultados):
    os.makedirs(Carpeta_Resultados)

# Guardar Generales
archivo_gen = os.path.join(Carpeta_Resultados, 'SEM_Variables_Filtradas_Generales.xlsx')
with pd.ExcelWriter(archivo_gen, engine='openpyxl') as writer:
    df_metricas_gen.to_excel(writer, sheet_name='M√©tricas de Ajuste', index=False)
    df_coef_gen.to_excel(writer, sheet_name='Coeficientes', index=False)

print(f"‚úì Resultados Generales guardados: SEM_Variables_Filtradas_Generales.xlsx")

# Guardar Ballotage
archivo_bal = os.path.join(Carpeta_Resultados, 'SEM_Variables_Filtradas_Ballotage.xlsx')
with pd.ExcelWriter(archivo_bal, engine='openpyxl') as writer:
    df_metricas_bal.to_excel(writer, sheet_name='M√©tricas de Ajuste', index=False)
    df_coef_bal.to_excel(writer, sheet_name='Coeficientes', index=False)

print(f"‚úì Resultados Ballotage guardados: SEM_Variables_Filtradas_Ballotage.xlsx")

‚úì Resultados Generales guardados: SEM_Variables_Filtradas_Generales.xlsx
‚úì Resultados Ballotage guardados: SEM_Variables_Filtradas_Ballotage.xlsx


## 8. Comparaci√≥n: Filtradas vs Sumadas

In [11]:
print("="*70)
print("COMPARACI√ìN: VARIABLES FILTRADAS vs SUMADAS")
print("="*70)

# Cargar resultados de variables sumadas si existen
archivo_sumadas_gen = os.path.join(Carpeta_Resultados, 'SEM_Variables_Sumadas_Generales.xlsx')
archivo_sumadas_bal = os.path.join(Carpeta_Resultados, 'SEM_Variables_Sumadas_Ballotage.xlsx')

if os.path.exists(archivo_sumadas_gen):
    df_sumadas_gen = pd.read_excel(archivo_sumadas_gen, sheet_name='M√©tricas de Ajuste')
    
    print("\nüìä GENERALES - Comparaci√≥n de R¬≤:")
    print("-"*70)
    print(f"\n  Variables Sumadas (promedio): {df_sumadas_gen['R¬≤'].mean():.4f}")
    print(f"  Variables Filtradas (promedio): {df_metricas_gen['R¬≤'].mean():.4f}")
    print(f"  Mejora: {(df_metricas_gen['R¬≤'].mean() - df_sumadas_gen['R¬≤'].mean()):.4f}")
    
    if df_metricas_gen['R¬≤'].mean() > df_sumadas_gen['R¬≤'].mean():
        print(f"  ‚úÖ Variables filtradas explican M√ÅS varianza")
    else:
        print(f"  ‚ö†Ô∏è  Variables sumadas explican m√°s varianza")
else:
    print("\n‚ö†Ô∏è  No se encontraron resultados de Variables Sumadas para comparar")

if os.path.exists(archivo_sumadas_bal):
    df_sumadas_bal = pd.read_excel(archivo_sumadas_bal, sheet_name='M√©tricas de Ajuste')
    
    print("\nüìä BALLOTAGE - Comparaci√≥n de R¬≤:")
    print("-"*70)
    print(f"\n  Variables Sumadas (promedio): {df_sumadas_bal['R¬≤'].mean():.4f}")
    print(f"  Variables Filtradas (promedio): {df_metricas_bal['R¬≤'].mean():.4f}")
    print(f"  Mejora: {(df_metricas_bal['R¬≤'].mean() - df_sumadas_bal['R¬≤'].mean()):.4f}")
    
    if df_metricas_bal['R¬≤'].mean() > df_sumadas_bal['R¬≤'].mean():
        print(f"  ‚úÖ Variables filtradas explican M√ÅS varianza")
    else:
        print(f"  ‚ö†Ô∏è  Variables sumadas explican m√°s varianza")

print("\n" + "="*70)

COMPARACI√ìN: VARIABLES FILTRADAS vs SUMADAS

üìä GENERALES - Comparaci√≥n de R¬≤:
----------------------------------------------------------------------

  Variables Sumadas (promedio): 0.0181
  Variables Filtradas (promedio): 0.0106
  Mejora: -0.0076
  ‚ö†Ô∏è  Variables sumadas explican m√°s varianza

üìä BALLOTAGE - Comparaci√≥n de R¬≤:
----------------------------------------------------------------------

  Variables Sumadas (promedio): 0.0209
  Variables Filtradas (promedio): 0.0161
  Mejora: -0.0047
  ‚ö†Ô∏è  Variables sumadas explican m√°s varianza



## 9. Identificar Mejores Modelos

In [12]:
print("="*70)
print("MEJORES MODELOS (por R¬≤) - VARIABLES FILTRADAS")
print("="*70)

print("\nüèÜ Top 3 Modelos - GENERALES:")
print("-"*70)
top3_gen = df_metricas_gen.sort_values('R¬≤', ascending=False).head(3)
print(top3_gen[['Outcome', 'R¬≤', 'AIC', 'BIC']].to_string(index=False))

print("\nüèÜ Top 3 Modelos - BALLOTAGE:")
print("-"*70)
top3_bal = df_metricas_bal.sort_values('R¬≤', ascending=False).head(3)
print(top3_bal[['Outcome', 'R¬≤', 'AIC', 'BIC']].to_string(index=False))

print("\n" + "="*70)

MEJORES MODELOS (por R¬≤) - VARIABLES FILTRADAS

üèÜ Top 3 Modelos - GENERALES:
----------------------------------------------------------------------
               Outcome       R¬≤         AIC         BIC
Cambio_Op_Filt_Con_Izq 0.031642 9247.452303 9265.249390
Cambio_Op_Filt_Con_Der 0.019763 7949.154221 7966.951308
Cambio_Op_Filt_Pro_Izq 0.010827 9447.489010 9465.286097

üèÜ Top 3 Modelos - BALLOTAGE:
----------------------------------------------------------------------
               Outcome       R¬≤         AIC         BIC
Cambio_Op_Filt_Con_Izq 0.037050 3905.830834 3921.233115
Cambio_Op_Filt_Pro_Der 0.022737 3663.291255 3678.693536
Cambio_Op_Filt_Pro_Izq 0.019217 3473.728808 3489.131089



## 10. Resumen Final

In [13]:
print("="*70)
print("RESUMEN FINAL: MODELOS SEM - VARIABLES FILTRADAS")
print("="*70)

print("\nüìä Modelos ejecutados:")
print(f"  - Generales: {len(resultados_generales)} modelos")
print(f"  - Ballotage: {len(resultados_ballotage)} modelos")
print(f"  - Total: {len(resultados_generales) + len(resultados_ballotage)} modelos")

print("\nüìà Estad√≠sticas generales:")
print(f"  Generales - R¬≤ promedio: {df_metricas_gen['R¬≤'].mean():.4f}")
print(f"  Ballotage - R¬≤ promedio: {df_metricas_bal['R¬≤'].mean():.4f}")

# Contar coeficientes significativos
sig_gen = len(df_coef_gen[df_coef_gen['Sig'] != 'ns'])
sig_bal = len(df_coef_bal[df_coef_bal['Sig'] != 'ns'])

print(f"\n  Generales - Coeficientes significativos: {sig_gen}/{len(df_coef_gen)}")
print(f"  Ballotage - Coeficientes significativos: {sig_bal}/{len(df_coef_bal)}")

print("\nüìÅ Archivos generados:")
print("  - SEM_Variables_Filtradas_Generales.xlsx")
print("  - SEM_Variables_Filtradas_Ballotage.xlsx")

print("\nüéØ Ventaja de Variables Filtradas:")
print("  - Solo incluyen √≠tems significativos (p<0.05 en Kruskal-Wallis)")
print("  - Mayor poder predictivo (esperamos R¬≤ m√°s alto)")
print("  - Relaciones m√°s claras entre ideolog√≠a y cambio")

print("\n" + "="*70)
print("‚úÖ AN√ÅLISIS SEM COMPLETADO")
print("="*70)

RESUMEN FINAL: MODELOS SEM - VARIABLES FILTRADAS

üìä Modelos ejecutados:
  - Generales: 8 modelos
  - Ballotage: 8 modelos
  - Total: 16 modelos

üìà Estad√≠sticas generales:
  Generales - R¬≤ promedio: 0.0106
  Ballotage - R¬≤ promedio: 0.0161

  Generales - Coeficientes significativos: 8/16
  Ballotage - Coeficientes significativos: 5/16

üìÅ Archivos generados:
  - SEM_Variables_Filtradas_Generales.xlsx
  - SEM_Variables_Filtradas_Ballotage.xlsx

üéØ Ventaja de Variables Filtradas:
  - Solo incluyen √≠tems significativos (p<0.05 en Kruskal-Wallis)
  - Mayor poder predictivo (esperamos R¬≤ m√°s alto)
  - Relaciones m√°s claras entre ideolog√≠a y cambio

‚úÖ AN√ÅLISIS SEM COMPLETADO
