In [1]:
# Celda 1: Importaciones y Carga de Datos
import pandas as pd
import os

# Configurar pandas para una mejor visualizaci√≥n en el notebook
pd.set_option('display.max_colwidth', 80)
pd.set_option('display.width', 150)
pd.set_option('display.max_rows', 100)

# --- 1. EJECUTAR EL SCRIPT DE AN√ÅLISIS PRINCIPAL ---
# Aseg√∫rate de que la ruta al script sea la correcta desde la ubicaci√≥n de tu notebook
script_path = '../scripts/ejecutar_analisis_clivajes_REU_06-08.py'

# Descomenta la siguiente l√≠nea para ejecutar el script desde el notebook si lo necesitas.
# Es mejor ejecutarlo desde la terminal si es un proceso largo.
# print("Ejecutando script de an√°lisis... Esto puede tardar varios minutos.")
# %run {script_path}
# print("Script finalizado.")

# --- 2. CARGAR LOS RESULTADOS GENERADOS ---
results_dir = '../results'
try:
    df_terminos = pd.read_csv(os.path.join(results_dir, 'exp_analisis_terminos.csv'), sep=';')
    df_nodos = pd.read_csv(os.path.join(results_dir, 'exp_analisis_nodos.csv'), sep=';')
    df_metricas = pd.read_csv(os.path.join(results_dir, 'exp_metricas_polarizacion.csv'), sep=';')
    
    print("Archivos de resultados cargados exitosamente.")
    print(f"T√©rminos encontrados: {len(df_terminos)} filas")
    print(f"Nodos centrales encontrados: {len(df_nodos)} filas")
    
except FileNotFoundError as e:
    print(f"Error: No se encontr√≥ el archivo de resultados. Aseg√∫rate de haber ejecutado el script primero.")
    print(e)

Archivos de resultados cargados exitosamente.
T√©rminos encontrados: 1304 filas
Nodos centrales encontrados: 75 filas


In [2]:
# Celda 2: Funci√≥n para Mostrar Resultados de Forma Ordenada

def mostrar_analisis_completo(df_terminos, df_nodos, dataset, algoritmo, ngram_tipo):
    """
    Filtra y muestra una tabla comparativa con los top t√©rminos y nodos para una configuraci√≥n espec√≠fica.
    """
    
    print("="*80)
    print(f"An√°lisis para: DATASET={dataset} | ALGORITMO={algoritmo} | N-GRAMS={ngram_tipo}")
    print("="*80)
    
    # Filtrar datos para la configuraci√≥n actual
    terminos_filtrados = df_terminos[
        (df_terminos['Dataset'] == dataset) & 
        (df_terminos['Algoritmo'] == algoritmo) & 
        (df_terminos['Tipo_Ngram'] == ngram_tipo)
    ]
    
    nodos_filtrados = df_nodos[
        (df_nodos['Dataset'] == dataset) & 
        (df_nodos['Algoritmo'] == algoritmo)
    ]
    
    if terminos_filtrados.empty or nodos_filtrados.empty:
        print("\nNo se encontraron datos para esta combinaci√≥n.\n")
        return

    # Preparar DataFrames para la visualizaci√≥n
    # Cl√∫ster S1 (Apruebo)
    terminos_s1 = terminos_filtrados[terminos_filtrados['Cluster'] == 'S1_Apruebo'][['Termino', 'Score_TFIDF_Avg']].head(10).reset_index(drop=True)
    nodos_s1 = nodos_filtrados[nodos_filtrados['Cluster'] == 'S1'][['Nodo', 'Grado']].head(5).reset_index(drop=True)
    terminos_s1.columns = [f'Top 10 T√©rminos (S1_{ngram_tipo})', 'Score']
    nodos_s1.columns = ['Top 5 Nodos (S1)', 'Grado']
    
    # Cl√∫ster S2 (Rechazo)
    terminos_s2 = terminos_filtrados[terminos_filtrados['Cluster'] == 'S2_Rechazo'][['Termino', 'Score_TFIDF_Avg']].head(10).reset_index(drop=True)
    nodos_s2 = nodos_filtrados[nodos_filtrados['Cluster'] == 'S2'][['Nodo', 'Grado']].head(5).reset_index(drop=True)
    terminos_s2.columns = [f'Top 10 T√©rminos (S2_{ngram_tipo})', 'Score']
    nodos_s2.columns = ['Top 5 Nodos (S2)', 'Grado']
    
    # Unir los dataframes para una visualizaci√≥n lado a lado
    df_display_terminos = pd.concat([terminos_s1, terminos_s2], axis=1).fillna('')
    df_display_nodos = pd.concat([nodos_s1, nodos_s2], axis=1).fillna('')
    
    print("\n--- AN√ÅLISIS DE T√âRMINOS ---")
    print(df_display_terminos.to_string())
    
    print("\n\n--- AN√ÅLISIS DE NODOS CENTRALES ---")
    print(df_display_nodos.to_string())
    print("\n\n")


# Celda 3: Iterar y Mostrar Todos los Resultados

# Obtener listas √∫nicas para iterar
datasets = df_terminos['Dataset'].unique()
algoritmos = df_terminos['Algoritmo'].unique()
ngram_tipos = df_terminos['Tipo_Ngram'].unique()

for dataset in datasets:
    for algoritmo in algoritmos:
        for ngram_tipo in ngram_tipos:
            mostrar_analisis_completo(df_terminos, df_nodos, dataset, algoritmo, ngram_tipo)

An√°lisis para: DATASET=Plebiscito_PRE | ALGORITMO=Eigensign | N-GRAMS=Unigramas

--- AN√ÅLISIS DE T√âRMINOS ---
Empty DataFrame
Columns: [Top 10 T√©rminos (S1_Unigramas), Score, Top 10 T√©rminos (S2_Unigramas), Score]
Index: []


--- AN√ÅLISIS DE NODOS CENTRALES ---
   Top 5 Nodos (S1)  Grado   Top 5 Nodos (S2)  Grado
0     javier macaya    2.0      gabriel boric    298
1       felipe kast    1.0    giorgio jackson     95
2  jorge alessandri    1.0     camila vallejo     80
3                           michelle bachelet     54
4                                izkia siches     52



An√°lisis para: DATASET=Plebiscito_PRE | ALGORITMO=Eigensign | N-GRAMS=Bigramas

--- AN√ÅLISIS DE T√âRMINOS ---
Empty DataFrame
Columns: [Top 10 T√©rminos (S1_Bigramas), Score, Top 10 T√©rminos (S2_Bigramas), Score]
Index: []


--- AN√ÅLISIS DE NODOS CENTRALES ---
   Top 5 Nodos (S1)  Grado   Top 5 Nodos (S2)  Grado
0     javier macaya    2.0      gabriel boric    298
1       felipe kast    1.0    giorgio ja

In [3]:
import pandas as pd

# Define las rutas a tus archivos de resultados
ruta_core = '../results/comparacion_metricas_core.csv'
ruta_paper = '../results/comparacion_metricas_paper.csv'
# Carga los CSV en DataFrames
df_core = pd.read_csv(ruta_core)
df_paper = pd.read_csv(ruta_paper)

df_paper.style \
    .format({
        "POL": "{:.3f}", "BA-POL": "{:.3f}", "BAL": "{:.2%}",
        "MAC": "{:.3f}", "MAO": "{:.3f}", "DENS": "{:.3f}",
        "ISO": "{:.3f}", "CC+": "{:.3f}", "CC-": "{:.3f}"
    }) \
    .background_gradient(
        cmap='RdYlGn',  # Rojo (bajo) a Verde (alto)
        subset=["POL", "BA-POL", "BAL", "ISO", "CC+", "CC-"]
    ) \
    .set_caption("üöÄ Tabla 2: M√©tricas Detalladas")

Unnamed: 0,Dataset,Algoritmo,POL,BA-POL,BAL,SIZE,ISO,CC+,CC-,CC_intra_S1,CC_intra_S2
0,Plebiscito PRE,Eigensign (Determinista),5.742,4.698,81.82%,120,0.176,0.635,0.88,0.291981,0.581879
1,Plebiscito PRE,Random Eigensign (Probabil√≠stico),2.373,1.727,72.77%,660,0.329,0.603,0.8,0.112295,0.357895
2,Plebiscito PRE,Local Search (beta=0.01),4.631,3.643,78.67%,536,0.452,0.594,0.803,0.248669,0.404152
3,Plebiscito PRE,Local Search (beta=0.005),3.85,3.702,96.15%,816,0.527,0.62,0.798,0.37016,0.208573
4,Plebiscito PRE,SCG (max_obj),5.988,4.459,74.47%,82,0.14,0.649,0.89,0.601742,0.378076
5,Plebiscito PRE,SCG (randomized),2.24,1.655,73.88%,699,0.339,0.603,0.78,0.332854,0.081166
6,Plebiscito PRE,SCG (bansal),2.1,0.9,42.86%,10,0.013,1.0,0.667,0.795238,1.0
7,Plebiscito POST,Eigensign (Determinista),5.316,1.418,26.67%,19,0.06,0.881,0.73,0.833333,0.844211
8,Plebiscito POST,Random Eigensign (Probabil√≠stico),1.756,1.741,99.15%,468,0.336,0.574,0.676,0.0841,0.279588
9,Plebiscito POST,Local Search (beta=0.01),3.547,3.547,100.00%,400,0.469,0.556,0.697,0.273097,0.437945


In [4]:
# Celda de An√°lisis Detallado para el Algoritmo Seleccionado

import pandas as pd

# --- CONFIGURACI√ìN ---
# Define el algoritmo que quieres analizar en detalle.
ALGORITMO_SELECCIONADO = 'Local Search (b=0.01)'
# Define los nombres de tus cl√∫steres para facilitar el filtrado.
CLUSTER_S1 = 'S1_Apruebo'
CLUSTER_S2 = 'S2_Rechazo'
# Define cu√°ntos t√©rminos de ejemplo quieres mostrar en las listas.
N_TERMINOS_A_MOSTRAR = 15

# --- INICIO DEL AN√ÅLISIS ---
print("=" * 90)
print(f"üîé AN√ÅLISIS DETALLADO DE LA EVOLUCI√ìN DEL DISCURSO PARA: '{ALGORITMO_SELECCIONADO}'")
print("=" * 90)

# Celda de An√°lisis para Presentaci√≥n (Comparando Cl√∫steres por Per√≠odo)

import pandas as pd

# --- CONFIGURACI√ìN ---
# Define el algoritmo que quieres analizar en detalle.
ALGORITMO_SELECCIONADO = 'Local Search (b=0.01)'
# Define los nombres de tus cl√∫steres para facilitar el filtrado.
CLUSTER_S1 = 'S1'
CLUSTER_S2 = 'S2'
# Define cu√°ntos t√©rminos quieres mostrar en las tablas.
N_TOP_TERMINOS = 15
# Define cu√°ntos nodos quieres mostrar en las tablas.
N_TOP_NODOS = 5



# 1. AN√ÅLISIS DE T√âRMINOS POR TIPO DE N-GRAM
# Itera sobre cada tipo de n-grama para analizarlo por separado.
for ngram_tipo in df_terminos['Tipo_Ngram'].unique():
    print(f"\n\n{'='*30} An√°lisis para N-Grams: {ngram_tipo} {'='*30}")
    
    # Filtra el DataFrame de t√©rminos para el algoritmo y n-gram actual.
    terminos_filtrados = df_terminos[
        (df_terminos['Algoritmo'] == ALGORITMO_SELECCIONADO) & 
        (df_terminos['Tipo_Ngram'] == ngram_tipo)
    ]
    
    # --- TABLA 1: AN√ÅLISIS PRE-PLEBISCITO ---
    print("\n--- üóìÔ∏è  Discurso ANTES del Plebiscito (S1 vs S2) ---\n")
    
    terminos_pre = terminos_filtrados[terminos_filtrados['Dataset'] == 'Plebiscito_PRE']
    
    # Prepara las columnas para la tabla comparativa PRE
    terminos_pre_s1 = terminos_pre[terminos_pre['Cluster'] == CLUSTER_S1][['Termino', 'Score_TFIDF_Avg']].head(N_TOP_TERMINOS).reset_index(drop=True)
    terminos_pre_s2 = terminos_pre[terminos_pre['Cluster'] == CLUSTER_S2][['Termino', 'Score_TFIDF_Avg']].head(N_TOP_TERMINOS).reset_index(drop=True)
    
    df_display_pre = pd.concat([
        terminos_pre_s1.rename(columns={'Termino': f'Top T√©rminos ({CLUSTER_S1})', 'Score_TFIDF_Avg': 'Score'}),
        terminos_pre_s2.rename(columns={'Termino': f'Top T√©rminos ({CLUSTER_S2})', 'Score_TFIDF_Avg': 'Score'})
    ], axis=1).fillna('')
    
    print(df_display_pre.to_string())

    
    # --- TABLA 2: AN√ÅLISIS POST-PLEBISCITO ---
    print("\n\n--- üóìÔ∏è  Discurso DESPU√âS del Plebiscito (S1 vs S2) ---\n")
    
    terminos_post = terminos_filtrados[terminos_filtrados['Dataset'] == 'Plebiscito_POST']
    
    # Prepara las columnas para la tabla comparativa POST
    terminos_post_s1 = terminos_post[terminos_post['Cluster'] == CLUSTER_S1][['Termino', 'Score_TFIDF_Avg']].head(N_TOP_TERMINOS).reset_index(drop=True)
    terminos_post_s2 = terminos_post[terminos_post['Cluster'] == CLUSTER_S2][['Termino', 'Score_TFIDF_Avg']].head(N_TOP_TERMINOS).reset_index(drop=True)

    df_display_post = pd.concat([
        terminos_post_s1.rename(columns={'Termino': f'Top T√©rminos ({CLUSTER_S1})', 'Score_TFIDF_Avg': 'Score'}),
        terminos_post_s2.rename(columns={'Termino': f'Top T√©rminos ({CLUSTER_S2})', 'Score_TFIDF_Avg': 'Score'})
    ], axis=1).fillna('')

    print(df_display_post.to_string())


# 2. AN√ÅLISIS DE NODOS CENTRALES (ACTORES M√ÅS RELEVANTES)
# Este an√°lisis ya tiene el formato correcto, comparando S1 vs S2 por per√≠odo.
print(f"\n\n{'='*30} An√°lisis de Nodos Centrales {'='*30}\n")

# Filtra el DataFrame de nodos para el algoritmo seleccionado.
nodos_filtrados = df_nodos[df_nodos['Algoritmo'] == ALGORITMO_SELECCIONADO]

# --- NODOS PRE-PLEBISCITO ---
nodos_pre = nodos_filtrados[nodos_filtrados['Dataset'] == 'Plebiscito_PRE']
nodos_pre_s1 = nodos_pre[nodos_pre['Cluster'] == CLUSTER_S1][['Nodo', 'Grado']].head(N_TOP_NODOS).reset_index(drop=True)
nodos_pre_s2 = nodos_pre[nodos_pre['Cluster'] == CLUSTER_S2][['Nodo', 'Grado']].head(N_TOP_NODOS).reset_index(drop=True)
df_display_nodos_pre = pd.concat([
    nodos_pre_s1.rename(columns={'Nodo': f'Nodos PRE ({CLUSTER_S1})', 'Grado': 'Grado S1'}),
    nodos_pre_s2.rename(columns={'Nodo': f'Nodos PRE ({CLUSTER_S2})', 'Grado': 'Grado S2'})
], axis=1).fillna('')

print("--- üë• Actores m√°s relevantes ANTES del plebiscito ---")
print(df_display_nodos_pre.to_string())


# --- NODOS POST-PLEBISCITO ---
nodos_post = nodos_filtrados[nodos_filtrados['Dataset'] == 'Plebiscito_POST']
nodos_post_s1 = nodos_post[nodos_post['Cluster'] == CLUSTER_S1][['Nodo', 'Grado']].head(N_TOP_NODOS).reset_index(drop=True)
nodos_post_s2 = nodos_post[nodos_post['Cluster'] == CLUSTER_S2][['Nodo', 'Grado']].head(N_TOP_NODOS).reset_index(drop=True)
df_display_nodos_post = pd.concat([
    nodos_post_s1.rename(columns={'Nodo': f'Nodos POST ({CLUSTER_S1})', 'Grado': 'Grado S1'}),
    nodos_post_s2.rename(columns={'Nodo': f'Nodos POST ({CLUSTER_S2})', 'Grado': 'Grado S2'})
], axis=1).fillna('')

print("\n--- üë• Actores m√°s relevantes DESPU√âS del plebiscito ---")
print(df_display_nodos_post.to_string())

# 1. AN√ÅLISIS DE T√âRMINOS POR TIPO DE N-GRAM
# Itera sobre cada tipo de n-grama para analizarlo por separado.
for ngram_tipo in df_terminos['Tipo_Ngram'].unique():
    print(f"\n\n{'='*30} An√°lisis para N-Grams: {ngram_tipo} {'='*30}\n")
    
    # Filtra el DataFrame de t√©rminos para el algoritmo y n-gram actual.
    terminos_filtrados = df_terminos[
        (df_terminos['Algoritmo'] == ALGORITMO_SELECCIONADO) & 
        (df_terminos['Tipo_Ngram'] == ngram_tipo)
    ]
    
    # Separa los DataFrames de t√©rminos para el per√≠odo PRE y POST.
    terminos_pre = terminos_filtrados[terminos_filtrados['Dataset'] == 'Plebiscito_PRE']
    terminos_post = terminos_filtrados[terminos_filtrados['Dataset'] == 'Plebiscito_POST']
    
    # Itera sobre cada cl√∫ster para analizar su discurso.
    for cluster_name in [CLUSTER_S1, CLUSTER_S2]:
        print(f"\n--- üó£Ô∏è Evoluci√≥n del Discurso del Cl√∫ster: {cluster_name} ---\n")
        
        # Usa sets para comparar eficientemente los t√©rminos PRE y POST.
        # Los sets contienen los t√©rminos m√°s importantes para cada per√≠odo.
        set_terminos_pre = set(terminos_pre[terminos_pre['Cluster'] == cluster_name]['Termino'])
        set_terminos_post = set(terminos_post[terminos_post['Cluster'] == cluster_name]['Termino'])
        
        # --- C√°lculo de la evoluci√≥n ---
        # Intersecci√≥n: T√©rminos que aparecen en ambos sets.
        terminos_mantenidos = list(set_terminos_pre.intersection(set_terminos_post))
        # Diferencia: T√©rminos en PRE que no est√°n en POST.
        terminos_perdidos = list(set_terminos_pre - set_terminos_post)
        # Diferencia: T√©rminos en POST que no est√°n en PRE.
        terminos_nuevos = list(set_terminos_post - set_terminos_pre)
        
        # --- Impresi√≥n de resultados ---
        print(f"‚úÖ T√©rminos Mantenidos (temas centrales persistentes):")
        print(f"   {terminos_mantenidos[:N_TERMINOS_A_MOSTRAR]}\n")
        
        print(f"‚ùå T√©rminos Perdidos (temas que perdieron relevancia post-plebiscito):")
        print(f"   {terminos_perdidos[:N_TERMINOS_A_MOSTRAR]}\n")
        
        print(f"‚ú® T√©rminos Nuevos (temas emergentes post-plebiscito):")
        print(f"   {terminos_nuevos[:N_TERMINOS_A_MOSTRAR]}\n")

# 2. AN√ÅLISIS DE NODOS CENTRALES (ACTORES M√ÅS RELEVANTES)
# Este an√°lisis es independiente del tipo de n-gram, por lo que se hace una sola vez.
print(f"\n\n{'='*30} An√°lisis de Nodos Centrales {'='*30}\n")

# Filtra el DataFrame de nodos para el algoritmo seleccionado.
nodos_filtrados = df_nodos[df_nodos['Algoritmo'] == ALGORITMO_SELECCIONADO]

# --- NODOS PRE-PLEBISCITO ---
nodos_pre = nodos_filtrados[nodos_filtrados['Dataset'] == 'Plebiscito_PRE']
nodos_pre_s1 = nodos_pre[nodos_pre['Cluster'] == CLUSTER_S1][['Nodo', 'Grado']].head().reset_index(drop=True)
nodos_pre_s2 = nodos_pre[nodos_pre['Cluster'] == CLUSTER_S2][['Nodo', 'Grado']].head().reset_index(drop=True)
df_display_pre = pd.concat([
    nodos_pre_s1.rename(columns={'Nodo': f'Nodos PRE ({CLUSTER_S1})', 'Grado': 'Grado S1'}),
    nodos_pre_s2.rename(columns={'Nodo': f'Nodos PRE ({CLUSTER_S2})', 'Grado': 'Grado S2'})
], axis=1).fillna('')

print("--- üë• Actores m√°s relevantes ANTES del plebiscito ---")
print(df_display_pre.to_string())


# --- NODOS POST-PLEBISCITO ---
nodos_post = nodos_filtrados[nodos_filtrados['Dataset'] == 'Plebiscito_POST']
nodos_post_s1 = nodos_post[nodos_post['Cluster'] == CLUSTER_S1][['Nodo', 'Grado']].head().reset_index(drop=True)
nodos_post_s2 = nodos_post[nodos_post['Cluster'] == CLUSTER_S2][['Nodo', 'Grado']].head().reset_index(drop=True)
df_display_post = pd.concat([
    nodos_post_s1.rename(columns={'Nodo': f'Nodos POST ({CLUSTER_S1})', 'Grado': 'Grado S1'}),
    nodos_post_s2.rename(columns={'Nodo': f'Nodos POST ({CLUSTER_S2})', 'Grado': 'Grado S2'})
], axis=1).fillna('')

print("\n--- üë• Actores m√°s relevantes DESPU√âS del plebiscito ---")
print(df_display_post.to_string())

üîé AN√ÅLISIS DETALLADO DE LA EVOLUCI√ìN DEL DISCURSO PARA: 'Local Search (b=0.01)'



--- üóìÔ∏è  Discurso ANTES del Plebiscito (S1 vs S2) ---

   Top T√©rminos (S1)    Score Top T√©rminos (S2)    Score
0            rechazo  0.09609             boric  0.06406
1                udi  0.07482           apruebo  0.05884
2       constituci√≥n  0.07195      constituci√≥n  0.05847
3            senador  0.06861        plebiscito  0.05714
4              carta  0.06344             nueva  0.05484
5         convenci√≥n  0.06210           rechazo  0.05002
6              lagos  0.06195    constitucional  0.04423
7              texto  0.06146        septiembre  0.04253
8     constitucional  0.06124           gabriel  0.04232
9              nueva  0.05634          ministra  0.04077
10             vamos  0.05452         propuesta  0.03980
11           apruebo  0.05429           proceso  0.03637
12        plebiscito  0.05338        convenci√≥n  0.03526
13     constituyente  0.05301           partido  

## üéØ Conclusiones del An√°lisis de T√©rminos Distintivos (TF-IDF)

* **Identificaci√≥n de Polos:** El an√°lisis de actores y t√©rminos confirma que el **Cl√∫ster S1** corresponde al polo del **"Rechazo / Oposici√≥n"** y el **Cl√∫ster S2** al **"Apruebo / Oficialismo"**.

### ‚ö° Discurso PRE-Plebiscito: Polarizaci√≥n Clara
* **S1 (Rechazo):** Su lenguaje es de oposici√≥n directa. Los t√©rminos m√°s distintivos son **"rechazo"**, **"udi"**, **"senador"** y los nombres de figuras cr√≠ticas al proceso como **"ricardo lagos"**.
* **S2 (Apruebo):** Su lenguaje se centra en el gobierno y la propuesta. Los t√©rminos clave son **"boric"**, **"apruebo"** y **"nueva constituci√≥n"**.
* **Resumen PRE:** Una clara divisi√≥n entre un polo que ataca y se define por la negativa, y otro que defiende el proyecto desde el oficialismo.

### üèõÔ∏è Discurso POST-Plebiscito: Del Voto al Congreso
El eje de la conversaci√≥n se traslada de la campa√±a p√∫blica a la negociaci√≥n institucional.
* **S1 (Oposici√≥n):** Su discurso evoluciona. Deja de ser solo "Rechazo" y pasa a hablar del **"nuevo proceso"**, el **"acuerdo"** y el rol de la **"c√°mara de diputados"**. Actores como **Karol Cariola** se vuelven centrales, reflejando el inicio de las negociaciones en el Congreso.
* **S2 (Oficialismo):** Su discurso se vuelve reactivo. Aunque **"boric"** sigue siendo central, emergen con fuerza t√©rminos como **"gabinete"**, **"cambio"** y **"mario marcel"**, reflejando la respuesta a la crisis y la nueva prioridad econ√≥mica.
* **Resumen POST:** La tem√°tica se vuelve m√°s compleja y centrada en la "cocina" pol√≠tica.

---
### üöÄ Conclusi√≥n Principal:
**El an√°lisis TF-IDF muestra una transici√≥n clara: de una polarizaci√≥n p√∫blica y electoral ("Apruebo vs. Rechazo") a una negociaci√≥n institucional y centrada en el Congreso, donde los discursos de ambos polos se reconfiguran en torno al "nuevo proceso constituyente".**

In [51]:
# Celda para Visualizar los Resultados del Topic Modeling

import pandas as pd
import os

# --- 1. CARGAR LOS RESULTADOS ---
# Aseg√∫rate de que la ruta sea correcta.
results_dir = '../results'
path_temas = os.path.join(results_dir, 'analisis_topic_modeling.csv')

try:
    df_temas = pd.read_csv(path_temas, sep=';')
    print("‚úÖ Archivo con resultados de Topic Modeling cargado exitosamente.")
except FileNotFoundError:
    print("‚ùå ERROR: No se encontr√≥ el archivo 'analisis_topic_modeling.csv'.")
    print("Aseg√∫rate de haber ejecutado el script 'ejecutar_analisis_temas.py' primero desde tu terminal.")

# --- 2. FUNCI√ìN PARA MOSTRAR LOS TEMAS DE FORMA ORDENADA ---
def mostrar_temas_por_escenario(df, dataset, cluster):
    """Filtra el DataFrame y muestra los temas para un escenario espec√≠fico."""
    
    print("=" * 80)
    print(f"üó£Ô∏è  TEMAS DE DISCUSI√ìN PARA: {dataset} | {cluster}")
    print("=" * 80)
    
    # Filtra los datos para el escenario actual.
    df_filtrado = df[(df['Dataset'] == dataset) & (df['Cluster'] == cluster)]
    
    if df_filtrado.empty:
        print("No se encontraron temas para este escenario.")
        return
        
    # Muestra los temas encontrados, excluyendo el tema -1 (outliers).
    temas_principales = df_filtrado[df_filtrado['Topic'] != -1]
    
    # Selecciona y renombra columnas para una visualizaci√≥n limpia.
    display_cols = {
        'Topic': 'ID Tema',
        'Count': 'N¬∞ Noticias',
        'Name': 'Nombre del Tema',
        'Representation': 'Palabras Clave'
    }
    
    # Imprime la tabla formateada.
    print(temas_principales[display_cols.keys()].rename(columns=display_cols).to_string(index=False))

# --- 3. MOSTRAR LOS RESULTADOS PARA CADA ESCENARIO ---
if 'df_temas' in locals():
    mostrar_temas_por_escenario(df_temas, 'Plebiscito_PRE', 'S1')
    print("\n")
    mostrar_temas_por_escenario(df_temas, 'Plebiscito_PRE', 'S2')
    print("\n")
    mostrar_temas_por_escenario(df_temas, 'Plebiscito_POST', 'S1')
    print("\n")
    mostrar_temas_por_escenario(df_temas, 'Plebiscito_POST', 'S2')

‚úÖ Archivo con resultados de Topic Modeling cargado exitosamente.
üó£Ô∏è  TEMAS DE DISCUSI√ìN PARA: Plebiscito_PRE | S1
No se encontraron temas para este escenario.


üó£Ô∏è  TEMAS DE DISCUSI√ìN PARA: Plebiscito_PRE | S2
 ID Tema  N¬∞ Noticias                                 Nombre del Tema                                                                                                                         Palabras Clave
       0          153         0_jackson_ministro_segpres_constituci√≥n              ['jackson', 'ministro', 'segpres', 'constituci√≥n', 'giorgio', 'nueva', 'boric', 'secretario', 'plebiscito', 'propuestas']
       1          124              1_boric_constituci√≥n_nueva_proceso              ['boric', 'constituci√≥n', 'nueva', 'proceso', 'plebiscito', 'rechazo', 'vamos', 'mandatario', 'constituyente', 'gabriel']
       2           88    2_contralor√≠a_ministra_vallejo_investigaci√≥n ['contralor√≠a', 'ministra', 'vallejo', 'investigaci√≥n', 'plebiscito', 'intervencio

In [52]:
# Celda Final para Visualizar Resultados Combinados (Temas y Nodos)

import pandas as pd
import os

# --- 1. CONFIGURACI√ìN ---
# Define el algoritmo que quieres analizar. Debe ser el mismo que usaste en el script.
ALGORITMO_SELECCIONADO = 'Local Search (b=0.01)'
# Define cu√°ntos nodos mostrar.
N_TOP_NODOS = 5

# --- 2. CARGAR TODOS LOS RESULTADOS NECESARIOS ---
results_dir = '../results'
path_temas = os.path.join(results_dir, 'analisis_topic_modeling.csv')
path_nodos = os.path.join(results_dir, 'exp_analisis_nodos.csv')

try:
    df_temas = pd.read_csv(path_temas, sep=';')
    df_nodos = pd.read_csv(path_nodos, sep=';')
    print("‚úÖ Archivos de Temas y Nodos cargados exitosamente.")
except FileNotFoundError as e:
    print(f"‚ùå ERROR: No se encontr√≥ un archivo de resultados: {e}")
    print("Aseg√∫rate de haber ejecutado los scripts 'ejecutar_analisis_clivajes...' y 'ejecutar_analisis_temas...' primero.")

# --- 3. FUNCI√ìN MEJORADA PARA MOSTRAR TODA LA INFORMACI√ìN ---
def mostrar_analisis_completo_por_escenario(df_temas, df_nodos, dataset, cluster):
    """
    Filtra y muestra los temas de discusi√≥n Y los actores principales
    para un escenario espec√≠fico.
    """
    
    print("=" * 80)
    print(f"üîé AN√ÅLISIS PARA: {dataset} | {cluster}")
    print("=" * 80)
    
    # --- Mostrar Temas de Discusi√≥n ---
    df_temas_filtrado = df_temas[(df_temas['Dataset'] == dataset) & (df_temas['Cluster'] == cluster)]
    
    if df_temas_filtrado.empty:
        print("No se encontraron temas de discusi√≥n para este escenario.")
    else:
        print("üó£Ô∏è TEMAS DE DISCUSI√ìN PRINCIPALES:")
        temas_principales = df_temas_filtrado[df_temas_filtrado['Topic'] != -1]
        display_cols = {
            'Topic': 'ID', 'Count': 'N¬∞ Docs', 'Name': 'Nombre del Tema', 'Representation': 'Palabras Clave'
        }
        print(temas_principales[display_cols.keys()].rename(columns=display_cols).to_string(index=False))

    print("-" * 80) # Separador visual

    # --- Mostrar Nodos Principales ---
    # Filtra el df de nodos para el mismo escenario (algoritmo, dataset, cluster)
    df_nodos_filtrado = df_nodos[
        (df_nodos['Algoritmo'] == ALGORITMO_SELECCIONADO) &
        (df_nodos['Dataset'] == dataset) & 
        (df_nodos['Cluster'] == cluster)
    ]

    if df_nodos_filtrado.empty:
        print("No se encontraron nodos centrales para este escenario.")
    else:
        print(f"üë• ACTORES PRINCIPALES (Top {N_TOP_NODOS} con mayor grado):")
        nodos_principales = df_nodos_filtrado[['Nodo', 'Grado']].head(N_TOP_NODOS)
        print(nodos_principales.to_string(index=False))


# --- 4. MOSTRAR LOS RESULTADOS COMPLETOS PARA CADA ESCENARIO ---
if 'df_temas' in locals() and 'df_nodos' in locals():
    # Obtiene los cl√∫steres y datasets del archivo de temas para iterar
    escenarios = df_temas[['Dataset', 'Cluster']].drop_duplicates().to_dict('records')
    
    for escenario in escenarios:
        mostrar_analisis_completo_por_escenario(df_temas, df_nodos, escenario['Dataset'], escenario['Cluster'])
        print("\n")

‚úÖ Archivos de Temas y Nodos cargados exitosamente.
üîé AN√ÅLISIS PARA: Plebiscito_PRE | S2
üó£Ô∏è TEMAS DE DISCUSI√ìN PRINCIPALES:
 ID  N¬∞ Docs                                 Nombre del Tema                                                                                                                         Palabras Clave
  0      153         0_jackson_ministro_segpres_constituci√≥n              ['jackson', 'ministro', 'segpres', 'constituci√≥n', 'giorgio', 'nueva', 'boric', 'secretario', 'plebiscito', 'propuestas']
  1      124              1_boric_constituci√≥n_nueva_proceso              ['boric', 'constituci√≥n', 'nueva', 'proceso', 'plebiscito', 'rechazo', 'vamos', 'mandatario', 'constituyente', 'gabriel']
  2       88    2_contralor√≠a_ministra_vallejo_investigaci√≥n ['contralor√≠a', 'ministra', 'vallejo', 'investigaci√≥n', 'plebiscito', 'intervencionismo', 'moneda', 'siches', 'campa√±a', 'ministerio']
  3       46            3_acuerdo_constituci√≥n_apruebo_nueva          

## üéØ Conclusiones del An√°lisis de Topic Modeling (Cl√∫ster Oficialismo/Apruebo)

* **Identificaci√≥n del Cl√∫ster:** Los actores principales (Boric, Jackson, Vallejo, Bachelet) confirman que el cl√∫ster analizado (`S2`) corresponde al polo del **Oficialismo / Apruebo**.

### üìù Agenda PRE-Plebiscito: Campa√±a "Multi-Frente"
El discurso antes de la elecci√≥n era amplio y cubr√≠a m√∫ltiples frentes simult√°neamente:
* **Promoci√≥n:** Impulso del "proceso constituyente" y la "nueva constituci√≥n".
* **Legitimaci√≥n:** B√∫squeda de respaldos clave, con temas espec√≠ficos dedicados a las figuras de **Michelle Bachelet** y **Ricardo Lagos**.
* **Defensa:** Gesti√≥n de controversias, como las acusaciones de "intervencionismo electoral" investigadas por la **Contralor√≠a**.
* **Contingencia:** Seguimiento de las encuestas ("Cadem") y gesti√≥n de problemas de gobierno como el "estado de excepci√≥n".

### üìâ Agenda POST-Plebiscito: Contracci√≥n y Gesti√≥n de Crisis
Tras la derrota, la agenda se contrae y se enfoca en la crisis inmediata:
* **Da√±o Pol√≠tico:** El tema dominante es el **"cambio de gabinete"**, con la salida de ministros como Izkia Siches y Giorgio Jackson.
* **Estabilidad Econ√≥mica:** Emerge un nuevo y fuerte discurso centrado en el Ministro de Hacienda, **Mario Marcel**, para calmar a los mercados e inversionistas.
* **Rearticulaci√≥n Pol√≠tica:** La conversaci√≥n se traslada al Congreso, con la aparici√≥n de la nueva Ministra Segpres, **Ana Lya Uriarte**, como figura clave en la negociaci√≥n del "nuevo proceso".

---
### üöÄ Conclusi√≥n Principal:
**El discurso del oficialismo pas√≥ de una narrativa de campa√±a expansiva y multifac√©tica a una de gesti√≥n de crisis, enfocada en la reestructuraci√≥n pol√≠tica interna y en proyectar estabilidad econ√≥mica.**