In [4]:
import pandas as pd
import modulos.paths as paths

from modulos.deteccion_emociones2 import identificar_emociones_todas
from modulos.prompts2 import PROMPT_EMOCIONES_ENUNCIADOR, PROMPT_EMOCIONES_ENUNCIATARIOS, PROMPT_EMOCIONES_ACTORES
from modulos.schemas import ListaEmocionesSchema
from modulos.modelo import get_model_ollama_par
from modulos.tipos_discurso import diccionario_tipos_discurso

# Cargar datos
df_recortes = pd.read_csv(paths.recortes_preprocesado, encoding="utf-8-sig")
df_discursos = pd.read_csv(paths.discursos_enunc, encoding="utf-8-sig")
df_actores = pd.read_csv(paths.actores_validos, encoding="utf-8-sig")  # Actores previamente identificados

# Crear nuevo df de prueba
df_prueba = df_recortes.head(25)
df_prueba.to_csv("data/recortes_prueba.csv", index=False, encoding="utf-8")

# Inicializar modelo
modelo_llm = get_model_ollama_par(modelo="gpt-oss:20b", temperature=0.0, output_format="text")

# Ejecución
resultados = identificar_emociones_todas(
    df_recortes=df_prueba,
    df_discursos=df_discursos,
    df_actores=df_actores,
    schema=ListaEmocionesSchema,
    modelo_llm=modelo_llm,
    prompt_enunciador=PROMPT_EMOCIONES_ENUNCIADOR,
    prompt_enunciatarios=PROMPT_EMOCIONES_ENUNCIATARIOS,
    prompt_actores=PROMPT_EMOCIONES_ACTORES,
    diccionario=diccionario_tipos_discurso,
    mostrar_prompts=True,
    path_errores=paths.errores_identificacion_emociones,
    output_path=paths.emociones_identificadas,
    guardar=True,
    mostrar_tiempo=True,
    checkpoint_interval=50,
    max_context=2
)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2 entries, 0 to 1
Data columns (total 25 columns):
 #   Column                        Non-Null Count  Dtype 
---  ------                        --------------  ----- 
 0   url                           2 non-null      object
 1   titulo                        2 non-null      object
 2   fecha                         2 non-null      object
 3   contenido                     2 non-null      object
 4   codigo                        2 non-null      object
 5   INDEX                         2 non-null      int64 
 6   texto_limpio                  2 non-null      object
 7   resumen                       2 non-null      object
 8   tipo_discurso                 2 non-null      object
 9   tipo_discurso_justificacion   2 non-null      object
 10  lugar_ciudad                  2 non-null      object
 11  lugar_provincia               2 non-null      object
 12  lugar_pais                    2 non-null      object
 13  lugar_justificacion     

In [None]:
# acceder a cada resultado
df_enunciador = resultados["enunciador"]
df_enunciatarios = resultados["enunciatarios"]
df_actores = resultados["actores"]