# 1. Prueba de m√≥dulo "webscraping"

**scrap_discursos:** Scrap de discursos desde una web paginada con links individuales por discurso.

Par√°metros:
- base_url (str): URL de inicio.
- xpaths (dict): Diccionario con claves: 'link_items', 'boton_siguiente', 'titulo', 'fecha', 'contenido'.
- espera (int): Tiempo de espera entre interacciones.
- paginas (int): N√∫mero m√°ximo de p√°ginas a recorrer.
- articulos_maximos (int): L√≠mite de discursos a scrapear.
- headless (bool): Si True, navegador sin interfaz.
- verbose (bool): Si True, muestra estado.
- output_path (str): Ruta opcional para guardar CSV.

Retorna:
- DataFrame con columnas: 'url', 'titulo', 'fecha', 'contenido', 'codigo'

In [7]:
from modulos.webscraping import xpaths_casarosada, scrap_discursos
import modulos.paths as paths

df = scrap_discursos(
    base_url="https://www.casarosada.gob.ar/informacion/discursos",
    xpaths=xpaths_casarosada,
    espera=3,
    paginas=5,
    articulos_maximos=1,
    headless=True,
    verbose=True,
    output_path=paths.discursos
)

df.head()

üåê P√°gina 1
‚ûï 40 nuevos links

üîó Total de links √∫nicos obtenidos: 1

üìÑ (1/1) Procesando: https://www.casarosada.gob.ar/informacion/discursos/51036-palabras-del-presidente-de-la-nacion-javier-milei-en-la-derecha-fest-cordoba
üìù Palabras del Presidente de la Naci√≥n, Javier Milei, en La Derecha Fest, C√≥rdoba (Martes 22 de julio de 2025) - 6640 palabras

‚úÖ Archivo 'C:\PROYECTOS\Primer MVP1\data\discursos.csv' guardado correctamente.


Unnamed: 0,url,titulo,fecha,contenido,codigo
0,https://www.casarosada.gob.ar/informacion/disc...,"Palabras del Presidente de la Naci√≥n, Javier M...",Martes 22 de julio de 2025,"Palabras del Presidente de la Naci√≥n, Javier M...",DISCURSO_001


# 2. Prueba de m√≥dulo "preprocesamiento"

## 2.1. Segmentaci√≥n en recortes

**generar_recortes:** Convierte una base de discursos en una base de recortes frase a frase.

Par√°metros:
- df_discursos (DataFrame): Debe tener columnas 'titulo' y 'contenido'.
- agregar_codigo (bool): Si True, genera columna 'codigo' con formato DISCURSO_001...
- prefijo_codigo (str): Prefijo para los c√≥digos asignados.
- guardar (bool): Si True, guarda la base generada como CSV.
- output_path (str): Ruta del archivo CSV de salida (requerido si guardar=True).

Retorna:
- DataFrame con columnas: 'codigo', 'recorte_id', 'posicion', 'frase'.

In [8]:
import pandas as pd
import modulos.paths as paths
from modulos.preprocesamiento import generar_recortes

# Cargar discursos scrapeados
df_discursos = pd.read_csv(paths.discursos, encoding="utf-8-sig")

# Generar recortes y guardar
df_recortes = generar_recortes(df_discursos, guardar=True, output_path=paths.recortes)

‚úÖ Archivo CSV generado correctamente.
üìÑ Ruta: C:\PROYECTOS\Primer MVP1\data\recortes.csv
üßæ La base tiene 242 observaciones (frases).


## 2.2. Filtrado de discursos por cantidad de frases (m√≠nimo: 24, para series temporales)

**filtrar_discursos:** Filtra los c√≥digos que tienen al menos `umbral` frases en `df_recortes`, y opcionalmente guarda los resultados si se indican los paths.

Par√°metros:
- df: DataFrame original con los textos completos.
- df_recortes: DataFrame con las frases (recortes) y la columna 'codigo'.
- umbral: Cantidad m√≠nima de frases necesarias para conservar un c√≥digo.
- guardar: Si True, guarda los DataFrames filtrados y la lista de c√≥digos eliminados.
- path_discursos: Ruta para guardar el CSV de discursos filtrados.
- path_recortes: Ruta para guardar el CSV de recortes filtrados.
- path_codigos_eliminados: Ruta para guardar el TXT con los c√≥digos eliminados.

Retorna:
- df_filtrado: DataFrame con discursos filtrados.
- df_recortes_filtrado: DataFrame de recortes correspondientes a los discursos filtrados.
- codigos_eliminados: lista de c√≥digos de discursos eliminados.
- codigos_validos : lista de c√≥digos de discursos v√°lidos.
- conteo_frases: DataFrame con el conteo total de frases por c√≥digo, antes del filtrado.

In [9]:
import pandas as pd
import modulos.paths as paths
from modulos.preprocesamiento import filtrar_discursos

df = pd.read_csv(paths.discursos, encoding="utf-8-sig")
df_recortes = pd.read_csv(paths.recortes, encoding="utf-8-sig")

df_filtrado, df_recortes_filtrado, codigos_eliminados, codigos_validos, conteo_frases = filtrar_discursos(
    df=df,
    df_recortes=df_recortes,
    umbral=24,
    guardar=True,
    path_discursos=paths.discursos_filtrado,
    path_recortes=paths.recortes_filtrado,
    path_codigos_eliminados=paths.codigos_eliminados
)

Cantidad de frases por c√≥digo (primeras filas):
         codigo  cantidad_frases
0  DISCURSO_001              242

‚úÖ C√≥digos con al menos 24 frases: 1
‚ùå C√≥digos eliminados (menos de 24 frases): 0

üìÑ Textos originales tras el filtro: 1
üßæ Frases tras el filtro: 242

üíæ Archivos guardados:
- Discursos: C:\PROYECTOS\Primer MVP1\data\discursos_filtrado.csv
- Recortes: C:\PROYECTOS\Primer MVP1\data\recortes_filtrado.csv
- C√≥digos eliminados: C:\PROYECTOS\Primer MVP1\data\codigos_eliminados.txt


## 2.3. Limpieza y preprocesamiento

**procesar_textos:** Procesa textos en una columna de un DataFrame aplicando limpieza y an√°lisis ling√º√≠stico.

Par√°metros:
- df (pd.DataFrame): DataFrame original.
- columna_texto (str): Nombre de la columna con texto.
- texto_limpio (bool): Si se debe incluir columna con texto limpio.
- tokens (bool): Si se deben incluir los tokens.
- lemmas (bool): Si se deben incluir los lemas.
- pos_tags (bool): Si se deben incluir etiquetas POS.
- dependencias (bool): Si se deben incluir dependencias sint√°cticas.
- entidades (bool): Si se deben incluir entidades nombradas.
- sujetos (bool): Si se debe marcar sujeto omitido por frase.
- guardar (bool): Si se debe guardar el resultado a CSV.
- path_salida (str): Ruta de salida (obligatoria si guardar=True).

Retorna:
- pd.DataFrame: DataFrame con columnas nuevas seg√∫n los flags seleccionados.

In [5]:
import pandas as pd
import modulos.paths as paths
from modulos.preprocesamiento import procesar_textos

df_filtrado = pd.read_csv(paths.discursos_filtrado, encoding="utf-8-sig")

df_resultado = procesar_textos(
    df=df_filtrado,
    columna_texto="contenido",
    texto_limpio=True,
    tokens=False,
    lemmas=False,
    pos_tags=False,
    dependencias=False,
    entidades=False,
    sujetos=False,
    guardar=True,
    path_salida=paths.discursos_preprocesado
)

‚úÖ Archivo guardado: C:\PROYECTOS\Primer MVP1\data\discursos_preprocesado.csv


In [6]:
df_recortes_filtrado = pd.read_csv(paths.recortes_filtrado, encoding="utf-8-sig")

df_resultado = procesar_textos(
    df=df_recortes_filtrado,
    columna_texto="frase",
    texto_limpio=True,
    tokens=True,
    lemmas=True,
    pos_tags=True,
    dependencias=True,
    entidades=True,
    sujetos=True,
    guardar=True,
    path_salida=paths.recortes_preprocesado
)

‚úÖ Archivo guardado: C:\PROYECTOS\Primer MVP1\data\recortes_preprocesado.csv


**Nota para optimizaci√≥n:** Ver de que no se dupliquen entidades y dependencias en el archivo

# 3. Prueba de m√≥dulo "resumen"

Este m√≥dulo permite generar res√∫menes de discursos extensos utilizando un LLM, a trav√©s de un enfoque por bloques tem√°ticos. La funci√≥n principal aplicada es resumir_dataframe.

L√≥gica del procedimiento
- Segmentaci√≥n sem√°ntica: el texto se divide en fragmentos seg√∫n cambios tem√°ticos detectados.
- Resumen parcial: cada fragmento se resume individualmente mediante un LLM.
- Redacci√≥n global: se produce un resumen final fluido e integrado a partir de los res√∫menes parciales.

**resumir_dataframe:** Genera res√∫menes utilizando un LLM para cada fila de un DataFrame que contenga la columna texto_limpio. Utiliza dos tipos de prompts: uno para fragmentos y otro para la redacci√≥n final del discurso completo.

Par√°metros:
- df (pd.DataFrame): DataFrame con columnas 'codigo', 'titulo', 'fecha', 'texto_limpio'.
- modelo_llm (Callable[[str], str]): Funci√≥n que toma un prompt (str) y devuelve la respuesta generada por el modelo LLM.
- prompt_fragmento (str): Prompt utilizado para resumir cada fragmento segmentado del discurso.
- prompt_discurso (str): Prompt utilizado para redactar el resumen global del discurso a partir de los res√∫menes parciales.
- umbral (float): Umbral de sensibilidad para la segmentaci√≥n tem√°tica. Valores m√°s bajos generan m√°s fragmentos.
- guardar (bool): Si es True, guarda el DataFrame resultante en un archivo .csv.
- path_salida (str): Ruta del archivo de salida si guardar=True.
- mostrar_prompts (bool): Si es True, imprime los prompts utilizados durante la ejecuci√≥n (√∫til para debugging).

Retorna:
- pd.DataFrame: DataFrame con una nueva columna 'resumen' que contiene el resumen generado por LLM para cada discurso.

In [1]:
import pandas as pd
import modulos.paths as paths
import modulos.prompts as prompts
from modulos.resumen import resumir_dataframe
from modulos.modelo import get_model

modelo_llm = get_model(modelo="mistral")

df_preprocesado = pd.read_csv(paths.discursos_preprocesado, encoding="utf-8-sig")

df_con_resumenes = resumir_dataframe(
    df=df_preprocesado,
    modelo_llm=modelo_llm,
    prompt_fragmento=prompts.PROMPT_RESUMIR_FRAGMENTO,
    prompt_discurso=prompts.PROMPT_RESUMIR_DISCURSO,
    umbral=0.25,
    guardar=True,
    path_salida=paths.discursos_resumen,
    mostrar_prompts=True
)

  from tqdm.autonotebook import tqdm, trange
INFO:sentence_transformers.SentenceTransformer:Use pytorch device_name: cpu
INFO:sentence_transformers.SentenceTransformer:Load pretrained SentenceTransformer: distiluse-base-multilingual-cased-v1
Generando res√∫menes con LLM:   0%|                                                                                                                                                                                    | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/2 [00:00<?, ?it/s]


üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
hola a todos. che, ¬øno van a sacar? ¬øc√≥mo es? ¬øsaquen al ping√ºino del caj√≥n? ¬°viva la libertad, carajo!



INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
primero que nada, quiero extenderle un c√°lido saludo a mi querid√≠simo amigo agust√≠n laje como as√≠ tambi√©n a todo el equipo de la derecha diario por organizar este enorme evento. muchas gracias. tambi√©n quiero agradecer a todos los expositores que me precedieron y, por supuesto, a todos ustedes. y tambi√©n quiero agradecer a todos aquellos que no pudieron venir, pero nos est√°n siguiendo desde sus casas. son ustedes que dan todo por sacar adelante un pa√≠s al que a√±os de estatismo descontrolado parec√≠an haber condenado al pa√≠s a la miseria. son ustedes quienes vieron a sus amigos armar valijas y emigrar, quienes vieron a sus padres sufrir la inflaci√≥n y las devaluaciones, quienes vieron c√≥mo cada d√≠a el sue√±o y la independencia econ√≥mica y el progreso se alejaba cada 

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
y, en este sentido, as√≠ tambi√©n surgieron las nefastas ideas de promover la diversidad, equidad e inclusi√≥n, tanto en las empresas como la sociedad en general. se reemplaz√≥ la igualdad ante la ley por la discriminaci√≥n positiva de colectivos sociales, dejamos de privilegiar la excelencia y la idoneidad para empezar a usar criterios gen√©ricos o √©tnicos. esto fragmenta la sociedad, enfrasca en luchas inventadas mientras que hace que todos pierdan la fe, la neutralidad de las instituciones, el estado moderno se fragmenta en mil pedazos. por suerte, en argentina solo el estado sufri√≥ esta perversi√≥n del derecho, ya que nuestra desconexi√≥n del resto del mundo mitig√≥ el impacto de este par√°sito en particular. y como frutilla del postre de todas estas ideas parasitarias, las 

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
si bien el liberalismo supo ponerse a la vanguardia de la batalla cultural, cambiando el curso de la historia humana desde su nacimiento, en el siglo xvii, durante el √∫ltimo siglo ha perdido terreno frente al colectivismo. los liberales descuidamos la batalla por las ideas y le dejamos las puertas abiertas al flagelo de la izquierda. por eso, no podemos perder un segundo m√°s, nuestras ideas son mejores, pero la evidencia dice que con eso no es suficiente. hay que saber comunicarlas y por eso debemos emular a la izquierda en este aspecto haciendo nuestra propia larga marcha sobre los distintos lugares de influencia, en cada plaza, en cada concejo deliberante, en cada onda de radio y cada canal de televisi√≥n del pa√≠s debe ver a alguien defendiendo y promoviendo las ideas de la l

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
por eso quiero darle su mensaje de esperanza. tenemos aqu√≠ una hermosa reflexi√≥n para hacer, en el a√±o 2023, los argentinos decidieron un cambio de rumbo, el cual tenemos que confirmarlo en septiembre en la provincia de buenos aires, en cada provincia y dar un tremendo batacazo violeta en el mes de octubre. tenemos que entender que en octubre de un lado va a estar el status quo, el partido del estado, la casta pol√≠tica chorra, parasitaria e in√∫til; la alta pol√≠tica, va a estar los perisobres, los periodistas ensobrados; van a estar tambi√©n los sindigarcas, van a estar los empresaurios, los empresarios chorros, prebendarios. y, del otro lado, vamos a estar los argentinos de bien que queremos abrazar las ideas de la libertad para hacer a la argentina grande nuevamente. lo que

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
en este sentido, aqu√≠ me gustar√≠a detenerme para reconocer a la derecha diario, que pas√≥ de ser un diario digital, hecho a pulm√≥n por dos adolescentes, a ser el diario m√°s le√≠do de todo el am√©rica latina, en cuesti√≥n de pocos a√±os. felicitaciones a todos los que son parte de la derecha diario y a sus creadores.



INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
volviendo a nuestro camino transitado en campa√±a, se nos burlaban, dec√≠an que no √©ramos m√°s que un fen√≥meno barrial y a√∫n as√≠ metimos dos bancas de diputados con nuestra modesta campa√±a. por si eso no fuera ya de por s√≠ un hito, dos a√±os m√°s tarde, ganamos nada m√°s y nada menos que la presidencia del pa√≠s, siendo el candidato con m√°s votos de la historia, habiendo hecho en simult√°neo la campa√±a m√°s austera de la historia.



INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
en definitiva, militar en los m√°rgenes, manteni√©ndonos fieles a las ideas de la libertad, llegar al poder a fuerza de predicar nuestras ideas y lograr demostrar todo su poder, es algo que un kirchnerista nunca va a entender porque ellos son militantes rentados, y otros tambi√©n tambi√©n tienen militantes rentados. y, obviamente, tampoco lo van a entender los liberales de caf√©, los liberales de copet√≠n, que se enroscan en las formas para autosabotearse sistem√°ticamente. en su mirada infantil de la pol√≠tica, creen que se pueden ganar la guerra con ponencia filos√≥fica, sin meterse en el barro, porque el barro les parece vulgar. yo suelo mencionar que si ustedes quieren y van a la cancha y ven un partido de argentina una de las cosas que ocurre es que digamos la tribuna es muy 

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
hay algo muy interesante y es que si antes de salir a la cancha es necesario hacer trampa es porque te sabes un perdedor, hoy los kukas se saben perdedores. de hecho, imagino que muchos de ustedes habr√°n visto la pel√≠cula gladiador. cuando la basura inmunda de c√≥modo decide pelear, mano a mano, con m√°ximo; y para salir a pelear, antes de pelear, le tuvo que clavar un pu√±al y que se empiece a desangrar, eso es lo que necesita hacer el kirchnerismo, necesita hacer trampa porque no puede ganar por la v√≠a leg√≠tima, pero tal como ocurri√≥ en gladiador, va a ocurrir en la argentina, m√°ximo libertad le va a ganar al c√≥modo kirchnerista.



INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
es m√°s, instituciones republicanas que fueron concebidas para evitar el surgimiento de la tiran√≠a se han convertido en herramientas de opresi√≥n y sometimiento al servicio de perpetuar el despotismo de las bur√≥cratas, congresos que no sesionan debidamente, jueces que dictaminan sobre cuestiones en las que no tienen injerencia, y todo con el fin de frenar las reformas de libertad que el pueblo pide a gritos. y, por si eso fuera poco, tenemos que lidiar con los infaltables traidores, gente que fue elegida con el mandato claro de liberar a argentina del yugo del estado solo para darse vuelta al poco tiempo de haber asumido, gente que tard√≥ tan solo minutos en revelar ese deseo irrefrenable de ser casta, gente que al poco tiempo de asumir su banca le dio la espalda al pueblo argen

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
pero as√≠ como la historia recuerda a los h√©roes, tambi√©n recuerda a los traidores. y en el c√≠rculo m√°s profundo del infierno, descrito por dante como un lugar remoto, fr√≠o y oscuro, sufren el tormento eterno quienes apu√±alaron por la espalda a quienes le tendieron la mano. en fin, el tiempo sabr√° poner a cada uno en el lugar que le corresponde.



INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
por nuestra parte, reiteramos que roma no paga traidores. nos tomamos demasiado en serio la tarea que nos ha sido encomendada por los argentinos, como ya he dicho, defendemos una causa justa y noble, mucho m√°s grande que cada uno de nosotros. somos individuos libres que voluntariamente se han asociado en pos de un objetivo com√∫n, hemos decidido por voluntad propia someternos a algo que nos excede resignando nuestras ambiciones personales, nuestro confort, nuestros deseos para llevar a cabo la haza√±a m√°s grande que haya visto nuestra naci√≥n desde su independencia, liberar al pueblo argentino de la tiran√≠a del estado omnipresente. siendo lo m√°s directo posible, algo que me caracteriza, estamos en guerra y por muy repetitivo que suene la historia ha demostrado que la √∫nica fo

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
de modo tal que ese pa√≠s de saqueadores, que fue liderado por la corrupta condenada, su difunto marido y el peor ministro de econom√≠a de la historia solo sea un mal recuerdo en la memoria de los argentinos.



INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt fragmento:
Resum√≠ en espa√±ol el siguiente fragmento de un discurso pol√≠tico, manteniendo su sentido general, tono e ideas principales. No inventes informaci√≥n y us√° lenguaje claro y preciso:
pero para lograrlo no podemos descuidarnos ni un solo segundo. la casta pol√≠tica sigue ah√≠, esperando que nos equivoquemos. se prepararon toda su vida sirvi√©ndose del estado y saltando de cargo en cargo. conocen a la perfecci√≥n cada engranaje de la m√°quina de impedir. m√°quina que ellos mismos construyeron para evitar los cambios que la sociedad demanda. nos quieren ver d√©biles para poder llevarnos puestos y as√≠ retomar el poder, con el √∫nico prop√≥sito de recuperar los privilegios que les estamos arrebatando en pos de devolverle la libertad a cada argentino de bien. no hay que permit√≠rselo. es el momento de estar m√°s unidos que nunca, fieles a nuestro prop√≥sito. ellos quieren que seamos un pa√≠s de pobres y sometidos. nosotros queremos un pa√≠s pr√≥spero y libre. esta 

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"



üì§ Prompt final:
T√≠tulo del discurso: Palabras del Presidente de la Naci√≥n, Javier Milei, en La Derecha Fest, C√≥rdoba
Fecha: Martes 22 de julio de 2025
A continuaci√≥n ten√©s los res√∫menes parciales de un discurso pol√≠tico extenso.
Redact√° un resumen final fluido y preciso, sin repetir ideas, manteniendo el tono original y resaltando los temas clave del discurso.
Evit√° generalidades vac√≠as o f√≥rmulas gen√©ricas. Escrib√≠ en espa√±ol claro:
Hola a todos. ¬øNo vais a salir? ¬øQu√© pasa? ¬øV√°yanse el ping√ºino del armario? ¬°Viva la libertad, carajo!
Resumen: El orador habla con una expresi√≥n coloquial para preguntar a la audiencia si est√° listo para salir de alg√∫n lugar. Luego hace una pregunta absurda para despertar la atenci√≥n y termina llamando a la libertad en un tono entusiasta. La idea principal es que el p√∫blico est√© listo para salir y estar ansioso por la libertad.
The text appears to be discussing the concepts and critiques of certain ideologies, such as neoli

INFO:httpx:HTTP Request: POST http://127.0.0.1:11434/api/chat "HTTP/1.1 200 OK"
Generando res√∫menes con LLM: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [17:50<00:00, 1070.76s/it]


üü© Resumen generado con √©xito para c√≥digo: DISCURSO_001
Resumen:
En este discurso pol√≠tico, Javier Milei aborda temas como el liberalismo y el colectivismo, criticando la promoci√≥n de diversidad, equidad e inclusi√≥n en empresas y sociedad en general. Seg√∫n el orador, esto ha sustituido la igualdad ante la ley por discriminaci√≥n positiva a grupos sociales, lo que fragmenta la sociedad y debilita las instituciones. El discurso se enfoca en llamar a la libertad, afirmando que Argentina necesita una nueva direcci√≥n pol√≠tica para sacarla de su √∫ltimo siglo de humillaci√≥n y llevar sus ideas de libertad al gran p√∫blico. Menciona la necesidad de una batalla cultural por las ideas de libertad y progreso, enfatizando la importancia de ser soldados en esta lucha. Adem√°s, hace un llamado a Argentina para ser el pa√≠s m√°s grande de Am√©rica Latina y exhorta a los oyentes a sentirse orgullosos de ser argentinos nuevamente. El discurso enfatiza la necesidad de un cambio en la pol√≠ti




# 4. Prueba de m√≥dulo "identificacion_actores"

## 4.1. Identificaci√≥n de tipo de discurso, enunciador, enunciatarios y lugar

**procesar_discursos_llm:** Procesa un conjunto de discursos para identificar autom√°ticamente su tipo, enunciador, enunciatarios y lugar, utilizando un modelo de lenguaje (LLM) a trav√©s de la API de Ollama y prompts personalizados.

Par√°metros:
- df (pd.DataFrame): DataFrame con columnas 'codigo', 'titulo', 'texto_limpio' y 'resumen'.
- diccionario (dict): Diccionario conceptual con categor√≠as y ejemplos, utilizado para orientar la identificaci√≥n de tipo de discurso y roles enunciativos (ej. diccionario_tipos_discurso).
- prompt_tipo (str): Prompt base para la detecci√≥n del tipo de discurso. Debe incluir los placeholders "RESUMEN", "FRAGMENTOS" y "DICCIONARIO".
- prompt_enunciacion (str): Prompt base para la identificaci√≥n del enunciador y los enunciatarios. Debe incluir los placeholders "RESUMEN", "FRAGMENTOS" y "DICCIONARIO".
- prompt_lugar (str): Prompt base para la detecci√≥n del lugar de enunciaci√≥n. Debe incluir los placeholders "TITULO", "RESUMEN" y "FRAGMENTOS".
- guardar_csv (bool, opcional): Si es True, guarda los resultados en un archivo .csv. Por defecto: True.
- output_path (str, opcional): Ruta al archivo donde se guardar√° el CSV. Obligatorio si guardar_csv=True.
- analizar_tipo (bool, opcional): Si es True, se realiza la identificaci√≥n del tipo de discurso. Por defecto: True.
- analizar_enunc (bool, opcional): Si es True, se identifican enunciador y enunciatarios. Por defecto: True.
- analizar_lug (bool, opcional): Si es True, se identifica el lugar de enunciaci√≥n. Por defecto: True.
- mostrar_prompts (bool, opcional): Si es True, imprime los prompts construidos antes de enviarlos al modelo. √ötil para debugging. Por defecto: False.

Retorna:
- pd.DataFrame: DataFrame original con columnas adicionales que contienen los resultados de la identificaci√≥n autom√°tica (tipo_discurso, tipo_discurso_justificacion, enunciador_actor, enunciador_justificacion, enunciatario_0_actor, enunciatario_0_tipo, enunciatario_0_justificacion, ..., lugar_ciudad, lugar_provincia, lugar_pais, lugar_justificacion).

Requiere:
- Definici√≥n previa de los paths en el m√≥dulo modulos.paths.
- Disponibilidad de los prompts base en el m√≥dulo modulos.prompts.
- Diccionario conceptual diccionario_tipos_discurso importado desde modulos.tipos_discurso.

In [1]:
# Cargar dataset con res√∫menes
import pandas as pd
import modulos.paths as paths

df_discursos = pd.read_csv(paths.discursos_resumen, encoding="utf-8-sig")

# Procesar discursos con el LLM
import modulos.prompts as prompts
from modulos.tipos_discurso import diccionario_tipos_discurso
from modulos.enunciacion import procesar_discursos_llm
from modulos.modelo import llm
df_resultado = procesar_discursos_llm(
    df=df_discursos,
    modelo_llm=llm,
    diccionario=diccionario_tipos_discurso,
    prompt_tipo=prompts.PROMPT_TIPO_DISCURSO,
    prompt_enunciacion=prompts.PROMPT_ENUNCIACION,
    prompt_lugar=prompts.PROMPT_LUGAR,
    guardar_csv=True,
    output_path=paths.discursos_enunc,
    analizar_tipo=True,
    analizar_enunc=True,
    analizar_lug=True,
    mostrar_prompts=True
)

Procesando discursos:   0%|                                                                                                                                                                                           | 0/1 [00:00<?, ?it/s]


üì§ Prompt - Tipo de discurso:
 Est√°s analizando un discurso. Tu √∫nica tarea es identificar el tipo de discurso y justificar por qu√©.
‚ö†Ô∏è Siempre agreg√° una justificaci√≥n sobre por qu√© identificaste el discurso como correspondiente a un determinado tipo.
### Resumen del discurso:
En este discurso pol√≠tico, Javier Milei aborda temas como el liberalismo y el colectivismo, criticando la promoci√≥n de diversidad, equidad e inclusi√≥n en empresas y sociedad en general. Seg√∫n el orador, esto ha sustituido la igualdad ante la ley por discriminaci√≥n positiva a grupos sociales, lo que fragmenta la sociedad y debilita las instituciones. El discurso se enfoca en llamar a la libertad, afirmando que Argentina necesita una nueva direcci√≥n pol√≠tica para sacarla de su √∫ltimo siglo de humillaci√≥n y llevar sus ideas de libertad al gran p√∫blico. Menciona la necesidad de una batalla cultural por las ideas de libertad y progreso, enfatizando la importancia de ser soldados en esta lucha. 

Procesando discursos: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [02:49<00:00, 169.51s/it]


üé§ C√≥digo: DISCURSO_001
‚úîÔ∏è Tipo de discurso: discurso pol√≠tico
‚úîÔ∏è Enunciador: Javier Milei
üì® Enunciatarios:
   1. La derecha (prodestinatario)
   2. La oposici√≥n pol√≠tica expl√≠cita (contradestinatario)
   3. La poblaci√≥n argentina en general (paradestinatario)
‚úîÔ∏è Lugar: C√≥rdoba C√≥rdoba Argentina

‚úÖ Archivo guardado como C:\PROYECTOS\Primer MVP1\data\A5. discursos_enunciacion.csv





## 4.2. Identificaci√≥n de actores con contexto enunciativo

**identificar_actores_con_contexto:** Procesa una serie de recortes textuales para identificar actores relevantes mencionados en cada frase, excluyendo al enunciador y los enunciatarios previamente detectados. Para ello, utiliza un modelo de lenguaje (LLM) mediante la API de Ollama y un prompt estructurado que combina informaci√≥n del discurso de inscripci√≥n (resumen, fecha, lugar, tipo, enunciador y enunciatarios) con la frase objetivo y su contexto.

Par√°metros:
- df_recortes (pd.DataFrame): DataFrame que contiene los recortes textuales a analizar. Debe incluir al menos las columnas 'frase', 'recorte_id' y 'codigo' (identificador del discurso de inscripci√≥n).
- df_enunc (pd.DataFrame): DataFrame con los discursos completos y los resultados de la identificaci√≥n enunciativa (enunciador, enunciatarios, tipo de discurso, lugar, etc.), asociados por la columna 'codigo'.
- prompt_template (str): Prompt base con placeholders que ser√° completado din√°micamente para cada recorte. Debe incluir:
- a. {resumen_global}: Resumen del discurso de inscripci√≥n.
- b. {fecha}: Fecha del discurso.
- c. {lugar_justificacion}: Lugar del discurso (con justificaci√≥n).
- d. {tipo_discurso}: Tipo de discurso identificado.
- e. {enunciador}: Enunciador del discurso.
- f. {enunciatarios}: Enunciatarios identificados.
- g. {frase}: Frase objetivo.
- h. {frases_contexto}: Frases inmediatamente anteriores y posteriores a la frase objetivo.
- i. {heuristicas}: Lista de reglas de inferencia v√°lidas.
- j. {ontologia}: Ontolog√≠a de actores posibles (categor√≠as permitidas para clasificaci√≥n).
- path_errores (str): Ruta del archivo donde se guardar√°n los errores o casos que no puedan procesarse correctamente.
- output_path (str): Ruta del archivo donde se guardar√°n los resultados procesados en formato .csv.
- modelo_llm (callable): Funci√≥n o clase del modelo LLM configurado, que recibe el prompt como string y devuelve una respuesta.
- mostrar_prompts (bool, opcional): Si es True, imprime el prompt generado para cada fragmento antes de enviarlo al modelo. √ötil para debugging. Por defecto: False.
- guardar_resultados (bool, opcional): Si es True, guarda el DataFrame resultante como CSV en output_path. Por defecto: True.

Retorna:
- pd.DataFrame: DataFrame original con columnas adicionales que contienen los actores identificados por frase (actor, tipo, modo, regla de inferencia), respetando el formato JSON indicado.

Requiere:
- Definici√≥n previa de los paths relevantes en el m√≥dulo modulos.paths.
- Prompt base definido en modulos.prompts.PROMPT_IDENTIFICAR_ACTORES.
- Preprocesamiento de enunciadores y enunciatarios mediante la funci√≥n procesar_discursos_llm (u otra que genere df_enunc compatible).

In [1]:
import pandas as pd
import modulos.paths as paths
import modulos.prompts as prompts
from modulos.identificacion_actores import identificar_actores_con_contexto
from modulos.modelo import llm

df_recortes = pd.read_csv(paths.recortes_prueba, encoding="utf-8-sig")
df_enunc = pd.read_csv(paths.discursos_enunc, encoding="utf-8-sig")

df_resultado = identificar_actores_con_contexto(
    df_recortes=df_recortes,
    df_enunc=df_enunc,
    prompt_template=prompts.PROMPT_IDENTIFICAR_ACTORES,
    path_errores=paths.errores_identificacion_actores,
    output_path=paths.actores_identificados,
    modelo_llm=llm,
    mostrar_prompts=False,
    guardar_resultados=True
)

  respuesta = modelo_llm([HumanMessage(content=prompt)]).content
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 10/10 [06:01<00:00, 36.11s/it]


In [2]:
df_actores = pd.read_csv("data/C1. actores_identificados.csv", encoding="utf-8-sig")

df_actores.head(20)

Unnamed: 0,actor,tipo,modo,frase_idx,recorte_id,codigo,regla_de_inferencia,regla de inferencia
0,audiencia,colectivo,expl√≠cito,0,DISCURSO_001_FR_001,DISCURSO_001,,
1,audiencia,colectivo,inferido,1,DISCURSO_001_FR_002,DISCURSO_001,4.0,
2,audiencia,colectivo,inferido,2,DISCURSO_001_FR_003,DISCURSO_001,4.0,
3,ping√ºino,humano_individual,inferido,3,DISCURSO_001_FR_004,DISCURSO_001,,1.0
4,Javier Milei,humano_individual,expl√≠cito,4,DISCURSO_001_FR_005,DISCURSO_001,,
5,La derecha,colectivo,expl√≠cito,4,DISCURSO_001_FR_005,DISCURSO_001,,
6,La poblaci√≥n argentina en general,colectivo,inferido,4,DISCURSO_001_FR_005,DISCURSO_001,,1.0
7,Agust√≠n Laje,humano_individual,expl√≠cito,5,DISCURSO_001_FR_006,DISCURSO_001,,1.0
8,El equipo de La Derecha Diario,colectivo,expl√≠cito,5,DISCURSO_001_FR_006,DISCURSO_001,,1.0
9,Javier Milei,humano_individual,expl√≠cito,6,DISCURSO_001_FR_007,DISCURSO_001,,


In [1]:
# 3. Reprocesamiento de errores HAY QUE REVISARLA DE NUEVO POR INCOMPATIBILIDADES POSIBLES

import pandas as pd
import modulos.paths as paths
import modulos.prompts as prompts
from modulos.identificacion_actores import reprocesar_errores_identificacion
from modulos.modelo import llm

df_enunc = pd.read_csv(paths.discursos_enunc, encoding="utf-8-sig")
df_recortes = pd.read_csv(paths.recortes_prueba, encoding="utf-8-sig")

reprocesar_errores_identificacion(
    df_recortes=df_recortes,
    df_enunc=df_enunc,
    path_errores=paths.errores_identificacion_actores,
    path_salida=paths.errores_persistentes,
    prompt_template=prompts.PROMPT_IDENTIFICAR_ACTORES,
    intento=1,
    evitar_duplicados=True,
    modelo_llm=llm,
    mostrar_prompts=False
)



üîÅ Reprocesando 1 errores...


  respuesta = modelo_llm([HumanMessage(content=prompt)]).content


‚úÖ Agregados 1 nuevos registros a 'C:\PROYECTOS\Primer MVP1\errores\errores_persistentes.jsonl'
‚úÖ Todos los errores fueron corregidos.


In [2]:
df_actores = pd.read_csv("data/C1. actores_identificados.csv", encoding="utf-8-sig")

df_actores.head(30)

Unnamed: 0,actor,tipo,modo,frase_idx,recorte_id,codigo,regla_de_inferencia,regla de inferencia
0,audiencia,colectivo,expl√≠cito,0,DISCURSO_001_FR_001,DISCURSO_001,,
1,audiencia,colectivo,inferido,1,DISCURSO_001_FR_002,DISCURSO_001,4.0,
2,audiencia,colectivo,inferido,2,DISCURSO_001_FR_003,DISCURSO_001,4.0,
3,ping√ºino,humano_individual,inferido,3,DISCURSO_001_FR_004,DISCURSO_001,,1.0
4,Javier Milei,humano_individual,expl√≠cito,4,DISCURSO_001_FR_005,DISCURSO_001,,
5,La derecha,colectivo,expl√≠cito,4,DISCURSO_001_FR_005,DISCURSO_001,,
6,La poblaci√≥n argentina en general,colectivo,inferido,4,DISCURSO_001_FR_005,DISCURSO_001,,1.0
7,Agust√≠n Laje,humano_individual,expl√≠cito,5,DISCURSO_001_FR_006,DISCURSO_001,,1.0
8,El equipo de La Derecha Diario,colectivo,expl√≠cito,5,DISCURSO_001_FR_006,DISCURSO_001,,1.0
9,Javier Milei,humano_individual,expl√≠cito,6,DISCURSO_001_FR_007,DISCURSO_001,,


In [1]:
# 4. Postprocesamiento

from modulos.identificacion_actores import validacion_actores

path_df_actores = "data/actores_identificados.csv"
path_df_recortes = "data/recortes_preprocesado_10.csv"
path_salida_validos = "data/actores_validos.csv"
path_salida_excluidos = "data/actores_excluidos.csv"

validacion_actores(
    path_df_actores=path_df_actores,
    path_df_recortes=path_df_recortes,
    path_salida_validos=path_salida_validos,
    path_salida_excluidos=path_salida_excluidos
)

Procesando recortes:   0%|                                                                      | 0/10 [00:00<?, ?it/s]
  respuesta = llm([HumanMessage(content=prompt)]).content

Validando actores recorte DISCURSO_001_FR_001: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:11<00:00, 11.48s/it][A
Procesando recortes:  10%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñè                                                       | 1/10 [00:11<01:43, 11.48s/it][A

DISCURSO_001_FR_001 - todos: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_002:   0%|                                             | 0/3 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_002:  33%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé                        | 1/3 [00:04<00:09,  4.69s/it][A

DISCURSO_001_FR_002 - Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_002:  67%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã            | 2/3 [00:08<00:03,  3.94s/it][A

DISCURSO_001_FR_002 - La instituci√≥n centenaria fundada por Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_002: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3/3 [00:12<00:00,  4.34s/it][A
Procesando recortes:  20%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñç                                                 | 2/10 [00:24<01:38, 12.33s/it][A

DISCURSO_001_FR_002 - Nuestro pa√≠s: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_003:   0%|                                             | 0/2 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_003:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                  | 1/2 [00:03<00:03,  3.72s/it][A

DISCURSO_001_FR_003 - Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_003: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 2/2 [00:07<00:00,  3.66s/it][A
Procesando recortes:  30%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                                           | 3/10 [00:31<01:10, 10.05s/it][A

DISCURSO_001_FR_003 - El discurso: ‚ùå excluido



Validando actores recorte DISCURSO_001_FR_004:   0%|                                             | 0/3 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_004:  33%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé                        | 1/3 [00:03<00:07,  3.72s/it][A

DISCURSO_001_FR_004 - La Libertad Avanza: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_004:  67%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã            | 2/3 [00:07<00:03,  3.53s/it][A

DISCURSO_001_FR_004 - Doctor Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_004: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3/3 [00:10<00:00,  3.47s/it][A
Procesando recortes:  40%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä                                     | 4/10 [00:42<01:01, 10.23s/it][A

DISCURSO_001_FR_004 - Gobierno nacional: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_005:   0%|                                             | 0/2 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_005:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                  | 1/2 [00:03<00:03,  3.71s/it][A

DISCURSO_001_FR_005 - Argentina: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_005: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 2/2 [00:07<00:00,  3.66s/it][A
Procesando recortes:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà                               | 5/10 [00:49<00:45,  9.19s/it][A

DISCURSO_001_FR_005 - El proceso de reconstrucci√≥n nacional: ‚ùå excluido



Validando actores recorte DISCURSO_001_FR_006:   0%|                                             | 0/2 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_006:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                  | 1/2 [00:03<00:03,  3.36s/it][A

DISCURSO_001_FR_006 - Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_006: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 2/2 [00:06<00:00,  3.46s/it][A
Procesando recortes:  60%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñè                        | 6/10 [00:56<00:33,  8.41s/it][A

DISCURSO_001_FR_006 - El que hace lo que hay que hacer: ‚ùå excluido



Validando actores recorte DISCURSO_001_FR_007:   0%|                                             | 0/3 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_007:  33%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé                        | 1/3 [00:03<00:07,  3.95s/it][A

DISCURSO_001_FR_007 - los tiempos: ‚ùå excluido



Validando actores recorte DISCURSO_001_FR_007:  67%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã            | 2/3 [00:07<00:03,  3.76s/it][A

DISCURSO_001_FR_007 - la informaci√≥n: ‚ùå excluido



Validando actores recorte DISCURSO_001_FR_007: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3/3 [00:11<00:00,  3.71s/it][A
Procesando recortes:  70%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñç                  | 7/10 [01:07<00:27,  9.33s/it][A

DISCURSO_001_FR_007 - las cosas que hab√≠a que hacerse: ‚ùå excluido



Validando actores recorte DISCURSO_001_FR_008:   0%|                                             | 0/4 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_008:  25%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé                           | 1/4 [00:03<00:11,  3.78s/it][A

DISCURSO_001_FR_008 - Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_008:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                  | 2/4 [00:07<00:07,  3.56s/it][A

DISCURSO_001_FR_008 - un asistente de Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_008:  75%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä         | 3/4 [00:10<00:03,  3.48s/it][A

DISCURSO_001_FR_008 - gente: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_008: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 4/4 [00:13<00:00,  3.46s/it][A
Procesando recortes:  80%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå            | 8/10 [01:21<00:21, 10.81s/it][A

DISCURSO_001_FR_008 - Congreso: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_009:   0%|                                             | 0/2 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_009:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                  | 1/2 [00:03<00:03,  3.77s/it][A

DISCURSO_001_FR_009 - Carlos Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_009: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 2/2 [00:07<00:00,  3.55s/it][A
Procesando recortes:  90%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä      | 9/10 [01:28<00:09,  9.67s/it][A

DISCURSO_001_FR_009 - gente: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_010:   0%|                                             | 0/2 [00:00<?, ?it/s][A
Validando actores recorte DISCURSO_001_FR_010:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå                  | 1/2 [00:03<00:03,  3.38s/it][A

DISCURSO_001_FR_010 - Pellegrini: ‚úÖ v√°lido



Validando actores recorte DISCURSO_001_FR_010: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 2/2 [00:06<00:00,  3.48s/it][A
Procesando recortes: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 10/10 [01:35<00:00,  9.58s/it][A

DISCURSO_001_FR_010 - la historia: ‚ùå excluido
‚úÖ Guardados 17 actores validados en 'data/actores_validos.csv'
üìÑ Guardados 7 actores excluidos en 'data/actores_excluidos.csv'



