82.18 - Procesamiento del Lenguaje Natural Segundo Cuat. 2023
En el directorio docs se encuentran las entregas del trabajo práctico.
A continuación se listan los links a los archivos:
- Datasets inicial de scripts.
- Este fue modificado para tomar sólo los diálogos “head_type” donde se tiene un “speaker/title”. Ej:
{
"head_type": "speaker/title",
"Head_text": {
"speaker/title":"WEST"
},
"text": "Three cases in two years? Who was she handling, the Rosenbergs?”
}En el directorio output se encuentran los archivos relacionados al análisis exploratorio. Estos incluten
- En el mismo se realiza un cloud of words para cada guionista con una selección reducida de todos los guiones.
- Por otro lado también se realizó un análisis de la media de largo de dialogos por guionista.
Los modelos usados son los siguientes:
Las métricas usadas son las siguientes:
- Accuracy
- F1-Score
- Precisión
- Recall