TPE NLP

82.18 - Procesamiento del Lenguaje Natural Segundo Cuat. 2023

Integrantes

Entregas

En el directorio docs se encuentran las entregas del trabajo práctico.

A continuación se listan los links a los archivos:

Corpus

Datasets inicial de scripts.
Este fue modificado para tomar sólo los diálogos “head_type” donde se tiene un “speaker/title”. Ej:

{
  "head_type": "speaker/title",
  "Head_text": {
    "speaker/title":"WEST"
  },
  "text": "Three cases in two years? Who was she handling, the Rosenbergs?”
}

Análisis

Exploratorio

En el directorio output se encuentran los archivos relacionados al análisis exploratorio. Estos incluten

En el mismo se realiza un cloud of words para cada guionista con una selección reducida de todos los guiones.
Por otro lado también se realizó un análisis de la media de largo de dialogos por guionista.

Modelos

Los modelos usados son los siguientes:

TF-IDF
BERT
- no fine-tuning
- fine-tuning

Métricas

Las métricas usadas son las siguientes:

Accuracy
F1-Score
Precisión
Recall

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
dataset		dataset
docs		docs
output		output
src		src
.gitignore		.gitignore
Pipfile		Pipfile
Pipfile.lock		Pipfile.lock
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TPE NLP

Integrantes

Entregas

Corpus

Análisis

Exploratorio

Modelos

Métricas

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

TPE NLP

Integrantes

Entregas

Corpus

Análisis

Exploratorio

Modelos

Métricas

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages