GitHub

Aplicación de técnicas de Machine Learning y Natural Language Processing para la extracción automática de metadatos bibliográficos desde documento académicos de la Universidad Mayor de San Andrés

demo-2024-02-13_16.11.17.mp4

Este repositorio contiene el codigo desarrollado como parte del proyecto de grado "Aplicación de técnicas de Machine Learning y Natural Language Processing para la extracción automática de metadatos bibliográficos en documento académicos de la Universidad Mayor de San Andrés" para el pregrado en Ingeniería Electrónica de la Universidad Mayor de San Andrés.

El proyecto se encuentra dividido en dos partes:

Extractor de metadatos: Consiste en un pipeline de Reconocimiento de Entidades Nombradas (NER), el cual fue entrenado para extraer metadatos desde la caratula de documentos académicos de la UMSA.
Generador de palabras clave: Consiste en un modelo LLM el cual ha sido Ajustado para generar palabras clave a partir del texto del resumen de los documentos académicos de la UMSA.

Estructura del repositorio

El repositorio se encuentra estructurado de la siguiente manera:

extractor_de_metadatos/: Contiene el código de entrenamiento del extractor de metadatos.
generator_de_palabras_clave/: Contiene el código de entrenamiento del generador de palabras clave.
demo/: Contiene el código de la aplicación web que permite probar los modelos entrenados.

Modelos entrenados y datasets

Los modelos entrenados se encuentran disponibles en 🤗 Hugging Face Hub y pueden ser descargados desde los siguientes enlaces:

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
demo		demo
extractor_de_metadatos		extractor_de_metadatos
generador_de_palabras_clave		generador_de_palabras_clave
LICENSE		LICENSE
README.md		README.md
rodrigo-iturralde-proyecto-de-grado.pdf		rodrigo-iturralde-proyecto-de-grado.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Estructura del repositorio

Modelos entrenados y datasets

About

Languages

License

riturr/metaextract_umsa

Folders and files

Latest commit

History

Repository files navigation

Estructura del repositorio

Modelos entrenados y datasets

About

Topics

Resources

License

Stars

Watchers

Forks

Languages