Alumno:
- Constantino Ferrucci
Docentes:
- Juan Pablo Manson
- Alan Geary
- Andrea Carolina Leon Cavallo
- Ariel D'Alessandro
Fecha:
- 11/12/2023
Para poder desplegar este proyecto se puede descargar el archivo, importar a Google Colab y ejecutar.
Es importante contar con un Token de Hugging Face para poder utilizar la API además de una cuenta de WikiData para poder hacer uso del servicio.
Todo el desarrollo del proyecto se encuentra dentro del archivo NLP_Final_Project.ipynb, allí dentro encontrarás todos los puntos que abarca este proyecto.
En este proyecto se desarrollaron la mayoría de contenidos dados en la asignatura Procesamiento de Lenguaje Natural, abarcando con éxito todas las unidades tocando temas como:
- Extracción de texto y procesamiento del mismo.
- Implementación de Web Scrapping para obtener contenidos de la Web almacenando la información obtenida.
- Procesamiento de varios formatos de texto como por ejemplo HTML y JSON.
- Representación vectorial del texto en espacios de altas dimensiones.
- Utilización de modelos de vectorización de texto apoyandonós en espacios de altas dimensiones.
- Búsqueda de similitudes entre documentos y textos.
- Procesamiento del lenguaje natural.
- Limpieza y procesamiento del texto.
- Arquitecturas del modelo de lenguaje.
- Implementación de pipelines para la eficiente búsqueda de información y posterior respuestas de los modelos de lenguaje.
- Almacenamiento y representación del conocimiento.
- Utilización de ChromaDB como base de datos vectorial en donde se almacenó el conocimiento obtenido.
- Chatbots y sistemas de dialogos.
- Implementación de un sistema de dialogo basado en modelos de HuggingFace ya preentrenados.
- Agentes autónomos basados en NLP.
- Desarrollo de un informe (en el ejercicio 2) en donde se realiza una investigación sobre agentes autónomos ejemplíficando el uso de estos en una problemática del mundo real.
Habiendo cumplido con el desarrollo del proyecto y cumpliendo con las consignas asignadas, se da como cierre el desarrollo de este trabajo.