NLP en Español con Hugging Face

"NLP en ES 🤗" es la comunidad de hispanohablantes de la iniciativa "Languages at Hugging Face".

Nuestra misión es crear y compartir recursos que posibiliten y aceleren el avance del NLP en Español. Es un objetivo muy amplio que se puede traducir en:

Crear bases de datos o añadir las ya existentes a la librería Datasets de Hugging Face
Entrenar/fine-tune modelos utilizando dichas bases de datos y añadirlos al Model Hub de Hugging Face
Crear tutoriales explicando cómo hacer uso de estos recursos o traducir tutoriales ya existentes
Compartir eventos, artículos y proyectos interesantes para la comunidad (Slack)
Organizar charlas donde discutir el estado del arte del NLP en español
Organizar webinars en los que dar visibilidad a los proyectos que están llevando a cabo nuestros miembros
Organizar workshops con los que mostrar a toda la comunidad hispanohablante del mundo de la IA cómo hacer uso de estos nuevos recursos

Datasets

Ahora mismo hay 7 datasets monolingües en español.

Cómo contribuir a la librería 🤗 Datasets:

Completar la documentación de las bases de datos ya existentes
Añadir una base de datos a la librería
Crear una nueva base de datos

Completar la documentación de las bases de datos ya existentes

El README de cada base de datos se llama Dataset Card y contiene información referente al uso, la estructura, la creación, la licencia y la citación de dicha base de datos.

Todas las Dataset Cards siguen una misma plantilla y cuanto más completas estén, mejor (e.g. Dataset Card for ELI5). Si encuentras información que todavía no está incluida en la Dataset Card de cualquier base de datos, crea una Merge Request con tu aportación.

Añadir una base de datos a la librería

Si quieres añadir una base de datos a la librería de HF, solo tienes que:

Añadir una nueva fila a la hoja de cálculo* con la información de dicha base de datos y poner tu nombre en la columna "Contribuyente"
Seguir las instrucciones detalladas en este documento

Si quieres sugerir la adición de una base de datos a la librería añade una nueva fila en la hoja de cálculo* y deja la columna "Contribuyente" en blanco para que otra persona pueda trabajar en ello.

*El enlace a la hoja de cálculo está en la descripción del canal #datasets del grupo de Slack.

Crear una nueva base de datos

Si tienes una idea para crear una nueva base de datos de NLP en español estás en el sitio adecuado:

Comparte tu idea en el canal #tutoriales de la comunidad de Slack
Reúne un equipo para hacerla realidad
Añádela a la librería de Hugging Face

Modelos

Ahora mismo hay 259 modelos en español.

Cómo añadir tu modelo al 🤗 Model Hub:

Entrena/fine-tune tu modelo (echa un vistazo a los datasets en español)
Sigue las instrucciones de esta página para compartir tu modelo y subirlo al Hub

Recuerda detallar bien la Model Card, puedes utilizar esta plantilla.

Si tienes más dudas echa un vistazo a Model Hub docs.

Tutoriales

Tanto si quieres crear un tutorial desde cero como si quieres traducir uno:

Comparte tu idea en el canal #tutoriales de la comunidad de Slack
Reúne un equipo para hacerla realidad
Crea un repositorio con el nombre del nuevo tutorial
Crea un README.md con la información del tutorial
¡Y a trabajar!

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP en Español con Hugging Face

Datasets

Completar la documentación de las bases de datos ya existentes

Añadir una base de datos a la librería

Crear una nueva base de datos

Modelos

Tutoriales

About

somosnlp/nlp-en-es

Folders and files

Latest commit

History

Repository files navigation

NLP en Español con Hugging Face

Datasets

Completar la documentación de las bases de datos ya existentes

Añadir una base de datos a la librería

Crear una nueva base de datos

Modelos

Tutoriales

About

Topics

Resources

Code of conduct

Stars

Watchers

Forks