Skip to content

Solución primer puesto competencia Metadata - Santander: Clasificación de preguntas de clientes

Notifications You must be signed in to change notification settings

frandorr/santander-question-classifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Clasificación de preguntas de clientes Santander

🏆 Primer puesto (0.883 score público)

En este repo se puede encontrar la solución con la que alcancé el primer puesto en el leaderboard público de la competencia de Metadata ECI Clasificación de preguntas de clientes.

La solución está basada en un Voting Hard sobre 6 modelos entrenados sobre BETO. Utilicé la biblioteca huggingface y Pytorch para la implementación.

El código está dividido en dos partes: modelado del lenguaje y clasificador.

AVISO: el código no está para nada pulido así que si no se entiende algo pueden preguntarme!

Modelado del lenguaje

En el notebook Language Model se puede encontrar el finetuning realizado sobre Beto para adaptarlo al problema

Clasificador

En el notebook Ensamble de Betos se encuentra el código utilizado para los múltiples entrenamientos y las predicciones.

En la siguiente imagen se pueden ver el score alcanzado en entrenamiento de lo 6 mejores modelos: Mejores modelos en Balanced Accuracy

About

Solución primer puesto competencia Metadata - Santander: Clasificación de preguntas de clientes

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published