Skip to content

Решение, занимающее 28/184 место в отборочном контесте ONTI "AI" на датасете MuSeRC.

Notifications You must be signed in to change notification settings

Gaussiandra/MuSeRC-Challenge-AI21

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 

Repository files navigation

Описание

Отборочный контест на олимпиаду НТИ по искусственному интеллекту на датасете MuSeRC, который представляет собой задачу reading comprehension, где чтобы ответить на вопрос, необходима информация из нескольких предложений. Дается текст, вопрос к нему и варианты ответов. На вопрос невозможно ответить не произведя операции причинно-следственных связей.

Пример данных для обучения

Снимок

Применённый подход

  • Задача была сведена к бинарной классификации с помощью Rubert от DeepPavlov из Huggingface.
  • Для ответа на вопрос использовались тройки, разделённые [SEP] токеном и состоящие из исходного текста, вопроса и предлагаемого ответа.
  • Из всего текста была удалена нумерация.
  • Использовалась аугментация с рандомной заменой вопроса или предлагаемого ответа.
  • Вначале файнтюнинга последние слои сети замораживались.
  • В проекте использовались PyTorch и Catalyst для обучения модели, Neptune AI для контроля экспериментов.
  • Сеть училась с помощью оптимизатора AdamW и ReduceLROnPlateau планировщика в FP16 режиме.
  • Была также идея давать сети возможность смотреть сразу на все варианты ответов, как например делается в этой статье, но с использованием attention транформера. Задумка значительно повышала точность на тренировочных данных, но не давала совершенно никакого эффекта на тестовых, поэтому от неё решено было отказаться.
По итогу соревнования такой подход давал 0.739 по F1 и 28/184 место на приватной части лидерборда, но вполне реально было выжать и больше, используя данные с валидации, Large версию модели и блендинг.

About

Решение, занимающее 28/184 место в отборочном контесте ONTI "AI" на датасете MuSeRC.

Topics

Resources

Stars

Watchers

Forks