Skip to content

Latest commit

 

History

History
11 lines (10 loc) · 1.29 KB

README.md

File metadata and controls

11 lines (10 loc) · 1.29 KB

Диалоговая система, которая на введённое сообщение способна разумным образом подобрать ответ из заданного списка.

Пример работы алгоритма, обёрнутого в чат-бот в телеграме

Снимок

Описание

  • Модель основана на DSSM архитектуре, где каждый возможный ответ и введёный контекст задается своим вектором.
  • Подходящий ответ определяется благодаря косинусной близости и алгоритму HNSW.
  • Энкодеры имеют одинаковую архитектуру: FastText embedding -> LSTM -> mean-max-last pooling -> Linear.
  • Обучение производится на триплетном лоссе.
  • Был использован Hard Negatives Mining как техника для улучшения сходимости.
  • Данными для обучения стали телеграм беседы. Спасибо за парсинг Fulldis.