Skip to content

Implementation of Wolpertinger algorithm for a recommender task

Notifications You must be signed in to change notification settings

pkorobov/wolpertinger-recommendations

Repository files navigation

Wolpertinger recommendations

Реализация статьи Deep Reinforcement Learning in Large Discrete Action Spaces для рекомендаций

К реализации алгоритма из статьи добавлена регуляризация критика по ближайшему соседу протодействия. В экспериментах показано улучшение в сравнении с бейзлайном.

На основе этого проекта была выполнена моя курсовая работа, где подробно описан симулятор для агента и результаты экспериментов.

About

Implementation of Wolpertinger algorithm for a recommender task

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published