Ukrainian tone dictionary
Switch branches/tags
Nothing to show
Clone or download
Latest commit 34a6007 Sep 26, 2016

README.md

Український тональний словник

Версія 2016-09-08

Словник знаходиться у файлі tone-dict-uk.tsv. Він містить 3442 слів української мови, які мають не нейтральну тональність (-2, -1, 1, 2).

Дані отримані з двох джерел:

  • файл tone-dict-uk-manual.tsv отриманий усередненням оцінок декількох експертів
  • файл tone-dict-uk-auto.tsv сгенеровано автоматичним розширенням словника tone-dict-uk-manual за допомогою ML-моделі з використанням векторів слів word2vec та lex2vec, а також незначною пост-обробкою людиною

Формат даних — tab-separated з наступними колонками:

  • слово
  • дискретна тональність (з діапазону: -2, -1, 0, 1, 2)

В словнику по-можливості всі слова приведені до базової граматичної форми, а також прислівники замінені на спільнокореневі прикметники.

Дані експертних оцінок надані: Олександром Маріковським та В'ячеславом Тихоновим

Розширений словник підготовлений: Сергій Шеховцов, Олесь Петрів, Дмитро Чаплинський, Всеволод Дьомкін