розмічений руками морфо’, синт’, кореф’ корпус української мови
Switch branches/tags
Nothing to show
Clone or download

README.md

Робоче репо золотого корпусу. Звідси скриптами будуються українські Universal Dependencies.
Використовуйте 👉збудовану версію, викладену на UD: вона має стандартний стабільний формат. Працюйте над створенням золота — тутечки.


екосистема

  1. машинка (морфо-анотатор)
    1. статистика (наперед треба увійти в анотатор)
  2. NoSketch Engine (корпусний рушій)
  3. синт
    1. brat (синтакс-анотатор)
    2. можливо-помилки в робочій версії
    3. дірки в робочій версії
    4. conllu робочої версії
    5. Turku (синтакс-пошук):
      1. наш
      2. фінський
    6. UD
      1. гітхаб-репо нашого трібанку
        1. стабільна гілка
        2. робоча гілка
      2. наші питання в UD
        1. відкриті
        2. закриті
  4. Intertext (вирівнювач паралельних корпусів)
  5. документація
    1. специфікація позначок
  6. іш’юзи
  7. гуглдоки
    1. протокол морфологічного розмічування
    2. підручник зі синтакс розмічування
    3. роботи над помилками / старі „як це позначати“
    4. інструкція з кореференції
  8. mova.institute (титульний сайт)
    1. сторінка про цей корпус
    2. демо аналізатора