Permalink
Find file Copy path
Fetching contributors…
Cannot retrieve contributors at this time
162 lines (121 sloc) 6.13 KB
Теги:
[КЛ] - ключ леми (тег, який розрізняє різні леми з омонімів)
noun іменник
[КЛ] anim істота
[КЛ] fname ім'я
[КЛ] lname прізвище
[КЛ] pname по батькові
[КЛ] inanim неістота
[КЛ] unanim невизначена категорія істота/неістота (бактерія)
prop власна назва
geo топонім
verb дієслово
[КЛ] imperf недоконаний вид
[КЛ] perf доконаний вид
[КЛ] rev зворотна форма (дієслова) (тег є неявним ключем, оскільки лема на -ся завжди відрізняється від прямого дієслова)
inf інфінітив
futr майбутній час
past минулий час
pres теперішній час
impr наказова форма
impers безособова форма
1 1-а особа
2 2-а особа
3 3-а особа
adj прикметник
compb базова форма
compc порівняльна форма
comps найвища форма
short короткі форми прикметників
adjp дієприкметник: (:&adjp - лише дієприкметник; :&&adjp - дієприкметник і прикметник)
actv активний
pasv пасивний
imperf недоконаний вид
perf доконаний вид
(past/pres є в коментарях сирців для більшості дієприкметників, але наразі не використовується)
adj/adjp:
v_zna:rinanim знахідний для неістот (лише ч.р.)
v_zna:ranim знахідний для істот (лише ч.р.)
uncontr нестягнені (не генеруються за уставою)
adv прислівник
compb базова форма
compc порівняльна форма
comps найвища форма
advp дієприслівник
[КЛ] perf
[КЛ] imperf
prep прийменник
conj сполучник
subord підрядний
coord сурядний
part частка
intj вигук
numr числівник
foreign невідмінювані запозичені слова невизначеної частини мови (Альгемайне, Юнайтед тощо)
noninfl невідмінювані частини (най-най, брутто, екстра...)
Спільні для noun/adj/adjp:
Відмінки:
v_naz називний
v_rod родовий
v_dav давальний
v_zna знахідний
v_oru орудний
v_mis місцевий
v_kly кличний
nv не відмінюється
np без множини (TODO: проставлено не всюди)
ns без однини (TODO: проставлено не всюди)
Спільні для noun/adj/adjp/verb
p множина
s однина
Рід:
m чоловічий
f жіночий
n середній
Додаткові теги:
abbr абревіатура
bad покруч
subst просторічна форма
rare рідковживане/діалектичне/застаріле
coll розмовне слово/розмовна форма
slang сленг
alt альтернативне написання (не за чинним правописом)
:xp[1-9] омоніми, що відрізняються парадигмою відмінювання (напр. бар - р.в. бару, бар - р.в. бара)
# в коментарях також :xv[1-9] омоніми, що відрізняються семантично (напр. глупий (дурний, має вищий ступінь глупіший) і глупий - глупа ніч, без порівняльних форм)
v-u паралельні форми на в-/у- (для правил милозвучності, не генерується за уставою)
Додаткові теги класів слів (після &):
&adjp — слова, що є дієприкметниками
&&adjp — слова, що є і прикметниками і дієприкметниками
[КЛ] &pron - наразі всі займенники мають теги відповідних частин мови (noun/adj/adv), але всі мають додатковий тег &pron
(тег &pron разом з наступним класифікатором стає ключем леми)
&numr - слова, що є порядковими числівниками
&&numr - слова, що є і іменниками і кількісними числівниками
&insert - може бути вставним словом
&predic - може бути предикативом
Теги займенників:
pers особовий
refl зворотний
pos присвійний
dem вказівний
def означальний
int питальний
rel відносний
neg заперечний
ind неозначений
gen узагальнювальний
emph підсилювальний
Динамічні теги (відсутні в словнику, їх проставляє модуль тегування LT):
number - число
date - дата
time - час
Теги, яких немає, але які теоретично нескладно додати:
noun:
common gender
verb:
dual form (imperf+perf)
adj:
qualitative (має порівняльні форми) / relative (не має порівняльних)
adjp:
past/pres
advp:
past/pres