Skip to content

Latest commit

 

History

History
91 lines (86 loc) · 11.9 KB

RNCtoUD.md

File metadata and controls

91 lines (86 loc) · 11.9 KB

Russian National Corpus tagset (main corpus): conversion table to UD 2.0

Created: 11 Jan 2017

Parts of speech (XPOS)

Status RNC tag UPOS tag description(RUS) description(ENG)
S NOUN существительное (яблоня, лошадь, корпус, вечность) noun
+ S PROPN + существительное - имя собственное (Иван, Москва, СССР); определяется по пометам persn, patrn, famn, zoon и в большинстве случаев abbr в поле «Грамматика»
- INIT PROPN инициал (запись вида «заглавная буква с точкой» (М., Р.). В поле «Лемма» инициал не раскрывается; грамматические признаки не указываются) proper noun (initial letter)
A ADJ прилагательное (коричневый, таинственный, морской) adjective
NUM NUM числительное (четыре, 4, много) numeral
- ANUM ADJ числительное-прилагательное (седьмой, восьмидесятый); NB за исключением один (размечается как NUM) ordinal numeral
V VERB глагол (пользоваться, обрабатывать) verb
+ V AUX вспомогательный глагол быть (выполняющий функции грамматического показателя) auxiliary
- PRAEDIC VERB предикатив (жаль, хорошо, пора), см. список predicative
- PRAEDICPRO VERB местоимение-предикатив (некого, нечего) predicative pronoun
ADV ADV наречие (сгоряча, очень) adverb
- PARENTH ADV вводное слово (кстати, по-моему) parenthetically used discoursive markers
* SPRO PRON местоимение-существительное (она, что), см. список pronoun (as noun)
* APRO DET местоимение-прилагательное (этот, твой); NB за исключением который (размечается как PRON), см. список adjectival pronoun/determiner
- ADVPRO ADV местоименное наречие (где, вот) adverbial pronoun
PR ADP предлог (под, напротив) preposition/adposition
CONJ SCONJ союз (что, чтобы); при конвертации по умолчанию подчинительный subordinating conjunction
+ CONJ CCONJ + сочинительный союз (и, но), см. список coordinating conjunction
PART PART частица (бы, же, пусть) particle
INTJ INTJ междометие (увы, батюшки) interjection
NONLEX X не-слова (шшетт, bolo) foreign and non-words
+ SYM символ (%, $) symbol
+ PUNCT знак препинания punctuation mark

Grammatical features (FEAT)

Status RNC tag FEAT feature description(RUS) description(ENG)
m Gender=Masc мужской род (работник, стол) masculine gender
f Gender=Fem женский род (работница, табуретка) feminine gender
n Gender=Neut средний род (животное, озеро) neuter gender
~ mf Gender=Masc «общий род» (задира, пьяница); в большинстве случаев приравнивание к м. р. не будет порождать ошибки common gender (the feature Gender=Com is not available in Russian UD)
anim Animacy=Anim одушевленность (человек, ангел, утопленник) animate
inan Animacy=Inan неодушевленность (рука, облако, культура) inanimate
sg Number=Sing единственное число (яблоко, гордость) singular number
pl Number=Plur множественное число (яблоки, ножницы, детишки) plural number
nom Case=Nom именительный падеж (голова, сын, степь, сани, который) Nominative case
gen Case=Gen родительный падеж (головы, сына, степи, саней, которого) Genitive case
dat Case=Dat дательный падеж (голове, сыну, степи, саням, которому) Dative case
acc Case=Acc винительный падеж (голову, сына, степь, сани, который/которого) Accusative case
ins Case=Ins творительный падеж (головой, сыном, степью, санями, которым) Instrumental case
loc Case=Loc предложный падеж ([о] голове, сыне, степи, санях, котором) Locative case
voc Case=Voc звательная форма (Господи, Серёж, ребят) Vocative case
gen2 Case=Par второй родительный падеж (чашка чаю) Partitive case
- dat2 Case=Dat дистрибутивный дательный ([по] многу, нескольку, стольку) second Dative case
- acc2 Case=Nom второй винительный падеж (постричься в монахи; по два человека) second Accusative case (in UD is treated as Nominative, still animate)
- loc2 Case=Loc второй предложный падеж (в лесу, на оси́) second Locative case
- adnum Case=Gen счётная форма (два часа́, три шара́) adnumeral form
brev Variant=Short краткая форма (высок, нежна, прочны, рад) short form
- plen полная форма (высокий, нежная, прочные, морской) full form
+ Degree=Pos позитивная степень (глубокий); присваивается всем формам прилагательных, наречий и предикативов, не имеющих сравнительной или превосходной степени positive, first degree
comp Degree=Cmp сравнительная степень (глубже) comparative degree
- comp2 Degree=Cmp форма «по+сравнительная степень» (поглубже) second comparative degree (po + comparative)
* supr Degree=Sup превосходная степень (глубочайший); ! в НКРЯ отсутствует и лемматизируется по образцу глубочайший, должна быть различена с позитивной степенью superlative degree
pf Aspect=Perf совершенный вид (пошёл, встречу) perfective aspect
ipf Aspect=Imp несовершенный вид (ходил, встречаю) imperfective aspect
- intr непереходность (ходить, вариться) intransitive verb
- tran переходность (вести, варить) transitive verb
act Voice=Act действительный залог (разрушил, разрушивший) active voice
pass Voice=Pass страдательный залог (только у причастий: разрушаемый, разрушенный) passive voice
med Voice=Mid медиальный, или средний залог (глагольные формы на -ся: разрушился и т.п.) middle voice
inf VerbForm=Inf инфинитив (украшать) infinitive
+ VerbForm=Fin финитная форма; в НКРЯ отсутствует, присваивается по умолчанию всем формам, не являющимся инфинитивом, причастием и деепричастием finite verb
partcp VerbForm=Part причастие (украшенный) participle
ger VerbForm=Conv деепричастие (украшая) gerundive (converb)
indic Mood=Ind изъявительное наклонение (украшаю, украшал, украшу) indicative mood
imper Mood=Imp повелительное наклонение (украшай) imperative mood
- imper2 Mood=Imp форма повелительного наклонения 1 л. мн. ч. на -те (идемте) second imperative (imperative on -мте)
praet Tense=Past прошедшее время (украшали, украшавший, украсив) past tense
praes Tense=Pres настоящее время (украшаем, украшающий, украшая) present tense
fut Tense=Fut будущее время (украсим); у глаголов несовершенного вида сложная форма размечается в два слова как буду + инфинитив future tense
1p Person=1 первое лицо (украшаю) first person
2p Person=2 второе лицо (украшаешь) second person
3p Person=3 третье лицо (украшает) third person
- persn личное имя (Иван, Дарья, Леопольд, Эстер, Гомер, Маугли) name of a person, first, given name
- patrn отчество (Иванович, Павловна) patronymic name
- famn фамилия (Николаев, Волконская, Гумбольдт) family name, second name
- zoon кличка животного (Шарик, Дочка) zoonym
- 0 несклоняемое (шоссе, Седых) indeclinable
- anom аномальная форма (различного рода морфологические аномалии, возможные у устаревших или просторечных нелитературных форм (три дни при нормативном три дня, ляжь при нормативном ляг)) grammatically anomalous form
- distort Typo=Yes искаженная форма (орфографическое и/или фонетическое искажение слова, часто передающее различные особенности произношения (дэвушка, това’ищи, про-хо-ди, низнаю)) distorted form
- ciph цифровая запись (запись числительного, числительного-прилагательного или прилагательного (полностью или частично) при помощи цифр (73, LXXIII, 73-й, 22-летний). Для этих словоформ в поле «Лемма» также употребляется цифровая запись; число и падеж указываются только в тех случаях, когда выписано окончание (типа 14-му)) digital
- abbr Abbr=Yes сокращение (сокращенная запись (тов., гг., ч.). В поле «Лемма» сокращение (кроме инициалов) раскрывается, указывается грамматическая форма, соответствующая контексту. Специально отметим, что акронимы вроде ООН, вуз и усеченные слова вроде зав, зам, записываемые без точки и не раскрываемые при чтении, не получают пометы abbr и трактуются как обычные слова (склоняемые или несклоняемые)) abbreviation