## Морфологический анализ с использованием pymorphy2

In [3]:
import pymorphy2

Заводим морфологический анализатор `m`:

In [4]:
m = pymorphy2.MorphAnalyzer()

Получим разбор для любой словоформы:

In [5]:
m.parse('подать')

[Parse(word='подать', tag=OpencorporaTag('INFN,perf,tran'), normal_form='подать', score=0.92, methods_stack=((<DictionaryAnalyzer>, 'подать', 843, 0),)),
 Parse(word='подать', tag=OpencorporaTag('NOUN,inan,femn sing,nomn'), normal_form='подать', score=0.04, methods_stack=((<DictionaryAnalyzer>, 'подать', 13, 0),)),
 Parse(word='подать', tag=OpencorporaTag('NOUN,inan,femn sing,accs'), normal_form='подать', score=0.04, methods_stack=((<DictionaryAnalyzer>, 'подать', 13, 3),))]

Каждый разбор состоит из исходной словоформы, набора граммем, леммы, значения вероятности разбора, также указаны внутренние методы разбора. Запишем список разборов в переменную:

In [6]:
full_parse = m.parse('подать')

Теперь можно вывести различные части разбора (например, первого):

In [9]:
# лемма
full_parse[0].normal_form

'подать'

In [10]:
# тег
full_parse[0].tag

OpencorporaTag('INFN,perf,tran')

In [11]:
# значения различных грамматических категорий
# full_parse[0].tag.aspect
# full_parse[0].tag.number
# full_parse[0].tag.gender
full_parse[1].tag.animacy
# full_parse[0].tag.tense
# ...

'inan'

In [12]:
# кириллическое представление тега
full_parse[0].tag.cyr_repr

'ИНФ,сов,перех'

Также для разбора можно получить полную парадигму соответствующей леммы:

In [16]:
full_parse[1].lexeme

[Parse(word='подать', tag=OpencorporaTag('NOUN,inan,femn sing,nomn'), normal_form='подать', score=1.0, methods_stack=((<DictionaryAnalyzer>, 'подать', 13, 0),)),
 Parse(word='подати', tag=OpencorporaTag('NOUN,inan,femn sing,gent'), normal_form='подать', score=1.0, methods_stack=((<DictionaryAnalyzer>, 'подати', 13, 1),)),
 Parse(word='подати', tag=OpencorporaTag('NOUN,inan,femn sing,datv'), normal_form='подать', score=1.0, methods_stack=((<DictionaryAnalyzer>, 'подати', 13, 2),)),
 Parse(word='подать', tag=OpencorporaTag('NOUN,inan,femn sing,accs'), normal_form='подать', score=1.0, methods_stack=((<DictionaryAnalyzer>, 'подать', 13, 3),)),
 Parse(word='податью', tag=OpencorporaTag('NOUN,inan,femn sing,ablt'), normal_form='подать', score=1.0, methods_stack=((<DictionaryAnalyzer>, 'податью', 13, 4),)),
 Parse(word='подати', tag=OpencorporaTag('NOUN,inan,femn sing,loct'), normal_form='подать', score=1.0, methods_stack=((<DictionaryAnalyzer>, 'подати', 13, 5),)),
 Parse(word='подати', tag=

Или вывести определённую форму:

In [14]:
full_parse[1].inflect({'gent'}).word

'подати'

Если заданной граммемы у слова быть не может, функция `inflect` не вернёт ничего:

In [17]:
full_parse[1].inflect({'perf'})

pymorphy2 умеет предсказывать разборы для слов, которых нет в словаре:

In [18]:
m.parse('калушата')

[Parse(word='калушата', tag=OpencorporaTag('ADJS,Qual femn,sing'), normal_form='калушатый', score=0.2857142857142857, methods_stack=((<DictionaryAnalyzer>, 'ушата', 4, 28), (<UnknownPrefixAnalyzer>, 'кал'))),
 Parse(word='калушата', tag=OpencorporaTag('NOUN,inan,masc sing,gent'), normal_form='калушат', score=0.2857142857142857, methods_stack=((<DictionaryAnalyzer>, 'ушата', 33, 1), (<UnknownPrefixAnalyzer>, 'кал'))),
 Parse(word='калушата', tag=OpencorporaTag('NOUN,anim,masc,Name sing,nomn'), normal_form='калушата', score=0.2857142857142857, methods_stack=((<DictionaryAnalyzer>, 'ата', 31, 0), (<UnknownPrefixAnalyzer>, 'калуш'))),
 Parse(word='калушата', tag=OpencorporaTag('NOUN,anim,masc plur,nomn'), normal_form='калушонок', score=0.14285714285714285, methods_stack=((<FakeDictionary>, 'калушата', 274, 6), (<KnownSuffixAnalyzer>, 'ушата')))]

Полный список граммем можно посмотреть в [словаре OpenCorpora](http://opencorpora.org/dict.php?act=gram)