Permalink
8d7924d Nov 28, 2016
54 lines (38 sloc) 2.25 KB

Морфологический анализатор pymorphy2

pymorphy2 написан на языке Python (работает под 2.7 и 3.3+). Он умеет:

  1. приводить слово к нормальной форме (например, "люди -> человек", или "гулял -> гулять").
  2. ставить слово в нужную форму. Например, ставить слово во множественное число, менять падеж слова и т.д.
  3. возвращать грамматическую информацию о слове (число, род, падеж, часть речи и т.д.)

При работе используется словарь OpenCorpora; для незнакомых слов строятся гипотезы. Библиотека достаточно быстрая: в настоящий момент скорость работы - от нескольких тыс слов/сек до > 100тыс слов/сек (в зависимости от выполняемой операции, интерпретатора и установленных пакетов); потребление памяти - 10...20Мб; полностью :ref:`поддерживается <char-substitutes>` буква ё.

Лицензия - MIT. Если вы используете pymorphy2 в научной работе, см. также раздел :ref:`citing`.

Содержание

Исходный код - на github. Если заметили ошибку, то пишите в баг-трекер. Для обсуждения есть гугл-группа; если есть какие-то вопросы - пишите туда.