- рефакторинг: теперь при необходимости можно дописывать свои "шаги" морфологического анализа ("предсказатели") и комбинировать их с существующими (документация пока не готова, и API может поменяться);
- на вход больше не обязательно подавать слова в нижнем регистре
(но на выходе при этом регистр сохраняться не обязан - используйте
функцию
pymorphy2.shapes.restore_word_case
, если требуется восстановить регистр полученных слов); - улучшено предсказание неизвестных слов по словообразовательным префиксам (учитывается больше таких префиксов);
- реализован разбор (и склонение) слов с дефисами;
- результаты разбора теперь включают в себя полную информацию о том,
как слово разбиралось; наличие
para_id
иidx
при этом больше не обязательно; - анализатор теперь отмечает пунктуацию тегом PNCT, числа - тегом NUMB, слова, записанные латиницей - тегом LATN;
- улучшено предсказание по неизвестному префиксу (добавлено ограничение по граммеме Apro);
- улучшения в тестах и бенчмарках;
- удален атрибут
morph.dict_meta
(используйтеmorph.dictionary.meta
); - удален (возможно, временно) метод
MorphAnalyzer.inflect
(используйте методinflect
у результата разбора); - удален метод
MorphAnalyzer.decline
(используйтеparse.lexeme
); - удалено свойство
Parse.paradigm
.
В результате этих изменений улучшилось качество разбора, качество склонения и возможности по расширению библиотеки (втч для настройки под конкретную задачу), но скорость работы "из коробки" по сравнению с 0.2 снизилась примерно на треть.
- улучшения в предсказателе: учет словоизменительных префиксов;
- улучшения в предсказателе: равноценные варианты разбора не отбрасываются;
- изменена схема проверки совместимости словарей;
- изменен формат словарей (нужно обновить pymorphy2-dicts до 2.0);
- добавлено свойство
Parse.paradigm
.
Первый альфа-релиз. Релизована основа: эффективный разбор и склонение, обновление словарей, полная поддержка буквы ё.
Многие вещи, которые были доступны в pymorphy, пока не работают (разбор слов с дефисом, разбор фамилий, поддержка шаблонов django, утилиты из contrib).
Кроме того, API пока не зафиксирован и может меняться в последующих релизах.