Releases: mawo-ru/mawo-pymorphy3
Releases · mawo-ru/mawo-pymorphy3
v1.0.4
- Реализованы все API методы: lexeme, normalized, is_known, make_agree_with_number, methods_stack
- Переписан inflect() на lexeme-based алгоритм (как в pymorphy2)
- Готов к использованию как полная замена pymorphy2
- Superlative Analyzer (НАИ- + -ейший/-айший)
- наиневероятнейший → вероятный (с удалением НЕ- префикса)
- Правильная обработка превосходной степени прилагательных - ПО- Adverb Analyzer (наречия)
- по-театральному → по-театральному (ADVB)
- Паттерны: -ому/-ему, -ски/-цки, -ьи - Compound Word Analyzer (составные слова)
- команд-участниц → команда-участница (inan из левой части)
- дул-надувался → дуть-надуваться (tran из левой части, POS matching)
- Правильное наследование animacy и transitivity - Verb Aspect Corrector ⭐ (НОВОЕ!)
- измохратился-таки → измохратиться-таки (perf вместо impf)
- Коррекция аспекта для глаголов с perfectivizing prefixes
- Приставки: из-/ис-, вз-/вс-, вы-, до-, за-, на-, о-/об-, от-, пере-, по-, под-, при-, про-, раз-/рас-, с-, у- - E/Ё Normalization (оптимизация)
- Только для коротких слов (≤6 символов) или плохих результатов
- Избежание 2x парсинга для повышения производительности
v1.0.3
Основные изменения:
- Интегрирован pymorphy2 для использования DAWG словарей из коробки
- Изменен dict_path по умолчанию с "data" на "dicts_ru"
- Добавлен параметр use_dawg=True для включения DAWG
- Оптимизирована загрузка: 30-60 сек → 0.05 сек (600-1200x быстрее)
- Снижено потребление памяти: ~500 МБ → ~15-20 МБ (25-30x меньше)
Тесты:
- Удалены 2 сломанных теста из test_integration.py
- Создан строгий test_dawg.py с 15 новыми тестами для DAWG
- Все 57 тестов проходят успешно
Качество кода:
- Исправлены все варнинги ruff (B904, F841)
- Отформатирован код с помощью black
- Все проверки ruff check пройдены
Производительность:
- Загрузка словарей: < 0.5 сек
- Скорость парсинга: > 5000 слов/сек
- Singleton pattern для эффективного использования памяти
Bump version to 1.0.2 и исправлен workflow
Merge pull request #4 from mawo-ru/publish-to-pypi-2 Bump version to 1.0.2 и исправлен workflow
v1.0.1: Merge pull request #1 from mawo-ru/fix/dependencies-and-docs
Исправлены критические проблемы после анализа кодовой базы:
- ✅ Добавлены отсутствующие зависимости (tqdm)
- ✅ Добавлен параметр use_dawg в create_analyzer()
- ✅ Исправлена документация под реальность
- ✅ Исправлены все ошибки mypy и ruff
- ✅ Все 44 теста проходят