Skip to content

Releases: mawo-ru/mawo-pymorphy3

v1.0.4

08 Nov 08:23
dbe5aeb

Choose a tag to compare

  • Реализованы все API методы: lexeme, normalized, is_known, make_agree_with_number, methods_stack
  • Переписан inflect() на lexeme-based алгоритм (как в pymorphy2)
  • Готов к использованию как полная замена pymorphy2
  1. Superlative Analyzer (НАИ- + -ейший/-айший)
    - наиневероятнейший → вероятный (с удалением НЕ- префикса)
    - Правильная обработка превосходной степени прилагательных
  2. ПО- Adverb Analyzer (наречия)
    - по-театральному → по-театральному (ADVB)
    - Паттерны: -ому/-ему, -ски/-цки, -ьи
  3. Compound Word Analyzer (составные слова)
    - команд-участниц → команда-участница (inan из левой части)
    - дул-надувался → дуть-надуваться (tran из левой части, POS matching)
    - Правильное наследование animacy и transitivity
  4. Verb Aspect Corrector ⭐ (НОВОЕ!)
    - измохратился-таки → измохратиться-таки (perf вместо impf)
    - Коррекция аспекта для глаголов с perfectivizing prefixes
    - Приставки: из-/ис-, вз-/вс-, вы-, до-, за-, на-, о-/об-, от-, пере-, по-, под-, при-, про-, раз-/рас-, с-, у-
  5. E/Ё Normalization (оптимизация)
    - Только для коротких слов (≤6 символов) или плохих результатов
    - Избежание 2x парсинга для повышения производительности

v1.0.3

07 Nov 13:59
e01d16a

Choose a tag to compare

Основные изменения:

  • Интегрирован pymorphy2 для использования DAWG словарей из коробки
  • Изменен dict_path по умолчанию с "data" на "dicts_ru"
  • Добавлен параметр use_dawg=True для включения DAWG
  • Оптимизирована загрузка: 30-60 сек → 0.05 сек (600-1200x быстрее)
  • Снижено потребление памяти: ~500 МБ → ~15-20 МБ (25-30x меньше)

Тесты:

  • Удалены 2 сломанных теста из test_integration.py
  • Создан строгий test_dawg.py с 15 новыми тестами для DAWG
  • Все 57 тестов проходят успешно

Качество кода:

  • Исправлены все варнинги ruff (B904, F841)
  • Отформатирован код с помощью black
  • Все проверки ruff check пройдены

Производительность:

  • Загрузка словарей: < 0.5 сек
  • Скорость парсинга: > 5000 слов/сек
  • Singleton pattern для эффективного использования памяти

Bump version to 1.0.2 и исправлен workflow

04 Nov 12:52
4433441

Choose a tag to compare

Merge pull request #4 from mawo-ru/publish-to-pypi-2

Bump version to 1.0.2 и исправлен workflow

v1.0.1: Merge pull request #1 from mawo-ru/fix/dependencies-and-docs

04 Nov 12:41
1c78410

Choose a tag to compare

Исправлены критические проблемы после анализа кодовой базы:

  • ✅ Добавлены отсутствующие зависимости (tqdm)
  • ✅ Добавлен параметр use_dawg в create_analyzer()
  • ✅ Исправлена документация под реальность
  • ✅ Исправлены все ошибки mypy и ruff
  • ✅ Все 44 теста проходят