Skip to content

Releases: malakhovks/ken

v3.3.4: Update project description

26 Oct 09:29
b3d1604
Compare
Choose a tag to compare

📚 Docs

  • updated project description.

👥 Contributors

@malakhovks

v3.3.3: Bug fixes of deployment process

11 Jul 11:45
8aa6b32
Compare
Choose a tag to compare

🔴 Bug fixes

  • updated up to python:3.7.17-slim-bookworm base docker image;
  • fixes wine installation/setup on Debian 12 Bookworm.

👥 Contributors

@malakhovks

v3.3.2, 2020-05-01

01 May 08:03
84270f0
Compare
Choose a tag to compare

🔴 Виправлення помилок

ENG🇬🇧

  • виправлено помилку nlp.max_length limit exceeded:
    Text of length 1195652 exceeds maximum of 1000000. The parser and NER models require roughly 1GB of temporary memory per 100,000 characters in the input. This means long texts may cause memory allocation errors. If you're not using the parser or NER, it's probably safe to increase the nlp.max_length limit. The limit is in number of characters, so you can check whether your inputs are too long by checking len(text).
    Встановлено ліміт NLP_EN.max_length = 5000000;

  • виправлено помилку ImportError: cannot import name 'escape' from 'jinja2':
    This happens because Jinja has removed those functions in a recent version — 3.1.0 — released on March 24th, 2022.

    Markup and escape should be imported from MarkupSafe.

    You have two options form here:

    1. either this error comes from one of your dependency.
      The first thing you should consider is to upgrade the said dependence(s). If this is not possible, what you can do, from here is to downgrade your Jinja version to a version that would still include escape, for example, adding it explicitly in your requirements.txt:
    jinja2<3.1.0
    
    1. or, your error is from code you wrote, so you can fix it by importing it from MarkupSafe, as suggested in the Jinja release notes.

    So, you should use

    from markupsafe import escape

    instead of

    from jinja2 import escape

    При використанні Flask==1.1.2 треба зафікмувати наступні залежності: jinja2<3.1.0; itsdangerous==2.0.1, Werkzeug<2.0.0;

  • дрібні виправлення коду.

⚠️ Зауваження

ENG🇬🇧

  • оновлено бібліотеку spaCy до версії 3.0.6;
  • встановлено keepalive_timeout 1050 для nginx;

v3.3.1, 2020-04-21

22 Apr 06:51
29ed112
Compare
Choose a tag to compare
  • fix fetch of parce.xml on client
  • update to v3.3.1

v3.3.0, 2020-04-21

21 Apr 08:38
Compare
Choose a tag to compare

⚠️ Зауваження

  • ENG🇬🇧 Змінено URL кінцевої точки API для отримання XML-структуру parce.xml:
    було:
    host[:port]/ken/api/en/file/parcexml
    стало:
    host[:port]/ken/api/en/parcexml
    Відтепер для обробки/аналізу текстів у вигляді повідомлень та файлів діє одна й та сама кінцева точка API: host[:port]/ken/api/en/parcexml.

🏭 Нові можливості

  • ENG🇬🇧 Додано API для обробки/аналізу текстів (а саме, отримання parce.xml) у вигляді повідомлень. Приклад вхідних даних:

    {
      "message": "After the vision of the Semantic Web was broadcasted at the turn of the millennium, ontology became a synonym for the solution to many problems concerning the fact that computers do not understand human language: if there were an ontology and every document were marked up with it and we had agents that would understand the mark-up, then computers would finally be able to process our queries in a really sophisticated way. Some years later, the success of Google shows us that the vision has not come true, being hampered by the incredible amount of extra work required for the intellectual encoding of semantic mark-up – as compared to simply uploading an HTML page."
    }

    HTTP method: POST
    Кінцева точка: host[:port]/ken/api/en/parcexml

👍 Покращення

  • UKR🇺🇦 ENG🇬🇧 Оновлено опис API для обробки/аналізу текстів у вигляді повідомлень та файлів для Англійської та Української мов у файлі HELP.md.

🔴 Виправлення помилок

  • UKR🇺🇦 ENG🇬🇧 дрібні виправлення.

v3.2.0, 2021-04-16

16 Apr 10:14
4df3aec
Compare
Choose a tag to compare

⚠️ Зауваження

  • ENG🇬🇧 оновлено бібліотеку spaCy до версії 3.0.5;
  • ENG🇬🇧 оновлено модель бібліотеки spaCy для англійської мови en_core_web_sm до версії 3.0.0;
  • оновлено бібліотеку pdfminer.six до версії 20201018;
  • оновлено бібліотеку flask-cors до версії 3.0.10;
  • ENG🇬🇧 додано нові документи для тестування сервісів для Англійської мови;
  • ENG🇬🇧 Змінено URL кінцевої точки API для отримання XML-структуру allterms.xml:
    було:
    host[:port]/ken/api/en/file/allterm
    стало:
    host[:port]/ken/api/en/allterms
    Відтепер для обробки/аналізу текстів у вигляді повідомлень та файлів діє одна й та сама кінцева точка API: host[:port]/ken/api/en/allterms.

🏭 Нові можливості

  • ENG🇬🇧 Додано API для обробки/аналізу текстів (а саме, отримання allterms.xml) у вигляді повідомлень. Приклад вхідних даних:
    {
      "message": "After the vision of the Semantic Web was broadcasted at the turn of the millennium, ontology became a synonym for the solution to many problems concerning the fact that computers do not understand human language: if there were an ontology and every document were marked up with it and we had agents that would understand the mark-up, then computers would finally be able to process our queries in a really sophisticated way. Some years later, the success of Google shows us that the vision has not come true, being hampered by the incredible amount of extra work required for the intellectual encoding of semantic mark-up – as compared to simply uploading an HTML page."
    }
    HTTP method: POST
    Кінцева точка: host[:port]/ken/api/en/allterms

👍 Покращення

  • ENG🇬🇧 покращено обробку складних термінів, зокрема, з трьох слів;
  • UKR🇺🇦 ENG🇬🇧 Оновлено опис API для обробки/аналізу текстів у вигляді повідомлень та файлів для Англійської та Української мов у файлі HELP.md.

🔴 Виправлення помилок

  • UKR🇺🇦 ENG🇬🇧 виправлені помилки відображення/візуалізації залежностей для термінів в елементі #depparse_tab, а саме в #displacy;
  • UKR🇺🇦 ENG🇬🇧 дрібні виправлення.

v3.1.0, 2021-03-02

02 Mar 16:11
5e64230
Compare
Choose a tag to compare

👍 Покращення

  • оновлено бібліотеку spaCy до версії 2.3.5;
  • оновлено модель бібліотеки spaCy en_core_web_sm до версії 2.3.1;
  • elementTree API оновлено до версії python 3.7.9;

🔴 Виправлення помилок

  • виправлено xml declaration (elementTree API оновлено до версії python 3.7.9);
  • дрібні виправлення.

v3.0.3, 2020-10-16

16 Oct 08:59
Compare
Choose a tag to compare

🔴 Виправлення помилок

  • Дрібні виправлення.

v3.0.2, 2020-10-16

16 Oct 08:24
Compare
Choose a tag to compare

👍 Покращення

  • Оновлено платформу Python до версії Python 3.7.9.

🏭 Нові можливості

  • UKR🇺🇦 Додано функцію заповнення контекстів в онтологічному шаблоні (вхідні структури: allterms.xml та structure.xml).

🔴 Виправлення помилок

  • Дрібні виправлення.

v1.0.5, 2019-12-11

11 Dec 10:00
Compare
Choose a tag to compare

🔴 Виправлення помилок

  • Виправлено помилку при нумерації в тегах <relup>/<reldown> файлу allterms.xml.
    Нумерація в тегах <relup>/<reldown> файлу allterms.xml починається з 0.
  • Виправлення JavaScript на клієнті згідно нової нумерації в тегах <relup>/<reldown>, <sentpos> файлу allterms.xml.