Releases: malakhovks/ken
v3.3.4: Update project description
v3.3.3: Bug fixes of deployment process
🔴 Bug fixes
- updated up to python:3.7.17-slim-bookworm base docker image;
- fixes wine installation/setup on Debian 12 Bookworm.
👥 Contributors
v3.3.2, 2020-05-01
🔴 Виправлення помилок
ENG🇬🇧
-
виправлено помилку
nlp.max_length limit exceeded
:
Text of length 1195652 exceeds maximum of 1000000. The parser and NER models require roughly 1GB of temporary memory per 100,000 characters in the input. This means long texts may cause memory allocation errors. If you're not using the parser or NER, it's probably safe to increase the nlp.max_length limit. The limit is in number of characters, so you can check whether your inputs are too long by checking len(text).
Встановлено лімітNLP_EN.max_length = 5000000
; -
виправлено помилку
ImportError: cannot import name 'escape' from 'jinja2'
:
This happens because Jinja has removed those functions in a recent version — 3.1.0 — released on March 24th, 2022.Markup
andescape
should be imported from MarkupSafe.You have two options form here:
- either this error comes from one of your dependency.
The first thing you should consider is to upgrade the said dependence(s). If this is not possible, what you can do, from here is to downgrade your Jinja version to a version that would still includeescape
, for example, adding it explicitly in your requirements.txt:
jinja2<3.1.0
- or, your error is from code you wrote, so you can fix it by importing it from MarkupSafe, as suggested in the Jinja release notes.
So, you should use
from markupsafe import escape
instead of
from jinja2 import escape
При використанні
Flask==1.1.2
треба зафікмувати наступні залежності:jinja2<3.1.0
;itsdangerous==2.0.1
,Werkzeug<2.0.0
; - either this error comes from one of your dependency.
-
дрібні виправлення коду.
⚠️ Зауваження
ENG🇬🇧
- оновлено бібліотеку spaCy до версії
3.0.6
; - встановлено
keepalive_timeout 1050
для nginx;
v3.3.1, 2020-04-21
- fix fetch of parce.xml on client
- update to v3.3.1
v3.3.0, 2020-04-21
⚠️ Зауваження
- ENG🇬🇧 Змінено URL кінцевої точки API для отримання XML-структуру parce.xml:
було:
host[:port]/ken/api/en/file/parcexml
стало:
host[:port]/ken/api/en/parcexml
Відтепер для обробки/аналізу текстів у вигляді повідомлень та файлів діє одна й та сама кінцева точка API:host[:port]/ken/api/en/parcexml
.
🏭 Нові можливості
-
ENG🇬🇧 Додано API для обробки/аналізу текстів (а саме, отримання parce.xml) у вигляді повідомлень. Приклад вхідних даних:
{ "message": "After the vision of the Semantic Web was broadcasted at the turn of the millennium, ontology became a synonym for the solution to many problems concerning the fact that computers do not understand human language: if there were an ontology and every document were marked up with it and we had agents that would understand the mark-up, then computers would finally be able to process our queries in a really sophisticated way. Some years later, the success of Google shows us that the vision has not come true, being hampered by the incredible amount of extra work required for the intellectual encoding of semantic mark-up – as compared to simply uploading an HTML page." }
HTTP method: POST
Кінцева точка:host[:port]/ken/api/en/parcexml
👍 Покращення
- UKR🇺🇦 ENG🇬🇧 Оновлено опис API для обробки/аналізу текстів у вигляді повідомлень та файлів для Англійської та Української мов у файлі
HELP.md
.
🔴 Виправлення помилок
- UKR🇺🇦 ENG🇬🇧 дрібні виправлення.
v3.2.0, 2021-04-16
⚠️ Зауваження
- ENG🇬🇧 оновлено бібліотеку spaCy до версії
3.0.5
; - ENG🇬🇧 оновлено модель бібліотеки spaCy для англійської мови
en_core_web_sm
до версії3.0.0
; - оновлено бібліотеку
pdfminer.six
до версії20201018
; - оновлено бібліотеку
flask-cors
до версії3.0.10
; - ENG🇬🇧 додано нові документи для тестування сервісів для Англійської мови;
- ENG🇬🇧 Змінено URL кінцевої точки API для отримання XML-структуру allterms.xml:
було:
host[:port]/ken/api/en/file/allterm
стало:
host[:port]/ken/api/en/allterms
Відтепер для обробки/аналізу текстів у вигляді повідомлень та файлів діє одна й та сама кінцева точка API:host[:port]/ken/api/en/allterms
.
🏭 Нові можливості
- ENG🇬🇧 Додано API для обробки/аналізу текстів (а саме, отримання
allterms.xml
) у вигляді повідомлень. Приклад вхідних даних:HTTP method: POST{ "message": "After the vision of the Semantic Web was broadcasted at the turn of the millennium, ontology became a synonym for the solution to many problems concerning the fact that computers do not understand human language: if there were an ontology and every document were marked up with it and we had agents that would understand the mark-up, then computers would finally be able to process our queries in a really sophisticated way. Some years later, the success of Google shows us that the vision has not come true, being hampered by the incredible amount of extra work required for the intellectual encoding of semantic mark-up – as compared to simply uploading an HTML page." }
Кінцева точка:host[:port]/ken/api/en/allterms
👍 Покращення
- ENG🇬🇧 покращено обробку складних термінів, зокрема, з трьох слів;
- UKR🇺🇦 ENG🇬🇧 Оновлено опис API для обробки/аналізу текстів у вигляді повідомлень та файлів для Англійської та Української мов у файлі
HELP.md
.
🔴 Виправлення помилок
- UKR🇺🇦 ENG🇬🇧 виправлені помилки відображення/візуалізації залежностей для термінів в елементі
#depparse_tab
, а саме в#displacy
; - UKR🇺🇦 ENG🇬🇧 дрібні виправлення.
v3.1.0, 2021-03-02
👍 Покращення
- оновлено бібліотеку spaCy до версії 2.3.5;
- оновлено модель бібліотеки spaCy
en_core_web_sm
до версії 2.3.1; - elementTree API оновлено до версії python 3.7.9;
🔴 Виправлення помилок
- виправлено xml declaration (elementTree API оновлено до версії python 3.7.9);
- дрібні виправлення.
v3.0.3, 2020-10-16
🔴 Виправлення помилок
- Дрібні виправлення.
v3.0.2, 2020-10-16
👍 Покращення
- Оновлено платформу
Python
до версіїPython 3.7.9
.
🏭 Нові можливості
- UKR🇺🇦 Додано функцію заповнення контекстів в онтологічному шаблоні (вхідні структури:
allterms.xml
таstructure.xml
).
🔴 Виправлення помилок
- Дрібні виправлення.
v1.0.5, 2019-12-11
🔴 Виправлення помилок
- Виправлено помилку при нумерації в тегах
<relup>
/<reldown>
файлуallterms.xml
.
Нумерація в тегах<relup>
/<reldown>
файлуallterms.xml
починається з0
. - Виправлення
JavaScript
на клієнті згідно нової нумерації в тегах<relup>
/<reldown>
,<sentpos>
файлуallterms.xml
.