Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Извлекаются не все факты из текста. #150

Open
KotIva opened this issue Apr 15, 2022 · 7 comments
Open

Извлекаются не все факты из текста. #150

KotIva opened this issue Apr 15, 2022 · 7 comments

Comments

@KotIva
Copy link

KotIva commented Apr 15, 2022

Есть ли какие-нибудь ограничения на количество слов, которые могут попадать в извлекаемые факты? Например если запустить на распознавание текст, то скажем извлеклось 3 факта из 6 , которые находятся в тексте, далее если уменьшить размер первых 3 фактов (удалить половину текста) и вновь отправить текст на распознавание , извлекается уже 5 фактов из 6. Какие на это могут влиять ограничения и можно ли как-то их изменить (увеличить)

@victorbocharov
Copy link
Contributor

Ограничения на количество слов нет. Приведите, пожалуйста, минимальный пример (грамматика, словари, газетиры, ...), который демонстрировал бы проблему. Тогда я смогу посмотреть.

@KotIva
Copy link
Author

KotIva commented Apr 18, 2022

А ограничение на длину извлекаемой цепочки есть? Как вы себе представляете приведение примера?

@victorbocharov
Copy link
Contributor

victorbocharov commented Apr 18, 2022

Есть ограничение на количество фактов в рамках одного предложения:

optional uint32 MaxFactsCountPerSentence = 19 [default = 25];

А ограничение на длину извлекаемой цепочки есть?

Не могу вспомнить ограничений на длину цепочки.

Как вы себе представляете приведение примера?

Сделайте отдельный проект, который демнострирует проблему, о которой вы пишете, но не делает ничего больше. Скопируйте в комментарии к этому тикету каждый файл (грамматики, газетиры, словари, конфиг). Добавьте входной файл, на котором будет видна проблема. Файл должен быть достаточным для демонстрации проблемы, но не более того.

@KotIva
Copy link
Author

KotIva commented Apr 18, 2022

А что значит количество фактов в рамках одного предложения?

@victorbocharov
Copy link
Contributor

Вначале парсер делит текст на предложения. Факты выделяются только внутри одного предложения. Если на одно предложение сгенерируется MaxFactsCountPerSentence фактов, то он остановит разбор этого предложения и не сгенерирует на него больше никаких фактов.

@KotIva
Copy link
Author

KotIva commented Apr 19, 2022

А как изменить этот параметр?

@victorbocharov
Copy link
Contributor

В config.proto поставьте MaxFactsCountPerSentence=нужное значение

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants