You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Заметил одну очень неприятную особенность. Если одни и те же данные (100%) в одном случае записать в один файл, а в другом случае в несколько файлов, то во втором случае извлекается большее количество фактов, причем значительно. Как будто бы из большого файла просто отсекается кусок определенного размера, а остальное игнорируется. Как подтверждение данной гипотезы, могу сказать, что и время обработки одного большого файла значительно меньше, чем обработка нескольких файлов. Использую параметр Dir="dir_name" в config.proto. Никаких ошибок не выводится. Есть этому какое-то разумное объяснение?
P.S. Я знаю о параметре File="file_name", но у меня ситуация такая, что таких файлов может быть какое-угодно количество, соответственно использую параметр Dir.
The text was updated successfully, but these errors were encountered:
Попробуйте изменить параметры конфига MaxFactsCountPerSentence и MaxNamesCount.
Если это не изменит результата, то напишите как воспроизвести проблему.
Заметил одну очень неприятную особенность. Если одни и те же данные (100%) в одном случае записать в один файл, а в другом случае в несколько файлов, то во втором случае извлекается большее количество фактов, причем значительно. Как будто бы из большого файла просто отсекается кусок определенного размера, а остальное игнорируется. Как подтверждение данной гипотезы, могу сказать, что и время обработки одного большого файла значительно меньше, чем обработка нескольких файлов. Использую параметр Dir="dir_name" в config.proto. Никаких ошибок не выводится. Есть этому какое-то разумное объяснение?
P.S. Я знаю о параметре File="file_name", но у меня ситуация такая, что таких файлов может быть какое-угодно количество, соответственно использую параметр Dir.
The text was updated successfully, but these errors were encountered: