Парсинг ФИО #111

presto78 · 2019-04-25T08:01:23Z

Доброго времени суток! Парсинг ФИО с использованием kwtype fio работает только если в тексте используются фамилия, имя и отчество с заглавными буквами.
Если ли возможность использовать парсер для ФИО, если весь текст написан строчными буквами? Данная задача может быть актуальна в случае распознавания текста, когда от алгоритма распознавания текст приходит в одном регистре.
Или же в tomita распознавание ФИО основано не на словаре, а именно на присутствии заглавных букв в словах?

ikor20 · 2019-04-25T12:25:17Z

Попробуйте указать в конфиге:
IgnoreUpperCase = true;
Сам не пробовал, но вот тут написано, что должно помочь - src/FactExtract/Parser/common/textminerconfig.proto

victorbocharov · 2020-11-01T15:24:56Z

Для истории: у меня не получилось с IgnoreUpperCase. Похоже, что это баг.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Парсинг ФИО #111

Парсинг ФИО #111

presto78 commented Apr 25, 2019

ikor20 commented Apr 25, 2019

victorbocharov commented Nov 1, 2020

Парсинг ФИО #111

Парсинг ФИО #111

Comments

presto78 commented Apr 25, 2019

ikor20 commented Apr 25, 2019

victorbocharov commented Nov 1, 2020