Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Парсинг ФИО #111

Open
presto78 opened this issue Apr 25, 2019 · 2 comments
Open

Парсинг ФИО #111

presto78 opened this issue Apr 25, 2019 · 2 comments

Comments

@presto78
Copy link

Доброго времени суток! Парсинг ФИО с использованием kwtype fio работает только если в тексте используются фамилия, имя и отчество с заглавными буквами.
Если ли возможность использовать парсер для ФИО, если весь текст написан строчными буквами? Данная задача может быть актуальна в случае распознавания текста, когда от алгоритма распознавания текст приходит в одном регистре.
Или же в tomita распознавание ФИО основано не на словаре, а именно на присутствии заглавных букв в словах?

@ikor20
Copy link

ikor20 commented Apr 25, 2019

Попробуйте указать в конфиге:
IgnoreUpperCase = true;
Сам не пробовал, но вот тут написано, что должно помочь - src/FactExtract/Parser/common/textminerconfig.proto

@victorbocharov
Copy link
Contributor

Для истории: у меня не получилось с IgnoreUpperCase. Похоже, что это баг.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants