Special analyzers #39

Open
wants to merge 6 commits into
from

Conversation

Projects
None yet
2 participants
@kmike
Owner

kmike commented Oct 9, 2013

Идея в том, чтоб на основе словаря кроме основного анализатора строить еще несколько специализированных. Например, отдельный анализатор для имен и фамилий, с помощью которого можно было бы более точно разбирать и склонять имена-фамилии, или то же самое для географических названий. Строятся такие анализаторы на словах, у которых указаны соответствующие граммемы.

Есть 2 сценария их использования:

а) отдельно - если известно, что на входе точно геогр. название, можно использовать специальный анализатор вместо общего;
б) интегрировано с "главным" анализатором - для слов кроме обычных гипотез строятся гипотезы, основанные на предположении о том, что слово - имя/фамилия/геогр. название. Например, в случае, если слово пишется с заглавной буквы, или если слова нет в словаре.

Чтоб это смерджить, требуется еще работа, т.к., насколько помню, качество разбора было далеко не идеальным. Сама идея мне все еще кажется правильной.

@kuraga

This comment has been minimized.

Show comment Hide comment
@kuraga

kuraga May 10, 2016

👍

kuraga commented May 10, 2016

👍

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment