Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Работа с UnknownWordUnit #5

Closed
mikhail-barg opened this issue Apr 19, 2016 · 2 comments
Closed

Работа с UnknownWordUnit #5

mikhail-barg opened this issue Apr 19, 2016 · 2 comments

Comments

@mikhail-barg
Copy link

У меня сложилось представление, что jmorphy не умеет склонять несловарные слова.

К примеру: morph.parse("няшка") возвращает

<ParsedWord: "няшка", "UNKN", "няшка", "няшка", 1,000000, class net.uaprom.jmorphy2.AnalyzerUnit$UnknownWordUnit>

с единственным элементом в getLexeme() и невозможностью склонять.

В то время как pymoprhy2 на morph.parse(u'няшка') отвечает

[Parse(word=u'няшка', tag=OpencorporaTag('NOUN,inan,femn sing,nomn'), normal_form=u'няшка', score=1.0, methods_stack=((<FakeDictionary>, u'няшка', 9, 0), (<KnownSuffixAnalyzer>, u'няшка')))]

а morph.parse(u'няшка')[0].inflect({'gent'}).word выдает ожидаемое u'няшки'.

Это ожидаемое поведение со стороны jmorphy? Или я просто не умею его готовить?

@anti-social
Copy link
Owner

Да, нахождение слова по известному суффиксу не реализовано. Склонение также не реализовано. Мне просто была нужна только нормальная форма слова для стемминга в Solr и Elasticsearch.

Постараюсь в ближайшее время довести до ума.

anti-social added a commit that referenced this issue Oct 5, 2016
anti-social added a commit that referenced this issue Nov 21, 2016
@anti-social
Copy link
Owner

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants