Работа с UnknownWordUnit #5

mikhail-barg · 2016-04-19T12:59:05Z

У меня сложилось представление, что jmorphy не умеет склонять несловарные слова.

К примеру: morph.parse("няшка") возвращает

<ParsedWord: "няшка", "UNKN", "няшка", "няшка", 1,000000, class net.uaprom.jmorphy2.AnalyzerUnit$UnknownWordUnit>

с единственным элементом в getLexeme() и невозможностью склонять.

В то время как pymoprhy2 на morph.parse(u'няшка') отвечает

[Parse(word=u'няшка', tag=OpencorporaTag('NOUN,inan,femn sing,nomn'), normal_form=u'няшка', score=1.0, methods_stack=((<FakeDictionary>, u'няшка', 9, 0), (<KnownSuffixAnalyzer>, u'няшка')))]

а morph.parse(u'няшка')[0].inflect({'gent'}).word выдает ожидаемое u'няшки'.

Это ожидаемое поведение со стороны jmorphy? Или я просто не умею его готовить?

The text was updated successfully, but these errors were encountered:

anti-social · 2016-04-20T21:44:41Z

Да, нахождение слова по известному суффиксу не реализовано. Склонение также не реализовано. Мне просто была нужна только нормальная форма слова для стемминга в Solr и Elasticsearch.

Постараюсь в ближайшее время довести до ума.

Known suffix analyzer #5

anti-social · 2017-05-16T16:36:17Z

8dfc03d#diff-0c6c4b5cd2c87b5d3355162634a05297R82

anti-social added a commit that referenced this issue Oct 5, 2016

Known suffix analyzer #5

8dfc03d

anti-social added a commit that referenced this issue Nov 21, 2016

Merge pull request #9 from anti-social/dev/known_suffix

62fd98d

Known suffix analyzer #5

anti-social closed this as completed May 16, 2017

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Работа с UnknownWordUnit #5

Работа с UnknownWordUnit #5

mikhail-barg commented Apr 19, 2016

anti-social commented Apr 20, 2016

anti-social commented May 16, 2017

Работа с UnknownWordUnit #5

Работа с UnknownWordUnit #5

Comments

mikhail-barg commented Apr 19, 2016

anti-social commented Apr 20, 2016

anti-social commented May 16, 2017