You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Base form constructing goes wrong somewhere with numeral compounds.
Examples:
> satakuusikymmentäviisi
satakuusikymmentäviisi sa#kuu#kymmen Par#viisi Num Nom Sg 0,000000
satakuusikymmentäviisi sa#kuusikymmentä#viisi Num Nom Sg 0,000000
> kolmattasataa
kolmattasataa kolma Ord Par#sata Num Par Sg 0,000000
> viidettäkymmentä
viidettäkymmentä vii Abe#kymmenen Num Par Sg 0,000000
viidettäkymmentä viide Ord Par#kymmenen Num Par Sg 0,000000
> satavuotias
satavuotias sa#-vuotias A Pos Nom Sg 0,000000
satavuotias sata#vuotias A Pos Nom Sg 0,000000
satavuotias sata#vuotias N Nom Sg 0,000000
Original issue reported on code.google.com by juha.kuo...@gmail.com on 13 Jun 2014 at 12:36
The text was updated successfully, but these errors were encountered:
Partly fixed in rev. 131eca1a9470 (removed extra tags before #).
Base forms still go wrong. Also, digits and acronyms get those extra tags. Cf.:
> viisiviivainen
viisiviivainen vii#-viivainen A Pos Nom Sg 0,000000
> hiisiviivainen
hiisiviivainen hiisi#-viivainen A Pos Nom Sg 0,000000
> 5-viivainen
5-viivainen 5 Digit#-viivainen A Pos Nom Sg 0,000000
> 10-kuva
10-kuva 10 Digit#kuva N Nom Sg 0,000000
> A-ryhmä
A-ryhmä A N Abbr#ryhmä N Nom Sg 0,000000
A-ryhmä a N Abbr#ryhmä N Nom Sg 0,000000
With truncated forms, numerals and acronyms also get inflection tags which
should be deleted:
> A-
A- A N Abbr TrunCo 0,000000
A- a N Abbr TrunCo 0,000000
> viisi-
viisi- viisi Num Nom Sg TrunCo 0,000000
Nouns and adjectives, in contrast, successfully delete their tags but get some
stem material instead(!):
> hiisi-
hiisi- hiisi Nsi TrunCo 0,000000
> oma-
oma- oma Aa TrunCo 0,000000
Original comment by juha.kuo...@gmail.com on 17 Jun 2014 at 11:00
Currently at:
> satakuusikymmentäviisi
satakuusikymmentäviisi sata#kuusikymmentä#viisi Num Nom Sg 2,001953
satakuusikymmentäviisi sata#kuusi#kymmen#viisi Num Nom Sg 3,002930
> kolmattasataa
kolmattasataa kolmassadas Num Ord Par Sg 0,000000
kolmattasataa kolmatta#sata Num Par Sg 1,000977
> viidettäkymmentä
viidettäkymmentä viide#kymmenen Num Par Sg 1,000977
viidettäkymmentä viidet#kymmenen Num Par Sg 1,000977
> satavuotias
satavuotias sata#-vuotias A Pos Nom Sg 1,000977
satavuotias sata#vuotias A Pos Nom Sg 1,000977
satavuotias sata#vuotias N Nom Sg 1,000977
> viisiviivainen
viisiviivainen viisi#-viivainen A Pos Nom Sg 1,000977
> 5-viivainen
5-viivainen 5 Digit#-viivainen A Pos Nom Sg 1,000977
> 10-kuva
10-kuva 10 Digit#kuva N Nom Sg 1,000977
> A-ryhmä
A-ryhmä A N Abbr#ryhmä N Nom Sg 1,000977
A-ryhmä a N Abbr#ryhmä N Nom Sg 1,000977
> A-
A- A N Abbr TrunCo 0,000000
A- a N Abbr TrunCo 0,000000
> viisi-
viisi- viisi Num Nom Sg TrunCo 0,000000
> hiisi-
hiisi- hiisi N TrunCo 0,000000
Exactly correct versions require two things: rewriting numeral inflection to
split compound-facing and compound-final parts and a test suite.
Original comment by ffFlammie@gmail.com on 20 Jun 2014 at 11:19
Original issue reported on code.google.com by
juha.kuo...@gmail.com
on 13 Jun 2014 at 12:36The text was updated successfully, but these errors were encountered: