Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Compound numerals get flawed ftb3 base forms #3

Open
GoogleCodeExporter opened this issue Mar 18, 2015 · 2 comments
Open

Compound numerals get flawed ftb3 base forms #3

GoogleCodeExporter opened this issue Mar 18, 2015 · 2 comments

Comments

@GoogleCodeExporter
Copy link

Base form constructing goes wrong somewhere with numeral compounds.
Examples:

> satakuusikymmentäviisi
satakuusikymmentäviisi  sa#kuu#kymmen Par#viisi Num Nom Sg      0,000000
satakuusikymmentäviisi  sa#kuusikymmentä#viisi Num Nom Sg       0,000000

> kolmattasataa
kolmattasataa   kolma Ord Par#sata Num Par Sg   0,000000

> viidettäkymmentä
viidettäkymmentä        vii Abe#kymmenen Num Par Sg     0,000000
viidettäkymmentä        viide Ord Par#kymmenen Num Par Sg       0,000000

> satavuotias
satavuotias     sa#-vuotias A Pos Nom Sg        0,000000
satavuotias     sata#vuotias A Pos Nom Sg       0,000000
satavuotias     sata#vuotias N Nom Sg   0,000000


Original issue reported on code.google.com by juha.kuo...@gmail.com on 13 Jun 2014 at 12:36

@GoogleCodeExporter
Copy link
Author

Partly fixed in rev. 131eca1a9470 (removed extra tags before #).

Base forms still go wrong. Also, digits and acronyms get those extra tags. Cf.:

> viisiviivainen
viisiviivainen  vii#-viivainen A Pos Nom Sg     0,000000

> hiisiviivainen
hiisiviivainen  hiisi#-viivainen A Pos Nom Sg   0,000000

> 5-viivainen
5-viivainen     5 Digit#-viivainen A Pos Nom Sg 0,000000

> 10-kuva
10-kuva 10 Digit#kuva N Nom Sg  0,000000

> A-ryhmä
A-ryhmä A N Abbr#ryhmä N Nom Sg 0,000000
A-ryhmä a N Abbr#ryhmä N Nom Sg 0,000000

With truncated forms, numerals and acronyms also get inflection tags which 
should be deleted:

> A-
A-      A N Abbr TrunCo 0,000000
A-      a N Abbr TrunCo 0,000000

> viisi-
viisi-  viisi Num Nom Sg TrunCo 0,000000

Nouns and adjectives, in contrast, successfully delete their tags but get some 
stem material instead(!):

> hiisi-
hiisi-  hiisi Nsi TrunCo        0,000000

> oma-
oma-    oma Aa TrunCo   0,000000

Original comment by juha.kuo...@gmail.com on 17 Jun 2014 at 11:00

@GoogleCodeExporter
Copy link
Author

Currently at:

> satakuusikymmentäviisi
satakuusikymmentäviisi sata#kuusikymmentä#viisi Num Nom Sg    2,001953
satakuusikymmentäviisi sata#kuusi#kymmen#viisi Num Nom Sg  3,002930

> kolmattasataa
kolmattasataa   kolmassadas Num Ord Par Sg  0,000000
kolmattasataa   kolmatta#sata Num Par Sg    1,000977

> viidettäkymmentä
viidettäkymmentä  viide#kymmenen Num Par Sg   1,000977
viidettäkymmentä  viidet#kymmenen Num Par Sg  1,000977

> satavuotias
satavuotias sata#-vuotias A Pos Nom Sg  1,000977
satavuotias sata#vuotias A Pos Nom Sg   1,000977
satavuotias sata#vuotias N Nom Sg   1,000977

> viisiviivainen
viisiviivainen  viisi#-viivainen A Pos Nom Sg   1,000977

> 5-viivainen
5-viivainen 5 Digit#-viivainen A Pos Nom Sg 1,000977

> 10-kuva
10-kuva 10 Digit#kuva N Nom Sg  1,000977

> A-ryhmä
A-ryhmä    A N Abbr#ryhmä N Nom Sg    1,000977
A-ryhmä    a N Abbr#ryhmä N Nom Sg    1,000977

> A-
A-  A N Abbr TrunCo 0,000000
A-  a N Abbr TrunCo 0,000000

> viisi-
viisi-  viisi Num Nom Sg TrunCo 0,000000

> hiisi-
hiisi-  hiisi N TrunCo  0,000000

Exactly correct versions require two things: rewriting numeral inflection to 
split compound-facing and compound-final parts and a test suite.

Original comment by ffFlammie@gmail.com on 20 Jun 2014 at 11:19

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant