Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

nicht-erkannte Komposita (compound words) #1774

Open
danielnaber opened this issue Jul 31, 2019 · 0 comments

Comments

@danielnaber
Copy link
Member

commented Jul 31, 2019

Das hunspell-Wörterbuch kennt viele Komposita, viele aber auch nicht. Nicht erkannt werden z.B.:

  • Releaseprozess
  • Visumvergabe
  • Visumsvergabe

Das ist ein Problem weil 1) die Wörter nicht erkannt werden und 2) die Vorschläge genau falsch sind ("Release Prozess"), also Fehler einführen.

Mögliche Lösungen:

  1. (nur Punkt 2): diese Vorschläge (Nomen + Leerzeichen + Nomen) nicht mehr anzeigen
  2. wir erweitern das Hunspell-Wörterbuch, d.h. fügen zu mehr Wörtern Flags hinzu, die sie als Komposita-Teile erlauben. Problem: viel manuelle Arbeit und es werden immer Wörter fehlen
  3. über Statistik entscheiden, ob das Kompositum korrekt ist. Braucht große Textmengen mit aktuellen und heterogenen und am besten trotzdem fehlerfreien Texten.
  4. Sonstige Ideen?

Keywords: Kompositum, zusammengeschrieben, Nomen, Substantive

@danielnaber danielnaber added the German label Jul 31, 2019

danielnaber added a commit that referenced this issue Aug 1, 2019

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
1 participant
You can’t perform that action at this time.