Silbentrennungsalgorithmus



  • Seit einiger Zeit beschäftigt mich das Thema „Silbentrennung“. Das scheint für eigene Projekte aber wohl nicht so einfach zu sein, denn ich habe nach langer Suche nichts wirklich Brauchbares gefunden.

    Auch den „neuen“ Worttrennungsalgorithmus, der von Frank Liang 1983 für TeX82 entwickelt wurde, habe ich mir angesehen. Leider ist der für Deutsch, wo es eine praktisch beliebige Anzahl von Komposita gibt, die nicht bei Erzeugung der Trennmuster berücksichtigt werden können, völlig unbrauchbar.

    Hat vielleicht hier jemand eine „zündende“ Idee oder einen weiterführenden Link?



  • Hm... Ich habe mal ein Projekt mit OpenNLP gemacht. Dort ging es eher um Worterkennung (ist WORT ein Name?) innerhalb eines Satzes. Aber vielleicht schaust du da mal rein, ob es auch eine Funktion zur Silbentrennung gibt. Ansonsten ist NLP wahrscheinlich ein guter Suchbegriff. Generell funktionierte (zumindest damals) NLP mit Englisch wesentlich besser als mit Deutsch.



  • Hm ... danke für den OpenNLP-Tipp. Kannte ich nicht, klingt aber sehr interessant. Eine Funktion zur Silbentrennung gibt in NLP aber leider nicht.

    Noch andere Vorschläge?



  • Ich weiß, der Thread ist etwas älter aber hier vielleicht noch ein Hinweis, habe ich selbst schon benutzt und hat ganz gut funktioniert:

    google: hyphenation nhunspell


Log in to reply