Wörter auf die Stammform reduzieren?



  • libstemmer oder gibts was besseres? brauch es nur für englisch.



  • 😕



  • Wenn bought -> bought und puppies -> puppi OK ist, dann wird der Snowball Stemmer OK sein.
    Wenn du die "echte" Stammform brauchst (also bought -> buy und puppies -> puppy ), dann wirst du dich um etwas umsehen müssen was ein Wörterbuch verwendet.
    (Sollte für Englisch auch aufzutreiben sein, hab damit aber keine Erfahrung und kann dir daher auch nix empfehlen.)

    ps: nachdem ich mir die Beschreibung durchgelesen habe bin ich gar nicht mehr sicher dass die "libstemmer" das nicht kann. Keine Ahnung. Die Online-Version kann es auf jeden Fall nicht. Falls du also die korrekte Stammform brauchst probier es auf jeden Fall vorher aus.



  • Mit nem entsprechenden Wörterbuch ist das Programm dafür doch auch fix selbst geschrieben. Ist halt die Frage, ob es ein geeignetes Wörterbuch frei erhältlich gibt.



  • @cooky451
    Naja schlauerweise verbindet man Wörterbuch + "Regel-Stemmer", wodurch dann was rauskommt was schlau UND klein ist.
    Und dann isses vermutlich schon nimmer ganz so trivial mit selber schreiben, da man das Wörterbuch an der passenden Stelle einklinken muss (und es auch passende Einträge enthalten muss).



  • hustbaer schrieb:

    Wenn bought -> bought und puppies -> puppi OK ist, dann wird der Snowball Stemmer OK sein.

    wörterbuch wär schon schön, aber man muss auch mal zufrieden sein 😉

    also wenn einer eines findet, wär ein link schon cool. auch wenn es im aktuellen projekt sicher nicht mehr zum einsatz kommt, da es den typen bei der 5 min. verweildauer sicher egal ist 😃

    aber in der werkzeugkiste hätt ich es schon gern 😋


Anmelden zum Antworten