String vergleichen ohne Groß/Kleinschreibung zu berücksichtigen



  • Und vor allem ists erstmal ein wahnsinniger Overhead...



  • EOP schrieb:

    Finnegan schrieb:

    wäre ich ganz froh darum, wenn die Standardbibliothek solche elementaren Funktionen unterstützen würde

    Naja, ganz so elementar und trivial und global einsetzbar ist es eben dann wohl doch nicht.

    Gibt es z.B. Im Arabischen oder Chinesischen überhaupt Groß- und Kleinschreibung?
    Mit den 1200 verschiedenen indischen Schriften will ich gar nicht erst anfangen

    Moment. Warst du nicht zuerst derjenige, der sowas gesagt hat wie dass man das mel eben selbst implementieren können sollte? :p

    Und nebenbei, das hier sind die aktuellen Unicode-Case-Folding-Regeln:

    CaseFolding.txt

    Das ist jetzt nicht so viel, dass man es nicht in einer kompakten binären Form in der Standardbibliothek unterbringen könnte, allerdings zusammen mit dem im Standard beschriebenen Algorithmus doch zu viel, als dass es mal eben in eine Lambda-Funktion zur Stringverarbeitung passt, geschweige denn dass ich grosse lust verspüre, es selbst zu machen, nur weil ich eine korrekte "case-insensitive"-Suche benötige. Ich geben allerdings zu, dass wenn man auch noch anderen Unicode-Kram mit implementiert, wahrscheinlich ein paar dickere zusätzliche Tabellen notwendig werden.

    Finn



  • Finnegan schrieb:

    Und nebenbei, das hier sind die aktuellen Unicode-Case-Folding-Regeln:

    CaseFolding.txt

    Das ist mal ein guter link. Zeigt einem so ein bißchen was von der Komplexität des Problems.


Anmelden zum Antworten