Name für "Antipattern" bezüglich Unicode/8-Bit Strings



  • Einige von euch kennen sicher das "Pattern" (ist vermutlich der falsche Ausdruck, aber egal), wo man einen String hat, der per Definitionem Unicode ist, aber garkein Unicode enthält.
    OK, ist jetzt sehr unverständlich formuliert.

    Angenommen ich habe einen griechischen 8-Bit String, der in Codepage Windows-1253 (Griechisch eben) codiert ist.

    Wenn ich diesen String jetzt nicht mit der korrekten Codepage, sondern mit Codepage 1252 (West European Latin) nach Unicode konvertiere, dann bekomme ich einen String der zwar aus 16 Bit "Einheiten" besteht, aber weder Unicode noch sonstwas ist, wofür ich einen guten Namen wüsste.

    Und nun wüsste ich gerne, ob dieses "Anti-Pattern" irgendeinen (mehr oder weniger) gebräuchlichen Namen hat.

    ----

    Ein zweites, ähnliches Antipattern, wäre, wenn das "Original" nicht ein 8-Bit String mit irgendeiner Codepage ist, sondern wenn es sich stattdessen um einen BLOB handelt. Wenn man diesen BLOB dann mit einer fixen Codepage nach "Unicode" konvertiert (weil man ihn z.B. irgenwo ablegen will oder über irgendwas transportieren will, was nur Unicode-Strings unterstützt, und man nicht auf die Idee kommt BASE64 oder ähnliches zu verwenden), hat man auch eine ähnliche Abscheulichkeit.

    Ich denke hier nur an COM-Komponenten + Visual Basic + ahnungslose/schlechte/wurschtige Programmierer 🙂



  • push



  • pop



  • hustbaer schrieb:

    Und nun wüsste ich gerne, ob dieses "Anti-Pattern" irgendeinen (mehr oder weniger) gebräuchlichen Namen hat.

    Das ist kein Anti-Pattern, sondern einfach ein Fehler. Als Name würde sich deshalb gequirlte Scheisse anbieten, oder Zombie-String. Und der zweite Fall nennt sich wohl binäre Serialisierung, nur ohne die Serialisierung, was somit einen Sonderfall der gequirlten Scheisse darstellt. 👍



  • Bennener der Fakten schrieb:

    hustbaer schrieb:

    Und nun wüsste ich gerne, ob dieses "Anti-Pattern" irgendeinen (mehr oder weniger) gebräuchlichen Namen hat.

    Das ist kein Anti-Pattern, sondern einfach ein Fehler. Als Name würde sich deshalb gequirlte Scheisse anbieten, oder Zombie-String. Und der zweite Fall nennt sich wohl binäre Serialisierung, nur ohne die Serialisierung, was somit einen Sonderfall der gequirlten Scheisse darstellt. 👍

    😃 👍




Anmelden zum Antworten