'ü' == xB3? Was muss da kaputt gehen?



  • Ich hatte heute eine Datei vor mir liegen in der ein ü als Hex B3 (³; hochgestellte drei) kodiert war.
    Ich hab keine gängige Codierung gefunden die darauf passt. Und da ich auch nicht davon ausgehe dass da sich jemand einfach vertippt hat muss ja irgendwas anderes falsch gelaufen sein.

    Wo wurde hier falsch abgebogen?

    Punkt ist dass ich die Datei später mit iconv in utf8 umwandeln will aber dafür ja ein input-encoding brauch 😕



  • Wenn ich mich nicht taeusche ist das der Zeichensatz der Windows-Konsole. Zumindest kann ich mich dunkel erinnern, dass ein ü da als 3^3 dargestellt wurde (z.B. beim verwenden von Lynx oder edit) und ein eingetipptes ü auc wieder zu 3^3 wurde, wenn man in edit etwas abgespeichert hat.
    Wie das Encoding heisst, weiss ich gerade leider nicht.



  • ü ist 0xFC in ISO-8859-1, und 0xFC ist die hochgestellte 3 in Codepage 850, die man auch in der Windows-Konsole haben kann. Was kann da also passiert sein? Eine Datei in ISO-8859-1 wurde als Codepage 850 interpretiert und von dort aus nach ISO-8859-1 konvertiert.



  • Danke Bashar, das wirds gewesen sein


Anmelden zum Antworten