verkorkstes kyrillisch wieder richten
-
Hallo,
ich habe ab und zu kyrillische Texte, die im falschen Encoding interpretiert werden und als ein Wirrwarr von Sonderzeichen angezeigt werden. Es gab aber eine Webseite, die diesen Wirrwar relativ automatisch wieder übersetzt hat, selbst wenn z.B. keine 'Character Encoding'-Einstellung im Browser eine richtige Anzeige erzeugen konnte. Leider kann ich diese Seite nicht mehr finden -- könnt ihr mir helfen?
-
Wenn du den Text hast, interpretier ihn doch einfach richtig!
-
SeppJ schrieb:
Wenn du den Text hast, interpretier ihn doch einfach richtig!Das ist nicht immer einfach möglich. Ich weiß nicht genau wieso, aber ein möglicher Fall wäre:
- 2 bit Kyrillisch in Encoding 1 als 1 bit Kyrillisch in Encoding 2 interpretieren
- Resultat in 2 bit Kyrillisch in Encoding 3 unter Beibehaltung der dargestellten Zeichen umwandeln.
- speichern.Jetzt kann man das Ergebnis im Allgemeinen nicht mehr einfach in das Originaldokument übersetzen, wegen der Konvertierung in Schritt 2. Diese Webseite hatte anscheinend Heuristiken um solche Fälle zu erkennen.
-
Hab's gefunden:
-
Hier noch ein Schmankel zu kyrillischen Encodings: http://czyborra.com/charsets/cyrillic.html