Verstaendnisfrage Unicode, UTF8, latin1



  • Hallo,

    ich habe eine Verstaendnisfrage zu unterschiedlichen Zeichenkodierungen.
    Ich habe eine Datei die in latin1 codiert ist.
    In meinem Program offne ich die Datei als UTF8, aber das offnen schlagt fehl mit der Fehlermeldung das die Datei nicht als UTF8 geoffnet werden kann.
    Die Datei besteht nur aus ASCII Zeichen mit einer Ausnahme, ein Wort beinhaltet ein "ß".
    Jetzt versuche ich diesen Artikel zu verstehen https://en.wikipedia.org/?title=UTF-8#Invalid_byte_sequences

    Was ist der Grund warum die Datei nicht geoffnet werden kann, diese Grunde werden auf wikipedia angefuehrt:

    -the red invalid bytes in the above table
    -an unexpected continuation byte
    -a start byte not followed by enough continuation bytes
    -an Overlong Encoding as described above
    -A 4-byte sequence (starting with 0xF4) that decodes to a value greater than U+10FFFF
    

    Was ist der Grund?

    Vielen Dank,
    🙂



  • Punkt zwei drei.

    ~Edit: war wohl zu früh, um bis drei zu zählen. >_<~



  • MisterSnister schrieb:

    Ich habe eine Datei die in latin1 codiert ist.
    In meinem Program offne ich die Datei als UTF8,

    Da frag ich mich doch eher: Wie kommst Du auf die Idee, dass das funktionieren könnte?!?!



  • MisterSnister schrieb:

    Was ist der Grund warum die Datei nicht geoffnet werden kann

    ca. 50 cm vor dem Monitor.



  • Caligulaminus schrieb:

    Punkt zwei drei.

    ~Edit: war wohl zu früh, um bis drei zu zählen. >_<~

    Danke fuer die information 🙂



  • SG1 schrieb:

    MisterSnister schrieb:

    Ich habe eine Datei die in latin1 codiert ist.
    In meinem Program offne ich die Datei als UTF8,

    Da frag ich mich doch eher: Wie kommst Du auf die Idee, dass das funktionieren könnte?!?!

    Das Programm dient lediglich dazu UTF8 zu lernen und sonst nichts, es sollte nicht funktionieren.


Log in to reply