Verstaendnisfrage Unicode, UTF8, latin1

Hallo,

ich habe eine Verstaendnisfrage zu unterschiedlichen Zeichenkodierungen.
Ich habe eine Datei die in latin1 codiert ist.
In meinem Program offne ich die Datei als UTF8, aber das offnen schlagt fehl mit der Fehlermeldung das die Datei nicht als UTF8 geoffnet werden kann.
Die Datei besteht nur aus ASCII Zeichen mit einer Ausnahme, ein Wort beinhaltet ein "ß".
Jetzt versuche ich diesen Artikel zu verstehen https://en.wikipedia.org/?title=UTF-8#Invalid_byte_sequences

Was ist der Grund warum die Datei nicht geoffnet werden kann, diese Grunde werden auf wikipedia angefuehrt:

-the red invalid bytes in the above table
-an unexpected continuation byte
-a start byte not followed by enough continuation bytes
-an Overlong Encoding as described above
-A 4-byte sequence (starting with 0xF4) that decodes to a value greater than U+10FFFF

Was ist der Grund?

Vielen Dank,

Caligulaminus

Punkt ~~zwei~~ drei.

~Edit: war wohl zu früh, um bis drei zu zählen. >_<~

SG1

MisterSnister schrieb:

Ich habe eine Datei die in latin1 codiert ist.
In meinem Program offne ich die Datei als UTF8,

Da frag ich mich doch eher: Wie kommst Du auf die Idee, dass das funktionieren könnte?!?!

MisterSnister schrieb:

Was ist der Grund warum die Datei nicht geoffnet werden kann

ca. 50 cm vor dem Monitor.

Caligulaminus schrieb:

Punkt ~~zwei~~ drei.

~Edit: war wohl zu früh, um bis drei zu zählen. >_<~

Danke fuer die information

SG1 schrieb:

MisterSnister schrieb:

Ich habe eine Datei die in latin1 codiert ist.
In meinem Program offne ich die Datei als UTF8,

Da frag ich mich doch eher: Wie kommst Du auf die Idee, dass das funktionieren könnte?!?!

Das Programm dient lediglich dazu UTF8 zu lernen und sonst nichts, es sollte nicht funktionieren.