Utf-8 kodierung erkennen
-
Hallo,
ich habe mehrere textdateien, die ich parsen muss. Nun wollte ich fragen, ob es eine möglichkeit gibt zu überprüfen, ob eine Textdatei utf-8 kodiert ist oder nicht. Ich arbeite mit c++.
Danke.
-
http://de.wikipedia.org/wiki/Byte_Order_Mark
Wenn es kein BOM hat, gibt es noch statistische Auswertungsmöglichkeiten. Im allgemeinen musst du dann allerdings eine API/Bibliothek verwenden. Zum Beispiel bei der WinAPI gibt es diese Funktion:
MSDN - IsTextUnicodeGrüssli