Xml kodierung



  • hallo leute,

    ich versteh das mit den xml dateien und umlauten nicht so richtig. ich habe in meinem programm die windows extended ascii zur verfügung, also diese http://www.nefec.org/UPM/sansi.htm

    Jetzt dachte ich ich kann in meine XML datei oben schreiben <?xml version="1.0" encoding="ISO-8859-1"?> um dann umlaute benutzen zu können. aber wenn ich z.b. ü benutze und mir den geparsten string dann im programm ausgebe, steht da für ein ü nicht 252 sondern zwei bytes 195 und 188. was hat das zu bedeuten und was muss ich jetzt tun? ich dachte damit würde ü zu unsigned char 252 aufgelöst werden, damit ich dies dann in meiner zeichentabelle nutzen kann um das ü-bitmap anzuzeigen? 😕



  • also in der xml datei ist ü auch als 252 drin wenn ich im hex editor guck aber ich mache bestimmt itrgendetwas falsch? 😕



  • ach du grüne neune, das ist alles komplizierter als ich dachte,

    also wenn ich es richtig verstanden habe brauche ich diese iconv bibliothek, habe die mal kurz kompiliert und damit kann ich den string dann von UTF-8 zu ISO-8859-1 konvertieren und dann ist ü 252...verstehe aber ned warum der expat parser das nicht gleich selber machen kann wenn man in der XML datei ISO-8859-1 angibt??

    naja problem ist erstmal gelöst.,,



  • Es sieht doch offensichtlich so aus, dass

    (A) die Datei als iso 8859-1 gekennzeichnet wurde, der Inhalt aber UTF-8 ist und expat die Kodierung ignoriert oder

    (B) das expat einfach jede Kodierung in UTF-8 umwandelt.

    Anyway würde ich darauf achten, was der User für eine Umgebung eingestellt hat, weil nichts ärgerlicher ist, als eine Anwendung die falsche Kodierungen ausspuckt.



  • Hi,

    ja expat wandelt jede Kodierung in UTF-8 um, habe es nochmal nachgeschaut!


Anmelden zum Antworten