<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[utf-8 mit Win Bordmitteln]]></title><description><![CDATA[<p>wie editiert man Textdateien in utf-8 Codierung und 0xa Zeilenenden mit Win 7 Bordmitteln?</p>
<p>mit dem Editor sehe ich keine Zeilentrennungen und mit wordpad keine Umläute.</p>
]]></description><link>https://www.c-plusplus.net/forum/topic/261810/utf-8-mit-win-bordmitteln</link><generator>RSS for Node</generator><lastBuildDate>Sun, 26 Apr 2026 20:40:04 GMT</lastBuildDate><atom:link href="https://www.c-plusplus.net/forum/topic/261810.rss" rel="self" type="application/rss+xml"/><pubDate>Wed, 24 Feb 2010 08:55:39 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 08:55:39 GMT]]></title><description><![CDATA[<p>wie editiert man Textdateien in utf-8 Codierung und 0xa Zeilenenden mit Win 7 Bordmitteln?</p>
<p>mit dem Editor sehe ich keine Zeilentrennungen und mit wordpad keine Umläute.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860425</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860425</guid><dc:creator><![CDATA[0xb.x.O51]]></dc:creator><pubDate>Wed, 24 Feb 2010 08:55:39 GMT</pubDate></item><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 10:40:11 GMT]]></title><description><![CDATA[<p>Eine Möglichkeit wäre, mit notepad die Datei öffnen, save as, dabei sicherstellen, dass UTF8 encoding ausgewählt ist. Das fügt die utf8 signature hinzu, und dann kommt auch wordpad mit der Datei klar.<br />
Problem ist halt, dass je nach Verwendungszweck die Signatur stören kann. <img
      src="https://www.c-plusplus.net/forum/plugins/nodebb-plugin-emoji/emoji/emoji-one/1f615.png?v=ab1pehoraso"
      class="not-responsive emoji emoji-emoji-one emoji--confused_face"
      title=":confused:"
      alt="😕"
    /></p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860461</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860461</guid><dc:creator><![CDATA[lilalaune]]></dc:creator><pubDate>Wed, 24 Feb 2010 10:40:11 GMT</pubDate></item><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 12:18:39 GMT]]></title><description><![CDATA[<p>thx, das geht. wieso will Win diese ersten 3 Bytes, linux aber nicht - könnte man sich da mal einigen, rund 17 Jahre nach der Präsentation von utf-8 ?</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860534</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860534</guid><dc:creator><![CDATA[0xb.x.O51]]></dc:creator><pubDate>Wed, 24 Feb 2010 12:18:39 GMT</pubDate></item><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 13:45:09 GMT]]></title><description><![CDATA[<p>Die ersten 2 Bytes, die du meinst, nennt man BOM und es ist wohl historisch bedingt, dass Windows die haben will. Windows hat Unicode ja eigentlich als UCS2 (oder angeblich UTF16, wobei ich davon ausgehe, dass viele Programme mit einem MB Zeichen nicht klarkommen) implementiert und da haben Unicodezeichen 16Bit also 2Byte. Wie die angeordnet sind hängt von der Endianess ab und daher gibt es im Unicodestandard die BOM (&quot;Byte Order Mark&quot;), damit Unicode auch wirklich portabel ist. Bei UTF-8 sind die Zeichen nur 8Bit also 1Byte groß und die Endianess spielt keine Rolle. Also ist ein BOM überflüssig. Aber es ist vom Unicodestandard dennoch erlaubt (aber nicht empfohlen) und wird unter Windows eben eingesetzt, damit man UTF-8 Dateien erkennen kann.</p>
<p>Unter Unixsystemen interpretiert und speichert man Dateien im Normalfall einfach anhand der aktuell gesetzten Locale. Das ist vermutlich auch einfach historisch bedingt und das BOM würde eben eine Spezialbehandlung in den zahlreichen Texttools, wie grep, cut, cat und allen anderen Programmen erfordern.</p>
<p>(Wobei aber vermutlich die meisten Linuxeditoren mit dem BOM zurecht kommen werden. Emacs hat extra einen Encoding dafür: utf-8-with-signature)</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860617</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860617</guid><dc:creator><![CDATA[rüdiger]]></dc:creator><pubDate>Wed, 24 Feb 2010 13:45:09 GMT</pubDate></item><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 14:44:36 GMT]]></title><description><![CDATA[<p>ach so ist das. Das Textfile beginnt bei mir jetzt mit ef bb bf. Widerspricht dann irgendwie dem un1x-Gedanken von wegen Datenaustausch vorzugsweise als Stream von lesbaren Zeichen.</p>
<p>Aber wieso wird das BOM eingesetzt, um UTF-8 zu erkennen ?</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860649</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860649</guid><dc:creator><![CDATA[0xb.x.O51]]></dc:creator><pubDate>Wed, 24 Feb 2010 14:44:36 GMT</pubDate></item><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 16:22:11 GMT]]></title><description><![CDATA[<p>Gibt es eine Erklärung wieso MS auf UTF-16 setzt? Hier ist ein wenig dazu: <a href="http://codesnipers.com/?q=utf-8-versus-windows-unicode" rel="nofollow">http://codesnipers.com/?q=utf-8-versus-windows-unicode</a></p>
<p>In kurz, MS macht sich das Leben leichter, auf Kosten von anderen in Complexity, Compatibility, Size weil sie bereits UCS-2 eingebaut hatten.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860710</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860710</guid><dc:creator><![CDATA[DEvent]]></dc:creator><pubDate>Wed, 24 Feb 2010 16:22:11 GMT</pubDate></item><item><title><![CDATA[Reply to utf-8 mit Win Bordmitteln on Wed, 24 Feb 2010 16:26:48 GMT]]></title><description><![CDATA[<p>0xb.x.O51 schrieb:</p>
<blockquote>
<p>thx, das geht. wieso will Win diese ersten 3 Bytes, linux aber nicht - könnte man sich da mal einigen, rund 17 Jahre nach der Präsentation von utf-8 ?</p>
</blockquote>
<p>Es gibt UTF-8 sowohl mit als auch ohne BLOM.</p>
<p>Was BLOM ist siehe Wikipedia.</p>
<p>Tatsache ist aber nunmal, das Unix Shellscripte wegen dem BLOM Probleme machen.<br />
Deswegen gibt's auch UTF-8 ohne BLOM.</p>
]]></description><link>https://www.c-plusplus.net/forum/post/1860715</link><guid isPermaLink="true">https://www.c-plusplus.net/forum/post/1860715</guid><dc:creator><![CDATA[BLOM]]></dc:creator><pubDate>Wed, 24 Feb 2010 16:26:48 GMT</pubDate></item></channel></rss>